QwenLM · YuanHanzhong · May 18, 2026 · wenshao · May 18, 2026 · wenshao
diff --git a/packages/core/src/core/openaiContentGenerator/provider/default.test.ts b/packages/core/src/core/openaiContentGenerator/provider/default.test.ts
@@ -409,6 +409,44 @@ describe('DefaultOpenAICompatibleProvider', () => {
       });
     });
 
+    it('should mirror reasoning_content to reasoning for Qwen model history', () => {
+      const qwenProvider = new DefaultOpenAICompatibleProvider(
+        {
+          ...mockContentGeneratorConfig,
+          model: 'Qwen/Qwen3.6-35B-A3B',
+        } as ContentGeneratorConfig,
+        mockCliConfig,
+      );
+      const originalRequest: OpenAI.Chat.ChatCompletionCreateParams = {
+        model: 'Qwen/Qwen3.6-35B-A3B',
+        messages: [
+          {
+            role: 'assistant',
+            content: 'The answer.',
+            reasoning_content: 'Prior reasoning.',
+          } as OpenAI.Chat.ChatCompletionAssistantMessageParam & {
+            reasoning_content: string;
+          },
+        ],
+      };
+
+      const result = qwenProvider.buildRequest(originalRequest, 'prompt-id');
+      const assistant = result.messages[0] as
+        | OpenAI.Chat.ChatCompletionAssistantMessageParam
+        | (OpenAI.Chat.ChatCompletionAssistantMessageParam & {
+            reasoning_content?: string;
+            reasoning?: string;
+          });
+
+      expect(assistant).toEqual(
+        expect.objectContaining({
+          reasoning_content: 'Prior reasoning.',
+          reasoning: 'Prior reasoning.',
+        }),
+      );
+      expect(originalRequest.messages[0]).not.toHaveProperty('reasoning');
+    });
+
     it('should not include extra_body when not configured', () => {
       const originalRequest: OpenAI.Chat.ChatCompletionCreateParams = {
         model: 'gpt-4',

diff --git a/packages/core/src/core/openaiContentGenerator/provider/default.ts b/packages/core/src/core/openaiContentGenerator/provider/default.ts
@@ -11,6 +11,8 @@ import {
   hasExplicitOutputLimit,
 } from '../../tokenLimits.js';
 
+const QWEN_MODEL_MARKER = 'qwen';
+
 /**
  * Default provider for standard OpenAI-compatible APIs
  */
@@ -76,10 +78,11 @@ export class DefaultOpenAICompatibleProvider
     // This prevents occupying too much context window with output reservation
     const requestWithTokenLimits = this.applyOutputTokenLimit(request);
 
-    return {
+    const builtRequest = {
       ...requestWithTokenLimits,
       ...(extraBody ? extraBody : {}),
     };
+    return this.mirrorQwenReasoningContent(builtRequest);
   }
 
   getDefaultGenerationConfig(): GenerateContentConfig {
@@ -167,4 +170,45 @@ export class DefaultOpenAICompatibleProvider
       max_tokens: effectiveMaxTokens,
     };
   }
+
-
+  /**
+   * Mirrors `reasoning_content` to `reasoning` for Qwen model history.
+   * Qwen's self-hosted API requires the `reasoning` field (not just
+   * `reasoning_content`) when replaying assistant messages in multi-turn
+   * conversations. This copies the content without removing the original
+   * field to preserve backward compatibility.
+   *
+   * Fixes #4285
+   */
+  private mirrorQwenReasoningContent(
-
+  /**
+   * Mirrors `reasoning_content` to `reasoning` for Qwen model history.
+   * Qwen's self-hosted API requires the `reasoning` field (not just
+   * `reasoning_content`) when replaying assistant messages in multi-turn
+   * conversations. This copies the content without removing the original
+   * field to preserve backward compatibility.
+   *
+   * Fixes #4285
+   */
+  private mirrorQwenReasoningContent(
+  private mirrorQwenReasoningContent(
+    request: OpenAI.Chat.ChatCompletionCreateParams,
+  ): OpenAI.Chat.ChatCompletionCreateParams {
+    const model = request.model.toLowerCase();
+    if (!model.includes(QWEN_MODEL_MARKER)) {
+      return request;
+    }
+
+    let changed = false;
+    const messages = request.messages.map((message) => {
+      if (message.role !== 'assistant') {
+        return message;
+      }
+
+      const extended = message as unknown as Record<string, unknown>;
-      const extended = message as unknown as Record<string, unknown>;
+      const extended = message as ExtendedChatCompletionAssistantMessageParam;
+      const reasoningContent = extended.reasoning_content;
-      const extended = message as unknown as Record<string, unknown>;
+      const extended = message as ExtendedChatCompletionAssistantMessageParam;
+      const reasoningContent = extended.reasoning_content;
+      const reasoningContent = extended['reasoning_content'];
+      if (
+        typeof reasoningContent !== 'string' ||
+        reasoningContent.length === 0 ||
+        typeof extended['reasoning'] === 'string'
+      ) {
+        return message;
+      }
+
+      changed = true;
+      return {
+        ...extended,
+        reasoning: reasoningContent,
+      } as unknown as OpenAI.Chat.ChatCompletionMessageParam;
+    });
+
+    if (!changed) {
+      return request;
+    }
+
+    return {
+      ...request,
+      messages,
+    };
+  }
 }