Qwen 3 4B 思维版 2507,作者 qwen
Qwen3-4B 的思维版本更新,持续扩展思维能力,提升推理的质量和深度。Qwen3-4B-Thinking-2507 包括以下关键增强功能:
在推理任务上显著提高了性能,包括逻辑推理、数学、科学、编码以及通常需要人类专业知识的学术基准。显著提升了通用能力,例如指令遵循、工具使用、文本生成以及与人类偏好的一致性。增强了 256K 长上下文理解能力。
支持长达 262,144 个 token 的上下文长度。
注意:此模型仅支持思维模式。无需指定 enable_thinking=True。