Qwen3 4B Thinking 2507,作者:qwen
Qwen3-4B 的更新思维版本,具有持续扩展的思维能力,提升了推理的质量和深度。Qwen3-4B-Thinking-2507 包含以下关键增强:
显著提升了在推理任务上的表现,包括逻辑推理、数学、科学、编码以及通常需要人类专业知识的学术基准。显著改善了通用能力,例如指令遵循、工具使用、文本生成以及与人类偏好的一致性。增强了 256K 的长上下文理解能力。
支持高达 262,144 个 token 的上下文长度。
注意:此模型仅支持思维模式。无需指定 enable_thinking=True。