53.2K 下载量

qwen/
qwen3-4b-thinking-2507
4B
qwen3moe

Qwen3 4B 的思维版本更新,持续扩展思维能力,提升推理的质量和深度

具使用进行训练

推理

上次更新27 天前
README

Qwen 3 4B 思维版 2507,作者 qwen

Qwen3-4B 的思维版本更新,持续扩展思维能力,提升推理的质量和深度。Qwen3-4B-Thinking-2507 包括以下关键增强功能:

在推理任务上显著提高了性能,包括逻辑推理、数学、科学、编码以及通常需要人类专业知识的学术基准。显著提升了通用能力,例如指令遵循、工具使用、文本生成以及与人类偏好的一致性。增强了 256K 长上下文理解能力。

支持长达 262,144 个 token 的上下文长度。

注意:此模型仅支持思维模式。无需指定 enable_thinking=True。

来源

此模型使用的底层模型文件

当您下载此模型时,LM Studio 会选择最适合您机器的来源(您可以覆盖此设置)

配置

此模型附带的自定义配置选项

最小 P 采样
0
重复惩罚
已禁用
温度
0.6
Top K 采样
20
Top P 采样
0.95