← 所有模型

qwen3-4b-thinking-2507

公开

Qwen3 4B 的更新思维版本,具有持续扩展的思维能力,提升了推理的质量和深度

208.4K 下载量

57 星标

1 分支

功能

推理

最低系统内存

2GB

标签

4B
qwen3

README

Qwen3 4B Thinking 2507,作者:qwen

Qwen3-4B 的更新思维版本,具有持续扩展的思维能力,提升了推理的质量和深度。Qwen3-4B-Thinking-2507 包含以下关键增强:

显著提升了在推理任务上的表现,包括逻辑推理、数学、科学、编码以及通常需要人类专业知识的学术基准。显著改善了通用能力,例如指令遵循、工具使用、文本生成以及与人类偏好的一致性。增强了 256K 的长上下文理解能力。

支持高达 262,144 个 token 的上下文长度。

注意:此模型仅支持思维模式。无需指定 enable_thinking=True。

参数

此模型附带的自定义配置选项

最小 P 采样
0
重复惩罚
已禁用
温度
0.6
Top K 采样
20
Top P 采样
0.95