Qwen3 4B 非思考模式的更新版本,在指令遵循、逻辑推理、文本理解、数学、科学、编程和工具使用等综合能力方面均有显著提升。

100.1K 下载量

25 颗星

1 次派生

功能

最低系统内存

2GB

标签

4B
qwen3

README

Qwen3 4B Instruct 2507 (由 qwen 提供)

Qwen3-4B 非思考模式的更新版本,在指令遵循、逻辑推理、文本理解、数学、科学、编程和工具使用等综合能力方面均有显著提升。

该模型在多语言的长尾知识覆盖方面取得了实质性进展,并在主观和开放式任务中与用户偏好的对齐度显著提升,能够提供更有帮助的回答和更高质量的文本生成。

增强了 256K 超长上下文的理解能力。

注意:此模型仅支持非思考模式,不在输出中生成 <think></think> 块。

参数

此模型附带的自定义配置选项

最小 P 采样
0
重复惩罚
已禁用
温度
0.7
Top K 采样
20
Top P 采样
0.8