28.3K 下载量

qwen/
qwen3-4b
4B
qwen3

Qwen3 模型家族的 4B 参数版本。

具使用进行训练

推理

上次更新5月24日
README

qwen 的 Qwen3 4B

使用 YaRN 最多支持 131,072 个上下文 token(默认 32k)

支持 /no_think 以禁用推理,只需将其添加到提示的末尾

支持思考和非思考模式,并在两种模式下增强推理能力,显著提升数学、编码和常识能力

擅长创意写作、角色扮演、多轮对话和指令遵循

高级代理功能,支持 100 多种语言和方言

自定义字段

模型作者定义的特殊功能

启用思考

: 布尔值

(默认值 =true)

控制模型在回复前是否会进行思考

来源

此模型使用的底层模型文件

当您下载此模型时,LM Studio 会选择最适合您机器的来源(您可以覆盖此设置)

配置

此模型附带的自定义配置选项

最小 P 采样
0
Top K 采样
20