登录或注册
首页
登录
模型目录
工作用途
文档
博客
下载
招聘
隐私政策
使用条款
7
25.4K 下载量
Qwen3 4B非思维模式的更新版本,在通用能力方面有显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编码和工具使用。
针对工具使用进行训练
Qwen3-4B非思维模式的更新版本,在通用能力方面有显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编码和工具使用。
该模型在多种语言的长尾知识覆盖方面取得了实质性进展,并在主观和开放式任务中与用户偏好保持了显著更好的对齐,从而实现了更有帮助的响应和更高质量的文本生成。
增强了256K长上下文理解能力。
注意:此模型仅支持非思考模式,不在输出中生成 <think></think> 块。
<think></think>
此模型使用的底层模型文件
基于
GGUF
MLX
当您下载此模型时,LM Studio 会选择最适合您机器的来源(您可以覆盖此设置)
此模型附带的自定义配置选项