登录或注册
模型
开发者文档
职业生涯
博客
更新日志
企业解决方案
隐私政策
使用条款
25
1
描述
Qwen3 4B 非思考模式的更新版本,在指令遵循、逻辑推理、文本理解、数学、科学、编程和工具使用等综合能力方面均有显著提升。
统计数据
100.1K 下载量
25 颗星
1 次派生
功能
最低系统内存
标签
最后更新
README
Qwen3-4B 非思考模式的更新版本,在指令遵循、逻辑推理、文本理解、数学、科学、编程和工具使用等综合能力方面均有显著提升。
该模型在多语言的长尾知识覆盖方面取得了实质性进展,并在主观和开放式任务中与用户偏好的对齐度显著提升,能够提供更有帮助的回答和更高质量的文本生成。
增强了 256K 超长上下文的理解能力。
注意:此模型仅支持非思考模式,不在输出中生成 <think></think> 块。
<think></think>
参数
此模型附带的自定义配置选项
来源
此模型使用的底层模型文件
基于
GGUF
MLX
产品
开发者
公司
法律