4K 下载量

qwen/
qwen3-coder-480b
480B
qwen3_moe

Qwen 最强大的代码模型,总参数量为 480B,通过专家混合 (MoE) 架构激活 35B 参数。

具使用进行训练

最后更新于 7 月 31 日
README

Qwen3 Coder 480B

Qwen 最强大的代码模型,总参数量为 480B,通过专家混合 (MoE) 架构激活 35B 参数。

主要功能

  • 智能编码:在编码任务上与 Claude Sonnet 4 性能相当
  • 仓库级理解:针对大型代码库和复杂项目进行优化

技术规格

  • 总参数 480B,激活 35B(具有 160 个专家和 8 个活跃专家的 MoE)
  • 62 层,采用分组查询注意力(96 个 Q 头,8 个 KV 头)
  • 原生 262,144 个令牌上下文长度

注意:此模型仅在非思考模式下运行,不生成 <think></think> 块。

来源

此模型使用的底层模型文件

当您下载此模型时,LM Studio 会选择最适合您机器的来源(您可以覆盖此设置)

配置

此模型附带的自定义配置选项

重复惩罚
1.05
温度
0.7
Top K 采样
20
Top P 采样
0.8