38K 下载量

qwen/
qwen3-30b-a3b-2507
30B
qwen3moe

Qwen3-30B-A3B 的更新版本,在指令遵循、逻辑推理、文本理解、数学、科学、编码和工具使用等通用能力方面有显著提升。

具使用进行训练

上次更新于 7 月 29 日
README

Qwen3 30B A3B 2507

Qwen3-30B-A3B 的更新版本,在指令遵循、逻辑推理、文本理解、数学、科学、编码和工具使用等通用能力方面有显著提升。

这个 MoE 模型使用了 3.3B 个激活参数,来自 128 个总专家,同时有 8 个专家处于活动状态。与原始的 Qwen3-30B-A3B 相比,它在多种语言的长尾知识覆盖方面取得了显著提升,并且在主观和开放式任务中与用户偏好有显著更好的对齐。

支持最长 262,144 个 tokens 的上下文长度。

高级代理能力,支持超过 100 种语言和方言。

注意:此模型仅支持非思考模式,不在输出中生成 <think></think> 块。

来源

此模型使用的底层模型文件

当您下载此模型时,LM Studio 会选择最适合您机器的来源(您可以覆盖此设置)

配置

此模型附带的自定义配置选项

最小 P 采样
0
重复惩罚
已禁用
温度
0.7
Top K 采样
20
Top P 采样
0.8