← 所有模型

qwen3-30b-a3b-2507

公开

Qwen3-30B-A3B 的更新版本,在指令遵循、逻辑推理、文本理解、数学、科学、编程和工具使用等通用能力方面有显著提升。

105.9K 下载量

43 星标

功能

最低系统内存

17GB

标签

30B
qwen3moe

README

Qwen3 30B A3B 2507

Qwen3-30B-A3B 的更新版本,在指令遵循、逻辑推理、文本理解、数学、科学、编程和工具使用等通用能力方面有显著提升。

此 MoE 模型使用来自总共 128 个专家中的 33 亿个激活参数,其中任意时刻有 8 个专家处于活跃状态。与原始的 Qwen3-30B-A3B 相比,它在多语言长尾知识覆盖方面取得了显著提升,并在主观和开放式任务中更好地与用户偏好对齐。

支持高达 262,144 个 token 的上下文长度。

先进的智能体(Agent)能力,支持超过 100 种语言和方言。

注意:此模型仅支持非思考模式,不在输出中生成 <think></think> 块。

参数

此模型附带的自定义配置选项

最小 P 采样
0
重复惩罚
已禁用
温度
0.7
Top K 采样
20
Top P 采样
0.8
© . This site is unofficial and not affiliated with Element Labs, Inc.