Qwen3 30B A3B 2507
Qwen3-30B-A3B 的更新版本,在指令遵循、逻辑推理、文本理解、数学、科学、编程和工具使用等通用能力方面有显著提升。
此 MoE 模型使用来自总共 128 个专家中的 33 亿个激活参数,其中任意时刻有 8 个专家处于活跃状态。与原始的 Qwen3-30B-A3B 相比,它在多语言长尾知识覆盖方面取得了显著提升,并在主观和开放式任务中更好地与用户偏好对齐。
支持高达 262,144 个 token 的上下文长度。
先进的智能体(Agent)能力,支持超过 100 种语言和方言。
注意:此模型仅支持非思考模式,不在输出中生成 <think></think> 块。