2.2K 下载量

qwen/
qwen3-235b-a22...
235B
qwen3moe

Qwen3 模型家族的 235B 参数(MoE)版本。

工具使用

推理能力

最后更新时间   20天前

最少134GB
README

Qwen3 235B A22B

支持通过 YaRN 实现高达 131,072 个 token 的上下文长度(默认 32k)

支持添加 /no_think 来禁用推理,只需将其添加到提示词末尾

MoE 模型,具有 22B 激活参数,总共 128 个专家,其中 8 个处于活跃状态

支持思考和非思考两种模式,并在这两种模式下增强推理能力,显著提升数学、编码和常识能力

擅长创意写作、角色扮演、多轮对话和指令遵循

高级代理能力,并支持超过 100 种语言和方言

自定义字段

由模型作者定义的特殊功能

启用思考

: 布尔值

(默认=true)

控制模型在回复前是否会进行思考

来源

此模型使用的底层模型文件

当您下载此模型时,LM Studio 会选择最适合您机器的来源(您可以覆盖此设置)

配置

此模型包含的自定义配置选项

Min P 采样
0
Top K 采样
20