qwen/qwen3-4b-2507 • LM Studio - LM Studio 应用程序

25.4K 下载量

qwen/qwen3-4b-2507

qwen/

qwen3-4b-2507

4B

qwen3moe

Qwen3 4B非思维模式的更新版本，在通用能力方面有显著提升，包括指令遵循、逻辑推理、文本理解、数学、科学、编码和工具使用。

针对工具使用进行训练

上次更新27天前

最低要求最低2GB

README

Qwen3 4B 指令 2507 by qwen

Qwen3-4B非思维模式的更新版本，在通用能力方面有显著提升，包括指令遵循、逻辑推理、文本理解、数学、科学、编码和工具使用。

该模型在多种语言的长尾知识覆盖方面取得了实质性进展，并在主观和开放式任务中与用户偏好保持了显著更好的对齐，从而实现了更有帮助的响应和更高质量的文本生成。

增强了256K长上下文理解能力。

注意：此模型仅支持非思考模式，不在输出中生成 <think></think> 块。

来源

此模型使用的底层模型文件

基于

GGUF

MLX

MLX

MLX

MLX

当您下载此模型时，LM Studio 会选择最适合您机器的来源（您可以覆盖此设置）

配置

此模型附带的自定义配置选项

最小 P 采样

0

重复惩罚

已禁用

温度

0.7

Top K 采样

20

Top P 采样

0.8