qwen/qwen3-4b-thinking-2507 • LM Studio

53.2K 下载量

qwen/qwen3-4b-thinking-2507

qwen/

qwen3-4b-thinking-2507

4B

qwen3moe

Qwen3 4B 的思维版本更新，持续扩展思维能力，提升推理的质量和深度

针对工具使用进行训练

推理

上次更新27 天前

最低要求最低2GB

README

Qwen 3 4B 思维版 2507，作者 qwen

Qwen3-4B 的思维版本更新，持续扩展思维能力，提升推理的质量和深度。Qwen3-4B-Thinking-2507 包括以下关键增强功能：

在推理任务上显著提高了性能，包括逻辑推理、数学、科学、编码以及通常需要人类专业知识的学术基准。显著提升了通用能力，例如指令遵循、工具使用、文本生成以及与人类偏好的一致性。增强了 256K 长上下文理解能力。

支持长达 262,144 个 token 的上下文长度。

注意：此模型仅支持思维模式。无需指定 enable_thinking=True。

来源

此模型使用的底层模型文件

基于

GGUF

MLX

MLX

MLX

当您下载此模型时，LM Studio 会选择最适合您机器的来源（您可以覆盖此设置）

配置

此模型附带的自定义配置选项

最小 P 采样

0

重复惩罚

已禁用

温度

0.6

Top K 采样

20

Top P 采样

0.95