DeepSeek-R1-0528 您可以在您的电脑上运行

2025-05-29

太长不看:您可以在您的电脑上运行最新 DeepSeek R1 模型的小版本,仅需大约 6GB RAM。在此处下载模型。您需要LM Studio 0.3.16 或更高版本。

undefined

DeepSeek-R1-0528-Qwen3-8B,一个从新 DeepSeek R1 的 CoT 中提取的 8B 模型

新的 DeepSeek R1:DeepSeek-R1-0528

昨天(2025年5月28日),DeepSeek 发布了其 R1 模型的最新迭代版本:DeepSeek-R1-0528。通过利用更多的计算资源和改进的后期训练算法,这个版本大大扩展了模型的推理和推断能力。

它在从数学到编程和一般逻辑等一系列基准测试中得分很高,接近 O3 和 Gemini 2.5 Pro 等模型的结果。

undefined

DeepSeek-R1-0528 发布公告中的基准测试

精炼 8B 模型:DeepSeek-R1-0528-Qwen3-8B

作为 R1-0528 发布的一部分,DeepSeek 还分享了DeepSeek-R1-0528-Qwen3-8B,这是一个“精炼”模型,通过使用 DeepSeek-R1-0528 的思维链轨迹继续对Qwen3 8B Base 进行后期训练而创建。这个较小的模型也支持工具使用和推理。

DeepSeek 团队报告称,它在 AIME 2024 上取得了最先进的成果,比 Qwen3 8B 表现高出约 10%,并与更大的 Qwen3-235B-thinking 相当。

AIME 24AIME 25HMMT 二月 25GPQA DiamondLiveCodeBench (2408-2505)
Qwen3-235B-A22B85.781.562.571.166.5
Qwen3-32B81.472.9-68.4-
Qwen3-8B76.067.3-62.0-
Phi-4-Reasoning-Plus-14B81.378.053.669.3-
Gemini-2.5-Flash-Thinking-052082.372.064.282.862.3
o3-mini (中)79.676.753.376.865.9
DeepSeek-R1-0528-Qwen3-8B86.076.361.561.160.5
来源:Hugging Face 上的DeepSeek-R1-0528

您只需4GB RAM 即可运行精炼模型。它开箱即支持工具和高级推理。

此模型提供 MLXGGUF 两种格式,需要 LM Studio 0.3.16 或更高版本。在 LM Studio 中打开 即可在您的 Mac、Windows 或 Linux 机器上下载。




👾 加入我们

有兴趣参与使本地 AI 变得人人可及且有用吗?

查看空缺职位:https://lm-studio.cn/careers