DeepSeek-R1-0528 可以在你的电脑上运行

2025-05-29

TLDR:您可以在电脑上运行最新 DeepSeek R1 模型的小型版本,只需约 6GB 内存。在此下载模型。您需要 LM Studio 0.3.16 或更高版本。

undefined

DeepSeek-R1-0528-Qwen3-8B,一个从新 DeepSeek R1 的 CoT 中提取的 8B 模型

新 DeepSeek R1: DeepSeek-R1-0528

昨日(2025年5月28日),DeepSeek 发布了其 R1 模型的新迭代版本:DeepSeek-R1-0528。通过利用更多计算资源和改进的后训练算法,此版本极大地扩展了模型的推理和推断能力。

它在从数学到编程和通用逻辑等各种基准测试中得分很高,接近 O3 和 Gemini 2.5 Pro 等模型的结果。

undefined

DeepSeek-R1-0528 在发布公告中的基准测试数据

蒸馏版 8B 模型: DeepSeek-R1-0528-Qwen3-8B

作为 R1-0528 发布的一部分,DeepSeek 还分享了 DeepSeek-R1-0528-Qwen3-8B,这是一个“蒸馏”模型,通过使用 DeepSeek-R1-0528 的思维链(chain-of-thought)轨迹继续对 Qwen3 8B Base 进行后训练而创建。这个较小的模型也支持工具使用和推理。

DeepSeek 团队报告称,该模型在 AIME 2024 上取得了最先进(state-of-the-art)的结果,性能比 Qwen3 8B 高出约 10%,并与更大的 Qwen3-235B-thinking 模型相匹配。

AIME 24AIME 25HMMT Feb 25GPQA DiamondLiveCodeBench (2408-2505)
Qwen3-235B-A22B85.781.562.571.166.5
Qwen3-32B81.472.9-68.4-
Qwen3-8B76.067.3-62.0-
Phi-4-Reasoning-Plus-14B81.378.053.669.3-
Gemini-2.5-Flash-Thinking-052082.372.064.282.862.3
o3-mini (medium)79.676.753.376.865.9
DeepSeek-R1-0528-Qwen3-8B86.076.361.561.160.5
来源: DeepSeek-R1-0528 (Hugging Face 平台)

您只需 4GB 内存即可运行该蒸馏模型。它开箱即用,支持工具和高级推理。

该模型支持 MLXGGUF 两种格式,需要 LM Studio 0.3.16 或更高版本。在 LM Studio 中打开,即可在您的 Mac、Windows 或 Linux 电脑上下载。




👾 加入我们

有兴趣参与让本地 AI 普惠人人并发挥作用的工作吗?

查看开放职位:https://lm-studio.cn/careers