DeepSeek-R1-0528 可以在你的电脑上运行
TLDR:您可以在电脑上运行最新 DeepSeek R1 模型的小型版本,只需约 6GB 内存。在此下载模型。您需要 LM Studio 0.3.16 或更高版本。
DeepSeek-R1-0528-Qwen3-8B,一个从新 DeepSeek R1 的 CoT 中提取的 8B 模型
DeepSeek-R1-0528
昨日(2025年5月28日),DeepSeek 发布了其 R1 模型的新迭代版本:DeepSeek-R1-0528。通过利用更多计算资源和改进的后训练算法,此版本极大地扩展了模型的推理和推断能力。
它在从数学到编程和通用逻辑等各种基准测试中得分很高,接近 O3 和 Gemini 2.5 Pro 等模型的结果。
DeepSeek-R1-0528 在发布公告中的基准测试数据
DeepSeek-R1-0528-Qwen3-8B
作为 R1-0528 发布的一部分,DeepSeek 还分享了 DeepSeek-R1-0528-Qwen3-8B,这是一个“蒸馏”模型,通过使用 DeepSeek-R1-0528 的思维链(chain-of-thought)轨迹继续对 Qwen3 8B Base 进行后训练而创建。这个较小的模型也支持工具使用和推理。
DeepSeek 团队报告称,该模型在 AIME 2024 上取得了最先进(state-of-the-art)的结果,性能比 Qwen3 8B 高出约 10%,并与更大的 Qwen3-235B-thinking 模型相匹配。
AIME 24 | AIME 25 | HMMT Feb 25 | GPQA Diamond | LiveCodeBench (2408-2505) | |
---|---|---|---|---|---|
Qwen3-235B-A22B | 85.7 | 81.5 | 62.5 | 71.1 | 66.5 |
Qwen3-32B | 81.4 | 72.9 | - | 68.4 | - |
Qwen3-8B | 76.0 | 67.3 | - | 62.0 | - |
Phi-4-Reasoning-Plus-14B | 81.3 | 78.0 | 53.6 | 69.3 | - |
Gemini-2.5-Flash-Thinking-0520 | 82.3 | 72.0 | 64.2 | 82.8 | 62.3 |
o3-mini (medium) | 79.6 | 76.7 | 53.3 | 76.8 | 65.9 |
DeepSeek-R1-0528-Qwen3-8B | 86.0 | 76.3 | 61.5 | 61.1 | 60.5 |
您只需 4GB 内存即可运行该蒸馏模型。它开箱即用,支持工具和高级推理。
该模型支持 MLX 和 GGUF 两种格式,需要 LM Studio 0.3.16 或更高版本。在 LM Studio 中打开,即可在您的 Mac、Windows 或 Linux 电脑上下载。
有兴趣参与让本地 AI 普惠人人并发挥作用的工作吗?
查看开放职位:https://lm-studio.cn/careers