DeepSeek-R1-0528 您可以在您的电脑上运行
太长不看:您可以在您的电脑上运行最新 DeepSeek R1 模型的小版本,仅需大约 6GB RAM。在此处下载模型。您需要LM Studio 0.3.16 或更高版本。
DeepSeek-R1-0528-Qwen3-8B,一个从新 DeepSeek R1 的 CoT 中提取的 8B 模型
DeepSeek-R1-0528
昨天(2025年5月28日),DeepSeek 发布了其 R1 模型的最新迭代版本:DeepSeek-R1-0528。通过利用更多的计算资源和改进的后期训练算法,这个版本大大扩展了模型的推理和推断能力。
它在从数学到编程和一般逻辑等一系列基准测试中得分很高,接近 O3 和 Gemini 2.5 Pro 等模型的结果。
DeepSeek-R1-0528 发布公告中的基准测试
DeepSeek-R1-0528-Qwen3-8B
作为 R1-0528 发布的一部分,DeepSeek 还分享了DeepSeek-R1-0528-Qwen3-8B,这是一个“精炼”模型,通过使用 DeepSeek-R1-0528 的思维链轨迹继续对Qwen3 8B Base 进行后期训练而创建。这个较小的模型也支持工具使用和推理。
DeepSeek 团队报告称,它在 AIME 2024 上取得了最先进的成果,比 Qwen3 8B 表现高出约 10%,并与更大的 Qwen3-235B-thinking 相当。
AIME 24 | AIME 25 | HMMT 二月 25 | GPQA Diamond | LiveCodeBench (2408-2505) | |
---|---|---|---|---|---|
Qwen3-235B-A22B | 85.7 | 81.5 | 62.5 | 71.1 | 66.5 |
Qwen3-32B | 81.4 | 72.9 | - | 68.4 | - |
Qwen3-8B | 76.0 | 67.3 | - | 62.0 | - |
Phi-4-Reasoning-Plus-14B | 81.3 | 78.0 | 53.6 | 69.3 | - |
Gemini-2.5-Flash-Thinking-0520 | 82.3 | 72.0 | 64.2 | 82.8 | 62.3 |
o3-mini (中) | 79.6 | 76.7 | 53.3 | 76.8 | 65.9 |
DeepSeek-R1-0528-Qwen3-8B | 86.0 | 76.3 | 61.5 | 61.1 | 60.5 |
您只需4GB RAM 即可运行精炼模型。它开箱即支持工具和高级推理。
此模型提供 MLX 和 GGUF 两种格式,需要 LM Studio 0.3.16 或更高版本。在 LM Studio 中打开 即可在您的 Mac、Windows 或 Linux 机器上下载。
有兴趣参与使本地 AI 变得人人可及且有用吗?
查看空缺职位:https://lm-studio.cn/careers