67.5K 下载量

deepseek/
deepseek-r1-05...
8B
qwen3

DeepSeek-R1-0528 模型的蒸馏版本,通过在 Qwen3 8B Base 模型上持续进行后训练,并利用 DeepSeek-R1-0528 的思维链 (CoT) 创建。

推理

上次更新   15 天前

最低4GB
README

DeepSeek-R1-0528-Qwen3-8B

这是 DeepSeek-R1-0528 模型的蒸馏版本,通过在 Qwen3 8B Base 模型上持续进行后训练,并利用 DeepSeek-R1-0528 的思维链 (CoT) 创建。

该模型旨在实现推理任务上的最先进性能,同时比大型模型更高效。

关于此模型,他们表示

我们从 DeepSeek-R1-0528 中蒸馏出思维链,用于对 Qwen3 8B Base 进行后训练,从而得到 DeepSeek-R1-0528-Qwen3-8B。该模型在 AIME 2024 上达到了开源模型中的最先进 (SOTA) 性能,超越 Qwen3 8B 达 +10.0%,并与 Qwen3-235B-thinking 的性能持平。我们相信 DeepSeek-R1-0528 的思维链无论是对于推理模型的学术研究,还是专注于小型模型的工业开发都将具有重要意义。

DeepSeek-R1-0528 概览

DeepSeek 发布了 R1 模型的最新迭代版本,命名为 DeepSeek-R1-0528。在最新更新中,DeepSeek R1 通过利用增加的计算资源并在后训练过程中引入算法优化机制,显著提升了其推理深度和推理能力。该模型在各项基准评估中表现出色,包括数学、编程和通用逻辑。其整体性能已接近领先模型,如 O3 和 Gemini 2.5 Pro。

来源

该模型使用的底层模型文件

当您下载此模型时,LM Studio 会自动选择最适合您机器的源文件(您可以覆盖此设置)

配置

此模型附带的自定义配置选项

无自定义配置。