67.5K 下载量
DeepSeek-R1-0528 模型的蒸馏版本,通过在 Qwen3 8B Base 模型上持续进行后训练,并利用 DeepSeek-R1-0528 的思维链 (CoT) 创建。
专为 工具使用
推理
上次更新 15 天前
这是 DeepSeek-R1-0528 模型的蒸馏版本,通过在 Qwen3 8B Base 模型上持续进行后训练,并利用 DeepSeek-R1-0528 的思维链 (CoT) 创建。
该模型旨在实现推理任务上的最先进性能,同时比大型模型更高效。
关于此模型,他们表示
我们从 DeepSeek-R1-0528 中蒸馏出思维链,用于对 Qwen3 8B Base 进行后训练,从而得到 DeepSeek-R1-0528-Qwen3-8B。该模型在 AIME 2024 上达到了开源模型中的最先进 (SOTA) 性能,超越 Qwen3 8B 达 +10.0%,并与 Qwen3-235B-thinking 的性能持平。我们相信 DeepSeek-R1-0528 的思维链无论是对于推理模型的学术研究,还是专注于小型模型的工业开发都将具有重要意义。
DeepSeek 发布了 R1 模型的最新迭代版本,命名为 DeepSeek-R1-0528。在最新更新中,DeepSeek R1 通过利用增加的计算资源并在后训练过程中引入算法优化机制,显著提升了其推理深度和推理能力。该模型在各项基准评估中表现出色,包括数学、编程和通用逻辑。其整体性能已接近领先模型,如 O3 和 Gemini 2.5 Pro。
该模型使用的底层模型文件
当您下载此模型时,LM Studio 会自动选择最适合您机器的源文件(您可以覆盖此设置)
此模型附带的自定义配置选项