251.1K 下载量
DeepSeek-R1-0528 模型的精简版,通过使用 DeepSeek-R1-0528 的思维链 (CoT) 在 Qwen3 8B 基础模型上继续进行后期训练过程而创建。
针对工具使用进行训练
推理
这是 DeepSeek-R1-0528 模型的精简版,通过使用 DeepSeek-R1-0528 的思维链 (CoT) 在 Qwen3 8B 基础模型上继续进行后期训练过程而创建。
该模型旨在实现推理任务的尖端性能,同时比大型模型更高效。
关于这个模型,他们说
我们从 DeepSeek-R1-0528 中提炼了思维链,对 Qwen3 8B Base 进行后期训练,获得了 DeepSeek-R1-0528-Qwen3-8B。该模型在 AIME 2024 上取得了开源模型中的最先进 (SOTA) 性能,超越 Qwen3 8B 10.0%,并与 Qwen3-235B-thinking 的性能持平。我们相信 DeepSeek-R1-0528 的思维链对于推理模型的学术研究和专注于小型模型的工业开发都将具有重要意义。
DeepSeek 发布了 R1 模型的最新迭代版本 DeepSeek-R1-0528。在最新更新中,DeepSeek R1 通过利用增加的计算资源并在后期训练期间引入算法优化机制,显著提高了其推理深度和推理能力。该模型在包括数学、编程和通用逻辑在内的各种基准评估中表现出色。其整体性能目前已接近 O3 和 Gemini 2.5 Pro 等领先模型。
此模型使用的底层模型文件
当您下载此模型时,LM Studio 会选择最适合您机器的来源(您可以覆盖此设置)
此模型附带的自定义配置选项