13.4K 下载量

bytedance/
seed-oss-36b
36B
seed_oss

来自字节跳动的先进推理模型,具有灵活的“思考预算”控制功能,并能够反思其自身推理的长度

具使用进行训练

推理

上次更新11 天前
README

Seed-OSS 36B

具有灵活思考预算控制和原生 512K 上下文支持的先进推理模型

36B 参数,采用 GQA 注意力架构,专为强大的长上下文推理、代理任务和通用能力而设计

具有动态推理长度控制功能,允许用户根据任务复杂性将思考预算从 512 个 token 调整到无限制

擅长数学推理、编码任务、工具使用和代理工作流,包括 SWE-Bench 和问题解决

在 MATH(81.7%)、LiveCodeBench(67.4%)和 RULER 长上下文(94.6%)等多个基准测试中取得了最先进的性能

针对国际用例进行了优化,采用 Apache 2.0 许可证和研究友好的设计

自定义字段

模型作者定义的特殊功能

思考预算

: 选择

(默认=-1)

设置模型可用于内部推理的最大 token 数量

来源

此模型使用的底层模型文件

当您下载此模型时,LM Studio 会选择最适合您机器的来源(您可以覆盖此设置)

配置

此模型附带的自定义配置选项

推理部分解析
{ "enabled": true, "startString": "<seed:think>", "endString": "</seed:think>" }
温度
1.1
Top P 采样
0.95