← 所有模型

Seed OSS 36B

公开

字节跳动的先进推理模型,具有灵活的“思考预算”控制功能和反思自身推理长度的能力

45.1K 下载量

21 星标

功能

推理

最低系统内存

21GB

标签

36B
seed_oss

最后更新

8月28日更新
yagil 的个人资料图片
yagil

README

Seed-OSS 36B

先进的推理模型,具有灵活的思考预算控制和原生 512K 上下文支持

36B 参数,采用 GQA 注意力架构,专为强大的长上下文推理、代理任务和通用能力设计

具有动态推理长度控制功能,允许用户根据任务复杂性将思考预算从 512 个词元调整为无限制

擅长数学推理、编码任务、工具使用和代理工作流,包括 SWE-Bench 和问题解决

在多个基准测试中取得最先进的性能,包括 MATH (81.7%)、LiveCodeBench (67.4%) 和 RULER 长上下文 (94.6%)

采用 Apache 2.0 许可证和研究友好型设计,针对国际用例进行优化

自定义字段

模型作者定义的特殊功能

思考预算

: 选择

(默认值=-1)

设置模型用于内部推理的最大词元数

参数

此模型附带的自定义配置选项

推理部分解析
{ "enabled": true, "startString": "<seed:think>", "endString": "</seed:think>" }
温度
1.1
Top P 采样
0.95