Seed-OSS 36B
先进的推理模型,具有灵活的思考预算控制和原生 512K 上下文支持
36B 参数,采用 GQA 注意力架构,专为强大的长上下文推理、代理任务和通用能力设计
具有动态推理长度控制功能,允许用户根据任务复杂性将思考预算从 512 个词元调整为无限制
擅长数学推理、编码任务、工具使用和代理工作流,包括 SWE-Bench 和问题解决
在多个基准测试中取得最先进的性能,包括 MATH (81.7%)、LiveCodeBench (67.4%) 和 RULER 长上下文 (94.6%)
采用 Apache 2.0 许可证和研究友好型设计,针对国际用例进行优化