登录或注册
主页
登录
模型目录
工作用途
文档
博客
下载
职业
隐私政策
使用条款
8
13.4K 下载量
来自字节跳动的先进推理模型,具有灵活的“思考预算”控制功能,并能够反思其自身推理的长度
针对工具使用进行训练
推理
具有灵活思考预算控制和原生 512K 上下文支持的先进推理模型
36B 参数,采用 GQA 注意力架构,专为强大的长上下文推理、代理任务和通用能力而设计
具有动态推理长度控制功能,允许用户根据任务复杂性将思考预算从 512 个 token 调整到无限制
擅长数学推理、编码任务、工具使用和代理工作流,包括 SWE-Bench 和问题解决
在 MATH(81.7%)、LiveCodeBench(67.4%)和 RULER 长上下文(94.6%)等多个基准测试中取得了最先进的性能
针对国际用例进行了优化,采用 Apache 2.0 许可证和研究友好的设计
模型作者定义的特殊功能
思考预算
: 选择
(默认=-1)
设置模型可用于内部推理的最大 token 数量
此模型使用的底层模型文件
基于
GGUF
MLX
当您下载此模型时,LM Studio 会选择最适合您机器的来源(您可以覆盖此设置)
此模型附带的自定义配置选项