bytedance/seed-oss-36b • LM Studio - LM Studio 应用程序

← 所有模型

13.4K 下载量

bytedance/seed-oss-36b

bytedance/

seed-oss-36b

36B

seed_oss

来自字节跳动的先进推理模型，具有灵活的“思考预算”控制功能，并能够反思其自身推理的长度

针对工具使用进行训练

推理

上次更新11 天前

在 LM Studio 中使用模型

最低要求最低21GB

README

Seed-OSS 36B

具有灵活思考预算控制和原生 512K 上下文支持的先进推理模型

36B 参数，采用 GQA 注意力架构，专为强大的长上下文推理、代理任务和通用能力而设计

具有动态推理长度控制功能，允许用户根据任务复杂性将思考预算从 512 个 token 调整到无限制

擅长数学推理、编码任务、工具使用和代理工作流，包括 SWE-Bench 和问题解决

在 MATH（81.7%）、LiveCodeBench（67.4%）和 RULER 长上下文（94.6%）等多个基准测试中取得了最先进的性能

针对国际用例进行了优化，采用 Apache 2.0 许可证和研究友好的设计

自定义字段

模型作者定义的特殊功能

思考预算

: 选择

（默认=-1)

设置模型可用于内部推理的最大 token 数量

来源

此模型使用的底层模型文件

基于

🤗lmstudio-community/Seed-OSS-36B-Instruct-GGUF→

GGUF

🤗lmstudio-community/Seed-OSS-36B-Instruct-MLX-4bit→

MLX

🤗lmstudio-community/Seed-OSS-36B-Instruct-MLX-5bit→

MLX

🤗lmstudio-community/Seed-OSS-36B-Instruct-MLX-6bit→

MLX

🤗lmstudio-community/Seed-OSS-36B-Instruct-MLX-8bit→

MLX

当您下载此模型时，LM Studio 会选择最适合您机器的来源（您可以覆盖此设置）

配置

此模型附带的自定义配置选项

推理部分解析

{ "enabled": true, "startString": "<seed:think>", "endString": "</seed:think>" }

温度

1.1

Top P 采样

0.95