OpenAI 开源模型的 120B 变体。采用 Apache 2.0 协议授权。

17.86万 下载量

70 星标

功能

推理

最低系统内存

65GB

标签

1200亿参数
gpt-oss

README

gpt-oss 120b

专为生产环境、通用目的及高推理需求场景设计,可部署于单张 H100 GPU(总参数量 1170亿,激活参数量 51亿)

该模型在宽松的 Apache 2.0 协议下发布,支持配置低、中、高三种推理强度,方便用户根据需求平衡输出质量与延迟。模型提供完整的思维链(Chain-of-Thought)可见性,以支持更便捷的调试并增强信任感(注:此输出不针对最终用户)。模型支持完全微调,可针对特定任务或领域进行适配,并内置了原生智能体能力,如函数调用、网页浏览、Python 执行及结构化输出。

该模型支持 131k 的上下文长度。

自定义字段

模型作者定义的特殊功能

推理强度 (Reasoning Effort)

: 选择

(默认=low)

控制模型应执行的推理量。

参数

此模型附带的自定义配置选项

最小 P 采样
0.05
重复惩罚
1.1
温度
0.8
Top K 采样
40
Top P 采样
0.8

来源

此模型使用的底层模型文件