gpt-oss 120b
专为生产环境、通用目的及高推理需求场景设计,可部署于单张 H100 GPU(总参数量 1170亿,激活参数量 51亿)
该模型在宽松的 Apache 2.0 协议下发布,支持配置低、中、高三种推理强度,方便用户根据需求平衡输出质量与延迟。模型提供完整的思维链(Chain-of-Thought)可见性,以支持更便捷的调试并增强信任感(注:此输出不针对最终用户)。模型支持完全微调,可针对特定任务或领域进行适配,并内置了原生智能体能力,如函数调用、网页浏览、Python 执行及结构化输出。
该模型支持 131k 的上下文长度。