gpt-oss-120b

gpt-oss-120b

功能最强大的开放权重模型,可适配H100 GPU
2025-08-05
语言大模型
输入:
$0.2/1M tokens
输出:
$1/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

基本信息

GPT-OSS-120B 是 OpenAI 于 2025 年 8 月 5 日推出的开放权重语言模型,属 GPT-OSS 系列,采用 Apache 2.0 许可证,可免费下载商用。需在 80GB GPU 上运行,兼容 OpenAI 回复 API,适配智能体工作流。其总参数 1170 亿,每个令牌激活 51 亿参数,在核心推理基准测试中与 o4-mini 接近,HealthBench 等场景表现超 o1 与 GPT-4o,已在 Hugging Face 开源,支持 PyTorch、Metal 等平台推理。

核心特性

具备强工具使用能力,可完成网页搜索、Python 代码执行等任务, Tau-Bench 智能体评估表现优异;支持 128k 长上下文,采用 “o200k_harmony” 令牌化器,适配多领域长文本处理;提供低、中、高三级推理强度调节,平衡延迟与性能,且支持结构化输出与完整思维链(CoT),便于定制。

技术亮点

采用专家混合(MoE)架构,36 层结构含 128 个专家,每个令牌激活 4 个专家,兼顾性能与效率;创新非监督式 CoT,未直接对齐监督,便于监测异常行为;经对抗性微调测试,内部安全基准达前沿模型水平,还通过外部专家审核方法论,设 50 万美元红队测试挑战赛优化安全。

市场影响

降低大型 AI 模型使用门槛,助力资源受限组织部署;推动开放模型安全标准建立,其安全评估方法为行业参考;适配多硬件与平台,促进 AI 民主化,加速边缘设备、本地推理等场景创新,为开放模型生态提供高性能范例。

相关测评:《开源新SOTA? Open AI GPT-OSS系列模型对决国产开源模型评测》

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (20)

API描述接口地址请求方法稳定性参数说明
Chat(LLaMA3.3)
POST
稳定
查看详情
Chat(LLaMA3.2多模态)
POST
稳定
查看详情
Chat(LLaMA3.1)
POST
稳定
查看详情
Chat(Mixtral-8x7B)
POST
稳定
查看详情
Chat(Gemma-7B)
POST
稳定
查看详情
Chat(Gemma2-9B)
POST
稳定
查看详情
Chat(Command R+)
POST
稳定
查看详情
Command R
POST
稳定
查看详情
Chat(Qwen2)
POST
稳定
查看详情
Chat(Qwen2.5)
POST
稳定
查看详情
Chat(Llama-3.1-nemotron)
POST
稳定
查看详情
Chat(Mistral)
POST
稳定
查看详情
Chat(Pixtral-Large-2411多模态)
POST
稳定
查看详情
Chat(QwQ-32B-Preview)
POST
稳定
查看详情
Marco-o1
POST
稳定
查看详情
QVQ-72B-Preview
POST
稳定
查看详情
QwQ-32B
POST
稳定
查看详情
Gemma-3-27b-it
POST
稳定
查看详情
Qwen3
POST
稳定
查看详情
Chat(LLaMA4)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

gpt-oss-120b

-
128000

输入$0.2 / 1M tokens
输出$1 / 1M tokens

输入$0.2/ 1M tokens
输出$1/ 1M tokens
原价