gpt-oss-20b

gpt-oss-20b

低延迟的中型开放权重模型
2025-08-05
语言大模型
输入:
$0.1/1M tokens
输出:
$0.5/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

基本信息

GPT-OSS-20B 是 OpenAI 于 2025 年 8 月 5 日推出的轻量级开放权重语言模型,隶属 GPT-OSS 系列,采用灵活的 Apache 2.0 许可证,可免费商用。模型总参数 210 亿,每个令牌激活 3.6 亿参数,兼容 OpenAI 回复 API,适配智能体工作流。部署门槛极低,仅需 16GB 内存即可在边缘设备运行,权重已在 Hugging Face 开源,原生量化为 MXFP4 格式,支持 PyTorch、Apple Metal 及 Windows ONNX Runtime 等多平台推理,还与 Azure、AWS、Ollama 等主流部署平台达成合作。

核心特性

性能对标 OpenAI o3-mini,在竞赛数学(AIME 2024/2025)、医疗(HealthBench)等场景表现更优;支持 128k 长上下文与 “o200k_harmony” 令牌化器,可处理多领域长文本任务;具备工具使用与少样本函数调用能力,能完成网页搜索、代码执行等操作;提供低 / 中 / 高三级推理强度调节,开发者可通过系统消息快速设置,平衡延迟与任务需求。

技术亮点

采用专家混合(MoE)架构,24 层结构含 32 个专家,每个令牌激活 4 个专家,兼顾效率与性能;创新非监督式思维链(CoT),未受直接对齐监督,便于监测异常行为;经严格安全训练,在《防范准备框架》下通过对抗性微调测试,内部安全基准达前沿模型水平,还支持结构化输出,适配定制化开发需求。

市场影响

大幅降低 AI 模型部署成本,助力小型组织、资源受限行业及新兴市场应用;推动边缘设备 AI 落地,适用于本地推理、低延迟场景;其开放特性与安全设计为行业树立轻量级开放模型标杆,加速 AI 民主化,同时为研究社区提供非监督式 CoT 与安全评估的实践范例。

相关测评:《开源新SOTA? Open AI GPT-OSS系列模型对决国产开源模型评测》

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(聊天)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

gpt-oss-20b

-
128000

输入$0.1 / 1M tokens
输出$0.5 / 1M tokens

输入$0.1/ 1M tokens
输出$0.5/ 1M tokens
原价