企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

gpt-oss-20b

低延迟的中型开放权重模型

2025-08-05

语言大模型

输入:

$0.1/1M tokens

输出:

$0.5/1M tokens

大额采购联系客户经理享专属优惠

稳定性

稳定

API介绍

基本信息

GPT-OSS-20B 是 OpenAI 于 2025 年 8 月 5 日推出的轻量级开放权重语言模型，隶属 GPT-OSS 系列，采用灵活的 Apache 2.0 许可证，可免费商用。模型总参数 210 亿，每个令牌激活 3.6 亿参数，兼容 OpenAI 回复 API，适配智能体工作流。部署门槛极低，仅需 16GB 内存即可在边缘设备运行，权重已在 Hugging Face 开源，原生量化为 MXFP4 格式，支持 PyTorch、Apple Metal 及 Windows ONNX Runtime 等多平台推理，还与 Azure、AWS、Ollama 等主流部署平台达成合作。

核心特性

性能对标 OpenAI o3-mini，在竞赛数学（AIME 2024/2025）、医疗（HealthBench）等场景表现更优；支持 128k 长上下文与 “o200k_harmony” 令牌化器，可处理多领域长文本任务；具备工具使用与少样本函数调用能力，能完成网页搜索、代码执行等操作；提供低 / 中 / 高三级推理强度调节，开发者可通过系统消息快速设置，平衡延迟与任务需求。

技术亮点

采用专家混合（MoE）架构，24 层结构含 32 个专家，每个令牌激活 4 个专家，兼顾效率与性能；创新非监督式思维链（CoT），未受直接对齐监督，便于监测异常行为；经严格安全训练，在《防范准备框架》下通过对抗性微调测试，内部安全基准达前沿模型水平，还支持结构化输出，适配定制化开发需求。

市场影响

大幅降低 AI 模型部署成本，助力小型组织、资源受限行业及新兴市场应用；推动边缘设备 AI 落地，适用于本地推理、低延迟场景；其开放特性与安全设计为行业树立轻量级开放模型标杆，加速 AI 民主化，同时为研究社区提供非监督式 CoT 与安全评估的实践范例。

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（聊天）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	官网原价	302.AI价格

gpt-oss-20b

128000

gpt-oss-20b

API介绍

基本信息

核心特性

技术亮点

市场影响

Playground

API统计

API列表 (1)

API价格表

gpt-oss-20b

输入$0.1 / 1M tokens
输出$0.5 / 1M tokens

输入$0.1/ 1M tokens
输出$0.5/ 1M tokens
原价

猜你喜欢

快捷访问

帮助与支持

法律声明

gpt-oss-20b

API介绍

基本信息

核心特性

技术亮点

市场影响

Playground

API统计

API列表 (1)

API价格表

gpt-oss-20b

输入$0.1 / 1M tokens输出$0.5 / 1M tokens

输入$0.1/ 1M tokens输出$0.5/ 1M tokens原价

猜你喜欢

输入$0.1 / 1M tokens
输出$0.5 / 1M tokens

输入$0.1/ 1M tokens
输出$0.5/ 1M tokens
原价