
gpt-oss-20b
API介绍
基本信息
GPT-OSS-20B 是 OpenAI 于 2025 年 8 月 5 日推出的轻量级开放权重语言模型,隶属 GPT-OSS 系列,采用灵活的 Apache 2.0 许可证,可免费商用。模型总参数 210 亿,每个令牌激活 3.6 亿参数,兼容 OpenAI 回复 API,适配智能体工作流。部署门槛极低,仅需 16GB 内存即可在边缘设备运行,权重已在 Hugging Face 开源,原生量化为 MXFP4 格式,支持 PyTorch、Apple Metal 及 Windows ONNX Runtime 等多平台推理,还与 Azure、AWS、Ollama 等主流部署平台达成合作。
核心特性
性能对标 OpenAI o3-mini,在竞赛数学(AIME 2024/2025)、医疗(HealthBench)等场景表现更优;支持 128k 长上下文与 “o200k_harmony” 令牌化器,可处理多领域长文本任务;具备工具使用与少样本函数调用能力,能完成网页搜索、代码执行等操作;提供低 / 中 / 高三级推理强度调节,开发者可通过系统消息快速设置,平衡延迟与任务需求。
技术亮点
采用专家混合(MoE)架构,24 层结构含 32 个专家,每个令牌激活 4 个专家,兼顾效率与性能;创新非监督式思维链(CoT),未受直接对齐监督,便于监测异常行为;经严格安全训练,在《防范准备框架》下通过对抗性微调测试,内部安全基准达前沿模型水平,还支持结构化输出,适配定制化开发需求。
市场影响
大幅降低 AI 模型部署成本,助力小型组织、资源受限行业及新兴市场应用;推动边缘设备 AI 落地,适用于本地推理、低延迟场景;其开放特性与安全设计为行业树立轻量级开放模型标杆,加速 AI 民主化,同时为研究社区提供非监督式 CoT 与安全评估的实践范例。
Playground
登录后,探索更多精彩功能! 点击登录