企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

baidu/ernie-4.5-21b-a3b-thinking

百度推出的开源混合专家模型，擅长逻辑推理、数学求解与学术分析等复杂任务设计

2025-09-10

语言大模型

输入:

$0.072/1M tokens

输出:

$0.286/1M tokens

大额采购联系客户经理享专属优惠

API介绍

ERNIE-4.5-21B-A3B-Thinking 是百度推出的 210亿参数级开源混合专家模型，核心定位为基于自研飞桨框架的高性能轻量级推理引擎，专为逻辑推理、数学求解与学术分析等复杂任务设计。

高效稀疏架构：采用 MoE 架构，总参数 21B 但每个 Token 仅激活 3B 参数，显著降低计算开销，参数效率极高（性能媲美更大参数模型）。
超长上下文支持：支持 128K 长上下文窗口，经过专属训练能稳定处理海量信息，显著减少幻觉问题，适用于复杂长文本任务。
自研框架底座：不同于主流模型，基于百度自研飞桨（PaddlePaddle）框架训练优化，全球仅百度和谷歌采用此模式，技术自主性强。

───────────────────────────────────────────────────────────────────

核心能力

🧠 深度逻辑与数学推理：内置高效工具调用功能，专为逻辑推理、数学求解设计，在 BBH、CMATH 等基准测试中表现卓越，接近或超越行业巨头竞品。

🚀 独家 MoE 稀疏激活架构：总参数 210亿但每 Token 仅激活 30亿参数，在保持高性能输出的同时大幅降低计算开销，实现高性能与低成本的完美平衡。

📜 海量长文本精准处理：支持 128K 长上下文窗口，经过专属学术级训练，能稳定处理复杂长文本任务（如学术分析），有效避免信息丢失与幻觉。

🛠️ 强大的工具调用与集成：支持结构化函数调用和外部 API 集成，完美适配程序合成、符号推理及多代理（Multi-Agent）工作流场景，扩展性强。

🌐 中英双语与多模态兼容：支持中英双语优化，具备极佳的多模态任务兼容性，基于飞桨框架确保了高效的硬件适配与全球开发者应用的广泛适用性。

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（PPIO派欧云）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	官网原价	302.AI价格