企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

baidu/ernie-4.5-21B-a3b

百度推出的高效能混合专家（MoE）大语言模型，核心定位为“小激活、大能力”的轻量级旗舰文本模型

2025-08-04

语言大模型

输入:

$0.0715/1M tokens

输出:

$0.286/1M tokens

大额采购联系客户经理享专属优惠

API介绍

ERNIE-4.5-21B-A3B 是百度推出的高效能混合专家（MoE）大语言模型，总参数210亿、激活参数仅30亿，核心定位为“小激活、大能力”的轻量级旗舰文本模型，兼顾高性能推理与低计算成本。

参数高效设计：21B总参数中每 token 仅激活3B，显著降低推理资源消耗，性价比优于稠密30B级模型
长上下文支持：最大上下文长度达120000 tokens，轻松处理长文档、复杂对话等场景
多模态架构复用：虽为纯文本模型，但复用文心4.5多模态MoE结构，含64个文本专家（激活6个）+2个共享专家
性能超越竞品：在BBH、CMATH等推理与数学基准上超越Qwen3-30B-A3B，实现“更小更强”
全生态兼容：提供PyTorch/飞桨双格式，支持vLLM、OpenAI协议，FastDeploy一行部署，Apache 2.0开源商用

───────────────────────────────────────────────────────────────────

核心能力

⚡ 高效MoE推理：仅激活3B参数实现21B模型性能，推理成本大幅低于同级稠密模型

📚 131K超长上下文：支持超长文本理解与生成，适用于法律、科研、客服等复杂场景

🧠 专家协同架构：64个文本专家+动态路由机制，精准匹配任务需求，提升生成质量

🏆 SOTA推理能力：在数学、逻辑、知识问答等任务上超越更大参数竞品

🛠️ 开箱即用生态：兼容transformers/vLLM，FastDeploy支持OpenAI API，快速集成现有系统

🔓 商业友好开源：Apache 2.0协议开放，支持精调（SFT/DPO/UPO）、量化、私有部署

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（PPIO派欧云）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	官网原价	302.AI价格