baidu/ernie-4-5-vl-424b-a47b

baidu/ernie-4-5-vl-424b-a47b

百度推出的旗舰级多模态大模型,支持思考与非思考双模式的高性能视觉语言理解引擎
2025-08-04
语言大模型
Model capability: function_call
输入:
$0.429/1M tokens
输出:
$1.29/1M tokens
大额采购联系客户经理享专属优惠

API介绍

ERNIE-4.5-VL-424B-A47B 是百度推出的旗舰级多模态大模型,基于文心4.5系列的混合专家(MoE)架构,总参数量高达424B、激活参数47B,核心定位为“支持思考与非思考双模式的高性能视觉语言理解引擎”。

  • 双模推理领先:思考模式下在MathVista、MMMU等高难度多模态推理任务上逼近甚至超越OpenAI-o1,非思考模式在CV-Bench等感知类任务保持顶尖表现  
  • 架构创新:采用多模态异构MoE结构,通过跨模态参数共享+专用空间保留,实现文本与视觉能力协同增强  
  • 效果效率兼优:相比Qwen2.5-VL系列,轻量版(28B-A3B)已具竞争力,旗舰版性能全面领跑多模态SOTA榜单  
  • 产业友好:基于飞桨训练部署,支持4-bit/2-bit无损量化、OpenAI协议兼容,开箱即用FastDeploy部署  
  • 开源开放:模型权重按Apache 2.0协议开源,支持学术研究与商业应用,配套ERNIEKit精调套件

───────────────────────────────────────────────────────────────────

核心能力  

👁️ 双模智能理解:独家支持“思考/非思考”切换,复杂推理与实时感知无缝兼顾  

MoE高效架构:47B激活参数实现424B总规模性能,推理成本显著低于同级稠密模型  

📊 多模态SOTA:在MathVista、MMMU、VisualPuzzle等10+权威基准全面超越竞品  

🛠️ 产业级部署:FastDeploy支持一行代码部署,兼容vLLM/OpenAI协议,适配多芯片平台  

🔐 全链路开源:Apache 2.0许可开放模型权重,ERNIEKit提供LoRA、DPO、量化等精调工具  

🇨🇳 中文场景优化:深度适配中文图文理解,在图表解析、文档问答等本土任务表现突出

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(PPIO派欧云)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

baidu/ernie-4.5-vl-424b-a47b

-
123000

输入$0.429 / 1M tokens
输出$1.29 / 1M tokens

输入$0.429/ 1M tokens
输出$1.29/ 1M tokens
原价