
baidu/ernie-4-5-vl-424b-a47b
百度推出的旗舰级多模态大模型,支持思考与非思考双模式的高性能视觉语言理解引擎
2025-08-04
输入:
$0.429/1M tokens
输出:
$1.29/1M tokens
大额采购联系客户经理享专属优惠
API介绍
ERNIE-4.5-VL-424B-A47B 是百度推出的旗舰级多模态大模型,基于文心4.5系列的混合专家(MoE)架构,总参数量高达424B、激活参数47B,核心定位为“支持思考与非思考双模式的高性能视觉语言理解引擎”。
- 双模推理领先:思考模式下在MathVista、MMMU等高难度多模态推理任务上逼近甚至超越OpenAI-o1,非思考模式在CV-Bench等感知类任务保持顶尖表现
- 架构创新:采用多模态异构MoE结构,通过跨模态参数共享+专用空间保留,实现文本与视觉能力协同增强
- 效果效率兼优:相比Qwen2.5-VL系列,轻量版(28B-A3B)已具竞争力,旗舰版性能全面领跑多模态SOTA榜单
- 产业友好:基于飞桨训练部署,支持4-bit/2-bit无损量化、OpenAI协议兼容,开箱即用FastDeploy部署
- 开源开放:模型权重按Apache 2.0协议开源,支持学术研究与商业应用,配套ERNIEKit精调套件
───────────────────────────────────────────────────────────────────
核心能力
👁️ 双模智能理解:独家支持“思考/非思考”切换,复杂推理与实时感知无缝兼顾
⚡ MoE高效架构:47B激活参数实现424B总规模性能,推理成本显著低于同级稠密模型
📊 多模态SOTA:在MathVista、MMMU、VisualPuzzle等10+权威基准全面超越竞品
🛠️ 产业级部署:FastDeploy支持一行代码部署,兼容vLLM/OpenAI协议,适配多芯片平台
🔐 全链路开源:Apache 2.0许可开放模型权重,ERNIEKit提供LoRA、DPO、量化等精调工具
🇨🇳 中文场景优化:深度适配中文图文理解,在图表解析、文档问答等本土任务表现突出
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽