baidu/ernie-4.5-0.3b

baidu/ernie-4.5-0.3b

百度推出的轻量级稠密语言模型,适用于端侧部署与低成本推理场景
2025-08-04
语言大模型
Model capability: function_call
输入:
免费
输出:
免费
大额采购联系客户经理享专属优惠

API介绍

ERNIE-4.5-0.3B 是百度推出的轻量级稠密语言模型,作为文心4.5系列中最小规格的开源模型,核心定位为“低资源、高效率的通用语言理解与生成引擎”,适用于端侧部署与低成本推理场景。

  • 极致轻量:仅3亿参数,支持在手机、嵌入式设备等资源受限环境运行
  • 高效推理:基于飞桨框架优化,支持超长上下文(32K tokens),响应迅速
  • 开箱即用:提供PyTorch与PaddlePaddle双格式,FastDeploy一行代码部署
  • 协议兼容:API接口兼容OpenAI,无缝接入现有LLM应用生态
  • 完全开源:Apache 2.0协议开放,支持商业与学术用途,配套ERNIEKit精调工具链

───────────────────────────────────────────────────────────────────

核心能力

📱 端侧友好:3亿参数极致压缩,内存占用低,适合移动端/边缘设备部署

长上下文支持:最大32768 tokens,轻松处理长文档摘要、对话历史等场景

🔌 OpenAI兼容:FastDeploy部署后提供标准OpenAI API,零成本迁移现有应用

🛠️ 全栈工具链:ERNIEKit支持LoRA、DPO、量化等后训练技术,快速定制领域模型

🔓 商业友好开源:Apache 2.0协议,无使用限制,支持私有化部署与二次开发

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(PPIO派欧云)
POST
稳定
查看详情

API价格表

$
模型说明上下文302.AI价格

baidu/ernie-4.5-0.3b

-
120000

输入免费
输出免费
原价