
baidu/ernie-4.5-0.3b
百度推出的轻量级稠密语言模型,适用于端侧部署与低成本推理场景
2025-08-04
输入:
免费
输出:
免费
大额采购联系客户经理享专属优惠
API介绍
ERNIE-4.5-0.3B 是百度推出的轻量级稠密语言模型,作为文心4.5系列中最小规格的开源模型,核心定位为“低资源、高效率的通用语言理解与生成引擎”,适用于端侧部署与低成本推理场景。
- 极致轻量:仅3亿参数,支持在手机、嵌入式设备等资源受限环境运行
- 高效推理:基于飞桨框架优化,支持超长上下文(32K tokens),响应迅速
- 开箱即用:提供PyTorch与PaddlePaddle双格式,FastDeploy一行代码部署
- 协议兼容:API接口兼容OpenAI,无缝接入现有LLM应用生态
- 完全开源:Apache 2.0协议开放,支持商业与学术用途,配套ERNIEKit精调工具链
───────────────────────────────────────────────────────────────────
核心能力
📱 端侧友好:3亿参数极致压缩,内存占用低,适合移动端/边缘设备部署
⚡ 长上下文支持:最大32768 tokens,轻松处理长文档摘要、对话历史等场景
🔌 OpenAI兼容:FastDeploy部署后提供标准OpenAI API,零成本迁移现有应用
🛠️ 全栈工具链:ERNIEKit支持LoRA、DPO、量化等后训练技术,快速定制领域模型
🔓 商业友好开源:Apache 2.0协议,无使用限制,支持私有化部署与二次开发
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽