
gemini-3.1-flash-lite-preview
gemini最新的轻量版模型,性价比极高
2026-03-04
输入:
$0.25/1M tokens
输出:
$1.5/1M tokens
大额采购联系客户经理享专属优惠
API介绍
Gemini 3.1 Flash-Lite Preview 是 Google Gemini 3.1 系列中主打“轻量与极致成本”的预览模型。它专门为处理海量、高频的自动化任务而生,在保持高质量处理表现的同时,最大限度地压缩了计算资源消耗。该模型通过精简的架构设计,实现了卓越的吞吐量与极低的调用成本,是需要大规模任务处理、即时翻译、批量内容清洗以及高频 API 调用场景下的性能之选。
───────────────────────────────────────────────────────────────────
核心能力
极致成本领先: 作为该系列最具性价比的模型,它能够显著降低大规模任务的单位处理成本,帮助企业在扩展 AI 应用时有效控制运营费用。
高吞吐与低延迟: 针对高并发请求进行深度优化,在高负载环境下依然能保持快速的响应速度和持续的输出稳定性。
稳健的任务处理力: 虽然定位于“轻量化”,但依然保留了 Gemini 3.1 的核心处理逻辑,能够高效完成包括翻译、摘要、基础逻辑判断在内的各类结构化数据处理任务。
平滑的 Agent 协作: 极其适合作为 Agent 编排中的“先行官”模型,快速过滤信息、处理简单请求,将复杂任务交给更深度的模型处理,从而优化整体链路效率。
───────────────────────────────────────────────────────────────────
相关测评
《比快、比省,而非拼上限:从实测看 Gemini 3.1 Flash-Lite 的能力边界与取舍》
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (3)
API价格表
$¥ 円 ₽