gemini-3.1-flash-lite-preview

gemini-3.1-flash-lite-preview

gemini最新的轻量版模型,性价比极高
2026-03-04
语言大模型
Model capability: imageModel capability: function_call
输入:
$0.25/1M tokens
输出:
$1.5/1M tokens
大额采购联系客户经理享专属优惠

API介绍

Gemini 3.1 Flash-Lite Preview 是 Google Gemini 3.1 系列中主打“轻量与极致成本”的预览模型。它专门为处理海量、高频的自动化任务而生,在保持高质量处理表现的同时,最大限度地压缩了计算资源消耗。该模型通过精简的架构设计,实现了卓越的吞吐量与极低的调用成本,是需要大规模任务处理、即时翻译、批量内容清洗以及高频 API 调用场景下的性能之选。

───────────────────────────────────────────────────────────────────

核心能力

极致成本领先 作为该系列最具性价比的模型,它能够显著降低大规模任务的单位处理成本,帮助企业在扩展 AI 应用时有效控制运营费用。

高吞吐与低延迟 针对高并发请求进行深度优化,在高负载环境下依然能保持快速的响应速度和持续的输出稳定性。

稳健的任务处理力 虽然定位于“轻量化”,但依然保留了 Gemini 3.1 的核心处理逻辑,能够高效完成包括翻译、摘要、基础逻辑判断在内的各类结构化数据处理任务。

平滑的 Agent 协作 极其适合作为 Agent 编排中的“先行官”模型,快速过滤信息、处理简单请求,将复杂任务交给更深度的模型处理,从而优化整体链路效率。

───────────────────────────────────────────────────────────────────

相关测评

比快、比省,而非拼上限:从实测看 Gemini 3.1 Flash-Lite 的能力边界与取舍


Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (3)

API描述接口地址请求方法稳定性参数说明
v1beta(官方格式-聊天)
POST
稳定
查看详情
Chat(聊天)
POST
稳定
查看详情
Chat(分析图片)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

gemini-3.1-flash-lite-preview

-
1000000

输入$0.25 / 1M tokens
输出$1.5 / 1M tokens

输入$0.25/ 1M tokens
输出$1.5/ 1M tokens
原价