gemini-2.5-flash-preview-09-2025

gemini-2.5-flash-preview-09-2025

适合大规模处理、低延迟、高数据量且需要思考的任务,以及代理应用场景
2025-09-26
语言大模型
Model capability: imageModel capability: function_call
输入:
$0.3/1M tokens
输出:
$2.5/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

基本信息

gemini-2.5-flash-preview-09-2025 是 Google 于 2025 年 9 月 25 日推出的 Gemini 2.5 Flash 系列预览版模型,模型标识为 gemini-2.5-flash-preview-09-2025。其知识截止日期为 2025 年 1 月,支持文本、图像、音频等多模态输入,主打高性价比与高效能,适配开发者构建复杂智能体应用及高吞吐量场景。

核心特性

  • 智能体工具使用升级:优化工具调用逻辑,在 SWE-bench Verified 编码基准测试中得分从 48.9% 提升至 54%,多步骤、复杂智能体任务处理能力显著增强。
  • 成本与效率优化:开启思考模式时,输出令牌消耗减少 24%,降低 latency 与调用成本,同时保持高质量输出,适配成本敏感型大规模应用。
  • 多模态能力强化:音频转录准确性、图像理解能力提升,翻译质量优化,可更好处理跨模态任务,满足多样化开发需求。

技术亮点

  • 动态思考机制:支持通过参数调节思考预算,可根据任务复杂度自适应调整推理深度,平衡速度与精度,无需在 “快模型” 与 “准模型” 间妥协。
  • 稀疏混合专家(MoE)架构:仅激活匹配任务的专家模块,实现大模型能力与低计算成本的平衡,保障百万级上下文处理能力的同时控制资源消耗。
  • 生态适配性强:可无缝集成 Google 开发者生态工具,便于快速落地智能体工作流,早期测试反馈显示其在长周期智能体任务中性能提升 15%,助力规模化应用部署。

注:现已支持Gemini原生格式进行调用

相关测评:

《大模型排行榜第二!Gemini-2.5-flash-preview-05-20全方位对比测评》

《Gemini-2.5-pro vs. Claude-3.7-Sonnet 前端编程能力实战对决》

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (4)

API描述接口地址请求方法稳定性参数说明
v1beta(官方格式-聊天)
POST
稳定
查看详情
Chat(聊天)
POST
稳定
查看详情
Chat(分析图片)
POST
稳定
查看详情
Chat(图片生成)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

gemini-2.5-flash

-
1000000

输入$0.3 / 1M tokens
输出$2.5 / 1M tokens

输入$0.3/ 1M tokens
输出$2.5/ 1M tokens
原价