
gemini-2.5-flash-preview-09-2025
适合大规模处理、低延迟、高数据量且需要思考的任务,以及代理应用场景
2025-09-26
输入:
$0.3/1M tokens
输出:
$2.5/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
基本信息
gemini-2.5-flash-preview-09-2025 是 Google 于 2025 年 9 月 25 日推出的 Gemini 2.5 Flash 系列预览版模型,模型标识为 gemini-2.5-flash-preview-09-2025。其知识截止日期为 2025 年 1 月,支持文本、图像、音频等多模态输入,主打高性价比与高效能,适配开发者构建复杂智能体应用及高吞吐量场景。
核心特性
- 智能体工具使用升级:优化工具调用逻辑,在 SWE-bench Verified 编码基准测试中得分从 48.9% 提升至 54%,多步骤、复杂智能体任务处理能力显著增强。
- 成本与效率优化:开启思考模式时,输出令牌消耗减少 24%,降低 latency 与调用成本,同时保持高质量输出,适配成本敏感型大规模应用。
- 多模态能力强化:音频转录准确性、图像理解能力提升,翻译质量优化,可更好处理跨模态任务,满足多样化开发需求。
技术亮点
- 动态思考机制:支持通过参数调节思考预算,可根据任务复杂度自适应调整推理深度,平衡速度与精度,无需在 “快模型” 与 “准模型” 间妥协。
- 稀疏混合专家(MoE)架构:仅激活匹配任务的专家模块,实现大模型能力与低计算成本的平衡,保障百万级上下文处理能力的同时控制资源消耗。
- 生态适配性强:可无缝集成 Google 开发者生态工具,便于快速落地智能体工作流,早期测试反馈显示其在长周期智能体任务中性能提升 15%,助力规模化应用部署。
注:现已支持Gemini原生格式进行调用
相关测评:
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (4)
API价格表
$¥ 円 ₽