企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

gemini-2.5-flash-preview-09-2025

适合大规模处理、低延迟、高数据量且需要思考的任务，以及代理应用场景

2025-09-26

语言大模型

输入:

$0.3/1M tokens

输出:

$2.5/1M tokens

大额采购联系客户经理享专属优惠

API介绍

基本信息

gemini-2.5-flash-preview-09-2025 是 Google 于 2025 年 9 月 25 日推出的 Gemini 2.5 Flash 系列预览版模型，模型标识为 gemini-2.5-flash-preview-09-2025。其知识截止日期为 2025 年 1 月，支持文本、图像、音频等多模态输入，主打高性价比与高效能，适配开发者构建复杂智能体应用及高吞吐量场景。

核心特性

智能体工具使用升级：优化工具调用逻辑，在 SWE-bench Verified 编码基准测试中得分从 48.9% 提升至 54%，多步骤、复杂智能体任务处理能力显著增强。
成本与效率优化：开启思考模式时，输出令牌消耗减少 24%，降低 latency 与调用成本，同时保持高质量输出，适配成本敏感型大规模应用。
多模态能力强化：音频转录准确性、图像理解能力提升，翻译质量优化，可更好处理跨模态任务，满足多样化开发需求。

技术亮点

动态思考机制：支持通过参数调节思考预算，可根据任务复杂度自适应调整推理深度，平衡速度与精度，无需在 “快模型” 与 “准模型” 间妥协。
稀疏混合专家（MoE）架构：仅激活匹配任务的专家模块，实现大模型能力与低计算成本的平衡，保障百万级上下文处理能力的同时控制资源消耗。
生态适配性强：可无缝集成 Google 开发者生态工具，便于快速落地智能体工作流，早期测试反馈显示其在长周期智能体任务中性能提升 15%，助力规模化应用部署。

注：现已支持Gemini原生格式进行调用

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (4)

API描述	接口地址	请求方法	稳定性	参数说明
v1beta（官方格式-聊天）	https://api.302.ai/v1beta/models/{model}:generateContent	POST	稳定	查看详情
暂无数据
Chat（聊天）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据
Chat（分析图片）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据
Chat（图片生成）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	官网原价	302.AI价格

gemini-2.5-flash

1000000

gemini-2.5-flash-preview-09-2025

API介绍

基本信息

核心特性

技术亮点

Playground

API统计

API列表 (4)

API价格表

gemini-2.5-flash

输入$0.3 / 1M tokens
输出$2.5 / 1M tokens

输入$0.3/ 1M tokens
输出$2.5/ 1M tokens
原价

猜你喜欢

快捷访问

帮助与支持

法律声明

gemini-2.5-flash-preview-09-2025

API介绍

基本信息

核心特性

技术亮点

Playground

API统计

API列表 (4)

API价格表

gemini-2.5-flash

输入$0.3 / 1M tokens输出$2.5 / 1M tokens

输入$0.3/ 1M tokens输出$2.5/ 1M tokens原价

猜你喜欢

输入$0.3 / 1M tokens
输出$2.5 / 1M tokens

输入$0.3/ 1M tokens
输出$2.5/ 1M tokens
原价