企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

step-3.5-flash

阶跃星辰的旗舰语言推理模型

2026-02-02

语言大模型

输入:

$0.11/1M tokens

输出:

$0.33/1M tokens

大额采购联系客户经理享专属优惠

API介绍

阶跃星辰的旗舰语言推理模型，该模型具备顶尖推理能力与快速可靠的执行能力，能够完成对复杂任务的分解、计划，可快速可靠地调用工具执行任务，胜任逻辑推理、数学、软件工程、深度研究等各种复杂任务。上下文长度为256K，核心定位为“轻激活、高密度的高效智能体引擎”，专为实时交互、复杂推理与代码任务打造

稀疏高效架构：基于196B总参数的MoE模型，每token仅激活11B参数，实现“大模型能力+小模型速度”的极致平衡。
超高速生成搭载：3路多令牌预测（MTP-3），典型场景达100–300 tok/s，单流编码峰值350 tok/s，响应近乎实时。
智能体性能领先：在SWE-bench Verified（74.4%）和Terminal-Bench 2.0（51.0%）等权威基准中表现优异，稳定性强。
长上下文优化：支持256K上下文，采用3:1滑动窗口注意力（SWA），大幅降低计算开销而不损性能。
本地友好部署：可在Mac Studio M4 Max、NVIDIA DGX Spark等消费级高端硬件运行，保障数据隐私与低延迟。

───────────────────────────────────────────────────────────────────

核心能力

⚡ 极速推理引擎：

MTP-3技术一次前向预测4个token，显著加速生成，编码任务快如闪电。
激活参数仅11B，推理成本约为同类MoE模型的1/6–1/18，性价比突出。

🧰 专业智能体底座：

集成可扩展RL框架，支持持续自我改进，擅长长周期、多步骤任务。
在BrowseComp-ZH（73.7）、GAIA（84.5）、AIME 2025（97.3）等中英文推理基准全面领先。

🧠 高密度智能：

288专家+1共享专家的细粒度路由，保留196B模型“记忆”，执行效率媲美11B模型。
支持Parallel Thinking机制，在xbench-DeepSearch等任务上进一步提升表现。

测试数据

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（阶跃星辰多模态）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	官网原价	302.AI价格

step-3.5-flash

256000

step-3.5-flash

API介绍

核心能力

测试数据

Playground

API统计

API列表 (1)

API价格表

step-3.5-flash

输入$0.1 / 1M tokens
输出$0.3 / 1M tokens

输入$0.11/ 1M tokens
输出$0.33/ 1M tokens
10%

猜你喜欢

快捷访问

帮助与支持

法律声明

step-3.5-flash

API介绍

核心能力

测试数据

Playground

API统计

API列表 (1)

API价格表

step-3.5-flash

输入$0.1 / 1M tokens输出$0.3 / 1M tokens

输入$0.11/ 1M tokens输出$0.33/ 1M tokens 10%

猜你喜欢

输入$0.1 / 1M tokens
输出$0.3 / 1M tokens

输入$0.11/ 1M tokens
输出$0.33/ 1M tokens
10%