
step-3.5-flash
阶跃星辰的旗舰语言推理模型
2026-02-02
输入:
$0.11/1M tokens
输出:
$0.33/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
阶跃星辰的旗舰语言推理模型,该模型具备顶尖推理能力与快速可靠的执行能力,能够完成对复杂任务的分解、计划,可快速可靠地调用工具执行任务,胜任逻辑推理、数学、软件工程、深度研究等各种复杂任务。上下文长度为256K,核心定位为“轻激活、高密度的高效智能体引擎”,专为实时交互、复杂推理与代码任务打造
- 稀疏高效架构:基于196B总参数的MoE模型,每token仅激活11B参数,实现“大模型能力+小模型速度”的极致平衡。
- 超高速生成搭载:3路多令牌预测(MTP-3),典型场景达100–300 tok/s,单流编码峰值350 tok/s,响应近乎实时。
- 智能体性能领先:在SWE-bench Verified(74.4%)和Terminal-Bench 2.0(51.0%)等权威基准中表现优异,稳定性强。
- 长上下文优化:支持256K上下文,采用3:1滑动窗口注意力(SWA),大幅降低计算开销而不损性能。
- 本地友好部署:可在Mac Studio M4 Max、NVIDIA DGX Spark等消费级高端硬件运行,保障数据隐私与低延迟。
───────────────────────────────────────────────────────────────────
核心能力
⚡ 极速推理引擎:
- MTP-3技术一次前向预测4个token,显著加速生成,编码任务快如闪电。
- 激活参数仅11B,推理成本约为同类MoE模型的1/6–1/18,性价比突出。
🧰 专业智能体底座:
- 集成可扩展RL框架,支持持续自我改进,擅长长周期、多步骤任务。
- 在BrowseComp-ZH(73.7)、GAIA(84.5)、AIME 2025(97.3)等中英文推理基准全面领先。
🧠 高密度智能:
- 288专家+1共享专家的细粒度路由,保留196B模型“记忆”,执行效率媲美11B模型。
- 支持Parallel Thinking机制,在xbench-DeepSearch等任务上进一步提升表现。
───────────────────────────────────────────────────────────────────
测试数据

Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽