step-3.5-flash

step-3.5-flash

阶跃星辰的旗舰语言推理模型
2026-02-02
语言大模型
Model capability: imageModel capability: thinkingModel capability: function_call
输入:
$0.11/1M tokens
输出:
$0.33/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

阶跃星辰的旗舰语言推理模型,该模型具备顶尖推理能力与快速可靠的执行能力,能够完成对复杂任务的分解、计划,可快速可靠地调用工具执行任务,胜任逻辑推理、数学、软件工程、深度研究等各种复杂任务。上下文长度为256K,核心定位为“轻激活、高密度的高效智能体引擎”,专为实时交互、复杂推理与代码任务打造

  • 稀疏高效架构:基于196B总参数的MoE模型,每token仅激活11B参数,实现“大模型能力+小模型速度”的极致平衡。
  • 超高速生成搭载:3路多令牌预测(MTP-3),典型场景达100–300 tok/s,单流编码峰值350 tok/s,响应近乎实时。
  • 智能体性能领先:在SWE-bench Verified(74.4%)和Terminal-Bench 2.0(51.0%)等权威基准中表现优异,稳定性强。
  • 长上下文优化:支持256K上下文,采用3:1滑动窗口注意力(SWA),大幅降低计算开销而不损性能。
  • 本地友好部署:可在Mac Studio M4 Max、NVIDIA DGX Spark等消费级高端硬件运行,保障数据隐私与低延迟。

───────────────────────────────────────────────────────────────────

核心能力

极速推理引擎

  • MTP-3技术一次前向预测4个token,显著加速生成,编码任务快如闪电。
  • 激活参数仅11B,推理成本约为同类MoE模型的1/6–1/18,性价比突出。

🧰 专业智能体底座

  • 集成可扩展RL框架,支持持续自我改进,擅长长周期、多步骤任务。
  • 在BrowseComp-ZH(73.7)、GAIA(84.5)、AIME 2025(97.3)等中英文推理基准全面领先。

🧠 高密度智能

  • 288专家+1共享专家的细粒度路由,保留196B模型“记忆”,执行效率媲美11B模型。
  • 支持Parallel Thinking机制,在xbench-DeepSearch等任务上进一步提升表现。

───────────────────────────────────────────────────────────────────

测试数据

step-bar-chart.png

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(阶跃星辰多模态)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

step-3.5-flash

-
256000

输入$0.1 / 1M tokens
输出$0.3 / 1M tokens

输入$0.11/ 1M tokens
输出$0.33/ 1M tokens
10%