SenseNova-V6-Reasoner

SenseNova-V6-Reasoner

商汤基于多模态理解的慢思考和深度推理模型
2025-04-09
语言大模型
Model capability: image
输入:
$0.66/1M tokens
输出:
$2.53/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

SenseNova-V6-Reasoner(日日新V6 Reasoner)是商汤科技(SenseTime)推出的新一代多模态深度推理大模型,核心定位为“对标 OpenAI o1 的原生多模态推理引擎”,旨在通过强化学习与长思维链技术解决复杂的跨模态逻辑难题。

  • 多模态深度推理: 专门针对复杂逻辑设计,在多模态推理(Multimodal Reasoning)任务上表现突出。根据评测数据,其性能在发布时对标并部分超越了 OpenAI o1 以及 Gemini 2.0 Flash-thinking,处于行业第一梯队。
  • 超长思维链(CoT)支持: 训练中使用了超过 200B 的高质量多模态长思维链数据,支持模型进行“慢思考”。思维链长度最高可达 64K tokens,能够处理极高复杂度的推理过程。
  • 強化学习驱动: 采用了面向图文任务的混合增强学习框架,通过多奖励模型和不同难度分级的训练,使模型在面对未知或高难度问题时具有更强的自纠错和逻辑拆解能力。
  • 极致的数理与数据分析: 在数学推理、代码编写及专业图表分析方面具有显著优势。其数据分析能力(Data Analysis)被认为大幅领先于 GPT-4o。
  • 全模态原生融合: 基于商汤 6000 亿参数的混合专家架构(MoE)构建,实现文本、图像、音频、视频及时间逻辑的统一编码,支持对长达 10 分钟的中长视频进行全帧率深度解析。

───────────────────────────────────────────────────────────────────

核心能力

👁️ 高精视觉感知: 具备极强的视觉理解精度,能精准识别手写体、复杂电路图、科学仪器读数及医学影像等细节信息。

🧠 长思维链思考: 针对复杂问题提供详尽的推理步骤(Step-by-step),不仅给出最终答案,还能清晰展示“思考过程”,适用于科研和教学场景。

🧮 专业级数理能力: 可处理从奥数级别(Olympiad-level)到大学水平的理科题目,支持“根据手写草稿进行逻辑推导”及“图表数据的深层趋势预测”。

🎬 长视频全局记忆: 凭借其独特的“全局记忆”技术,能够打破短视频限制,对长视频中的因果关系、隐喻内容进行逻辑分析与总结。

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(商汤日日新)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

SenseNova-V6-Reasoner

-
32000

输入$0.6 / 1M tokens
输出$2.3 / 1M tokens

输入$0.66/ 1M tokens
输出$2.53/ 1M tokens
10%