qvq-plus-latest

qvq-plus-latest

通义千问QVQ视觉推理模型增强版
2025-06-03
语言大模型
Model capability: imageModel capability: video
输入:
$0.29/1M tokens
输出:
$0.72/1M tokens
大额采购联系客户经理享专属优惠

API介绍

QVQ是阿里巴巴通义实验室推出的实验性多模态推理模型,核心定位为“更强视觉理解 + 深度复杂推理”的开源视觉语言研究基座。

  • 卓越视觉推理能力:基于 Qwen2-VL-72B 构建,在 MMMU、MathVista、MathVision、OlympiadBench 等高难度多模态评测中显著超越原模型,尤其在数学与科学领域表现突出
  • 复杂任务分步求解:支持细致的逐步推理(step-by-step reasoning),能对物理题、几何图、学术图表等进行逻辑拆解与严谨推导
  • 多学科综合理解:覆盖大学级数学、物理、化学、生物等学科内容,可处理奥林匹克竞赛级别及中国高考真题

───────────────────────────────────────────────────────────────────

核心能力

👁️ 高阶视觉解析:精准理解函数图像、电路图、分子结构、几何证明图等专业视觉内容

🧠 跨模态深度推理:结合图像信息与符号逻辑,完成如“根据表格求导数”“从论文配图推断实验结论”等复杂任务

🧮 数学竞赛级解题:在真实数学竞赛题(如 MathVision)上展现接近人类选手的解题思路与准确性

🔍 专家级注释对齐:训练中融入 OlympiadBench 的专家逐步推理标注,输出过程更符合教学与科研规范

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (3)

API描述接口地址请求方法稳定性参数说明
Chat(通义千问)
POST
稳定
查看详情
Chat(通义千问-VL)
POST
稳定
查看详情
Chat(通义千问-OCR)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

qvq-plus-latest

-
128000

输入$0.29 / 1M tokens
输出$0.72 / 1M tokens

输入$0.29/ 1M tokens
输出$0.72/ 1M tokens
原价