
qvq-plus-latest
通义千问QVQ视觉推理模型增强版
2025-06-03
输入:
$0.29/1M tokens
输出:
$0.72/1M tokens
大额采购联系客户经理享专属优惠
API介绍
QVQ是阿里巴巴通义实验室推出的实验性多模态推理模型,核心定位为“更强视觉理解 + 深度复杂推理”的开源视觉语言研究基座。
- 卓越视觉推理能力:基于 Qwen2-VL-72B 构建,在 MMMU、MathVista、MathVision、OlympiadBench 等高难度多模态评测中显著超越原模型,尤其在数学与科学领域表现突出
- 复杂任务分步求解:支持细致的逐步推理(step-by-step reasoning),能对物理题、几何图、学术图表等进行逻辑拆解与严谨推导
- 多学科综合理解:覆盖大学级数学、物理、化学、生物等学科内容,可处理奥林匹克竞赛级别及中国高考真题
───────────────────────────────────────────────────────────────────
核心能力
👁️ 高阶视觉解析:精准理解函数图像、电路图、分子结构、几何证明图等专业视觉内容
🧠 跨模态深度推理:结合图像信息与符号逻辑,完成如“根据表格求导数”“从论文配图推断实验结论”等复杂任务
🧮 数学竞赛级解题:在真实数学竞赛题(如 MathVision)上展现接近人类选手的解题思路与准确性
🔍 专家级注释对齐:训练中融入 OlympiadBench 的专家逐步推理标注,输出过程更符合教学与科研规范
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (3)
API价格表
$¥ 円 ₽