qwen3-vl-235b-a22b-instruct

qwen3-vl-235b-a22b-instruct

通义千问推出的旗舰级多模态混合专家(MoE)模型
2025-09-24
语言大模型
Model capability: image
输入:
$0.286/1M tokens
输出:
$1.143/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

Qwen3-VL-235B-A22B-Instruct 是阿里巴巴通义实验室推出的超大规模多模态指令微调模型,核心定位为“最强开源视觉语言智能体基座”,专为复杂图文理解与工具协同场景打造。

  • MoE 架构旗舰:总参数 235B,激活参数仅 22B,兼顾顶尖多模态能力与高效推理成本
  • 原生支持长视频与文档:可处理图像、视频、PDF、网页截图等多类型输入,单次支持超长上下文融合分析
  • 智能体能力全面强化:在 GUI 操作、前端代码生成、图表问答等任务中表现领先,支持 Function Calling 与结构化输出
  • 深度思考模式内置:可自动启用链式推理(Chain-of-Thought),对复杂视觉任务分步拆解、逐步求解

───────────────────────────────────────────────────────────────────

核心能力

👁️ 像素级语义理解:精准识别界面元素、图表数据、文档排版,并关联文本指令进行高阶推理

🧠 自主任务规划:面对“根据商品图写电商详情页”或“从财报截图生成分析报告”等需求,能自动规划解析→提取→生成流程

🌍 多语言图文生成:支持中英等多语种的图像描述、解释与创作,输出符合本地文化语境

🧩 智能体无缝协同:原生兼容工具调用协议,可直接驱动浏览器、代码执行器或设计软件,构建端到端自动化工作流

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(通义千问-OCR)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

qwen3-vl-235b-a22b-instruct

-
126976

输入$0.286 / 1M tokens
输出$1.143 / 1M tokens

输入$0.286/ 1M tokens
输出$1.143/ 1M tokens
原价