
pixtral-large-2411
基于Mistral Large 2构建,具备前沿级别的图像理解能力
2024-11-18
输入:
$2.2/1M tokens
输出:
$6.6/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
Pixtral Large Instruct 2411 是 Mistral AI 推出的旗舰级多模态语言模型,核心定位为“高精度图文理解+高效推理”的专业级视觉语言引擎。
- 原生多模态架构:直接处理任意分辨率图像与长文本混合输入,无需额外视觉编码器
- 超长上下文支持:支持高达 128K token 上下文,可同时解析多张高分辨率图片与长文档
- 复杂视觉任务领先:在图表理解、界面解析、多图对比等高难度任务中表现超越多数开源及闭源模型
- 多语言图文能力:支持英语、中文、法语、德语等主流语言的图像描述、问答与内容生成
───────────────────────────────────────────────────────────────────
核心能力
👁️ 像素级图文对齐:能精准定位图像中的文字、图标、表格区域,并结合上下文进行语义推理
📊 结构化视觉解析:自动提取截图中的按钮、菜单、数据图表,转化为可操作的 UI 描述或代码
🌍 跨语言视觉理解:看懂中文海报、德语说明书或阿拉伯界面,并用对应语言准确解释内容
🧩 智能体就绪设计:支持图文联合指令(如“根据这三张产品图写电商详情页”),无缝集成自动化工作流
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽