pixtral-large-2411

pixtral-large-2411

基于Mistral Large 2构建,具备前沿级别的图像理解能力
2024-11-18
语言大模型
Model capability: imageModel capability: function_call
输入:
$2.2/1M tokens
输出:
$6.6/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

Pixtral Large Instruct 2411 是 Mistral AI 推出的旗舰级多模态语言模型,核心定位为“高精度图文理解+高效推理”的专业级视觉语言引擎。

  • 原生多模态架构:直接处理任意分辨率图像与长文本混合输入,无需额外视觉编码器
  • 超长上下文支持:支持高达 128K token 上下文,可同时解析多张高分辨率图片与长文档
  • 复杂视觉任务领先:在图表理解、界面解析、多图对比等高难度任务中表现超越多数开源及闭源模型
  • 多语言图文能力:支持英语、中文、法语、德语等主流语言的图像描述、问答与内容生成

───────────────────────────────────────────────────────────────────

核心能力

👁️ 像素级图文对齐:能精准定位图像中的文字、图标、表格区域,并结合上下文进行语义推理

📊 结构化视觉解析:自动提取截图中的按钮、菜单、数据图表,转化为可操作的 UI 描述或代码

🌍 跨语言视觉理解:看懂中文海报、德语说明书或阿拉伯界面,并用对应语言准确解释内容

🧩 智能体就绪设计:支持图文联合指令(如“根据这三张产品图写电商详情页”),无缝集成自动化工作流

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(Pixtral-Large-2411多模态)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

pixtral-large-2411

-
128000

输入$2 / 1M tokens
输出$6 / 1M tokens

输入$2.2/ 1M tokens
输出$6.6/ 1M tokens
10%