glm-4.6v

glm-4.6v

智谱高性能视觉理解模型
2025-12-08
语言大模型
Model capability: imageModel capability: function_call
输入:
$0.145/1M tokens
输出:
$0.43/1M tokens
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

GLM-4.6V 是智谱 AI 推出的旗舰级多模态视觉理解模型,核心定位为高效视觉推理,具备深度思考与流式输出等强大能力。

  • 定位清晰:支持多类型输入输出,上下文窗口达 128K tokens,专注旗舰视觉推理。
  • 能力多元:有深度思考、视觉理解、流式输出等核心能力。
  • 场景丰富:适用于图片理解、视频理解、文档问答等复杂任务。
  • 技术领先:原生多模态工具调用,多模态评测基准表现 SOTA。

───────────────────────────────────────────────────────────────────

核心能力

🔍 视觉理解:支持多类型输入,精准识别内容、属性和场景,可用于发票 OCR 等。

🤔 深度思考:思考模式可灵活开关,提升复杂任务处理的推理分析能力。

💬 流式输出:实时生成响应,优化在对话系统等场景中的用户交互体验。

🛠 Function Call:原生支持工具调用,集成外部工具,实现图文混排输出等功能。

⚡ 上下文缓存:智能缓存优化长对话性能,支持高效处理长文本和视频。

───────────────────────────────────────────────────────────────────

相关测评

GLM-4.6V 实测:当视觉模型学会“动手”,它离“顶尖”还差什么?

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(智谱GLM-4V)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

glm-4.6v

输入长度[0, 32k]价格
128000

输入$0.145 / 1M tokens
输出$0.43 / 1M tokens

输入$0.145/ 1M tokens
输出$0.43/ 1M tokens
原价

glm-4.6v

输入长度[32k,128k]价格
128000

输入$0.29 / 1M tokens
输出$0.86 / 1M tokens

输入$0.29/ 1M tokens
输出$0.86/ 1M tokens
原价