glm-4.6v-flash

glm-4.6v-flash

智谱轻量级视觉理解模型
2025-12-08
语言大模型
Model capability: imageModel capability: function_call
价格:
免费
大额采购联系客户经理享专属优惠
稳定性
稳定

API介绍

GLM-4.6V 是智谱 AI 推出的旗舰级多模态视觉理解模型,GLM-4.6V-Flash是其9B轻量版,专为本地部署与低延迟场景设计,适配普通硬件与主流推理框架,整体表现超过同参数的Qwen3-VL-8B。

  • 定位清晰:支持多类型输入输出,上下文窗口达 128K tokens,专注旗舰视觉推理。
  • 能力多元:有深度思考、视觉理解、流式输出等核心能力。
  • 场景丰富:适用于图片理解、视频理解、文档问答等复杂任务。
  • 技术领先:原生多模态工具调用,多模态评测基准表现 SOTA。

───────────────────────────────────────────────────────────────────

核心能力

🔍 视觉理解:支持多类型输入,精准识别内容、属性和场景,可用于发票 OCR 等。

🤔 深度思考:思考模式可灵活开关,提升复杂任务处理的推理分析能力。

💬 流式输出:实时生成响应,优化在对话系统等场景中的用户交互体验。

🛠 Function Call:原生支持工具调用,集成外部工具,实现图文混排输出等功能。

⚡ 上下文缓存:智能缓存优化长对话性能,支持高效处理长文本和视频。

───────────────────────────────────────────────────────────────────

相关测评

GLM-4.6V 实测:当视觉模型学会“动手”,它离“顶尖”还差什么?

Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(智谱GLM-4V)
POST
稳定
查看详情

API价格表

$
模型说明上下文302.AI价格

glm-4.6v-flash

glm-4.6v-flash
128000

免费