
glm-4.6v
智谱高性能视觉理解模型
2025-12-08
输入:
$0.145/1M tokens起
输出:
$0.43/1M tokens起
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
GLM-4.6V 是智谱 AI 推出的旗舰级多模态视觉理解模型,核心定位为高效视觉推理,具备深度思考与流式输出等强大能力。
- 定位清晰:支持多类型输入输出,上下文窗口达 128K tokens,专注旗舰视觉推理。
- 能力多元:有深度思考、视觉理解、流式输出等核心能力。
- 场景丰富:适用于图片理解、视频理解、文档问答等复杂任务。
- 技术领先:原生多模态工具调用,多模态评测基准表现 SOTA。
───────────────────────────────────────────────────────────────────
核心能力
🔍 视觉理解:支持多类型输入,精准识别内容、属性和场景,可用于发票 OCR 等。
🤔 深度思考:思考模式可灵活开关,提升复杂任务处理的推理分析能力。
💬 流式输出:实时生成响应,优化在对话系统等场景中的用户交互体验。
🛠 Function Call:原生支持工具调用,集成外部工具,实现图文混排输出等功能。
⚡ 上下文缓存:智能缓存优化长对话性能,支持高效处理长文本和视频。
───────────────────────────────────────────────────────────────────
相关测评
《GLM-4.6V 实测:当视觉模型学会“动手”,它离“顶尖”还差什么?》
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽