
THUDM/GLM-4.1V-9B-Thinking
智谱AI(THUDM)推出的支持思维链推理的高性能视觉语言模型
2025-07-22
价格:
大额采购联系客户经理享专属优惠
API介绍
GLM-4.1V-9B-Thinking 是智谱AI(THUDM)推出的推理优先型多模态大模型,基于GLM-4-9B架构,总参数约90亿,核心定位为“支持思维链推理的高性能视觉语言模型”,在10B级VLM中实现SOTA表现,甚至超越72B级竞品。
- 推理能力突破:首次在GLM-V系列引入“思考范式”,通过强化学习增强复杂任务推理能力,在28项基准中23项领先10B级模型
- 性能越级对标:在18项任务上超越Qwen2.5-VL-72B,展现“小模型大智能”的高效设计
- 超长上下文支持:支持64K上下文长度,适配长文档、多轮图文对话等复杂场景
- 高分辨率兼容:支持任意宽高比图像输入,最高达4K分辨率,细节捕捉更精准
- 双语开源开放:中英双语理解与生成能力,Apache协议开源(基础版GLM-4.1V-9B-Base同步开放)
───────────────────────────────────────────────────────────────────
核心能力
🧠 思维链推理:独家“Thinking Mode”显著提升答案准确性、逻辑性与可解释性
📊 SOTA多模态表现:10B级模型中23项基准第一,18项超越72B大模型
🖼️ 4K高分辨理解:支持任意比例图像,最高输入4K,精准解析图表、文档、场景
📚 64K长上下文:轻松处理多图+长文本混合输入,适用于教育、科研、客服等场景
🇨🇳 中英双语原生支持:专为中文场景优化,同时具备强大英文理解能力
🔓 开源可商用:基础模型与推理模型双开源,支持研究与产业级部署
Playground
登录后,探索更多精彩功能! 点击登录
API统计
API列表 (1)
API价格表
$¥ 円 ₽