glm-4-airx

glm-4-airx

智谱AI推出的高性能级语言模型,低延时、高并发的智能体任务执行引擎,在工具调用、实时响应及复杂逻辑处理中表现卓越
2025-04-14
语言大模型
Model capability: function_call
输入:
$1.4/1M tokens
输出:
$1.4/1M tokens
大额采购联系客户经理享专属优惠

API介绍

GLM-4-AirX 是智谱AI推出的高性能级语言模型,核心定位为低延时、高并发的智能体任务执行引擎,在工具调用、实时响应及复杂逻辑处理中表现卓越。

  • 性能对标国际顶级模型:在BFCL-v3(综合工具调用)、TAU-Bench(智能体任务)等评测中,部分指标接近甚至超越GPT-4o、DeepSeek-V3等更大模型。
  • 强化学习优化原子能力:通过拒绝采样和强化学习技术,显著提升指令遵循、代码生成、函数调用等智能体核心任务表现。
  • 毫秒级超低延迟响应:推理环节优化prefill和decoder自回归输出阶段,实现更快响应速度,适配实时交互场景。
  • 高并发企业级保障:V3等级用户支持最高500次并发,满足金融风控、电商客服等高频调用需求。
  • 极致性价比优势:作为GLM-4-Air的高速版本,在速度与并发能力上全面升级,调用成本低于同类旗舰模型30%+。

───────────────────────────────────────────────────────────────────

核心能力

⚡ 毫秒级实时响应:

优化推理架构,复杂逻辑处理进入毫秒级,保障多轮对话/实时检索的流畅性

🔧 智能工具调用:

强化函数调用(Function Call)能力,无缝对接搜索/数据库等外部系统

🤖 智能体任务优化:

专项提升指令遵循与代码生成能力,适配智能体所需的原子任务执行场景

📈 高并发企业保障:

V3用户享500次并发支持,满足金融/电商等高频交互场景的稳定性需求

🌐 多场景深度适配:

兼顾代码生成、工具集成、实时响应等需求,成为企业级智能体核心引擎


Playground

登录后,探索更多精彩功能! 点击登录

API统计

API列表 (1)

API描述接口地址请求方法稳定性参数说明
Chat(智谱GLM-4)
POST
稳定
查看详情

API价格表

$
模型说明上下文官网原价302.AI价格

glm-4-airx

-
8000

输入$1.4 / 1M tokens
输出$1.4 / 1M tokens

输入$1.4/ 1M tokens
输出$1.4/ 1M tokens
原价