企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

glm-4-airx

智谱AI推出的高性能级语言模型，低延时、高并发的智能体任务执行引擎，在工具调用、实时响应及复杂逻辑处理中表现卓越

2025-04-14

语言大模型

输入:

$1.4/1M tokens

输出:

$1.4/1M tokens

大额采购联系客户经理享专属优惠

API介绍

GLM-4-AirX 是智谱AI推出的高性能级语言模型，核心定位为低延时、高并发的智能体任务执行引擎，在工具调用、实时响应及复杂逻辑处理中表现卓越。

性能对标国际顶级模型：在BFCL-v3（综合工具调用）、TAU-Bench（智能体任务）等评测中，部分指标接近甚至超越GPT-4o、DeepSeek-V3等更大模型。
强化学习优化原子能力：通过拒绝采样和强化学习技术，显著提升指令遵循、代码生成、函数调用等智能体核心任务表现。
毫秒级超低延迟响应：推理环节优化prefill和decoder自回归输出阶段，实现更快响应速度，适配实时交互场景。
高并发企业级保障：V3等级用户支持最高500次并发，满足金融风控、电商客服等高频调用需求。
极致性价比优势：作为GLM-4-Air的高速版本，在速度与并发能力上全面升级，调用成本低于同类旗舰模型30%+。

───────────────────────────────────────────────────────────────────

核心能力

⚡ 毫秒级实时响应：

优化推理架构，复杂逻辑处理进入毫秒级，保障多轮对话/实时检索的流畅性

🔧 智能工具调用：

强化函数调用（Function Call）能力，无缝对接搜索/数据库等外部系统

🤖 智能体任务优化：

专项提升指令遵循与代码生成能力，适配智能体所需的原子任务执行场景

📈 高并发企业保障：

V3用户享500次并发支持，满足金融/电商等高频交互场景的稳定性需求

🌐 多场景深度适配：

兼顾代码生成、工具集成、实时响应等需求，成为企业级智能体核心引擎

Playground

登录后，探索更多精彩功能！点击登录

API统计

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
Chat（智谱GLM-4）	https://api.302.ai/v1/chat/completions	POST	稳定	查看详情
暂无数据

API价格表

$￥円 ₽

模型	说明	上下文	官网原价	302.AI价格

glm-4-airx

8000

glm-4-airx

API介绍

核心能力

Playground

API统计

API列表 (1)

API价格表

glm-4-airx

输入$1.4 / 1M tokens
输出$1.4 / 1M tokens

输入$1.4/ 1M tokens
输出$1.4/ 1M tokens
原价

猜你喜欢

快捷访问

帮助与支持

法律声明

glm-4-airx

API介绍

核心能力

Playground

API统计

API列表 (1)

API价格表

glm-4-airx

输入$1.4 / 1M tokens输出$1.4 / 1M tokens

输入$1.4/ 1M tokens输出$1.4/ 1M tokens原价

猜你喜欢

输入$1.4 / 1M tokens
输出$1.4 / 1M tokens

输入$1.4/ 1M tokens
输出$1.4/ 1M tokens
原价