企业级AI资源平台 - 302.AI | 按用量付费，全模型API接入，应用在线使用

GLM-Image

智谱旗舰图像生成模型，采用混合自回归+扩散解码器架构

2026-01-14

图片生成

价格:

$0.016/次

大额采购联系客户经理享专属优惠

API介绍

GLM-Image 是智谱AI推出的旗舰级图像生成模型，核心定位为“认知型生成：全局指令理解 + 局部细节刻画”的新一代多模态生成基座。

混合架构创新：采用「9B 自回归模型 + 7B DiT 扩散解码器」混合架构，兼顾语义理解与高频细节还原，显著改善文字生成准确性
文字密集场景领先：在 CVTG-2K 与 LongText-Bench 榜单中达开源 SOTA，中文文字准确率 0.9788，英文 0.9524，适用于海报、PPT、科普图等知识密集型生成
国产全栈训练：全程基于昇腾 Atlas 800T A2 芯片与 MindSpore 框架完成训练，是首个国产芯片全流程训练的 SOTA 多模态生成模型
灵活分辨率支持：原生支持 1:1、3:4、16:9 等比例，尺寸范围 512×512 至 2048×2048（需为 32 的整数倍），适配多端展示需求

───────────────────────────────────────────────────────────────────

核心能力

🖋️ 精准文字嵌入：在商业海报、招牌、甚至复杂的对话框中渲染出排版准确、笔画工整的中英文。

📽️ 商业海报专家：具备极强的视觉构图与层次感，适用于生成具有设计感的节日海报、品牌宣传图及多样化的社交媒体素材。

🔬 科普逻辑插画：能够理解复杂的提示词逻辑，准确绘制带有标注的科学原理图、流程图，确保画面美观与知识传递的统一。

👥 高质量写实人像：结合 DiT 架构的细节刻画能力，可生成皮肤肌理自然、光影斑驳、发丝纤毫毕现的写实摄影级人像。

📖 连贯多格创作：在生成电商展示图、连环故事画时，能较好地保持主体形象一致性，并能同步优化多处细节文字。

API调试台

登录后，探索更多精彩功能！点击登录

API统计

API列表 (1)

API描述	接口地址	请求方法	稳定性	参数说明
image（文字生成图片）	https://api.302.ai/bigmodel/api/paas/v4/images/generations	POST	稳定	查看详情
文档详情来自智谱的图片生成模型，使用 GLM-Image 等系列模型从文本提示生成高质量图像。通过对用户文字描述快速、精准的理解，让 AI 的图像表达更加精确和个性化。支持模型： glm-image （最新） cogview-4-250304 cogview-4 官方文档：https://open.bigmodel.cn/dev/api/image-model/cogview 价格： cogview-4: 0.01 PTC/次 cogview-4-250304: 0.01 PTC/次 glm-image: 0.016 PTC/次请求参数 Header参数 Authorizationstring 可选示例值:`Bearer {{YOUR_API_KEY}}` Content-Typestring 可选示例值:`application/json` Body参数 application/json modelenum<string> 必需模型编码。可选：`glm-image`,`cogview-4-250304`,`cogview-4` 枚举值: `glm-imagecogview-4-250304cogview-4` promptstring 必需所需图像的文本描述示例值:`"一只可爱的小猫咪"` sizeenum<string> 可选图片尺寸。默认值:`1280x1280` `glm-image` 推荐枚举值：`1280x1280` (默认), `1568×1056`, `1056×1568`, `1472×1088`, `1088×1472`, `1728×960`, `960×1728`。自定义参数:长宽推荐设置在`1024px-2048px`范围内,并保证最大像素数不超过`2^22px`;长宽均需为`32`的整数倍。其它模型推荐枚举值：`1024x1024` (默认), `768x1344`, `864x1152`, `1344x768`, `1152x864`, `1440x720`, `720x1440`。自定义参数：长宽均需满足`512px-2048px`之间，需被`16`整除，并保证最大像素数不超过`2^21px`。枚举值: `1280x12801568x10561056x15681472x10881088x14721728x960960x1728` user_idstring 可选终端用户的唯一ID，协助平台对终端用户的违规行为、生成违法及不良信息或其他滥用行为进行干预。ID长度要求：最少6个字符，最多128个字符。 Required string length: 6 - 128 qualityenum<string> 可选生成图像的质量。可选: `hd`, `standard` `glm-image` 默认为 `hd`, 其它默认为 `standard`。`glm-image` 仅支持 `hd`。 `hd`: 生成更精细、细节更丰富的图像，整体一致性更高，耗时约20秒； `standard`: 快速生成图像，适合对生成速度有较高要求的场景，耗时约5-10秒。枚举值: `hdstandard` watermark_enabledboolean 可选控制AI生成图片时是否添加水印。 `true`: 默认启用AI生成的显式水印及隐式数字水印，符合政策要求。 `false`: 关闭所有水印

API价格表

$￥円 ₽

模型	说明	302.AI价格

glm-image

文字生成图片

GLM-Image

API介绍

核心能力

相关测评

API调试台

API统计

API列表 (1)

Header参数

Body参数 application/json

API价格表

glm-image

$0.016/次

猜你喜欢

快捷访问

帮助与支持

法律声明