
Qwen-Image-Layered(图片分层)
将图像分解为多个 RGBA 图层的模型,赋予图像内在可编辑性
2025-12-20
价格:
大额采购联系客户经理享专属优惠
稳定性
稳定
API介绍
Qwen-Image-Layered 是阿里巴巴通义实验室推出的端到端可编辑图像生成模型,核心定位为“将AI生成图自动转为专业级分层设计稿”,实现像素级可控编辑。
- 首创语义分层架构:单张RGB图自动解耦为3–8个RGBA图层(如人物、文字、背景、特效),每层独立可编辑
- 媲美PSD的专业工作流:输出结构与Photoshop文档一致,支持重着色、缩放、替换等操作而不影响其他元素
- 高质量训练数据支撑:基于百万级真实PSD文件构建标注数据集,覆盖图形设计、摄影、排版等多元场景
- 编辑一致性显著领先:在Crello测试集上,Alpha通道IoU达0.916,重建L1误差降低超85%
- 多阶段训练策略:从文本→单层→多层→图像反推,逐步提升层间语义解耦能力
—————————————————————————————————————————————————————
核心能力
🎨 原生可编辑生成:生成即分层,无需后期抠图,轻松修改局部元素(如换衣服、改标语、调背景)
🧩 变量层数动态输出:通过VLD-MMDiT架构和Layer3D RoPE位置编码,灵活处理不同复杂度图像的图层数量
🖼️ 高保真RGBA重建:RGBA-VAE实现PSNR 38.83、LPIPS 0.012,细节与透明度还原接近无损
🛠️ 设计工具无缝衔接:输出可直接导入主流设计软件,打通AI生成与人工精修的协作闭环
—————————————————————————————————————————————————————
—————————————————————————————————————————————————————
相关测评
《Qwen-Image-Layered:找到了AI修图的新路,却还没跨过“商用”门槛》
API调试台
登录后,探索更多精彩功能! 点击登录
API列表 (2)
API价格表
$¥ 円 ₽