AI生图
-
把图片像PSD一样拆开?Qwen-Image-Layered:找到了AI修图的新路,却还没跨过“商用”门槛丨302.AI 基准实验室
阿里通义团队于 12 月 19 日推出了其新一代图像生成模型 Qwen-lmage-Layered。新模型采用自研创新架构,可将图片“拆解”成多个图层。这种分层表示赋予了图像内在的可编辑性:每个图层都可以独立操作,而不会影响其他内容。 Qwen-lmage-Layered 的核心突破在于其革命性的“智能分层”能力。与传统的、直接生成一张平面像素图的模型不同,…
-
图像模型SOTA易主?GPT-Image-1.5 对决Nano Banana Pro测评丨302.AI 基准实验室
12月16日晚,OpenAI 正式发布了全新的旗舰图像生成模型——GPT Image 1.5 这确实是一个久违的名字。时间回溯到今年3月26日,OpenAI 首次推出了基于 GPT-4o 的图像生成模型 GPT Image 1.0,那场发布会直接引爆了一波席卷全球的”万物皆可吉卜力”风格热潮。无论是社交媒体上的普通用户,还是专业设计师…
-
年末开源图像模型决战:Z-Image-Turbo vs Flux.2 Dev 丨302.AI 基准实验室
在上篇《顶流开源模型Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测》我们对Flux.2的两个闭源版本(Pro和Flex)进行了测试。而在同一周(11月27日),阿里通义紧随Flux的步伐,也发布了全新的开源图像模型:Z-Image-Turbo. Z-Image-Turbo 是 Z-Image 的蒸馏版本,仅使用 8 次函数评估(NFE)…
-
昔日顶流更新,Flux.2是否依然能打?硬钢Nano Banana Pro五轮实测丨302.AI 基准实验室
11月25日,Black Forest Labs终于将其2024年发布的图像模型Flux迭代至2.0版本。作为开源模型,Flux曾凭借其性价比与微调能力,一时风头无两,几乎取代了Stable Diffusion的生态。诸如腾讯混元针对人像微调的Flux-1-SRPO也获得过我们不错的评价。但近半年,随着谷歌Nano Banana和字节跳动SeeDance的问…
-
美学大师 vs 世界模拟器:Seedream 4.5对决Nano Banana Pro,SOTA能否易主?丨302.AI 基准实验室
12月3日,火山引擎正式发布了新一代 AI 图像模型 Seedream 4.5,又进入到了熟悉的中国模型后发制人的节奏:今年 8 月末 Nano Banana 横空出世不久,字节跳动便带着 Seedream 4.0 进行精准狙击。在我们当时的横评文章中,Seedream 4.0 六战五胜,实现了对 Nano Banana 的全面反超。回顾一下对于 4.0 版…
-
AIGC万字指南(下):从A到Z,打破技术词汇认知壁垒 | 302.AI大白话聊一聊
话不多说,文接上篇,让我们从字母L继续。 字母L: LLM (Large Language Model,大语言模型) 定义:一个在海量文本数据上进行预训练,规模巨大、参数量通常在十亿级别以上的深度学习模型,能够理解和生成人类语言。 通俗解释:把它想象成一个读完了人类历史上几乎所有书籍、网页和对话的“超级大脑”或“通天晓”。它不仅能和你聊天,更能扮演“世界模拟…
-
AIGC万字指南(上):从A到Z,打破技术词汇认知壁垒 | 302.AI大白话聊一聊
2025年末,AIGC(AI-Generated Content,人工智能生成内容)早已从前沿概念,演变为深刻改变创意产业的强大生产力。从本质上讲,AIGC是利用机器学习,特别是深度学习模型,通过对海量数据的学习,来自动化地生成全新的文本、图像、音频、视频、3D交互内容乃至代码等各种形式的数字资产。它不仅仅是一种技术工具,更被视为重塑内容生产逻辑、驱动经济社…
-
六战全胜!4K输出,从信息图到超写实人像:Nano Banana Pro重回王座丨302.AI 基准实验室
本周的 LLM 战场硝烟未散,谷歌又投下了一枚重磅炸弹。 北京时间 11 月 20 日晚,Nano Banana Pro(官方版本号 Gemini-3-Pro-Image-Preview)正式开放。仅仅三个月前,那个曾以“万物皆可 3D 手办”席卷 AIGC 社区的“魔法香蕉”,如今在 Gemini 3 Pro 强大基座的加持下强势回归。 既然挂上了“Pro…
-
Topaz Labs评测:当“修复式”专业工具遇上“生成式”大模型,AI修图的未来将走向何方?丨302.AI 基准实验室
相信很多影像工作者近些年对 Topaz Labs 这家公司已不陌生,和一众 2024 年后围绕AI做概念就开始融资的新玩家不同,Topaz Labs 是在AI浪潮来临之前,就已经把专业技能点点满的硬核老兵——它用一系列真实可用的模型工具,在图像修复、局部放大、细节增强、去噪、插帧和视频补帧等领域打下了坚实口碑:模糊镜头能拉清晰、低分辨率素材能补成4K,尤其是…
-
AI人像专题测试:腾讯混元微调的Flux-1-SRPO有何独门绝技?丨302.AI 基准实验室
近日,腾讯混元团队开源了其最新图像模型 Flux-1-SRPO,这款模型是基于黑森林 Flux-DEV 微调的文生图模型,其全称为 Semantic Relative Preference Optimization(语义相对偏好优化),旨在解决当前 AI 生图模型在人像生成方面的油腻皮肤质感和“AI味”常态。 针对人像生成优化,混元团队提出的创新型 Dire…