302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

7月6日,可灵网页版正式上线并且宣布了该网页端集成了文生图、文生视频相关能力,同时提供了一些新功能,如更加清晰的高画质版视频、首尾帧控制、镜头控制等全新编辑能力。

而在可灵网页版上线的前两天,快手发布了Live-portrait初始版本的推理代码和模型模型。此外,LivePortrait的官方网站也在同一天上线。

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

Live-portrait能够将静态照片转化为逼真的动态视频,通过智能算法控制眼睛和嘴唇的动作,生成生动的效果,突破传统动画制作的难题。上传自己的照片,并选择不同的动作和表情,就能生成具有高度真实感和细腻表情变化的动态人像。

简单粗暴的理解就是,表情的“移花接木”,Live-portrait能够让一张面无表情或者只有简单表情的照片动起来,例如在Live-portrait的功能下,各大艺术作品中的人物也被“唤醒”了。

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

(图源302.AI的API超市)

自从Live-portrait技术推出后,就迅速成为了热门话题。连HuggingFace的首席战略官Thomas Wolf也在社交媒体上分享了自己使用Live-portrait功能后的作品。302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

Live-Portrait为什么这么火?先来看下它的方法介绍:LivePortrait的模型训练分为两阶段。第一阶段为基础模型训练,第二阶段为贴合和重定向模块训练

在第一阶段模型训练中,LivePortrait对基于隐式点的框架,如Face vid2vid,做了一系列改进,包括:高质量训练数据收集、视频-图像混合训练、升级的网络结构、更灵活的动作变换建模、关键点引导的隐式关键点优化、级联损失函数。第一阶段的所有模块为从头训练,总的训练优化函数 (Lbase) 为以上损失项的加权和。

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

而第二阶段,贴合和重定向模块训练,考虑到实际需求,LivePortrait设计了一个贴合模块、眼部重定向模块和嘴部重定向模块。当参考人像被裁切时,驱动后的人像会从裁图空间被反贴回原始图像空间,贴合模块的加入是为了避免反贴过程中出现像素错位,比如肩膀区域。

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

眼部重定向模块旨在解决跨身份驱动时眼睛闭合不完全的问题,尤其是当眼睛小的人像驱动眼睛大的人像时。嘴部重定向模块的设计思想类似于眼部重定向模块,它通过将参考图片的嘴部驱动为闭合状态来规范输入,从而更好地进行驱动。

接下来,为了更好理解,一起来看下Live-Portrait的实际效果展示。除了文章上面提到的单一的图像生成,对于多人合照,也可以实现“表情转移”:

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

如果仅把目光局限在人物上,那就错了!因为除了能将人物的静态照片转化为动态视频,动物也可以:

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

除了人像照片,给定一段人像视频,比如舞蹈视频,Live-Portrait也可以用驱动视频对头部区域进行动作编辑,看下效果:

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

虽然Live-Portrait是一款开源模型,但是如果用户想要使用,需要在下载好模型后,设置开发环境、安装必要的软件,还需要如足够的内存和高性能的GPU等一系列繁琐的步骤。然而,302.AI提供了一个更为便捷的解决方案,首先进入302.AI官网后找到API超市,在API分类选择【视频生成】,点击302.AI;

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

只需要找到302.AI的API超市提供的Live-Portrait的API,可以省去大量配置和安装的步骤,支持在线调试,快速接入Live-Portrait模型。重要的是,302.AI提供按需付费的方式,且无捆绑套餐。

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

让我们一起看看通过302.AI的API超市实现的Live-Portrait技术成果:

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

原图(来源于302.AI的API超市)

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

效果图(来源于302.AI的API超市)

302.AI的API超市分类明晰,会实时更新市面上AI模型的API,不需要自己找模型,不需要配置环境,不需要部署,即使是小白用户也能轻松打开并立即使用。

302.AI 新品发布 | Live-portrait人像转视频模型,让照片中的脸都动起来

参考文章:https://mp.weixin.qq.com/s/b_7N4KaY8El4JeD1lorodQ

在探索Live-portrait技术,将静态人像转换为动态视频的旅途中,我们见证了技术的巨大潜力,正如我们已经看到的那些通过Live-portrait动起来的艺术画像,每一个成功的转换都让人感受到时间的力量和科技的魅力。未来,随着技术的进步和应用的深入,我们期待看到更多曾经静默的面孔走入我们的世界,以全新的方式诉说他们的故事。


👉立即注册免费试用302.AI,开启你的AI之旅!👈

为什么选择302.AI?

● 灵活付费:无需月费,按需付费,成本可控
● 丰富功能:从文字、图片到视频,应有尽有,满足多种场景需求
● 开源生态:支持开发者深度定制,打造专属AI应用
● 易用性:界面友好,操作简单,快速上手

302.AI 新品发布 | 图像创意站:GPT-Image-1玩法全解析,轻松生成惊艳作品
All Rights Reserved by 302.AI
喜欢 (0)
302.AI302.AI
上一页 2024 年 7 月 25 日 下午3:47
下一页 2024 年 7 月 26 日 下午3:39

相关推荐

  • 谁才是真正的生产力工具?实测 Wan 2.7 Image:人像能力顶级,但工程顽疾丢分丨302.AI 基准实验室

    文章导读: AI 模型生图能力日趋饱和,而人物趋同、色彩难控、文本不稳等细微问题,仍是暴露 AI 痕迹的关键痛点。阿里通义最新发布的 Wan2.7-Image,不卷参数卷体验——聚焦角色辨识度、色彩精准控制与长文本渲染,同时补齐交互式编辑、多主体一致性、组图生成等实用能力。本文将从多维度实测展示:当 AI 生图从“好看”走向“好用”,谁能真正胜任实际工作流。…

    2026 年 4 月 2 日 AI资讯
    5790
  • Nano Banana 2对决Seedream 5.0实测:2026年的图像新SOTA诞生?丨302.AI 基准实验室

    文章导读: 谷歌深夜突袭发布 Nano Banana 2,主打 Pro 级画质与 Flash 级速度的完美融合。本期实测通过人物特写、街头摄影、海报设计等六大维度评测,硬核对比 Nano Banana 2 与字节跳动 Seedream 5.0 。结论先行:Nano Banana 2 降维打击,在光影质感与审美表现上呈现压倒性优势,世界知识理解依然抗打,但在中…

    2026 年 2 月 27 日 基准实验室
    1.4K0
  • Kling O3实测:能够实现人人皆可成为导演的愿景么?丨302.AI 基准实验室

    导读:快手可灵Kling 3.0系列模型上线,主打“人人皆导演”的全链路创作。本文对Kling O3进行了多场景实测。结果显示,该模型在镜头调度与人物演技上表现卓越,特定领域已达“以假乱真”的商用级水准;但在指定风格还原、音乐生成及高速运动伪影方面仍有提升空间。对于创作者而言,Kling O3优势明显,但需明确其能力边界,方能最大化利用。 中国各大AI公司在…

    2026 年 2 月 11 日 基准实验室
    1.1K0
  • 回归美学测试:实测Z-Image,Grok Imagine与Midjourney丨302.AI 基准实验室

    文章导读:通义Z-Image基础版发布,与Grok-Imagine-Image一同挑战“美学大师”Midjourney。本次测评聚焦水墨、动漫等六大流派的“美学”对决。结果显示:Z-Image以稳健的商业美学和精准指令忝居高位;Grok凭借侵略性的视觉张力在动感场景中脱颖而出;而Midjourney虽在文字与逻辑上有短板,却依然是无法撼动的审美天花板。这场评…

    2026 年 2 月 5 日 基准实验室
    1.1K0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注