AI视频
-
302.AI 基准实验室丨最新国产视频模型实测对比:Kling 2.0 vs. Vidu Q1
4月,可灵(Kling)AI 推出了视频模型 2.0 版本。与此前版本相比,Kling 2.0 拥有更强的语义响应、更优的动态质量和更好的画面美学。 同月,生数科技正式发布新一代视频大模型 Vidu Q1 。据官方宣称,Vidu Q1 在生成逼真度、美学质量、对象/场景生成精准度以及视频语义一致性等方面均展现出令人惊叹的效果。 为了让用户能更直观地了解这两款…
-
302.AI 赛博月刊丨Vol.5 神仙打架,Manus 之后的新玩家们
AI 行业大事记 2025 年 5 月 联合出品: Jomy @ 302.AI 南乔 @ ShowMeAI 大聪明 @ 赛博禅心 说明: ① 本期月刊收录 AI 行业大事共 104 件; ② 本文分类中的【模型】均指代语言模型; ③ 本文 Agent、代理、智能体等词语的含义相同; ④ 一般产品接入 MCP 不再单独列出,头部公…
-
302.AI 基准实验室 | 四大场景对比Gen-4 vs. Kling-1.6图生视频效果,这次谁破防了?!
4月1日,Runway 推出了新视频模型:Gen-4。 据官方介绍,Gen-4 与上一版本 Gen-3 Alpha 模型相比有显著改进。它能够生成具有逼真动作的高度动态视频,并且主题、对象和风格一致,具有出色的即时一致性和一流的世界理解能力。 4月8日,Runway再次宣布推出新版本 :Gen-4 Turbo。官方称Gen-4 Turbo是其迄今为止最强大的…
-
302.AI 新品发布 | 视频竞技场:模型PK+视频生成,打造AI视频新玩法
当AI视频模型同台竞技,谁将获得最终胜利? 目前,AI视频生成领域涌现出越来越多的新模型,作为使用者是不是常常会面临这样的困惑:“哪个视频模型最符合我的需求?哪个模型的效果更佳?” 为了帮助用户解开这些疑惑,302.AI最新推出了一款工具:视频竞技场。这是一个集成了多种功能的竞技场,用户不仅能够在视频竞技场进行AI模型视频生成能力的比拼,还可以根据自己的需求…
-
302.AI 基准实验室 | 通义万相2.1模型实测绝了!汉字竟在视频里“活”了
继豆包图像模型攻克汉字生成的难题后,国内AI视频生成领域在中文生成方面再次来了新突破! 今年年初,阿里云推出了全新升级的的视频生成模型——通义万相2.1。据了解,这是⌈ 首个具备中文文字生成能力的视频生成模型 ⌋ 。 通义万相2.1视频模型一经推出,便以 84.70% 总分登顶权威评测榜单VBench榜首。除了中文文字生成的创新,该模型在复杂运动、大幅度动作…
-
资讯丨首个支持多主体一致性的大模型Vidu 1.5,在302.AI上玩到停不下来!
11中旬,生数科技推出了最新AI视频生成模型Vidu 1.5版本,并声称这一版本模型为“全球首个支持多主体一致性的大模型”。 先简单理解下多主体一致性的意思,多主体一致性即多个主体如人物、物体、场景等,在不同场景、不同镜头下的形象、特征和行为都是连贯和一致的。更简单地说,就是视频里的每个角色或物体在不同时间和不同地点都能保持他们的特征和行为,使得整个视频看起…
-
302.AI 基准实验室 | 带你在302.AI玩转Runway新功能Expand Video
11月底,Runway推出了新功能——Expand Video。这项功能允许用户通过简单的文本提示,在原始视频画面基础上生成额外的视觉内容,并灵活调整视频比例。这和早前很火的“图片扩图”功能非常相似,只不过Expand Video扩的不是静态的图片而是视频。 Expand Video功能的主要特点包括: 1、无缝扩展框架,同时保持视觉一致性,并以…
-
302.AI 实战教程 | 简单几步学会制作超真实的“毒液变身”特效,胆小慎进!
最近,各社交媒体平台都被一种叫“毒液变身”的特效刷屏了,视频虽然仅有短短几秒钟,却通过生动的画面和动感的特效,给观众带来了强烈的视觉冲击,从而迅速吸引了大量网友的目光。甚至在某些短视频平台上,使用这一特效制作的视频获得了过万的点赞: “毒液变身”特效流行后,许多网友纷纷在线求教程,想要学习如何制作类似的视频。实际上,这些视频效果都是通过最新的视频生成模型——…
-
302.AI 新品发布 | 静态照片如何秒变会说话?只需要一个AI照片说话工具!
近段时间,在社交媒体平台经常看到一些【照片说话】视频非常有趣,流量好,甚至有大几万的点赞!这到底是用什么AI工具实现的呢?先来看看视频效果: (案例由302.AI的AI照片说话生成) 我们简单分析下,原图(左侧)是一张静态的照片,通过AI技术与一段音频巧妙结合后,静态的照片能够“开口说话”了,而且能够实现口型与音频同步,生成的效果(右侧)仿佛真人般自然流畅。…
-
302.AI 基准实验室 | Genmo推出全球最大开源视频生成模型Mochi V1,实测效果到底如何?
10月22日,Genmo在社交媒体平台发布消息,推出最新的开源视频生成模型 Mochi V1。Mochi V1采用创新的 Asymmetric Diffusion Transformer(AsymmDiT)架构,拥有高达100亿个参数,是迄今为止公开发布的最大视频生成模型。 根据Genmo官方介绍,Mochi V1模型在提示词遵循和动作质量方面表现十分出色:…