王者归来!AI视频巨头Runway深夜发布Gen-3,演示暴打Sora惊艳网友

HelloKitty 2024-06-19 15:21

3083

本文由 新智元 撰写/授权提供,转载请注明原出处。

文章来源于:新智元

作者:Aeneas 桃子

时隔多月,Runway 终于出手了。新版 Gen-3 Alpha,直接向 Sora 发起挑战。

跟前代 Gen-2 相比,Gen-3 Alpha 在细节、一致性和运动表现方面,又有了史诗级改进!

1.png

现在,网友们激动地转发 Gen-3 Alpha 的各种演示,前几天的风头大盛的 Luma,光芒都被盖过去了。

2.png

「Luma 开始雪崩,Gen-3 Alpha 将在未来几天内到来!Runway 在保真度、一致性、动作和真实感人体方面取得了进步,模型擅长生成具有各种动作、手势和情感的富有表现力的人类角色」

如今的 AI 视频社区,似乎又要迎来新王了。

3.png

Runway 认为,Gen-3 Alpha 的诞生,意味着我们离通用世界模型和新一代 AI 视频又近了一步。

Gen-3 Alpha:新基础设施系列的首个模型

Gen-3 Alpha 接受了视频和图像混合训练。

与 2023 年 11 月推出的前身一样,也支持文本到视频、图像到视频和文本到图像功能控制模式,如运动画笔、高级相机控制和导演模式。

而在未来,Runway 计划提供更多工具,让用户实现对结构、样式和运动更好的控制。

根据 Runway 的说法,Gen-3 Alpha 是基于大型多模态模型全新训练基础设施训出的第一个模型。

不过,Runway 并未透露研究者做了哪些具体改变。

这次上新也没有技术论文发布,博客文章中只显示了多个最长 10 秒的视频示例。

网友盛赞:令人印象深刻,光线、颜色、皮肤纹理、清晰度,一切都令人惊叹。

4.png

这就是即将撼动娱乐圈的 AI!

5.png

Hugging Face 创始人表示,泰裤辣,谁将会成为从开源视频模型收获百倍关注的幸运儿?

7.png

Pytorch 之父高度赞扬道,这简直就是 Sora 级别的模型。

6.png

人物更加真实,表现力更加细腻

从下面这些示例看出,新模型不仅对于不同动作、手势、情感的人类角色把握得更为细腻,在场景中元素和过渡的时间控制上,也有了更大的进步。

人物生成上,肖像的面部细节更真实,而且在生成 10 秒长的时间里,完全能够风格保持一致性。

坐在车中的女子,在经过霓虹灯的街道上,脸上的光影变化毫无违和感。

8.gif

仰头大笑的男子,戴上了假发和眼镜。根本无法辨认出,这是 AI 生成的。

9.gif

穿着宇航服的男子穿梭在石头建筑之间,好像在讲述着这座古城的历史。

10.gif

一位老人在仓库中的特写镜头。

11.gif

再来看日漫人物生成,也是非常地完美。

12.gif

更懂物理世界

此外,Gen-3 Alpha 经过描述详尽、时间连续的训练数据,以此生成了富有想象力,以及画面过度的效果。

而且,它还能精准对场景中的元素进行关键帧动画制作。

13.gif

Gen-3 Alpha 对物理世界理解,也更近一步,洪水涌入山庄,水流状态与真实世界别无二致。

14.gif

走廊中,闪光灯打在飞舞的银色布料上。

15.gif

不过这次,蚂蚁的腿还是没有对上。

16.gif

一会儿多几条,一会儿少几条,堪称薛定谔的蚂蚁腿

Gen-3 Alpha 在由远拉近的镜头生成中,能够细致地呈现出想要的场景。

17.gif

这个热气球同样如此,与拍视频中运镜的效果是一样的。

18.gif

超梦幻的海底世界,一切仿佛置于梦境之中。

19.gif

更值得一提的是,Gen-3 Alpha 在视频中生成字体变得更真实了。一面白墙上用黑色涂鸦,写着 Runway。

20.gif

博物馆中一幅画的宽幅对称照片,镜头拉近到画作附近。

21.gif

窗外看到一个巨大的奇怪生物在夜晚的破败城市中行走,一盏路灯照亮了这个昏暗的地方。

22.gif

一缕缕活生生的火焰,在熙熙攘攘的幻想集市中飞驰的特写镜头。

23.gif

此外,官方放出的炸裂演示还有:

24.gif

25.gif

26.gif

28.gif

还有一些网友,应该拿到了内测资格,开启一大波试用。

29.gif

30.gif

31.gif

为何 Gen-3 Alpha 此次升级,在画质美学上再次有了史诗级升级?

原因在于,在这次模型的训练中,凝聚了研究者、工程师和艺术家的共同努力。正是这种跨学科的团队合作,让 Gen-3 Alpha 可以诠释各种风格和电影概念。

追赶 Sora

而且,除了标准版本外,Runway 也正在和娱乐、媒体公司展开合作,开发 Gen-3 的定制版本。

这些定制模型,会为用户提供更好的风格控制、更一致的人物,还能满足用户的特定要求。

另外,Runway 还宣布了新的安全功能,例如改进的审核系统和对 C2PA 标准的支持(所有主要商业图像模型都使用该标准)。

32.png

说起来,OpenAI 的 Sora 已经鸽了很久了。

24 年 2 月,横空出世的 Sora,在一致性和图像质量方面标志着全新的里程碑,直接刷新了全世界对 AI 视频的认识。

33.png

不过,到现在 Sora 仍然不是公开可用的,距离商业化的道路依旧很遥远。

而全世界的 Sora 平替,也如雨后春笋一般冒出。

多年以来,RunwayML 一直是 AI 视频领域的先驱,凭借这次 Gen-3 Alpha 的发布,它似乎再次证明了自己的地位。

而且还有一个重磅消息:再过几天,Gen-3 Alpha 就会向付费订阅者开放了。

参考资料:

https://x.com/runwayml/status/1802691475391566108

微信图片_20240207151541.png

微信图片_20240313155219.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章