逼真到颤抖!Midjourney画出完美中国情侣,画师、演员、模特一键淘汰

HelloKitty 2023-03-22 17:39

扫一扫 在手机阅读、分享本文

1069

本文由 新智元 撰写/授权提供,转载请注明原出处。

文章来源于新智元

昨天,由 Midjourney V5 画的一对中国情侣在网上引起轩然大波。

许多人纷纷惊呼:人类画师别活了。

1.png

有人不相信这是 Midjourney 之作,也亲手体验了一把。在输入以下的 prompt 后,画风瞬间惊艳了。

「A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen --v 5 --s 250 --q 2」

2.png

在 GPT-4 发布后,Midjourney 也更新了 V5,不仅绘图更逼真,而且 prompt 更灵敏。

最重要的是,一直被诟病的「AI 不会画手指」,Midjourney V5 都拿捏了。

3.jpg

还有满屏的电影质感,除了 OMG,还是 OMG。

4.png

甚至有网友惊呼:模特不存在了!

5.png

效果炸裂,一大波设计师要失业了

从 Midjourney 的 V1 到 V5,就可以看到 AIGC 这一年来的进化速度有多快。

最新 V5 版的图像质量更高、输出更多样化、有更广泛的风格、支持无缝纹理、有更宽的纵横比、有更好的图像提示,以及更宽的动态范围……

激动的心,颤抖的手,国内网友纷纷上手实操了一波。

先上手的写真图:

6.png

7.png

虽然 V5 能够画出 5 根手指,但是在手指的细节上,还是差点意思。

8.png

比如试着让 Midjourney V5 给梵高的房间拍个照:

9.png

10.png

微博网友@纽约吃货用 Midjourney V5 在画中国美女的神态时,把控也是非常到位。

11.png

V5 还能拿捏中国古典风格的美,画出了亭亭玉立的美人,细节颗粒度拉满。

12.png

还有网友用 GPT-4+Midjourney V5 创作了电影「杭州重生」,连豆瓣上介绍页都P出来了,看起来还真是那么回事儿。

13.png

在 2022 年 12 月,谭木匠举办了一场梳子比赛,人类设计师设计的梳子如下:

14.png

网友黄仲生用 V5 试了一波,并惊讶地发现「麻瓜」在 AI 面前完全不能打。

15.png

16.png

当别人反馈说上面的梳子太美,只能用来收藏,网友又整了一波日常可用的梳子。

17.png

还有给小朋友用的梳子

18.png

在国外,有网友直接用 Midjourney V5 画出了 The Matrix 的电影质感,让人瞬间怀疑这是不是电影里的截图。

并且献上了 prompt:

「Keanu Reeves in The Matrix. AI cinema. Synthography. Cinematic. Film grain. --ar 16:9 --v 5」

19.png

20.png

还有网友尝试用「民宅火灾现场微笑女孩」经典 meme 让 Midjourney 创作「城堡火灾现场微笑洛基」。

21.jpg

来看下这炸裂的效果。

22.jpg

23.jpg

此外,网友还开脑洞把「北京屋顶情侣」图加上洛基元素。

24.png

还有个搞笑版的,龙卷风来了,老太太骑着电驴在「狂飙」。

25.png

亚洲人的脸部特征也是做的非常逼真。

26.png

27.png

28.png

旅行博主都不用出门,直接在家调教 Midjourney 就可以了。

29.png

还有网友拿 V4 和 V5 做了对比图,通过输入一张图,还有文字提示,V4 生成的图片在光照下物体阴影处理方面无法与 V5 相比。

30.png

再来一张眼睛特写图:

31.png

通过在 V3、V4、V5 这三个版本输入相同提示、相同设置,对其输出图片进行了对比。

在 V5 这个版本中,波光粼粼的水面,还有鱼儿在水中游的倒影,已经达到了以假乱真的程度。

32.png

33.png

但是如果没有提供有关环境的文本的提示,比起 V4,V5 默认生成了更加真的环境。

34.png

网友迫不及待地让 V5 来复刻一下王家卫「蓝莓之夜」的电影风格,发现 V5 在处理玻璃的反射方面做得更逼真了。

35.png

以及各种真假难辨的作品:

36.png

反派气质拉满的马斯克:

37.jpg

「猫戴 VR」:

38.png

比 V4 强在哪?

最新升级的 V5,相较于前一版本有什么改进,一位研究员就他们之间的对比做了一张表:

39.png

1. 密铺(--tile argument)

在创建模式时使用。此前 V3 有这一参数,然而在 V4 中暂时终止使用,V5 版本重新上线。

比如输入「/imagine tesseract pattern, repeat, white and blue highlights --s 1000 --v 5 --tile」,生成如下的图:

40.png

2. 长宽比(--ar argument )

在V4中,只能有不高于1:2或不宽于2:1的自定义纵横比。而在V5中,你可以自定义比率与任何「宽度: 长度」比,如下是自定义比例的演示:

41.png

这一点升级,意味着什么?

现代电影中常见的最宽纵横比 2.39:1 都能够实现,你可以制作电影巨幕,人人都能成为导演!

42.png

V5生成2.4:1电影画幕

3. 图像权重可以自定义( -- iw argument)

图像提示中的权重现在可以输入自定义值。你可以决定输入图像对最终生成的图像的影响程度。

如下,在 Midjourney V5 中,输入一张图和一句文本提示。

43.png

通过自定义不同权重,2、1、0.5 生成了不同的图片。

输入的提示如下:「/imagine http://imgur.com/romman.png a roman soldier with daisies in the background --seed 123 --iw 2 --v 5」

44.png

4. less opinionated

「less opinionated」意味着,在V4中,只需要编写较少的文本提示,Midjourney便会输出更具创造性的图像。

但V5不是这样的,你可能需要输入更多的形容词,并给出更多的细节,比如风格或情绪,输出图像应该是什么样子。如果没有更多描述,Midjourney就会输出一个默认风格,比如「摄影」风格。

这一点升级,可以让人们通过文本提示能够更精准地把控Midjourney输出的内容。也意味着,在输入文本和输出图像之间有「更多的内聚力」。

以上 4 点升级是官方博客中提到,但是最让人意想不到的是 Midjourney V5 能够画出「5 个手指」!

45.png

46.png46.png

另外,V5 已经在更真实的图像/照片上进行了微调,因此可以看到在输出窗户反射和透过玻璃的图片上更加真实。

47.png

48.png

考考眼力见

最后来一个测试题:

下面 4 张图,只有一张是真人,其他都是 Midjourney V5 画的,猜猜真人是哪一张?

49.png

50.png

51.png

52.png

53.png

参考资料:

https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295

https://twitter.com/mranti/status/1637326003927396352?s=46&t=iBppoR0Tk6jtBDcof0HHgg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章