你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!

逼真到颤抖！Midjourney画出完美中国情侣，画师、演员、模特一键淘汰

HelloKitty • 2023-03-22 17:39

扫一扫在手机阅读、分享本文

2739

本文由新智元撰写/授权提供，转载请注明原出处。

文章来源于新智元

昨天，由 Midjourney V5 画的一对中国情侣在网上引起轩然大波。

许多人纷纷惊呼：人类画师别活了。

有人不相信这是 Midjourney 之作，也亲手体验了一把。在输入以下的 prompt 后，画风瞬间惊艳了。

「A pair of young Chinese lovers, wearing jackets and jeans, sitting on the roof, the background is Beijing in the 1990s, and the opposite building can be seen --v 5 --s 250 --q 2」

在 GPT-4 发布后，Midjourney 也更新了 V5，不仅绘图更逼真，而且 prompt 更灵敏。

最重要的是，一直被诟病的「AI 不会画手指」，Midjourney V5 都拿捏了。

还有满屏的电影质感，除了 OMG，还是 OMG。

甚至有网友惊呼：模特不存在了！

效果炸裂，一大波设计师要失业了

从 Midjourney 的 V1 到 V5，就可以看到 AIGC 这一年来的进化速度有多快。

最新 V5 版的图像质量更高、输出更多样化、有更广泛的风格、支持无缝纹理、有更宽的纵横比、有更好的图像提示，以及更宽的动态范围……

激动的心，颤抖的手，国内网友纷纷上手实操了一波。

先上手的写真图：

虽然 V5 能够画出 5 根手指，但是在手指的细节上，还是差点意思。

比如试着让 Midjourney V5 给梵高的房间拍个照：

微博网友@纽约吃货用 Midjourney V5 在画中国美女的神态时，把控也是非常到位。

V5 还能拿捏中国古典风格的美，画出了亭亭玉立的美人，细节颗粒度拉满。

还有网友用 GPT-4+Midjourney V5 创作了电影「杭州重生」，连豆瓣上介绍页都P出来了，看起来还真是那么回事儿。

在 2022 年 12 月，谭木匠举办了一场梳子比赛，人类设计师设计的梳子如下：

网友黄仲生用 V5 试了一波，并惊讶地发现「麻瓜」在 AI 面前完全不能打。

当别人反馈说上面的梳子太美，只能用来收藏，网友又整了一波日常可用的梳子。

还有给小朋友用的梳子

在国外，有网友直接用 Midjourney V5 画出了 The Matrix 的电影质感，让人瞬间怀疑这是不是电影里的截图。

并且献上了 prompt:

「Keanu Reeves in The Matrix. AI cinema. Synthography. Cinematic. Film grain. --ar 16:9 --v 5」

还有网友尝试用「民宅火灾现场微笑女孩」经典 meme 让 Midjourney 创作「城堡火灾现场微笑洛基」。

来看下这炸裂的效果。

此外，网友还开脑洞把「北京屋顶情侣」图加上洛基元素。

还有个搞笑版的，龙卷风来了，老太太骑着电驴在「狂飙」。

亚洲人的脸部特征也是做的非常逼真。

旅行博主都不用出门，直接在家调教 Midjourney 就可以了。

还有网友拿 V4 和 V5 做了对比图，通过输入一张图，还有文字提示，V4 生成的图片在光照下物体阴影处理方面无法与 V5 相比。

再来一张眼睛特写图：

通过在 V3、V4、V5 这三个版本输入相同提示、相同设置，对其输出图片进行了对比。

在 V5 这个版本中，波光粼粼的水面，还有鱼儿在水中游的倒影，已经达到了以假乱真的程度。

但是如果没有提供有关环境的文本的提示，比起 V4，V5 默认生成了更加真的环境。

网友迫不及待地让 V5 来复刻一下王家卫「蓝莓之夜」的电影风格，发现 V5 在处理玻璃的反射方面做得更逼真了。

以及各种真假难辨的作品：

反派气质拉满的马斯克：

「猫戴 VR」：

比 V4 强在哪？

最新升级的 V5，相较于前一版本有什么改进，一位研究员就他们之间的对比做了一张表：

1. 密铺（--tile argument）

在创建模式时使用。此前 V3 有这一参数，然而在 V4 中暂时终止使用，V5 版本重新上线。

比如输入「/imagine tesseract pattern, repeat, white and blue highlights --s 1000 --v 5 --tile」，生成如下的图：

2. 长宽比（--ar argument ）

在V4中，只能有不高于1:2或不宽于2:1的自定义纵横比。而在V5中，你可以自定义比率与任何「宽度: 长度」比，如下是自定义比例的演示：

这一点升级，意味着什么？

现代电影中常见的最宽纵横比 2.39:1 都能够实现，你可以制作电影巨幕，人人都能成为导演！

V5生成2.4:1电影画幕

3. 图像权重可以自定义（ -- iw argument）

图像提示中的权重现在可以输入自定义值。你可以决定输入图像对最终生成的图像的影响程度。

如下，在 Midjourney V5 中，输入一张图和一句文本提示。

通过自定义不同权重，2、1、0.5 生成了不同的图片。

输入的提示如下：「/imagine http://imgur.com/romman.png a roman soldier with daisies in the background --seed 123 --iw 2 --v 5」

4. less opinionated

「less opinionated」意味着，在V4中，只需要编写较少的文本提示，Midjourney便会输出更具创造性的图像。

但V5不是这样的，你可能需要输入更多的形容词，并给出更多的细节，比如风格或情绪，输出图像应该是什么样子。如果没有更多描述，Midjourney就会输出一个默认风格，比如「摄影」风格。

这一点升级，可以让人们通过文本提示能够更精准地把控Midjourney输出的内容。也意味着，在输入文本和输出图像之间有「更多的内聚力」。

以上 4 点升级是官方博客中提到，但是最让人意想不到的是 Midjourney V5 能够画出「5 个手指」！

另外，V5 已经在更真实的图像/照片上进行了微调，因此可以看到在输出窗户反射和透过玻璃的图片上更加真实。

考考眼力见

最后来一个测试题：

下面 4 张图，只有一张是真人，其他都是 Midjourney V5 画的，猜猜真人是哪一张？

参考资料：

https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295

https://twitter.com/mranti/status/1637326003927396352?s=46&t=iBppoR0Tk6jtBDcof0HHgg

微信图片_20230104175528.jpg

扫码关注公众号

获取更多技术资讯

上一篇：比尔·盖茨：AI 的时代已经开启

下一篇：云大厂仍在过冬，亚马逊再裁9000人，三个月裁员达...

精选活动更多 >

{{ val.activity_name }}

{{ val.province ? (val.province + ' ' + val.city) : val.location }}

热门文章

中国未来AI力量，藏在2026 WAIC这些首发新品里

中国未来AI力量，藏在2026 WAIC这些首发新品里

2026-07-21

北美AI短剧市场：大厂的游戏，中小公司纯靠赌？

北美AI短剧市场：大厂的游戏，中小公司纯靠赌？

2026-07-21

不危险不配上桌？AI御三家自曝家丑藏心机：安全报告成AI版安兔兔

不危险不配上桌？AI御三家自曝家丑藏心机：安全报告成AI版安兔兔

2026-07-21

刚刚，智谱建了一座只用国产芯片的数据中心

刚刚，智谱建了一座只用国产芯片的数据中心

2026-07-22

第一个被AI做空的国家，出现了

第一个被AI做空的国家，出现了

2026-07-22

千问补课苹果AI：阿里有了自己的“豆包手机”

千问补课苹果AI：阿里有了自己的“豆包手机”

2026-07-22

Kimi，要去IPO了

Kimi，要去IPO了

2026-07-23

阿里腾讯领衔，“反字节联盟”狙击Seedance？

阿里腾讯领衔，“反字节联盟”狙击Seedance？

2026-07-23