菜单

Midjourney V6超进化,大神网友深度评测来了!画质逼真到可怕,人像图片令人惊呆

区块链 2024-01-20 11:25:03

【#区块链# #Midjourney V6超进化,大神网友深度评测来了!画质逼真到可怕,人像图片令人惊呆#】

文章来源:新智元

Midjourney大神的超深度测评来了!V6比起V5.2究竟有哪些改进?来感受一下吧。

图片来源:由无界 AI生成

最近,国外的一位名叫Andrei Kovalev的大神网友,做出了一份Midjourney V6的超深度评测。

指南很专业,V6和V5.2有什么不同,很直观地就能看出来。

下面,就让我们来跟随大神的脚步,深入感受一下Midjourney V6的性能有多强吧。


V6模型,究竟比V5.2强在哪


在以往,当我们看一张AI生图时,可能马上就会感觉到这是AI画的。

但在Midjourney V6中,你很少会有这样的感觉。

在这一部分中,Kovalev介绍了V6的优势、劣势,以及和V5.2相比的主要变化。

Tim Walker的高级时装正面肖像,清澈的白色空灵机器人,半透明的皮肤淹没在电线的海洋中。红色和青色色调,发光的高光,深色阴影

V6

V5.2

Kovalev发现,V6有以下升级(因为当前还处于Alpha测试,以后还会发生变化)。

在遵循提示时更准确了,并且使用更长的提示时,效果会更好。
新模型的一致性大大增强了。
V6改进了图像提示功能。
现在V6有了两个新的升频器,具有微妙和创意模式(都将分辨率提高了两倍)。
有一个「unopinionated」的 --style raw模式(类似于 V5.2)。
此外,还可以在图像中添加文本了。

所以,V6究竟变成了什么样子?


超现实主义


以往每次的Midjourney升级,都会提升照片的真实感,V6也不例外。

最能定义V6的关键词,恐怕就是超现实主义。

川内凛子的少女太空飞行员摄影肖像

V6

V5.2

总而言之,V6的逼真度爆表,上升到了一个新台阶,尤其是在摄影风格上,已经到了让人迷惑的程度。

Kourtney Roy的老海员摄影肖像

V6

而Midjourney V6中逼真图像功能之所以如此惊人,恰恰是因为存在缺陷:镜头像差、故意过度突出的区域、意外的失焦元素以及各种胶片效果。

Mitsuo Katsui拍摄的初音未来照片 --stylize 175

当然,V6不止是人像画得好。

第比利斯的延时摄影 --stylize 175

而且,在某些情况下需要更微妙的外观和感觉,这时V6的超现实主义就显得有些尖锐,显得有些矫枉过正。

Ara Guler对1970年代伊斯坦布尔赌场赌徒的肖像

V6

V5.2


细节很疯狂


每次在Midjourney的下一个模型发布之前,许多人都会屏住呼吸,想看看他们会如何处理细节。

V6中的细节,很疯狂。而新的upscalers功能,则让细节更进一步。

Ivan Bilibin的画作,描绘骑着白狼的冬季领主

V6

V5.2

不过,虽然图像的复杂性随着每个新模型的出现而稳步上升,但在此过程中,却丢失了一些东西,比如纹理。

比如,V4的精细程度在V5+中提高了十倍,因此几乎不可能实现胶片颗粒或真实笔触这类效果。

虽然离真正的颗粒感似乎仍然遥不可及,但V6显然朝着以前失去的原始性,迈出了明确的一步。

它的纹理令人惊叹,比起V5来大放异彩(在V5中,需要选择「non-refined」的视觉风格)。

Marianna Rothen的梦幻女孩

V6

V5.2

另一个能很好地描述V6的概念,是非常规组合(unconventional composition),这导致了V5.2中结构化和平衡方法的重大转变。

以前的模型追求几何完美、黄金比例和中心主体,而V6追求不对称,经常将主体从画面中间移开。

Tyrus Wong的跨维度神秘野兽

V6

V5

这可能会提供更具动态性和吸引力的视觉效果,但也需要相应地调整提示。即使是很小的调整,也可以恢复中心构图和对称性。


可变性增强


可以看到,在V6中,同一提示结果的可变性增强了。

与早期模型相比,单个提示的四个变体,通常显示出更明显的差异。

Jessie Willcox Smith的《银术士》

V6

V5.2

许多情况下,这会产生一种更具创意、更有趣,有时甚至更忠实于现实生活中原型的多样性的艺术风格表现。


艺术风格


在提示中,我们可以引用「Style modifiers」的名称,召唤图像的特定视觉风格、技术、流派、主题或上下文。

像素艺术

V6

V5.2

现在,每个新模型都更善于了解源材料,并且在输出中重新创建它,这已经是一个传统。

然而,Midjourney从未停止这种戏剧性的变化。

by Jody Bergsma

V6

V5.2

无论这些风格本身多么伟大,真正将它们从对原作的单纯解释转变为独特的东西的,是我们添加的提示。


图片中添加文本


双手拿着报纸,标题为「Midjourney的文本 - 真实还是骗局?」

V6

V5.2

更多详解,还请参考原文网站。

参考资料:

https://midlibrary.io/midguide/midjourney-v6-in-depth-review-part-1-overview

上一篇: 拆解Thrupenny 详细分析Thrupenny骗局套路 资金盘模式让人忧

下一篇: 以太坊的坎昆硬分叉后下一个升级应该是怎样的

关闭