Midjourney这种AI绘图，对摄影师和设计师而言是祸还是福？

手背靠夕陽 发表于 2023-5-8 10:00:04

先说明：此文所有图片均为梁叔用Midjourney所做

http://pic3.zhimg.com/v2-e04f689b76657830cb1b406b54cb2be6_r.jpg
一夜之间，漫天都是AI。很多人都没想到AI的风口来得如此快速，甚至快到马斯克等大咖也要喊hold on, hold on，停一下。
一部人半信半疑，还有一部人已跃跃欲试。每次技术革命来袭，这样分歧心态的人都存在。这一次是否还有想抗拒的人？
在我看来，chatGPT作为目前AI应用布衣化的核心代表，意味人类科技呈现了一个不成能遏制繁殖的“细胞”，无法逆转，就如同智人呈现最后演变成如今的人类一样，命运可能掌握在宇宙冥冥手里，而不会再由我们傍边的某个人、某群人决定。《暗中终结者》里不管怎么阻止扶植天网的人和路径，最终人类的结局还是要跟AI和机器人对抗……在我看来就是一样的道理。
Anyway，我们这些卡拉米的想法已经不重要。回过神来想想，不管是否拒绝、疑惑、抵当，必需要承认的事情是——AIGC这东西必然会成为内容出产方式的颠覆者，sooner or later而已。
以这两天最新鲜的2023上海车展热搜——宝马冰淇淋事件为例，很多人都发现chatGPT生成的公关声明完胜宝马MINI公司本身发布的声明，甚至chatGPT还在声明中给出了弥补的法子，对比之下，更显得宝马的官方应对口径和方式直落下风。
所以做公关的压力有点大啊，以后我们发声明之前第一时间还得先check一下AI会怎么说，你还不能比AI说得更差，同时还要加快速度发布，否则就被别人用AI来校验对比你的效果。
“写声明”这种事，就是集萃所有人类常识数据库和互联网数据库的AI对人类倡议的挑战，日后这样的事情还会越来越多，我坚信大部门情况下它城市超出我们的预期，颠覆我们个体的想象。因为个体，不成能打赢大数据。
我也向这股新势力“投降”了，不管是敌是友，还是但愿能了解它。也许搞不好，还能及早站在先进出产力的这一边。所以在Rita同学的协助下先搞定了chatGPT的账号，同时注册了Midjourney账号，但25次免费做图的权益很快就耍光了。上周末，狠了下心，采办了一个月Midjourney试用一下。事实上在Midjourney出来前，经常呈此刻我视线里的是开源版的Stable Diffusion，小红书上半年前就已经呈现了不少SD绘制的模拟真人的图，那时候已经心头一震：以后还需要真人摄影吗?
从“写声明”到出图，不管是文字还是图片，以往可能属于PGC和UGC的内容，也许一部门都能用AIGC来代替了。这必然会是一个营销层面的新趋势，只要对内容的需求不熄灭，那图文内容的出产方式就会被重点渗透。视频类面临的挑战稍微会晚一点吧，毕竟AI视频的生成目前还未见开始大量的应用。
但真的开始搞Midjourney，才发现比我想的更强悍。事实上证明，如果你想玩Midjourney，最好还是要花钱。当然，还要魔法上网，以及全程用英文来跟系统沟通。跟ChatGPT分歧的就是它还不能聪明到撑持中文。
从上周六开始，到周日晚结束，两天时间我泡在上面超过5个小时。十三姨非常好奇，这种“图片生成器”为什么能让我坐在电脑前搞那么长时间？
简单来说，就是玩Midjourney，很容易上瘾。我很难解释……也许那是属于缔造者的快乐和感动。我骨子里还是有一种艺术创作的感动，跟拍照类似，而Midjourney无疑用夸张的方式、很低的门槛满足了我们这种人的创作欲望。微微动一两个提示词字眼，甚至在后缀参数上调几个分歧数字，就能无限制地产出各种照片和丹青。那种面对未知、又等闲被大量满足的过程，让人极度满足又衍生出更多贪欲。喜欢做创作的人，一旦面对Midjourney，会难以控制被它吸引。如果你也曾从某些热爱的事物中获得过难以言喻的快感和成就感，而且被驱动着不竭去翻越和攀登，那你就能理解我所表达的这种感觉。
当然，一开始我也有某个瞬间心态略矛盾，毕竟这玩意夺走了相机摄影的意义和本质。Jovi说，你搞这东西变成了“宅摄影”——宅在家里就能完成的“摄影”。所以它究竟是毁灭了摄影还是说换个角度助长了摄影的热情？
这是无法等闲得出答案的问题了，to be or not to be，类似这个难度。
到我玩Midjourney的第二天结束，收到了系统的通知，说我已经获得1000社区的认证。啥？我仔细一看，靠，本来这意味着我已经渲了1000张图了……按照1000/4=250来算，代表我对系统倡议了250条prompts（提示词的意思）的请求，我们把prompt戏称为Midjourney的咒语，意思就是输入什么关键词组合，能让系统生成什么成果。如果你留意下，小红书上此刻满布这样的咒语推介，一时之间标致小姐姐退散，AI的图片在我小红书的保举页横行，实在没想到有一天会这样。
我学习Midjourney的方式，并不是先找个教程从头至尾学完了才动手，而是采用了我在PS里自学滤镜差不多的方式——出格简单的系统设置了解一点之后，就先用别人的咒语来测试，出图之后本身再来改削各种提示词，而且一边改削一边用excel表格直接记录下各种类型的关键词和prompt。我之前学习P图方式也类似这样的，下载成百上千的Camera RAW滤镜，然后一个个测试，按照实际照片改削滤镜参数，再另存为本身可用的预设。最终那些滤镜都变成我本身的版本，而且我调整后的版本，必然比原始的版本更都雅更牛逼。那都是我电脑里不能丢掉的财富，凝聚着时间和汗水。
网上已经有人开始卖打包的Midjourney关键词了，但我懒得买，因为我并不需要一个大而全的词库，理论上在学会它的逻辑之后，我只会聚焦在本身喜欢的主题上，所以完全可以本身摸索、收集出阿谁主题下所需要的关键词。只是前期我需要通过测试大量别人的咒语来“喂养”我本身的词库，提升我对各种参数的熟练度——这么听起来在某种程度上，我也采用了AI的学习模式。方式可能斗劲笨。
接下来，是见证咒语变成魔法的时候了，我从所渲的超过1000张图里头，挑一些跟还没见识过AI绘图能力的伴侣分享，展示下到底AI能做出什么样的效果。
人像

目前Midjourney进化到V5引擎，这个版本对于欧美人的面容把握得非常牛逼了，甚至某些环境下皮肤、毛孔都真实得吓人。对比之下，生成的亚洲人和中国人的面容都还是有点差距，我认为还是数据问题，AI并不太懂得我们中国人长啥样，尤其是男性，它很容易把中国男人搞出越南人的feel。所以往往我被迫都在咒语中加一个demo的reference，以此来把人物的颜值拉高一点，这tnnd有点可笑？
先上一组半身为主、中国女性人像：

http://pic2.zhimg.com/v2-660458024a898748871e24f64549d085_r.jpg

http://pic1.zhimg.com/v2-26bb23217fc546aa8da72657f24a6a2c_r.jpg

http://pic4.zhimg.com/v2-0ac16c86c48a845e58ce305c5f36de0f_r.jpg

http://pic3.zhimg.com/v2-1cea22847044f171544800f8169a5bfe_r.jpg

http://pic2.zhimg.com/v2-dbef80e4ce6b73b3eac1e5920dd6f2c1_r.jpg

http://pic1.zhimg.com/v2-e6478b535993249ccb7b1bac648fc874_r.jpg

http://pic2.zhimg.com/v2-ba6504131011523cff3817d1c6337c19_r.jpg

http://pic2.zhimg.com/v2-d180fca214d333a07b4e3af9c6d0f575_r.jpg

http://pic4.zhimg.com/v2-f39fbb98eaed37d644b86b8ee4d2063f_r.jpg

http://pic3.zhimg.com/v2-dc368d98b62e057076a78e23781e4d72_r.jpg

http://pic4.zhimg.com/v2-074642939a4f525147aed04a6ae4432f_r.jpg
相信你看完这一组之后，惊讶之余，也会看出她们的问题，就是皮肤就像过度“美图秀秀”了，毛孔啥的都看不到，能看出来有一些些假。而且你们绝对想不到我在这些中国女性人像的咒语里，设置了谁作为reference。
再来看一组所谓“中国男性”：

http://pic2.zhimg.com/v2-ea687b7cd9643c6058377138eb542831_r.jpg

http://pic2.zhimg.com/v2-eeedd3fe0dc3ecd24bf429dbb74827e1_r.jpg

http://pic2.zhimg.com/v2-f20746572a2f92a8a598233b03ab9e55_r.jpg

http://pic2.zhimg.com/v2-868182d523c21e6db1298bbd65ecb971_r.jpg

http://pic3.zhimg.com/v2-98251de1d538a0287f73a214c6dc3ebe_r.jpg
这颜值，真的一言难尽啊……当然，我也在思考，是不是跟我的咒语有关系，我的描述还不够准确，以至于AI自由阐扬过了火。
但是换成欧美面孔，真实度和自然度则提升了不少。

http://pic1.zhimg.com/v2-a27d0d861f876bf82064ea65a8595608_r.jpg

http://pic4.zhimg.com/v2-05d1c35d0cd62d1980e77072b66cd83f_r.jpg

http://pic4.zhimg.com/v2-d80d4a7f3ddb6ab5de51773785d26d73_r.jpg

http://pic3.zhimg.com/v2-c7aee789bca729a1d9aa45b268ac0d46_r.jpg

http://pic4.zhimg.com/v2-269100742fd78a05a2266c6b157921cf_r.jpg

http://pic3.zhimg.com/v2-b7e26b3e6b6425d7a539ff6c76ead26e_r.jpg

http://pic3.zhimg.com/v2-5bc0f913a99c953ba6dd5d57692477fa_r.jpg

傍边有个别几张，真的我已经分不清真伪，汗毛耸立暗示敬佩。但想想，这是强大的AI啊，理论上可以做到基本100%真实才对。
而且Midjourney这种AI非常擅长缔造复杂、充满想象力的环境，因此环境人像也变得超乎想象的容易。

http://pic4.zhimg.com/v2-5f2224382f60e2f49e7032dbc069e0af_r.jpg

http://pic2.zhimg.com/v2-5a9a6e77df2da09b6e3fdca2e9d68ca9_r.jpg

http://pic2.zhimg.com/v2-ab67a2c418842401f24f83631a1ed51d_r.jpg

http://pic4.zhimg.com/v2-bee18f68b729170613b17305410d561f_r.jpg

http://pic4.zhimg.com/v2-a0084431d5c6ae14090d3e7cc470d263_r.jpg

http://pic4.zhimg.com/v2-1ffd41522aa447a84ec053a1f0eea01f_r.jpg
静物

传神度最高的图，是那些偏静物的图，尤其是小体积的静物。我主要测试了相机、香水、酒瓶等，都让人对劲到不行，头皮发麻。

http://pic3.zhimg.com/v2-bd950309d8510314167f5db68f311262_r.jpg

http://pic2.zhimg.com/v2-67f558a735e16f6ffef92e41645950c9_r.jpg

http://pic1.zhimg.com/v2-85745f6c7ea78412f0862b35b737947c_r.jpg

http://pic3.zhimg.com/v2-1af00db7df45bc2f7570bef13b4e92da_r.jpg

http://pic3.zhimg.com/v2-5783f6719bb3d86f04b77ef49e7c81ca_r.jpg

http://pic1.zhimg.com/v2-c01ea199306c9b23d34d154f75702728_r.jpg

http://pic2.zhimg.com/v2-e56e5776a211eff4937b393c154aedd9_r.jpg

http://pic1.zhimg.com/v2-5dbcc8ba473fb68e4837e3ca4d333174_r.jpg

http://pic1.zhimg.com/v2-51265288aaedc487f9fb2c6086bf74b4_r.jpg

http://pic4.zhimg.com/v2-0ce9dc3c9cceafdc1eb8de92cf012b6b_r.jpg
建筑
跟建筑主题相关的输出精度都较低，不知道为啥，跟人物和静物的精度质量就是没法比。这种精度我指的是点击大图之后所看到的图像细节。所以我还在思考是不是本身的咒语有问题。

http://pic1.zhimg.com/v2-45a6db3ce6bfab8496e7191e072c0960_r.jpg

http://pic3.zhimg.com/v2-564392876df87e346508592b9a09f752_r.jpg

我特地用主题化的方式做了一组建筑类图片，用保鲜膜把建筑包起来，这个灵感主要来自于之前凯旋门被打包的阿谁艺术行为。我感觉这是AI绘图最好玩的处所，就是你可以为某个对象制造系列化的创作，或者围绕某个主题做出各种别致的挖掘。

http://pic1.zhimg.com/v2-4af0ddadcffebd18f751155cc860f4ec_r.jpg

然后我用这个方式把卢浮宫用塑料膜包起来……

http://pic4.zhimg.com/v2-da116aec24e45339689d4f4a18633fdf_r.jpg

http://pic3.zhimg.com/v2-793348fafcd3e96033d21f2f449740ee_r.jpg

http://pic3.zhimg.com/v2-0e98f7b78f3c9a18f4e755b80efde076_r.jpg

http://pic1.zhimg.com/v2-f6086917ed3ac7922f562ae6b638557c_r.jpg

http://pic1.zhimg.com/v2-91851ba309b8dd24604d46c2cad3d5c0_r.jpg
如果你纳闷为啥没有了卢浮宫标识表记标帜性的玻璃金字塔，这就是涉及到Midjourney的版权设定问题。为了避免对现实世界的侵权，它会刻意避开跟现实一模一样的输出。这个问题，也呈此刻所有具有品牌属性的商品和所有静物傍边。包罗我上面输出的香水和下面会呈现的汽车车型上。
汽车

终于来到本行。这估计会是我日后大量测验考试的主题。如我上面所提，因为版权问题，AI必然会对你输入的产物做一些变异，比如说你不成能得到跟现实一样的东方明珠或卢浮宫，它总会某个特征位置长得分歧；所有汽车的logo城市变形或者故意错误谬误啥，不会跟你输入的logo一样，而且车型长得也跟现实车型的设计有一些差异。当然，不排除在参数设定上还有一些窍门我没抓住。但我此刻的发现就是用它来直接衬着出跟现实某个具体东西一模一样，暂时不成能。但日后更强大的商业化介入之后，我相信它必定可以撑持数模输入，产出真实的商品衬着效果，这个应该不会太久了。
先看一组静态的、偏影棚感觉的车图：

http://pic4.zhimg.com/v2-05d9ca90bfb8f58fea4150b7cacd221b_r.jpg

http://pic3.zhimg.com/v2-bb1048ebb4ff273358c02b7977ff3196_r.jpg

http://pic3.zhimg.com/v2-f777e88d9dfb8ca44084f47b5d1adb4e_r.jpg

http://pic4.zhimg.com/v2-2f00234a032019e1b3b4c2ca358b053f_r.jpg

http://pic1.zhimg.com/v2-4479162de194db247199fc03c443a2fc_r.jpg

http://pic1.zhimg.com/v2-91c564f684282bcf984e1122b2a04ec8_r.jpg
再来一组户外、动态的图：

http://pic3.zhimg.com/v2-c50e6cccbab0e690ac58a4b501a31c5e_r.jpg

http://pic1.zhimg.com/v2-dcfcf99f4b3df164d811aaec10018fd0_r.jpg

http://pic2.zhimg.com/v2-0e954363e01b905cf504967aa06017f9_r.jpg

http://pic2.zhimg.com/v2-4525f9ba9a09401a7853981d27300b65_r.jpg

http://pic1.zhimg.com/v2-69977dd547cc4d981cf843c0f21d1cd8_r.jpg

http://pic1.zhimg.com/v2-ec436feeedc852399bdb25e4013c2ab4_r.jpg

跑个山：

http://pic4.zhimg.com/v2-fc4b4f35027af6b3121fdb150c0d5e07_r.jpg

http://pic4.zhimg.com/v2-532cc5290c77045734bc6e1b9aec381b_r.jpg

http://pic2.zhimg.com/v2-67f6ad541d7e51ae668f337653fd69c1_r.jpg

加一组城市街道里的露出：

http://pic2.zhimg.com/v2-663da91a11b007f71e888ada1d935315_r.jpg

http://pic3.zhimg.com/v2-af59d15b0d832338ceb91b6589d1815a_r.jpg

http://pic1.zhimg.com/v2-5b9eb8d16b05ffc0cb072b4ff16e2604_r.jpg

http://pic2.zhimg.com/v2-34235fe5ff741e7214932ac505f580bd_r.jpg

http://pic1.zhimg.com/v2-40289b7e395ba4be33ae715680bd10cc_r.jpg
还测试了一下多车组图：

http://pic2.zhimg.com/v2-2d1a2172fc14d4d77fab4351a7e090e9_r.jpg

http://pic1.zhimg.com/v2-e98f9c2e486a62d5291704b9c93c2474_r.jpg

http://pic4.zhimg.com/v2-eea4a8fad9e873e16f15415a07acd37b_r.jpg
上面图里的车型我基本都是用本司的一些品牌作为关键词丢给AI，但你们会发现的确没有一款跟现实里的它们100%一样的设计。所以比来车展期间阿维塔在小红书做了一个活动，就是号召网友用Midjourney里头“垫图”的方式来为阿维塔设计行驶在分歧风光和场景下的图，事实上这样是无法在AI的出图里得到原本阿维塔的模样，只能先用AI生成风光，然后再用PS后期抠图把车子塞到风光里。
其他设计我还用Midjourney做了一些参差不齐的测验考试，比如说昨天一位伴侣说让我辅佐给他们的一个汽车行业panel discussion活动出一组KV设计，关键词主要就是汽车新能源，变化和不变。我额外添加的关键词不多，除了第一组的四张图是给了一些明确的布景要求，其他的关键词都变化不大，但后缀里的style和chaos的参数做了好几种分歧的组合，让AI本身阐扬：

http://pic2.zhimg.com/v2-923110f91a4bbb86fa7327f678cc445d_r.jpg

http://pic3.zhimg.com/v2-0beb705d156262c4acfded4740657efe_r.jpg

http://pic3.zhimg.com/v2-e5b1d12b6f731ab5283b67943ca120d6_r.jpg

http://pic2.zhimg.com/v2-6de018adc2f66bf45078bb320bad56b1_r.jpg

http://pic3.zhimg.com/v2-475493a82e7e8fc33df4dd0b7114f282_r.jpg

http://pic1.zhimg.com/v2-ea5d8e0bf816b10262ba7a5fb4e8a1b8_r.jpg

http://pic4.zhimg.com/v2-6ca525e4d560ff6329df819571fc4673_r.jpg

http://pic1.zhimg.com/v2-671fbc2692cac2f512e3b5e25773f47c_r.jpg

也许第一眼看到会感觉风格太迥异，但这正是它的优势，可以无限制输出各种可能性，带给你更多灵感。当然，你也可以给它更明确的约束，让它尽可能贴近你的描述。
下面是我此外随便做的一些设计，包含插画、3D设计和风光等。量不多，只是我当时想了解下Midjourney的能力。

http://pic1.zhimg.com/v2-0f4d1b2b4563ac0502132a93f51fe55c_r.jpg
（上图：这是我用法罗群岛的照片给到系统，让系统本身describe出咒语之后让系统生成的，成果跟我原图非常非常相似，我感觉是AI通过咒语完全辨认出这是现实世界里的法罗群岛）

http://pic2.zhimg.com/v2-f691cc445e39ceb20acaef5a04197941_r.jpg

http://pic1.zhimg.com/v2-f1a045c25f4f773523f7a8b54884104c_r.jpg

http://pic4.zhimg.com/v2-b71908c007bb30e626017b5d501880e7_r.jpg

http://pic2.zhimg.com/v2-a4267503cfa4ab610d35dd5e37daae8d_r.jpg

http://pic4.zhimg.com/v2-8791ace7059f7ed2d4db7ae96ffb5327_r.jpg

http://pic3.zhimg.com/v2-7a39fd5da31a90dcff6818abd6ee9a6a_r.jpg

http://pic2.zhimg.com/v2-60373139304b49d2dc1a99aed2cf5ebd_r.jpg

http://pic4.zhimg.com/v2-0bb7273375203c31c320dc1fdce0c0bb_r.jpg

http://pic2.zhimg.com/v2-0f808d05e256c2e0b9f2ca8d71fe6971_r.jpg

下面这张卡通图，是用左边的图作为“垫图”，然后插手其他卡通相关的咒语来做的人像卡通形象，这个也是目前蛮多人正在玩的，可以用来给本身微信替换个卡通头像。

http://pic3.zhimg.com/v2-cb97845cb2f124b9d8fb86430f69455a_r.jpg

对插画、平面设计、3D设计、卡通等创意设计师来说，这种冲击是致命的呢，还是说这是超级爽的工作刀兵？
从工作层面来看，我更倾向于同意这是后者，它将提升所有人的工作效率。从社会的角度来看，它是前者，因为我瞥见它对于人类创作灵魂的碾压，以后不需要我们人类费脑子去想创意了，AI给你答案，只需要我们抄下来改削下即可，我们成为临摹者，这必然最后导致没人愿意去思考、创新了……
不能深思，细思极恐。更有甚者，之前我们用特定的问句测试chatGPT时，它还给出了“毁灭人类”这样的回答。不知道这是打趣还是它无意识下的有意识。
但这恐怕是人类的命运，我还是那一句——不由个体所掌控。
另，我在知乎的另一条回答里会不按期更新我作品的 prompt：
除此之外，我的微博和小红书账户上也会分享Midjourney的一些咒语和本身的使用体会，欢迎存眷“荒梁大叔”。

页: [1]

T9AI - 深度人工智能平台's Archiver

Midjourney这种AI绘图，对摄影师和设计师而言是祸还是福？