|
发表于 2023-5-15 15:17:18
|
显示全部楼层
Prompt 控制准确度的基本测试,对比两个版本
V4 在左边,V5 在右边,都使用了完全一样的 Prompt。
穿白衣服的男人坐在红椅子上拿着蓝色的水杯。最常见的染色溢出问题还是很严重。
a men wearing white suit sitting on a red chair, holding a blue cup
“抱猫的机器人”, 这个 Prompt 我用 v5 跑了好几次,每次都是猫头机器人,新版本中两个对象貌似出现了比 v4 更严重的混淆问题。
a robot holding a tabby cat
3 个柠檬和 2 个玻璃碗,数量依然不能精确控制。不过我觉得 v5 的水彩渲染要远好于 V4,但油画风格的渲染都一样不合格
oil painting of still life, 2 glass bowl and 3 lemons
watercolor painting of still life, 2 glass bowl and 3 lemons
马依然不能骑宇航员
A horse is riding on the back of an astronaut
多物体的空间关系也仍然无法精确控制,不过 V5 里起码每一张都生成了一把椅子。
A ball is placed inside a box, and the box is placed under a chair.
V5 相比 V4 的优越之处
V5 在镜头语言的控制上,相比 V4 实现了非常明显的进步,光影的渲染也更写实、自然。AI 感已经变得很弱了,几乎肉眼难辨。
POV 第一视角
pov shot of 3 cats watching you
俯拍镜头 overhead shot
overhead shot of 3 cats watching you
低角度镜头
v5 有一张做到了非常标准。V4 基本是胡来
super low angle shot of 3 cats watching you
高角度镜头
super high angle shot of 3 cats watching you
浅景深,V5 比 V4 自然得多
Shallow Focus Shot of 3 cats watching you
深景深
deep Focus Shot of 3 cats watching you
V4 在生成 bird eye view 的同时还生成了 bird 和 eye
eye bird view shot of a white sand beach, ocean wave foam
全身像。大部分时候,用 V4 生成 full body 都不是真正的全身像(没有脚部或者膝盖以下),V5 里表现要好很多
full body portrait of a Zombie Bride
半身像。V4 一个被诟病的问题是,每组 4v1 生成的结构,构图都过于接近,而且人像太容易出现中心对称构图。V5 应该是增加了每批次 4 个种子的随机变量,每批结果的构图会更多样。下面的对比可以观察到这个结果。
half body portrait of a Zombie Bride
侧面像 + knee shot
side view portrait of a Zombie Bride, knee shot
广角,场景和构图更多样
a cowboy riding a running horse, full body horse, wide shot
V5 相比 V4 的倒退之处
1. 虽然摄影类风格的生成更写实和自然,但比较下面放大的僵尸新娘和牛仔骑马场景,可以发现 v5 的生成都像打了柔光,都笼罩上了一层影楼滤镜或电影滤镜。相比 V4,虽然 AI 感降低了,但也一定程度上牺牲掉了成像的细节,清晰和锐利程度都明显下降。
2. V5 倾向于照片化一切生成结果,而且有一种 “糖水感”。
a stunning futuristic cabin, floating on the sea level, the tumultuous sea, masterpiece, inspired by lawren Harris
by Tony Cragg , character, ink art, side view (https://lib.kalos.art/artist/63ec1157-6cf8-4f04-871e-2ed96225db1e?model=1)
3. 下面两组都是艺术媒介测试,铅笔素描和版画风格的弗兰肯斯坦,V5 会过度添加细节,也基本丢失了艺术媒介的特征。所以想用 MJ 生成 fine-art 类作品的 (除了水彩),还是退回 V4 版本吧
pencil drawimatchng of portraitof Frankenstein, artistic, detailed
fine-art woodcut pringmaking of portrait of Frankenstein, artistic, masterpiece, detailed
4. V5 生成构图更碎片化,同时也有明显的锐度丢失的倾向
by Tomek Setowski , city landscape (https://lib.kalos.art/artist/0ce5871e-630d-4bdb-bab6-ec20357a3937?model=1)
M C Escher style Stairway to Hell (https://lib.kalos.art/artist/f0d8bff7-db5c-4a53-a3d4-b9a201306005?model=1)
5. V5 会倾向于生成过多不必要的细节,对画面主题的美感和结构都有很负面的影响
Cat Goddess by H.R. Giger, half body, super-detailed, white and Pearlescent :: 2, melting vintage gold Fragments :: 1 (https://lib.kalos.art/artist/0363b74e-fd51-44c3-bb02-5bedd13decc3?model=1)
再次生成时,我去掉了 Prompt 里的 “super-detailed”,情况并没有得到改善。
Cat Goddess by H.R. Giger, half body, white and Pearlescent :: 2, melting vintage gold Fragments :: 1
highly detailed beautiful organic molding, white smooth shiny polished marble, art nouveau, sharp focus, dynamic lighting, elegant harmony, beauty, masterpiece, only oni mask, cyberpunk,
Demon’s Crown, by Camille Claudel (https://lib.kalos.art/artist/f669d8ff-54d0-4160-b1c6-24e0a27c55f5?model=1)
平面插画类的生成,也出现过于繁复的笔触和构图
by Alphonso Mucha , stunning natural landscape, church (https://lib.kalos.art/artist/e0cab3c5-5b91-4834-a751-0e27d6179383?model=1)
feline animal painting by Utagawa Kuniyoshi (https://lib.kalos.art/artist/67afd69d-11f5-408e-bd48-b7f2535d52eb?model=1)
by Amanda Sage (https://lib.kalos.art/artist/501c2b6a-9284-4104-b71b-9dac30b43ac2?model=1)
以上对比评测都是用同样 Prompt 在两个版本里首次生成的结果,尽量避免了人为的 cherry picking。如果结果太意外,我会多次生成以确认。
个人评价意见仅供参考。在生成不同主题和风格的作品时,该选择 V4 还是 V5?希望这个对比评测能对你有所帮助。
Praying Hands, young lady’s hands, shining smooth skin, realistic , close-up view, clear background, Minimalism, artistic, atmospheric, masterpiece, sharp focus, hyper-detailed, 500px
BTW, 传说中 V5 解决了的手指问题,好像并没有哦~~
<hr/>上月我发布了 AIGC 艺术家样式库 lib.KALOS.art 。一个 4 人小团队前后忙了 4 周。
- 目前全球规模最大,1300+ 艺术家共 3 万余张 4v1 样式图片
- 覆盖三个主流图像生成模型
- 为每个艺术家都生成了 8~11 种常见主题,如 人像、风景、科幻、街景、动物、花卉等主题
艺术家和多种主题的结合,会带来很多意想不到的结果。
后现代舞台设计师去画废土科幻场景?or 立体主义雕塑家去画一张猫咪?
按人类惯有思维,用肖像画家去生成肖像,用风景画家去生成风景,其实限制了AI模型的创作力和可能性。
https://lib.kalos.art/artist/6eded638-369c-4f0b-87d8-7203373bd964?model=1
https://lib.kalos.art/artist/65ce249f-e68c-4b06-9031-670eedfa2c8b?model=1
希望 lib.KALOS.art 能帮你发掘 AIGC 的潜力,得到更多创作灵感。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|