找回密码
 立即注册
查看: 241|回复: 0

Midjourney V6 Beta版本正式发布

[复制链接]

1

主题

0

回帖

5

积分

新手上路

积分
5
发表于 2024-9-13 16:20:41 | 显示全部楼层 |阅读模式
近日,Midjourney V6 Beta版本正式发布,给用户带来了很多惊喜。
按照官方说明,Midjourney V6 Beta模型将会撑持更长的提示词,模型也会具备更强的常识和连贯性。最重要的是,V6的提示词布局将会发生大的变化。之前被网友广泛使用的award winning,photorealistic,4K等无用的词条,将会成为历史。
和V5分歧的是,V6更需要精确的提示词,而不是斗劲宽泛的通用术语。新的提示词布局由风格化词条、动作、位置、照明和额外信息组成。登录到Midjourney,就可以切换到V6 Beta版本。
和V5无版本分歧的是,V6生成的图像更加真实。例如,人物面具上的灯光反射效果非常真实,细节措置也很到位。相对于V5版本,V6具备更强的提示词理解能力。例如,V6对面部表情词条的理解,可谓非常准确。生成的人像更接近专业摄影作品。


上图中,左侧图像是V5版本,右侧图像是V6版本,可以看出V6对专业摄影术语的理解上,远超上个版本。
图像三,V6在对整体提示词理解,以及场景还原能力方面,也要强于V5版本。通过多组测试,在人像摄影中对光影的应用和长题是词理解方面,已经无可挑剔。
下图是,躺在地上的女性,V6模型生成的图像,更符合提示词,也符合大大都人的审美不雅观。


V6还对vary功能进行了强化,可以保持图像风格的连贯性。例如,在初始提示词中改换汽车的类型,画风,图像布局,依然保持了高度的一致。
此外,Midjourney V6还具备强大的文本显示能力。从生成的组图可以看出,V6模型可以在正确的位置显示完美的文本,效果非常真实。尽管还不是百分百完美,作为扩散模型,V6对文字的还原能力,已经非常出众。在和之前发布的DALLE3模型相对比后,二者均可生成精确的文字,不外,在图像质量上,Midjourney V6还要远超对手。
Midjourney V6的upscale功能,可以将生成的图像,放大到4K以上画质,已经达到超清程度。
除了具备很强的人像生成能力,V6还可以生成传神的装修效果图,以及水彩、油画风格的作品。在对名人明星的刻画方面,你这里也能生成媲美真人的效果,完全看不出合成陈迹。
在动漫图像生成方面,V6版本也有不错的表示。下一张图像,阳光照耀下的大峡谷,光线,暗影效果非常真实。在多组自然风光测试中,V6都可以生成堪比国家地舆杂志的图像。
此外,V6模型依然擅长生成美食和动物类图像。
在对知名品牌和产物的还原方面,也达到了专业级水准。下一组图像,夜色下的跑车,光线反射效果,已经达到了极致的效果,以及类似速度与激情电影场景中的汽车运动画面。


目前,V6 BETA已经面向所有用户开放。大师可以自行测验考试,把v6生成的图像通过RunwayML制作成短视频,效果堪比电影水准。按照按照Midjourney官方说明,在Beta测试期结束后,v6正式版本还会增加新的命令。
总之,V6版本的推出,意味着ai绘图东西已经达到了超高画质,单反相机的拍摄程度。访谒Midjourney,就可以测验考试这个强大的模型。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-11-21 23:57 , Processed in 0.058936 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表