Midjourney 5.1 来了，使用更丝滑，网友已经玩嗨了

fei100083 · 发表于 2023-5-8 14:46:10

存眷“FightingCV”公众号
答复“AI”即可获得超100G人工智能的教程
点击进入→FightingCV交流群

Midjourney 5.1已经发布，为生成式人工智能艺术处事质量带来了另一个重大改良。

AI 绘图已经不竭刷新人们对 AIGC 的认知了，AI 的缔造力已经越来越让人惊叹。这不，Midjourney 5.1 的到来再一次将它们的作品推向更高的舞台。

Midjourney 5.1 的引擎 "更有主见"，接近于在 Midjourney4 得到的那种成果，但质量更高，并有一个”RAW 模式，供那些不但愿图像过于有缔造性的人使用。

Midjourney5.1 简短的提示使用起来更加便捷。并有一个 "RAW" 模式（类似于 V5 的默认模式）。但 Midjourney5.1 对比于 Midjourney5 加强了连贯性、提高了对文字提示的反映的准确性，减少了不需要的边框和文字工件，提供了更加清晰的画面。

在推特上，大师都已经开始使用起 Midjourney 5.1 进行新的创作了，看看它的成图效果吧。

推特 @Atelier SG | Digital Art

推特 @Hildiebird

推特 @Pixel_Cognition

推特 @AIFinity76

有作者测试了 Midjourney 5.1 如何措置富有表示力的人像及其色彩，他用到的提示词为” 一个音乐家在舞台上表演的坦率人像，以动态和精力充沛的方式拍摄，灵感来自于米克 - 洛克和安妮 - 莱博维茨的作品，特点是广角镜头和特写镜头的混合，重点是个性和表情，使用快速变焦镜头。“

Midjourney5 成图为左边，Midjourney5.1 成图为右边

可以看出 Midjourney 5.1 图像的布景颜色完美地表达了 "动态和活力" 的提示，而 Midjourney 5 的图像则有些单调。然而，两张图片中的人脸似乎同样超卓。

但当提示词改变为 “一群分歧的人在城市街道上为社会正义而抗议，用纪实风格的编纂图片拍摄，强调此刻的能量和感情，灵感来自于戈登 - 帕克斯的作品，特点是使用快速素描镜头，混合拍摄 " 时，两个版本之间的人脸细节高下立见。

（Midjourney5 成图为左边，Midjourney5.1 成图为右边）

Midjourney 5 已经画出了传神的面孔，但与 Midjourney5.1 的关键区别在于，5.1 版的人脸非常有表示力，符合事件的态度，而 5 版的人脸都是没有表情的。

Midjourney 也已经从头启用了 V5 和更新的机型的 AI 审核，而且此刻比以前更好 —— 人工智能申诉系统此刻限制每天拒绝 25 次，但成功的上诉将不计入你的每日限额。

那么，如何启用 V5.1：在设置中单击 “Midjourney5.1”（在第二行）或在提示后键入 V5.1。官方后续的打算是本周末（5 月 6 日或 7 日）将 Midjourney5.1 设置为默认的版本，并代替 Midjourney4 版本。未来还会进一法式整 Midjourney5.1 风格，并在此之后发布 Midjourney5.2。别等了，赶紧着手尝尝看吧！

往期回顾

基础常识
【CV常识点汇总与解析】|损掉函数篇

【CV常识点汇总与解析】|激活函数篇

【CV常识点汇总与解析】| optimizer和学习率篇

【CV常识点汇总与解析】| 正则化篇
【CV常识点汇总与解析】| 参数初始化篇

【CV常识点汇总与解析】| 卷积和池化篇（超多图警告）

【CV常识点汇总与解析】| 技术成长篇 (超详细！！！)

最新论文解析
NeurIPS2022 Spotlight | TANGO：一种基于光照分化实现传神稳健的文本驱动3D风格化
ECCV2022 Oral | 微软提出UNICORN，统一文本生成与边框预测任务
NeurIPS 2022 | VideoMAE：南大&腾讯联合提出第一个视频版MAE框架，粉饰率达到90%
NeurIPS 2022 | 清华大学提出OrdinalCLIP，基于序数提示学习的语言引导有序回归

SlowFast Network：用于计算机视觉视频理解的双模CNN
WACV2022 | 一张图片只值五句话吗？UAB提出图像-文本匹配语义的新视角！
CVPR2022 | Attention机制是为了找最相关的item？中科大团队反其道而行之！
ECCV2022 Oral | SeqTR：一个简单而通用的 Visual Grounding网络
如何训练用于图像检索的Vision Transformer？Facebook研究员解决了这个问题！
ICLR22 Workshop | 用两个模型解决一个任务，意大利学者提出维基百科上的高效检索模型

See Finer, See More！腾讯&上交提出IVT，越看越精细，进行精细全面的跨模态对比！
MM2022｜兼具初级和高级表征，百度提出操作显式高级语义增强视频文本检索
MM2022 | 用StyleGAN进行数据增强，真的太好用了

MM2022 | 在特征空间中的多模态数据增强方式

ECCV2022|港中文MM Lab证明Frozen的CLIP 模型是高效视频学习者

ECCV2022｜只能11%的参数就能优于Swin，微软提出快速预训练蒸馏方式TinyViT

CVPR2022|比VinVL快一万倍！人大提出交互协同的双流视觉语言预训练模型COTS，又快又好！

CVPR2022 Oral｜通过多尺度token聚合分流自注意力，代码已开源

CVPR Oral | 谷歌&斯坦福（李飞飞组）提出TIRG，用组合的文本和图像来进行图像检索

		自动登录	找回密码
密码			立即注册

Midjourney 5.1 来了，使用更丝滑，网友已经玩嗨了

本帖子中包含更多资源