找回密码
 立即注册
查看: 1796|回复: 20

一句话生成3D模型:AI扩散模型的打破,让建模师慌了

[复制链接]

1

主题

0

回帖

12

积分

新手上路

积分
12
发表于 2023-5-8 09:40:56 | 显示全部楼层 |阅读模式
英伟达进入 AI 生成模型范围的研究,直接比别人多一个次元:一句描述生成 3D 模型。
机器之心报道,编纂:泽南、小舟。
我们生活在三维的世界里,尽管目前大大都应用法式是 2D 的,但人们一直对 3D 数字内容有很高的需求,包罗游戏、娱乐、建筑和机器人模拟等应用。
然而,创建专业的 3D 内容需要很高的艺术与审美素养和大量 3D 建模专业常识。人工完成这项工作需要花费大量时间和精力来培养这些技能。
需求大又是「劳动密集型行业」,那么有没有可能交给 AI 来做?上周五,英伟达提交到预印版论文平台 arXiv 的论文引起了人们的存眷。
和此刻风行的 NovelAI 差不多,人们只需要输入一段文字比如「一只坐在睡莲上的蓝色箭毒蛙」,AI 就能给你生成个纹理造型俱全的 3D 模型出来。


Magic3D 还可以执行基于提示的 3D 网格编纂:给定低分辩率 3D 模型和基本提示,可以更改文本从而改削生成的模型内容。此外,作者还展示了保持画风,以及将 2D 图像样式应用于 3D 模型的能力。


Stable Diffusion 的论文在 2022 年 8 月才初度提交,几个月就已经进化到这样的程度,不禁让人感慨科技成长的速度。
英伟达暗示,你只需要在这个基础上稍作改削,生成的模型就可以当做游戏或 CGI 艺术场景的素材了。
3D 生成模型的标的目的并不神秘,其实在 9 月 29 日,谷歌曾经发布过一款文本到 3D 的生成模型 DreamFusion,英伟达在 Magic3D 的研究中直接对标该方式。


类似于 DreamFusion 用文本生成 2D 图像,再将其优化为体积 NeRF(神经辐射场)数据的流程,Magic3D 使用两阶段生成法,用低分辩率生成的粗略模型再优化到更高的分辩率。
英伟达的方式首先使用低分辩率扩散先验获得粗拙模型,并使用稀疏 3D 哈希网格布局进行加速。用粗略暗示作为初始,再进一步优化了带纹理的 3D 网格模型,该模型具有与高分辩率潜在扩散模型交互的高效可微分衬着器。
Magic3D 可以在 40 分钟内创建高质量的 3D 网格模型,比 DreamFusion 快 2 倍(后者平均需要 1.5 小时),同时还实现了更高的分辩率。统计表白对比 DreamFusion,61.7% 的人更喜欢英伟达的新方式。
连同图像调节生成功能,新技术为各种创意应用斥地了新途径。


论文链接:https://arxiv.org/abs/2211.10440
技术细节
Magic3D 可以在较短的计算时间内按照文本 prompt 合成高度详细的 3D 模型。Magic3D 通过改良 DreamFusion 中的几个主要设计选择来使用文本 prompt 合成高质量的 3D 内容。
具体来说,Magic3D 是一种从粗到精的优化方式,此中使用分歧分辩率下的多个扩散先验来优化 3D 表征,从而生成视图一致的几何形状以及高分辩率细节。Magic3D 使用监督方式合成 8 倍高分辩率的 3D 内容,速度也比 DreamFusion 快 2 倍。
Magic3D 的整个工作流程分为两个阶段:在第一阶段,该研究优化了类似于 DreamFusion 的粗略神经场表征,以实现具有基于哈希网格(hash grid)的内存和计算的高效场景表征。
在第二阶段该方式切换到优化网格表征。这个法式很关键,它允许该方式在高达 512 × 512 的分辩率下操作扩散先验。由于 3D 网格适用于快速图形衬着,可以实时衬着高分辩率图像,因此该研究操作基于光栅化的高效微分衬着器和相机特写来恢复几何纹理中的高频细节。
基于上述两个阶段,该方式可以生成高保真的 3D 内容,而且很容易在尺度图形软件中导入和可视化。
此外,该研究展示了用文本 prompt 对 3D 合成过程的缔造性控制能力,如下图 1 所示。


为了对比实际应用效果,英伟达的研究人员把 Magic3D 和 DreamFusion 在 397 个文本提示生成的内容长进行了斗劲。平均的粗略模型生成阶段花费 15 分钟,精细阶段训练了 25 分钟,所有运行时间均在 8 块英伟达 A100 GPU 上测得。




虽然论文和 demo 只是第一步,但英伟达已经为 Magic3D 想好了未来的应用标的目的:给游戏和元宇宙世界提供制作海量 3D 模型的东西,而且让所有人都可以上手使用。
当然,最早上线这项功能的可能会是英伟达本身的 Omniverse。
参考内容:https://arstechnica.com/information-technology/2022/11/nvidias-magic3d-creates-3d-models-from-written-descriptions-thanks-to-ai/

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

2

回帖

4

积分

新手上路

积分
4
发表于 2023-5-8 09:41:02 | 显示全部楼层
元宇宙确实需要一个建模工具[捂脸]
回复

使用道具 举报

0

主题

1

回帖

12

积分

新手上路

积分
12
发表于 2023-5-8 09:41:46 | 显示全部楼层
主要是上亿例的3d训练集和标注不好找[捂脸]
回复

使用道具 举报

0

主题

2

回帖

15

积分

新手上路

积分
15
发表于 2023-5-8 09:41:55 | 显示全部楼层
真黑科技了
回复

使用道具 举报

0

主题

5

回帖

7

积分

新手上路

积分
7
发表于 2023-5-8 09:42:24 | 显示全部楼层
一直在找这种工具,可以说是独立开发者的福音了。另外,建议再来一个能自动生成骨骼动画的工具
回复

使用道具 举报

0

主题

2

回帖

0

积分

新手上路

积分
0
发表于 2023-5-8 09:42:59 | 显示全部楼层
牛B
回复

使用道具 举报

0

主题

1

回帖

10

积分

新手上路

积分
10
发表于 2023-5-8 09:43:51 | 显示全部楼层
本来觉得AI最不会取代艺术创作的工作,没想到第一个拿艺术开刀。
回复

使用道具 举报

0

主题

4

回帖

3

积分

新手上路

积分
3
发表于 2023-5-8 09:43:59 | 显示全部楼层
今后游戏素材的ai生成肯定是大势所趋了
回复

使用道具 举报

0

主题

4

回帖

3

积分

新手上路

积分
3
发表于 2023-5-8 09:44:48 | 显示全部楼层
别的不说,倒是给看看布线啊[惊喜]
回复

使用道具 举报

0

主题

2

回帖

20

积分

新手上路

积分
20
发表于 2023-5-8 09:44:58 | 显示全部楼层
都是图片生成的模型,属于粗模型吧。此前不就已经实现拍图生成模型吗?但给出的模型还得人工调节修正布线才能用于生产制作。[吃瓜]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-11-23 19:02 , Processed in 0.059136 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表