本篇文章给各位网友带来的资讯是:网上随便搜的图就能 AI 合成渲染手办,甚至已有网友开发游戏 NFT 详情请欣赏下文
渲染一个精细到头发和皮肤褶皱的龙珠 3D 手办,有多复杂?对于经典模型 NeRF 来说,至少需要同一个相机从特定距离拍摄的 100 张手办照片。

但现在,一个新 AI 模型只需要 40 张来源不限的网络图片,就能把整个手办渲染出来!

这些照片的拍摄角度、远近和亮暗都没有要求,还原出来的图片却能做到清晰无伪影:

甚至还能预估材质,并从任意角度重新打光:

这个 AI 模型名叫 NeROIC,是南加州大学和 Snap 团队玩出来的新花样。

有网友见状狂喜:
不同角度的照片就能渲染 3D 模型,快进到只用照片来拍电影……

还有网友借机炒了波游戏 NFT(手动狗头)

所以,NeROIC 究竟是如何仅凭任意 2D 输入,就获取到物体的 3D 形状和性质的呢?
基于 NeRF 改进,可预测材料光照
介绍这个模型之前,需要先简单回顾一下 NeRF。
NeRF 提出了一种名叫神经辐射场(neural radiance field)的方法,利用 5D 向量函数来表示连续场景,其中 5 个参数分别用来表示空间点的坐标位置(x,y,z)和视角方向(θ,φ)。

然而,NeRF 却存在一些问题:
对输入图片的要求较高,必须是同一场景下拍摄的物体照片;
无法预测物体的材料属性,因此无法改变渲染的光照条件。
这次的 NeROIC,就针对这两方面进行了优化:
输入图片的场景不限,可以是物体的任意背景照片,甚至是网络图片;
可以预测材料属性,在渲染时可以改变物体表面光照效果(可以打光)。
它主要由 2 个网络构成,包括深度提取网络(a)和渲染网络(c)。

首先是深度提取网络,用于提取物体的各种参数。
为了做到输入场景不限,需要先让 AI 学会从不同背景中抠图,但由于 AI 对相机的位置估计得不准确,抠出来的图片总是存在下面这样的伪影(图左):

因此,深度提取网络引入了相机参数,让 AI 学习如何估计相机的位置,也就是估算图片中的网友是从哪个角度拍摄、距离有多远,抠出来的图片接近真实效果(GT):

同时,设计了一种估计物体表面法线的新算法,在保留关键细节的同时,也消除了几何噪声的影响(法线即模型表面的纹路,随光线条件变化发生变化,从而影响光照渲染效果):

最后是渲染网络,用提取的参数来渲染出 3D 物体的效果。
具体来说,论文提出了一种将颜色预测、神经网络与参数模型结合的方法,用于计算颜色、预测最终法线等。
其中,NeROIC 的实现框架用 PyTorch 搭建,训练时用了 4 张英伟达的 Tesla V100 显卡。
训练时,深度提取网络需要跑 6~13 小时,渲染网络则跑 2~4 小时。
用网络图片就能渲染 3D 模型
至于训练 NeROIC 采用的数据集,则主要有三部分:
来源于互联网(部分商品来源于网购平台,即亚马逊和淘宝)、NeRD、以及作者自己拍摄的(牛奶、电视、模型)图像,平均每个物体收集 40 张照片。
那么,这样的模型效果究竟如何呢?论文先是将 NeROIC 与 NeRF 进行了对比。从直观效果来看,无论是物体渲染细节还是清晰度,NeROIC 都要比 NeRF 更好。

具体到峰值信噪比(PSNR)和结构相似性(SSIM)来看,深度提取网络的“抠图”技术都挺不错,相较 NeRF 做得更好:

同时,论文也在更多场景中测试了渲染模型的效果,事实证明不会出现伪影等情况:

还能产生新角度,而且重新打光的效果也不错,例如这是在室外场景:

室内场景的打光又是另一种效果:

作者们还尝试将照片数量减少到 20 张甚至 10 张,对 NeRF 和 NeROIC 进行训练。
结果显示,即使是数据集不足的情况下,NeROIC 的效果依旧比 NeRF 更好。

不过也有网友表示,作者没给出玻璃或是半透明材质的渲染效果:

对 AI 来说,重建透明或半透明物体确实也确实是比较复杂的任务,可以等代码出来后尝试一下效果。
据作者表示,代码目前还在准备中。网友调侃:“可能中顶会、或者在演讲之后就会放出”。

一作清华校友

论文一作匡正非,目前在南加州大学(University of Southern California)读博,导师是计算机图形学领域知名华人教授黎颢。
他本科毕业于清华计算机系,曾经在胡事民教授的计图团队中担任助理研究员。
这篇文章是他在 Snap 公司实习期间做出来的,其余作者全部来自 Snap 团队。

以后或许只需要几张网友“卖家秀”,就真能在家搞 VR 云试用了。

论文地址:
https://arxiv.org/abs/2201.02533
项目地址:
https://formyfamily.github.io/NeROIC/
参考链接:
[1]https://zhengfeikuang.com/
[2]https://ningding97.github.io/fewnerd/
[3]https://twitter.com/ben_ferns/status/1486705623186112520
[4]https://twitter.com/ak92501/status/1480353151748386824
1、IT大王遵守相关法律法规,由于本站资源全部来源于网络程序/投稿,故资源量太大无法一一准确核实资源侵权的真实性;
2、出于传递信息之目的,故IT大王可能会误刊发损害或影响您的合法权益,请您积极与我们联系处理(所有内容不代表本站观点与立场);
3、因时间、精力有限,我们无法一一核实每一条消息的真实性,但我们会在发布之前尽最大努力来核实这些信息;
4、无论出于何种目的要求本站删除内容,您均需要提供根据国家版权局发布的示范格式
《要求删除或断开链接侵权网络内容的通知》:https://itdw.cn/ziliao/sfgs.pdf,
国家知识产权局《要求删除或断开链接侵权网络内容的通知》填写说明: http://www.ncac.gov.cn/chinacopyright/contents/12227/342400.shtml
未按照国家知识产权局格式通知一律不予处理;请按照此通知格式填写发至本站的邮箱 wl6@163.com