英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

IT资讯3年前 (2021)发布 IT资讯
0

本篇文章给各位网友带来的资讯是:英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出 详情请欣赏下文

12 月 5 日消息,英伟达的最新 AI 工具又让网友用户们激动了。“我已经等不及了!”

英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

一位网友在看完演示视频后表示。

对于“手残党”来说,英伟达的 EditGAN 简直就是零基础 P 图神器。能够高质量、高精细度地对图像进行修改,让 P 图方式从未如此容易。

例如,让画像和雕塑“挤眉弄眼”:

英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

只要你会上传图片、能画草图,就能够轻松 P 图。如此“魔性”的工具,难怪得到了网友热捧。

EditGAN 甚至能精细到修改车轮辐条大小和方向:

英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

当然,真人照片也不在话下,如控制人眼朝向、头发量等:

英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

还能给猫咪修改耳朵大小:

英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

而你要做的,只是上传一张图片,然后由程序生成一张语义分割草图,直接在草图上涂抹修改。

英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

▲ 在草图中加入牙齿部分,人就笑了

EditGAN 只会修改你想要改变的部位,其他部分都原封不动。

和最近的 GauGAN2 一样,英伟达也为 EditGAN 开发了一个电脑软件:

英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

这项研究已经被 NeurIPS 2021 接收。

本文一作是来自多伦多大学的华人博士生凌欢,他同时在该校人工智能研究院(Vector Institute)和英伟达做研究。

英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

首个 GAN 驱动的图像编辑器

研究人员表示,EditGAN 是第一个 GAN 驱动的图像编辑框架,它的主要特点是:

1、提供非常高的精度编辑,

2、只需要很少的注释训练数据,

3、可以实时交互式运行,

4、允许多个编辑的直接合成,

5、适用于真正的嵌入式、GAN 生成甚至域外图像。

首先,EditGAN 使用 StyleGAN2 生成图像。

StyleGAN2 的工作流程是:获取图像,将其编码到潜在空间,并使用生成器将这个编码子空间转换为另一个图像

但问题在于,这个空间是多维的,我们很难将其可视化,也很难确定该子空间的哪一部分负责重建图像中的哪个特征。

英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

通常,需要庞大的标注数据集,才能知道模型中潜在空间哪一部分控制哪些特征。

而 EditGAN 仅通过对少数标记的数据集示例进行学习,就能将分割与图像相匹配,从而实现图像图像的编辑。EditGAN 保留了完整的图像质量,同时提供了前所未有的细节和自由度。

更重要的是 EditGAN 不仅知道潜在空间对应控制那个部分,而且还将它们与草图对应起来。这样,我们就可以通过修改草图轻易地修改图像了。

EditGAN 基于 DatasetGAN,结合了图像建模及其语义分割。

EditGAN 的关键思想在于利用图像和像素级语言分割联合分布。

具体而言,就是将图像嵌入 GAN 的潜在空间,并根据分割编辑执行条件潜在代码优化。

英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

以上展示了 EditGAN 的训练过程:修改语义分割并优化共享的潜在代码,与编辑区域内的新分割,以及编辑区域外的 RGB 外观保持一致。相应的梯度通过共享生成器进行反向传播。

为了摊销优化,作者在实现编辑的潜在空间中找到“编辑矢量”。该框架允许学习任意数量的编辑矢量,然后以实时的速率直接应用于其他图像。

P 图工具即将发布

作者团队在英伟达内部 GPU 集群上使用 V100 执行底层 StyleGAN2、编码器和分割分支的训练以及嵌入和编辑的优化。

该项目使用了大约 14000 个 GPU 小时,其中大约 3500 个 GPU 小时用于最终实验,其余用于研究项目早期阶段的探索和测试。至于 EditGAN 的运行,在 V100 上进行 30 (60) 步优化需要 11.4 (18.9) 秒。

虽然训练不起,但是用训练好的模型来 P 图还是有可能的。

此前英伟达发布的 Canvas 就集成了 GauGAN2 等最新成果,可以用手绘草图生成精细的 PS 文件。

英伟达把 P 图软件 GAN 了,最新 AI 工具即将推出

可能 Canvas 也会很快集成 EditGAN 的吧。

有个好消息是,英伟达表示,将会代码和编辑工具软件即将推出。你是是不是迫不及待想尝试一把了?

论文地址:点击打开

补充材料:点击打开

© 版权声明
好牛新坐标 广告
版权声明:
1、IT大王遵守相关法律法规,由于本站资源全部来源于网络程序/投稿,故资源量太大无法一一准确核实资源侵权的真实性;
2、出于传递信息之目的,故IT大王可能会误刊发损害或影响您的合法权益,请您积极与我们联系处理(所有内容不代表本站观点与立场);
3、因时间、精力有限,我们无法一一核实每一条消息的真实性,但我们会在发布之前尽最大努力来核实这些信息;
4、无论出于何种目的要求本站删除内容,您均需要提供根据国家版权局发布的示范格式
《要求删除或断开链接侵权网络内容的通知》:https://itdw.cn/ziliao/sfgs.pdf,
国家知识产权局《要求删除或断开链接侵权网络内容的通知》填写说明: http://www.ncac.gov.cn/chinacopyright/contents/12227/342400.shtml
未按照国家知识产权局格式通知一律不予处理;请按照此通知格式填写发至本站的邮箱 wl6@163.com

相关文章