DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

IT资讯4年前发布 IT资讯

本篇文章给各位网友带来的资讯是：DALL・E 这波超进化，画质艺术感双飞升，还学会了无痕 P 图详情请欣赏下文

把椅子上的萌犬 P 成猫猫，需要几步？第一步，圈出狗狗。第二步，告诉 AI 你的需求。鼠标一点，齐活。

这位 AI P 图大师，其实是位老朋友 ——OpenAI 风靡全球的那位 DALL・E。现在，它刚刚完成了“2.0 超进化”。不仅新学了一手出神入化的 P 图绝技，创作质量也有了飞跃式的提升。

话不多说，直接看作品感受一下~ 这是 DALL・E 2 在“星云爆炸状柯基头”这一提示下的创作出来的画作：

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

这幅萨尔瓦多・达利的画像，是不是有点萨尔瓦多・达利内味儿了？

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

跟初代 DALL・E 比起来，着实是画质与艺术感双双飞升了。

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

△ “日出时分安坐在田野里的狐狸，莫奈风格”

所以，研究人员具体如何点亮了 DALL・E 的新技能点？

CLIP + 扩散模型

DALL・E 此番进化，简单来说就是分辨率更高了，延迟更低了。此外，还有更新 2 大新功能：

首先，在更细粒度上实现文本 → 图像功能。也就是说，DALL・E 2 可以根据自然语言提示进行 P 图。在 P 图的过程中，还会考虑阴影、反射、纹理等元素的变化。比如在左图标“2”的位置 P 一个火烈鸟泳圈，DALL-E 2 会把水面倒影这种细节也处理到位。

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

其次，是可以在保留原作核心元素的基础之上，赋予原作船新的风格。并且生成画面的画质是 DALL・E 1 的 4 倍，即从 256×256 提升到了 1024×1024。

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

具体的实现方法，用 OpenAI 官方的话来说，就是结合了 CLIP 和扩散模型两种技术的优点。CLIP 是原版 DALL・E 功能实现的基础，是一个负责给图像重排序的模型，其零样本学习能力已经在各种视觉和语言任务上大放异彩。而扩散模型的特点在于，在牺牲多样性的前提下，能大大提升生成图像的逼真度。于是，OpenAI 的研究人员设计了这样一种方案：

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

在这个名为 unCLIP 的架构中，CLIP 文本嵌入首先会被喂给自回归或扩散先验，以产生一个图像嵌入。而后，这个嵌入会被用来调节扩散编码器，以生成最终的图像。

OpenAI 解释称，DALL・E 能够 get 图像和用于描述画面的文本之间的关系。其图像的生成是在“扩散”过程中完成的，可以理解为是从“一堆点”出发，用越来越多的细节去把图像填充完整。

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

研究人员将 DALL・E 2 与 DALL・E、GLIDE 等模型进行了对比。

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

实验结果显示，DALL・E 2 的图像生成质量与 GLIDE 相当，但 DALL・E 的生成结果更具多样性。

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

目前，DALL・E 2 并未对公众开放，不过如果你感兴趣，可以在线注册申请一发~

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

项目地址：

https://openai.com/dall-e-2/#demos

文章版权归作者所有，未经允许请勿转载。

版权声明：
1、IT大王遵守相关法律法规，由于本站资源全部来源于网络程序/投稿，故资源量太大无法一一准确核实资源侵权的真实性；
2、出于传递信息之目的，故IT大王可能会误刊发损害或影响您的合法权益，请您积极与我们联系处理(所有内容不代表本站观点与立场)；
3、因时间、精力有限，我们无法一一核实每一条消息的真实性，但我们会在发布之前尽最大努力来核实这些信息；
4、无论出于何种目的要求本站删除内容，您均需要提供根据国家版权局发布的示范格式
《要求删除或断开链接侵权网络内容的通知》：https://itdw.cn/ziliao/sfgs.pdf，
国家知识产权局《要求删除或断开链接侵权网络内容的通知》填写说明： http://www.ncac.gov.cn/chinacopyright/contents/12227/342400.shtml
未按照国家知识产权局格式通知一律不予处理；请按照此通知格式填写发至本站的邮箱 wl6@163.com

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

CLIP + 扩散模型

多位美国女性报警被 AirTag 跟踪,苹果表示将强烈谴责

OPPO K10 手机搭载天玑 8000 芯片、LCD 高刷

相关文章

用小米11等安卓手机解锁目标检测模型 YOLOv5,识别速度

只用一张图 + 相机走位,AI 就能脑补周围环境:通通都是高

Steam 上星期销量榜：《质量效应：传奇版》登顶

快手：二次元观众中 Z 世世代代占比超 85%，男士作者偏爱公布实体模型手办模型相关内容

DALLE 这波超进化,画质艺术感双飞升,还学会了无痕 P

CLIP + 扩散模型

多位美国女性报警被 AirTag 跟踪,苹果表示将强烈谴责

OPPO K10 手机搭载天玑 8000 芯片、LCD 高刷

相关文章

用小米11等安卓手机解锁目标检测模型 YOLOv5,识别速度

只用一张图 + 相机走位,AI 就能脑补周围环境:通通都是高

Steam 上星期销量榜 ：《质量效应：传奇版》登顶

快手：二次元观众中 Z 世世代代占比超 85%，男士作者偏爱公布实体模型手办模型相关内容

Steam 上星期销量榜：《质量效应：传奇版》登顶