本篇文章给各位网友带来的资讯是:聊天截图厚码也不安全,大神算法分分钟还原 详情请欣赏下文
讲个恐怖的故事。早上跟同事在微信闲谈,聊起了一位女同事最近的变化。结果他反手就把文字打上马赛克,截图丢进了群里:
还欠欠儿地补了一刀:“@XXX,他说你坏话了呦~”万万没想到,这位同事气势汹汹地走了过来,竟然直接点出了“秘密文字”的内容。当时的我是这样的:
见状,这位老师补充道:
都什么年代了,以为打马赛克我就认不出来了?分分钟还原好吧!
…… 好奇如我,马上对这个技术展开了一番“调查”。(PS:聊天原图在文末揭晓)
如何还原打了马赛克的文字?
还别说,国外一家公司的首席研究员 Dan Petro(下文简称 Dan),这两天就发布了这么一篇帖子。
他直接点出了重点:
打马赛克(像素化),是一种非常不好、不安全,而且会泄露敏感数据的方法。
为了验证他的说法,Dan 亲自下场写了一个名为 Unredacter 的工具。然后现场演示了一下,这个工具是如何一点一点把打了马赛克的文字还原的:
从上面的示例中,不难看出,即便原文打了厚厚的一层马赛克,在这个工具面前依旧像“裸奔”一样。或许你会说,这玩意儿操作起来会很复杂吧?不不不。非常之简单,仅仅是 2 个步骤:
-
用 npm install 安装依赖项
-
用 npm start 来启动
虽然在 Dan 之前,已经有类似的工具存在了,例如 Depix。但一个非常现实的问题就是,Depix 还原的文字,从视觉效果上并不是很好:
Depix 还原出来的文字,有些地方的还是糊糊的。因此,国外 Jumpsec Lab 的一位研究员指出了这个问题,并且还附上了一道比较有意思的挑战:如果你破解了密码,请联系我们。
这样的挑战便引起了 Dan 极大的兴趣,这也就是他开发 Unredacter 的原因。于是,在 Unredacter 的加持下,Dan 顺利攻破了这项挑战:
而后 Dan 联系上了这位研究员,在邮件的回复中,也证实了 Dan 的结果是正确的:
不仅如此,Dan 还介绍说,像类似用涂抹方式来打的马赛克,无论是在 GiMP、Photoshop 或者其它编辑器中,结果都是一样的。因此,他的破解方法应当是具备一定的通用性。
当然,生活中我们或多或少都会有“打码”的需求,既然马赛克不安全,那有没有更好的方式呢?Dan 对此的答复是:用黑色条来遮挡。
还有还原打了马赛克的图片
其实“还原马赛克”这件事,AI 界早就有所研究。例如杜克大学提出的 PLUSE 便是其中之一,还登顶了 CVPR。但它修复的并不是文字,而是人像,例如:
从原理角度来看,它本质上是生成对抗网络 (GAN)。PLUSE 主要是根据模糊的马赛克像素,“画”出新的一张张不存在的人脸,再压缩回马赛克状态跟原图比一比,把相似的版本拿出来展示。
当然,这项技术也并非完美,也有翻车的时候。例如网友就拿马里奥试了试,结果……
Emmm…… 这“味道”,不一般。
One More Thing
最后,来揭晓一下开头故事的答案。
着实是个惨痛的教训了……
项目地址:
https://github.com/bishopfox/unredacter
参考链接:
[1]https://bishopfox.com/blog/unredacter-tool-never-pixelation
[2]https://labs.jumpsec.com/can-depix-deobfuscate-your-data/
[3]https://arxiv.org/abs/2003.03808
1、IT大王遵守相关法律法规,由于本站资源全部来源于网络程序/投稿,故资源量太大无法一一准确核实资源侵权的真实性;
2、出于传递信息之目的,故IT大王可能会误刊发损害或影响您的合法权益,请您积极与我们联系处理(所有内容不代表本站观点与立场);
3、因时间、精力有限,我们无法一一核实每一条消息的真实性,但我们会在发布之前尽最大努力来核实这些信息;
4、无论出于何种目的要求本站删除内容,您均需要提供根据国家版权局发布的示范格式
《要求删除或断开链接侵权网络内容的通知》:https://itdw.cn/ziliao/sfgs.pdf,
国家知识产权局《要求删除或断开链接侵权网络内容的通知》填写说明: http://www.ncac.gov.cn/chinacopyright/contents/12227/342400.shtml
未按照国家知识产权局格式通知一律不予处理;请按照此通知格式填写发至本站的邮箱 wl6@163.com