AI破解古文字登 Nature 封面:修复缺失文字,精确地理

IT资讯3年前 (2022)发布 IT资讯
0

本篇文章给各位网友带来的资讯是:AI 破解古文字登 Nature 封面:修复缺失文字,精确地理位置和书写时间 详情请欣赏下文

最新一期的 Nature 封面,AI 再度来到舞台中央,这一次是在破译古文字方面立功了。这是一种基于 Transformer 架构的方法,由 DeepMind、谷歌、牛津大学等多家研究机构联合开发

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

在单独修复受损文本时,这种方法能达到 62% 的准确率。在实际应用中,历史学家单独破译某块古希腊石碑的准确率本来只有 25%,但在使用这一方法后一举提升了近乎 3 倍,达到了 72%。

不仅能修复文字,这一方法在地理归属的任务上也有 71% 的准确率,还能将古文字的书写日期精确到 30 年以内。目前,这一方法已经引起了不小的讨论热度:

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

现在已经有可以在线解析古希腊文字的网页版,架构方法也已开源

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

Transformer 破译古文字

这是一个叫做 Ithaca 的架构,以荷马史诗《奥德赛》中的希腊岛屿命名。Ithaca 架构中的注意力机制能够通过串联输入的单个字符、完整单词的表征与顺序位置来了解输入文本的每一部分的位置,最终权衡不同的输入对模型决策过程的影响。

完整架构由多个 Transformer 块组成,每个 Transformer 块都输出一个经过处理的表征序列(Sequence of Processed Representations),其长度即输入字符的数量。其输入随后被传递给三个分别负责文字修复、地理归属、时间归属的任务头,每个头都由一个前馈的神经网络组成,专门负责各自任务的训练。

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

在文字修复任务中,Ithaca 会提供 20 个按概率排列的解析结果预测:

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

地理归属的确定上,则会依据古历史学中的 84 个区域中对输入文本进行分类,将可能的区域预测类别通过地图和柱状图展现:

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

日期归属任务同样也通过分布预测的柱状图来展示。如下图所示,公元前 300-250 年的日期 10 年一组,被表示为 5 个概率相同的范围,而公元前 305 年的铭文将以 100% 的概率被分配到公元前 300-310 年的十年组:

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

历史学家的 AI 助手

研究人员分别将 Ithaca 与历史学家、同类 AI 方法 Pythia、以及 Ithaca 与历史学家合作等不同破解古文字的方法做了对比。

字错率(CER)总是越低越好,在文字修复任务上,Ithaca 的字错率和准确率都最好,如果与历史学家合作时,效果还将再次提升。

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

在论文的最后,研究人员表示,研究方法适用于手稿学、钱币学和纸草学等所有与古代文本相关的学科也适用于古代、现代的任何语言

目前,这一方法已经投入了实际使用,比如在雅典时期颁布的某个重要法令的碑文的日期确认上,历史学家们之前认为是在公元前 446/5 年之前书写的。而 Ithaca 与历史学家一起,将这一日期更新到了公元前 424/3 年:

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

Ithaca 现在提供了在线试用的途径,登录官网,在方框中中输入古希腊铭文,将缺少的字符标记为破折号(-)),将预测的字符标记为问号(?)。

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

每次查询最多可以预测 10 个连续或非连续的问号,点击查询后将在下方显示文本缺失的字符,并将其归属到原来的地点和时间:

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

作者介绍

研究由 DeepMind、威尼斯卡福斯卡里大学(Ca’ Foscari University of Venice)、哈佛大学、雅典经商大学 (Athens University of Economics and Business)、谷歌几家 AI 团队合作开发。

论文有两位共同一作,其中 annis Assael 为 DeepMind 的 AI 部门的研究员,硕博都毕业于牛津大学,同时也是福布斯“30 岁以下 30 名欧洲杰出科学家”之一:

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

共同一作 Thea Sommerschield 则是一位历史学家,目前任威尼斯佛斯卡里大学的人文科学院,以及哈佛大学希腊研究中心的研究员,主要研究领域是将机器学习应用于研究古代地中海的书面文化。

AI破解古文字登 Nature 封面:修复缺失文字,精确地理

论文:

https://www.nature.com/articles/s41586-022-04448-z

开源链接:

https://github.com/DeepMind/ithaca

在线试用:

https://ithaca.DeepMind.com/?job=eyJyZXF1ZXN0SUQiOiJmYzUwNGY0NWNhZjJjZWMxZjIxZDA4YWVjNTdkMjEzMSIsImF0dHJpYnV0aW9uIjp0cnVlLCJyZXN0b3JhdGlvbiI6dHJ1ZX0%3D

© 版权声明
好牛新坐标 广告
版权声明:
1、IT大王遵守相关法律法规,由于本站资源全部来源于网络程序/投稿,故资源量太大无法一一准确核实资源侵权的真实性;
2、出于传递信息之目的,故IT大王可能会误刊发损害或影响您的合法权益,请您积极与我们联系处理(所有内容不代表本站观点与立场);
3、因时间、精力有限,我们无法一一核实每一条消息的真实性,但我们会在发布之前尽最大努力来核实这些信息;
4、无论出于何种目的要求本站删除内容,您均需要提供根据国家版权局发布的示范格式
《要求删除或断开链接侵权网络内容的通知》:https://itdw.cn/ziliao/sfgs.pdf,
国家知识产权局《要求删除或断开链接侵权网络内容的通知》填写说明: http://www.ncac.gov.cn/chinacopyright/contents/12227/342400.shtml
未按照国家知识产权局格式通知一律不予处理;请按照此通知格式填写发至本站的邮箱 wl6@163.com

相关文章