AI缀合,让甲骨重获新生(了不起的甲骨文)
创始人
2024-08-21 07:45:52
0

□河南日报社全媒体记者张熠朱晓玲

近年来,用人工智能辅助古文字研究成为学界的重要课题。2020年,全国首款AI甲骨缀合产品——“缀多多”正式推出,首次实现了人工智能批量缀合甲骨。当古老的甲骨文遇上AI技术,会碰撞出怎样的火花?交叉跨界的研究者对此深有感悟。立秋时节,记者专访了河南大学计算机与信息工程学院教授、河南大学黄河文化遗产实验室研究员张重生。

缀合是甲骨重获新生的必经之路

甲骨缀合,就是综合利用甲骨的各方面信息,将两片及以上的甲骨碎片拼接起来,变为完整或较为完整的材料。“比方说,3个花瓶打碎了,有5000多片各种形态的碎片,运用AI技术把这些碎片重组复原,这就是我在做的事情。”张重生这样描述他的工作。

作为最早的成系统的汉字,甲骨文是研究商周文化的第一手材料,而距今三千多年的商周甲骨破碎十分严重,目前发现的约16万片甲骨中,碎片占90%以上。为了更好地研究利用甲骨这一珍贵遗产,必须开展甲骨碎片的缀合复原工作。因为缀合并非通过甲骨实物,而是通过拓片和摹本,还要考虑到重复和仿制的问题,复杂性不言而喻。

张重生介绍,近年来利用计算机图像辅助甲骨缀合是最高效也是最经济的办法。很多从事甲骨缀合的学者都利用计算机来提高缀合效率,但过去的计算机缀合模型没有起到完全缀合的作用,甲骨学家还需承担大量的缀合工作,劳动强度很大。近几年,人工智能技术的突飞猛进,让研究者有机会更接近完全缀合的目标。

完整缀合出一块甲骨不亚于发现一块新甲骨

将三千多年前的甲骨碎片“拼拼图”,是破译古文字的基础。甲骨学者普遍认为,缀合出一块较为完整的、可用于甲骨文研究的甲骨,其价值不亚于发现一块新的甲骨。

张重生表示,缀合的每组甲骨具有唯一性。甲骨缀合,不仅要求甲骨的形状能严丝合缝连接,甲骨正反两面的纹路也要能对上,还要检查所刻的文字,从字体、风格再到叙事内容都要契合。

更复杂的是,由于甲骨分散在世界各地的博物馆、大学或研究机构,需要相关数据信息共享。“我们可以用数字化的方法进行甲骨碎片缀合还原,让相关学者将内容破译出来,继续研究。”张重生说。

“甲骨缀合是项苦差事。边缘记忆和匹配能力对于人脑来说是比较困难的,这恰恰是人工智能擅长的领域。”2018年,张重生团队开创了AI自动识别甲骨文的新范式,极大超越了传统算法。考虑到精准复原甲骨是学界的重大现实需求,团队从2019年开始设计甲骨缀合算法,并于2020年与首都师范大学联合研发出AI缀合软件“缀多多”,实验阶段甲骨缀合准确率达99%左右;应用阶段准确率为85%左右,在甲骨学历史上首次实现了人工智能批量缀合甲骨。

当前AI缀合还处于初级阶段

用AI缀合甲骨还有很多难题待解。张重生介绍,甲骨中的每个文字数据量分布非常不均衡,有些字出现的频率非常高,如“王”和“贞”,而另外一些字出现的频率则较低。目前,人工智能技术只能识别出现频率较高的甲骨文,对出现频率较低的甲骨文有可能识别不出来或正确率不高。对于甲骨文中的形似字,如“夕”和“月”,“比”和“从”,在形态上非常相似,只能依靠专家的经验辨识。此外,文字不是孤立地存在的,需要放入具体的文本环境中进行理解,而文本环境具有一定的不确定性,这无疑增加了甲骨文破译的难度。

对于利用人工智能破译甲骨文的前景,张重生认为,目前人工智能与古文字研究的结合还处于初级阶段,人工智能在对问题的规划求解、语义理解和创新知识等方面仍处于辅助地位,所以在未来较长的一段时间里,“人机耦合”将会是研究甲骨文的主要形态。所谓“人机耦合”,就是人与机器进行紧密结合和相互协作,在AI擅长的领域解决对人类智能来说比较困难的问题,在人类智能比较擅长的领域解决AI比较困难的问题。通过“人机耦合”,最终完整地解决问题。

“下一步,我希望AI缀合可以赋能更多的古文献研究,例如,秦汉简牍、敦煌遗书、吐鲁番文书等。”张重生说,“我的名字叫张重生,而我的工作就是让出土文献重获新生,所以我经常开玩笑说,我的名字已经说明了我的使命。”

相关内容

中消协“618”消费维权报...
中国消费者协会(简称“中消协”)26日发布“618”消费维权舆情分...
2026-06-27 08:54:17
字节与Anthropic打...
文 | 最话FunTalk,作者 | 林书,编辑 | 刘宇翔 6...
2026-06-26 22:40:47
在Soul App,他们一...
1980年,英国技术哲学家大卫·科林格里奇在 《技术的社会控制》中...
2026-06-26 22:39:24
首个开源鸿蒙机器人操作系统...
6月26日,M-Robots开源社区在2026开放原子开源生态大会...
2026-06-26 22:36:34
曹操出行牵手上海人工智能研...
观点网讯:6月25日,曹操出行与上海人工智能研究院达成战略合作,正...
2026-06-26 18:44:30
从“用AI”到“造AI”:...
AI浪潮袭来已有数年。从最初的观望、焦虑,到后来的尝试、落地,再到...
2026-06-26 18:40:45

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
8月20日基金净值:前海开源中... 证券之星消息,8月20日,前海开源中国稀缺资产混合A最新单位净值为1.43元,累计净值为1.43元,...