AI缀合,让甲骨重获新生(了不起的甲骨文)
创始人
2024-08-21 07:45:52
0

□河南日报社全媒体记者张熠朱晓玲

近年来,用人工智能辅助古文字研究成为学界的重要课题。2020年,全国首款AI甲骨缀合产品——“缀多多”正式推出,首次实现了人工智能批量缀合甲骨。当古老的甲骨文遇上AI技术,会碰撞出怎样的火花?交叉跨界的研究者对此深有感悟。立秋时节,记者专访了河南大学计算机与信息工程学院教授、河南大学黄河文化遗产实验室研究员张重生。

缀合是甲骨重获新生的必经之路

甲骨缀合,就是综合利用甲骨的各方面信息,将两片及以上的甲骨碎片拼接起来,变为完整或较为完整的材料。“比方说,3个花瓶打碎了,有5000多片各种形态的碎片,运用AI技术把这些碎片重组复原,这就是我在做的事情。”张重生这样描述他的工作。

作为最早的成系统的汉字,甲骨文是研究商周文化的第一手材料,而距今三千多年的商周甲骨破碎十分严重,目前发现的约16万片甲骨中,碎片占90%以上。为了更好地研究利用甲骨这一珍贵遗产,必须开展甲骨碎片的缀合复原工作。因为缀合并非通过甲骨实物,而是通过拓片和摹本,还要考虑到重复和仿制的问题,复杂性不言而喻。

张重生介绍,近年来利用计算机图像辅助甲骨缀合是最高效也是最经济的办法。很多从事甲骨缀合的学者都利用计算机来提高缀合效率,但过去的计算机缀合模型没有起到完全缀合的作用,甲骨学家还需承担大量的缀合工作,劳动强度很大。近几年,人工智能技术的突飞猛进,让研究者有机会更接近完全缀合的目标。

完整缀合出一块甲骨不亚于发现一块新甲骨

将三千多年前的甲骨碎片“拼拼图”,是破译古文字的基础。甲骨学者普遍认为,缀合出一块较为完整的、可用于甲骨文研究的甲骨,其价值不亚于发现一块新的甲骨。

张重生表示,缀合的每组甲骨具有唯一性。甲骨缀合,不仅要求甲骨的形状能严丝合缝连接,甲骨正反两面的纹路也要能对上,还要检查所刻的文字,从字体、风格再到叙事内容都要契合。

更复杂的是,由于甲骨分散在世界各地的博物馆、大学或研究机构,需要相关数据信息共享。“我们可以用数字化的方法进行甲骨碎片缀合还原,让相关学者将内容破译出来,继续研究。”张重生说。

“甲骨缀合是项苦差事。边缘记忆和匹配能力对于人脑来说是比较困难的,这恰恰是人工智能擅长的领域。”2018年,张重生团队开创了AI自动识别甲骨文的新范式,极大超越了传统算法。考虑到精准复原甲骨是学界的重大现实需求,团队从2019年开始设计甲骨缀合算法,并于2020年与首都师范大学联合研发出AI缀合软件“缀多多”,实验阶段甲骨缀合准确率达99%左右;应用阶段准确率为85%左右,在甲骨学历史上首次实现了人工智能批量缀合甲骨。

当前AI缀合还处于初级阶段

用AI缀合甲骨还有很多难题待解。张重生介绍,甲骨中的每个文字数据量分布非常不均衡,有些字出现的频率非常高,如“王”和“贞”,而另外一些字出现的频率则较低。目前,人工智能技术只能识别出现频率较高的甲骨文,对出现频率较低的甲骨文有可能识别不出来或正确率不高。对于甲骨文中的形似字,如“夕”和“月”,“比”和“从”,在形态上非常相似,只能依靠专家的经验辨识。此外,文字不是孤立地存在的,需要放入具体的文本环境中进行理解,而文本环境具有一定的不确定性,这无疑增加了甲骨文破译的难度。

对于利用人工智能破译甲骨文的前景,张重生认为,目前人工智能与古文字研究的结合还处于初级阶段,人工智能在对问题的规划求解、语义理解和创新知识等方面仍处于辅助地位,所以在未来较长的一段时间里,“人机耦合”将会是研究甲骨文的主要形态。所谓“人机耦合”,就是人与机器进行紧密结合和相互协作,在AI擅长的领域解决对人类智能来说比较困难的问题,在人类智能比较擅长的领域解决AI比较困难的问题。通过“人机耦合”,最终完整地解决问题。

“下一步,我希望AI缀合可以赋能更多的古文献研究,例如,秦汉简牍、敦煌遗书、吐鲁番文书等。”张重生说,“我的名字叫张重生,而我的工作就是让出土文献重获新生,所以我经常开玩笑说,我的名字已经说明了我的使命。”

相关内容

八成受访消费企业今年拟引入...
7月10日下午,由南方都市报主办的“2025高品质消费品牌TOP1...
2025-07-10 11:43:05
“上岗”即用的AI客服、A...
目前,随着AI的大范围应用,各类AI Agent产品如雨后春笋般出...
2025-07-10 11:13:02
中国电信刘桂清:拥抱AI,...
瑞士时间7月9日,人工智能向善全球峰会(AI for Good S...
2025-07-10 11:12:36
美年健康:借助AI技术赋能...
证券之星消息,美年健康(002044)07月08日在投资者关系平台...
2025-07-09 22:13:52
快手张迪:AI将进一步拓展...
日前,在2025全球数字经济大会“人工智能融合应用发展论坛”上,快...
2025-07-09 22:13:24
高德地图上线AR打卡功能,...
“每个角落都有故事”,怀揣着这样的愿景,阿里巴巴集团旗下高德地图正...
2025-07-09 22:13:11

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...