“AI太炎2.0”公众版发布丨来自北师大的古代汉语AI智慧平台
创始人
2024-08-28 18:18:04
0

北京师范大学古汉语大语言模型

“AI太炎 2.0”发布会成功举办

2024年8月27日上午,北京师范大学古汉语大语言模型“AI太炎2.0”发布会暨数智时代应用语言学学科建设路径与方法座谈会在京隆重举行。教育部语言文字信息管理司司长刘培俊、北京师范大学常务副校长王守军、北京大学中文系系主任杜晓勤、北京师范大学汉字汉语研究与社会应用实验室学术委员会主任华学诚等领导专家出席会议并致辞。课题负责人、文学院院长王立军教授对项目进行了介绍。语言学和人工智能领域的三十余位专家学者以及来自俄罗斯、西班牙、爱尔兰、德国、韩国、英国等国的十余位汉学家参加会议研讨,他们为“AI太炎”的研发、应用提出了宝贵建议,并围绕数智时代应用语言学学科建设和人才培养问题发言讨论。北京师范大学文学院党委书记周云磊主持发布会,北京师范大学文学院教授刘利作会议总结。

参会嘉宾合影

“AI太炎”是北京师范大学科研团队研发的专门适用于古汉语文本理解的大语言模型,属于国家语委重大项目“古籍整理智能化关键技术研究”(ZDA145-9)的阶段性成果。该模型具有较强的古典文献释读能力,支持字词释义、文白翻译、句读标点、用典分析等多种具有挑战性的文言文理解任务,兼容繁简中文输入。为了致敬近代国学大师章太炎先生,秉承章黄学派弘扬中华优秀传统文化的宗旨,该模型命名为“AI太炎”。

此前,“AI太炎”1.0版于2023年11月进入内测阶段。在众多老师同学的帮助和推介下,海内外学术科研、基础教育、编辑出版等不同行业领域的4000余名用户参与内测,为模型分析结果提出改进意见。研究团队在此基础上对模型进行了持续迭代优化,并于2024年8月27日发布了“AI太炎2.0”公众版,以期更好地助力古籍整理、文言文教学和古汉语信息处理研究。

内测用户来自全国34个省级行政区和海外十余个国家,在半年多的内测时间中,用户通过邀请码访问系统,并以点击页面底部按钮和撰写留言的方式为“AI太炎”的成长提供了数万字宝贵建议❤️

嘉宾代表刘利、周建设、杜晓勤、华学诚与项目负责人王立军、主持人周云磊共同启动系统,“AI太炎2.0”公众版正式发布!

王立军教授在发布会上介绍,课题团队针对古汉语信息处理任务“低资源”“富知识”的特点,从头构建了专门适用于古汉语文本理解的大语言模型。通过合理的模型设计、数据处理、基座训练及微调,仅使用1.8B参数量即可取得较好效果。小型大语言模型可以极大地降低模型研发、迭代和使用成本,并兼顾效果和效率平衡。值得一提的是,在辅助古籍整理、辞书编纂和语言研究等方面,模型表现出较大应用潜力。

目前,用户可通过文末地址访问“AI太炎2.0”公众版,输入待分析的古籍文本后,系统能够根据用户选择进行释读(无需输入提示词),包括解释文本中的疑难字词含义或背后的文化常识,将文言文翻译为现代汉语,对文本进行高精度的句读标点,或识别其所用典故。

字词释义

文白翻译

句读标点

识别用典

“AI太炎”诞生不足一载,经过内测阶段诸多贤达的悉心指点,虽已初具古汉语理解之能,但仍在“襁褓”之中,有很大的成长空间。

尽管如此,我们笃信,在用户的使用与反馈中,TA将逐步完善。您的每次点击与意见反馈,都是TA成长的宝贵助力。诚挚地邀请您参与“AI太炎”的成长历程,共同致力于新一代古汉语AI研究,探寻科技与文化的交融之美!

使用说明

“AI太炎2.0”公众版访问地址:https://t.shenshen.wiki

1. 因现阶段技术的局限性和生成式AI的特殊性,在分析文本时,TA无法确保完全准确和完整,且可能生成一些具有误导性的内容。

2. 建议输入完整的句子或段落,和人一样,TA也需要根据语境来理解文本。输入50-60字好于10-20字。

3. 欢迎点击页面底部的按钮提交您的反馈。

如有任何问题,请联系:shen@mail.bnu.edu.cn。

致谢

诚挚感谢在资源建设、模型评估、内测和发布上为“AI太炎”提供巨大帮助的老师同学们!

资源建设倾力付出

评估模型不辞辛劳

内测阶段集思广益

真知灼见助我成长

特别鸣谢

敦和基金会

章黄国学

有深度的大众国学

有趣味的青春国学

有担当的时代国学

北京师范大学汉字汉语研究与社会应用实验室

北京师范大学文学院古代汉语研究所

北京师范大学文学院古代文学研究所

微信号:zhanghuangguoxue

文章原创|版权所有|转发请注出处

公众号主编:孟琢 谢琰 董京尘

责任编辑:高洁

我知道你在看

相关内容

声网参编《移动AI愿景与发...
6月25日,2026上海世界移动通信大会(MWC上海)——移动AI...
2026-06-29 21:51:38
苹果2027新品前瞻:Ai...
智能手机逐渐趋于成熟,行业焦点正从硬件迭代转向形态创新。在这样的背...
2026-06-29 16:33:19
群贤聚太湖 共话AI赋能“...
6月28日,由无锡市医学会、无锡市预防医学会主办,无锡爱尔眼科医院...
2026-06-29 16:32:20
大厂终于不再逼用户“用AI...
文|听筒Tech 陈柯 在C端争夺了几年后,大厂似乎终于明白用户...
2026-06-29 16:30:36
世界杯32强出炉!12大A...
快科技6月28日消息,今日,2026年美加墨世界杯J组小组赛收官。...
2026-06-29 01:34:50
AI(人工智能)也有“人格...
作者 | 阿童木 人工智能(AI,Artificial Intel...
2026-06-29 01:28:54

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
8月20日基金净值:前海开源中... 证券之星消息,8月20日,前海开源中国稀缺资产混合A最新单位净值为1.43元,累计净值为1.43元,...