超越 OCR,谷歌 AI 技术 InkSight 可精准识别手写文字
创始人
2024-11-05 19:59:48
0

IT之家 11 月 5 日消息,Google Research 展示了一种使用人工智能读取手写内容的新方法,名为 InkSight 的系统能够直接从手写文字的图片中提取出数字文本,无需任何中间设备。

传统的手写文字识别技术主要依赖于光学字符识别 (OCR),但这种方法在处理复杂背景、模糊不清或低光照条件下的手写文字时往往表现不佳。InkSight 则采用了不同的思路,通过模仿人类学习阅读的过程,即通过不断地重写文本,来学习整个单词的外观和含义。这需要研究人员训练 AI 模型,使其能够识别和模仿人类的手写风格。

InkSight 在处理复杂场景时表现更为出色,例如当照片光线昏暗、文本部分遮挡或背景干扰时,InkSight 能够更准确地识别手写文字。研究人员发现,人类能够阅读 InkSight 生成的文本描摹的准确率高达 87%,其中三分之二的描摹结果与真实手写几乎无法区分。

对于喜欢手写的人来说,InkSight 具有巨大的潜力。想象一下,只需将手写笔记拍摄照片,即可立即将其转换为可搜索的数字文本。对于那些字迹潦草的人来说,InkSight 可以将难以辨认的手写内容转化为清晰、准确的打印文本。

从更广阔的视角来看,这项技术对于破译和和将几个世纪以来的手写文本转换为数字形式具有重要意义。即使对于那些数字化程度较低的语言,InkSight 也能帮助保护手写遗产,并为这些语言的数字化训练提供更多资源。

IT之家注意到,谷歌并不是唯一一家致力于开发手写识别 AI 工具的公司。亚马逊的 Kindle Scribe 电子阅读器也具备将手写笔记转换为可读文本的功能。此外,Goodnotes 等数字笔记应用也推出了手写识别和编辑功能,可以将手写文字转换为可编辑的数字文本。

相关内容

黄仁勋:AI时代无需过度纠...
正值高校毕业季,AI技术的快速迭代让不少毕业生对就业前景倍感焦虑,...
2026-06-01 00:43:12
小米开源可控视频音效生成模...
IT之家 5 月 29 日消息,小米大模型应用团队今日发布 Con...
2026-06-01 00:41:13
制造业大市如何拥抱AI?绍...
“此次圆桌研讨凝聚起产业发展共识,后续浙江将持续整合各方资源,汇聚...
2026-05-30 05:50:45
鸿蒙生态设备超13亿台,开...
PChome 5月28日消息,2026开源鸿蒙开发者大会正式召开,...
2026-05-30 05:44:37
德勤:聚焦AI驱动产业变革...
上证报中国证券网讯(记者 汪友若)5月27日,“2026德勤中国高...
2026-05-28 21:01:39
广联达:AI技术与建筑实体...
证券之星消息,广联达(002410)05月25日在投资者关系平台上...
2026-05-27 20:52:17

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...