Nature专业户DeepMind又登封面,开源水印技术SynthID-Text,Gemini已经用上了
创始人
2024-10-24 16:30:19
0

机器之心报道

机器之心编辑部

现如今,大型语言模型(LLM)生成的内容已经充斥了整个互联网,并且这些模型还能模仿各种类似真人的语气和行文风格,让人难以分辨眼前的文本究竟来自人类还是 AI。

这样的问题或许可通过所谓的水印(watermarking)技术来解决。

谷歌开发的 SynthID 文本水印技术登上了最新一期 Nature 杂志封面,之前机器之心已经报道过该公司开发的图像水印技术,参阅《给 AI 生成图像「加水印」,谷歌发布识别工具 SynthID》。

给图像和文本添加水印具有各不一样的难点。

在给图像添加水印时,由于人眼的辨别相近色彩和能力远不及机器 —— 毕竟在机器「看」来,这些不同颜色本质上只是不同的数值。以下动图展示了多张加了水印和未加水印的对比图像。是不是完全看不来水印在哪里?

但对于以序列形式展示的文本,人类和机器一样可以分明地看见其中全部信息。那么该如何给文本添加水印呢?

为了使人工智能生成的文本更易于识别,Google DeepMind 创建了 SynthID-Text,现已通过 Google Responsible Generative AI Toolkit 开源。

论文地址:https://www.nature.com/articles/s41586-024-08025-4

开源地址:https://github.com/synthid-text

SynthID-Text 是一种可立即投入生产的文本水印方案,可保持文本质量并实现高检测精度,同时将延迟开销降至最低。并且,SynthID-Text 不影响 LLM 训练,仅修改采样程序;水印检测计算效率高,无需使用底层 LLM。

SynthID-Text 建立在以前生成水印组件的基础上,并引入了一种新型采样算法,即 Tournament 采样。SynthID-Text 可以配置为非失真(保留文本质量)或失真(以牺牲文本质量为代价提高水印可检测性)。在这两种设置中,SynthID-Text 都提供了更高的检测率。

简单举个例子,对于短语「我最喜欢的热带水果是__」,LLM 可能会使用 token「芒果」、「荔枝」、「木瓜」或「榴莲」来完成句子,并且每个 token 都会给出一个概率分数。当有一系列不同的 token 可供选择时,SynthID 可以调整每个预测 token 的概率分数,以免影响输出的质量、准确性和创造力。

谷歌通过对来自 Gemini 实时互动的近 2000 万条响应进行了大规模用户反馈评估,结果表明:非失真 SynthID-Text 可以保持文本质量。因此,SynthID-Text 已被用于为 Gemini 和 Gemini Advanced 添加水印。这证明生成文本水印可以成功实施并扩展到现实世界的生产系统,为数百万用户提供服务。

此外,谷歌还提供了一种将生成水印与投机采样(speculative sampling)相结合的算法,允许将 SynthID-Text 集成到大规模生产系统中,而额外的计算开销可以忽略不计。

不过,SynthID-Text 目前仅可以处理短至三句话的文本,以及经过裁剪、解释或修改的文本,但却很难处理短文本、被重写或翻译的内容,甚至是对事实问题的回答。

谷歌表示:「SynthID 并不是识别人工智能生成内容的灵丹妙药,但 SynthID 将是开发更可靠人工智能识别工具的重要组成部分。」

参考链接:

https://www.theverge.com/2024/10/23/24277873/google-artificial-intelligence-synthid-watermarking-open-source

相关内容

macOS 27 Gold...
谷歌Gemini的macOS客户端近期因不遵守Mac应用规范而受到...
2026-06-20 12:54:18
小米开源可控视频音效生成模...
IT之家 5 月 29 日消息,小米大模型应用团队今日发布 Con...
2026-06-01 00:41:13
鸿蒙生态设备超13亿台,开...
PChome 5月28日消息,2026开源鸿蒙开发者大会正式召开,...
2026-05-30 05:44:37
德勤:聚焦AI驱动产业变革...
上证报中国证券网讯(记者 汪友若)5月27日,“2026德勤中国高...
2026-05-28 21:01:39
自变量开源 Wall-OS...
2026-05-28 16:19:28 作者:狼叫兽 自变量机器...
2026-05-28 20:29:33
ThinkPad全家族AI...
一、活动,是联想为回馈广大会员长久以来的支持与信赖而精心筹备的一场...
2026-05-28 20:24:30

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...