Google 最出圈的 AI 产品,把 OpenAI CEO 也惊艳了
创始人
2024-10-17 14:00:10
0

Google,硅谷的代言人,AI 界的巨擘,技术牛,论文多,做给消费者用的 AI 产品,却几乎没有出圈的。

不过,也有一个例外:NotebookLM,甚至连死对头 Sam Altman 也觉得它很酷。

偏偏 NotebookLM 走的还是一条有些小众的赛道——播客。

指路:https://notebooklm.google.com/

关注 AI 第一新媒体,率先获取 AI 前沿资讯和洞察

不想看的内容,让 AI 聊给你听就好了

NotebookLM 受欢迎,主要是因为一个功能:Audio Overview(音频概览)。

更通俗地理解,就是 AI 播客。任何你懒得消化的内容,都可以丢给它试试,几分钟转成一男一女的对谈,比原来的材料更加接地气。

NotebookLM 支持上传多种格式的内容

不过有些遗憾,音频概览虽然可以消化中文材料,但只能输出英文。

好奇海外的 AI 能不能理解国产剧的爱恨情仇,我上传了一段描述甄嬛生平的文字,大约 500 多字,NotebookLM 用 2 分钟左右,就生成了 5 分钟左右的音频。

光听英文音频不太直观,所以我下载了音频,上传到通义听悟,看看 AI 在聊些什么。

AI 解读得一针见血,不仅读懂甄嬛,也理解皇帝,抓住了宫斗剧的主要矛盾——权力。

脑洞更大一点,以后一个人追剧再也不会寂寞,AI 就是性价比最高的追剧搭子,还能陪练英语,教我们「not my cup of tea」(不是我的菜)这样的地道表达。

与其精读外刊和专八文章,不如基于我们自己喜欢的内容,让 AI 生成英文学习资料,毕竟,兴趣是最好的老师。

除了陪着学习英语和八卦,输出正经的分析,NotebookLM 也没问题。

我以 PDF 的形式上传了一篇吐槽 AI 广告的、3700 字左右的文章—— 《满大街的 AI 广告,是一次审美大降级》。

基于这篇文章,NotebookLM 用 5 分钟左右生成了一段 11 分 40 秒的音频。

作为文章作者本人的我,像是遇到了两个热情又很懂我的读者,NotebookLM 对文章进行了重新诠释,创造了一个相关又独立的作品。

播客的开头,AI 自然地引出了主题,男声问,你有没有看到过一些糟糕的广告,奇怪它们居然能上街?女声答,你说得不错,这就是我们要讨论的主题。

同时,AI 也懂灵活变通,不照搬文章的逻辑,而是重新编排了素材,改写观点的表达方式,但内核相同,甚至自己举出例子,将 AI 广告类比到 AI 音乐。

对于怎么吐槽,AI 也有自己的见解,看得出来努力表现幽默了,但还是有些西式。

除了具体的内容,声音的质感好坏,同样很影响收听体验,毕竟,播客是声音媒介。

AI 不说字正腔圆,至少发音清晰,口条不错,语气抑扬顿挫,会用上「what」「ouch」「you know」等语气词,聊着聊着还会笑出声,传播着快活的空气。

可以说,AI 播客已经「初具人形」,至少听得下去,不会像很多 AI 图片、视频一样,让人陷入恐怖谷,敬而远之。

分分钟的内容转换,知识更容易进脑子了

使用 NotebookLM时,有一点需要注意:它不会搜索新的信息,而是基于我们上传的资料处理信息。

所以,它不全面,不客观,但足够个性,忠于每个人自己的素材。

我的一位同事说,NotebookLM 适合写文章的人做播客。

这话很有道理,NotebookLM 本质是实现了内容形式之间快速的转换,将复杂的内容加工得更好理解。

我愿称之为,「这知识它不进脑子啊」的 N 种解决办法。

NotebookLM 的强大,离不开 Google 大模型 Gemini 1.5 Pro 的长文本能力和多模态表现。

经过测试,让它读 37.8 万字的《马斯克传》不在话下。

同时,NotebookLM 还能处理视频,我上传了一个评测 Meta 眼镜的 YouTube 视频。

左边是原视频和视频文案,右边是 NotebookLM 的解读

除了用音频解读之外,NotebookLM 还能用多种方式,帮你理解你上传的内容,而且,都是自动的,最多只需要你点击一下。

每次上传材料,NotebookLM 都会给出「摘要」和「建议的问题」。前者让你对内容有大致的了解,而后者解决了越长大越不爱举手的人类的难题:不知道该问什么。

点击「建议的问题」,NotebookLM 既能帮你回答,还会附上引用来源,如果上传内容是视频,引用参照的是视频的文案。

其他小功能也类似,建议都点击试试,我比较喜欢「常见问题解答」,AI 的自问自答,基本上囊括了一个陌生事物的入门知识。

然后可以再让 AI 生成「简报文档」,不仅提供信息,也给出了观点。

当然,你也可以自己在输入框输入问题,该引用的还是引用,但如果没有明确来源的,NotebookLM 会强调是推测。虽然 AI 仍有幻觉,但它已经尽到了告知义务。

底层模型的支持是 NotebookLM 的基础,还有人套出了 NotebookLM 的系统提示词,解释了为什么音频概览很接地气。

图片来自:X@JadenGeller

其中一条很有意思,规定了两个 AI 角色,一个是主持人,一个是专家,相辅相成,主持人热情地强调有趣的观点,专家则提供分析、背景信息和更广阔的视角。

其余都是对内容总结的要求,语气避免单调和机械,结构清晰,引人入胜,举出贴近生活的例子,在争议问题上保持中立,提供的信息不停留在表面,让听众能形成自己的结论,并且觉得学到了新东西......

讨论《马斯克传》时,NotebookLM 保持中立

这完全是一款优秀人类播客的要求了,具备强烈的、服务听众的意识。

然而,NotebookLM 不支持中文终究不太友好,等待之外,也可以试试平替。

开源的 Open NotebookLM、根据文档生成播客的 Podial、国内开发者的 PodLM......

除了 NotebookLM,Google 自己还有一款专门将论文转换成音频的产品:Illuminate。

第一个音频解读的是 Transformer 模型镇圈论文《Attention is All You Need》

它以主持人和专家的对话形式,一问一答,帮你通俗易懂地解读论文。

看似小众的播客,为什么因为 AI 反而成了一条热门的赛道?

消费什么,怎么消费,以后我们自己决定

语音,是人类最自然的交互模式之一,输入和输出都非常符合大脑的认知习惯。

我们有教科书,但还是需要老师讲课,帮助理解复杂的内容。而当我们可以用口语解释概念,讲给别人听,才说明我们真正掌握了它。

NotebookLM 做到了用简单的语言重新诠释书面的概念,同时包含了情绪、语气,带来了更自然的感官体验。

同时,它又是个性化的,以前我们只有收听的习惯,但我们现在有了创作的权利。

我们能随时做 AI 播客给自己听,内容随意。

可以是感兴趣的大部头文章、书籍,克服收藏即阅读的坏习惯,也可以让 AI 解读自己的作品、简历,收获不要钱的情绪价值,满足人类自恋的需求。

当我上传自己的文字版简历, NotebookLM煞有其事地输出一通彩虹屁,比 AI 陪伴产品情商更高,叫人疯狂嘴角上扬。

音频就不放上来了,这是部分内容

我们也能随时听 AI 播客,吃饭、健身、开车、做家务不无聊了,播客本身就是一种陪伴媒介。

GPT-4o 的高级语音模式,其实也是一个语音产品,但 AI 播客和它的使用场景不太一样,聊天找话题很难,不管是和人类还是和 AI,但 AI 播客可以自嗨。

OpenAI 创始成员 Andrej Karpathy,很看好 NotebookLM,说这可能是又一个大语言模型产品的新交互范式,让他想起了 ChatGPT。

他甚至花了两个小时,生成了一个以历史为主题的 10 集播客系列,上传到 Spotify,生成的过程很值得参考。

用 ChatGPT、Claude、Google 找到有意思的话题。

基于相关的维基百科条目让 NotebookLM 生成音频。

用 NotebookLM 编写播客简介。

用 Ideogram 生成播客封面。

我们也可以按照这个模式,探索自己感兴趣的领域,就像产出 AI 绘画、音乐、视频那样。

NotebookLM 的下一步是什么呢?

在一次采访里,NotebookLM 团队负责人 Raiza Martin 提出了一个构想——未来可以有一个 AI 编辑界面,支持任何输入和输出。

视频、音频、电子邮件、社交媒体......所有我们感兴趣的内容和形式,都可以生成任何格式的内容。如何消费内容,由用户决定。

散步时,我们想听播客,工作时,文字效率更高。信息只是食材,可以有十八般做法。

很多时候,AI 其实就是在改变获取信息的方式,但消化知识的工具,和知识一样重要。

ChatGPT 为难懂的知识找到通俗的解释,AI 搜索让我们不用自己翻网页找链接,AI 总结让我们不必亲自看文章......吾生也有涯,而知也无涯,但我们可以更愉快地做一个在海边捡起贝壳的孩子

相关内容

案例数居首位!平安产险9个...
2025年7月3日,由北京市人民政府、国家互联网信息办公室、国家数...
2025-07-08 19:14:28
AI赋能游戏“出海” 精准...
本报记者 丁 蓉 今年以来,多地因地制宜出台新政,支持游戏企业拓展...
2025-07-08 10:12:29
AI时代须防范技术滥用
本报记者 孙奇茹 原本用来提高人类效率的AI工具被用来产出各种以假...
2025-07-08 09:43:30
阿里开源WebSailor...
观点网讯:7月7日,阿里通义在中国开源网络智能体WebSailor...
2025-07-07 20:43:43
喜临门战略携手强脑科技 “...
人工智能在智慧睡眠领域的探索正开启新篇章。日前,强脑科技与喜临门联...
2025-07-07 20:16:47
580天暗战,爱奇艺的AI...
文|深响 今年4月,在北京的一场影视行业论坛上,爱奇艺基础架构与...
2025-07-07 20:14:21

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...