谷歌“Her”抢跑落地 OpenAI语音AI仍在“hold on”
创始人
2024-08-14 21:12:29
0

21世纪经济报道记者孔海丽、实习生刘清怡 北京报道

北京时间8月14日凌晨,谷歌在“Made by Google”大会上正式发布了智能语音助手Gemini Live。这一功能直接挑战OpenAI的GPT-4o语音模式,并标志着人工智能交互向更加自然、通用和用户友好的方向又迈进了一步。

根据谷歌的介绍,用户可以与Gemini Live进行自由流畅的对话,而不是通过传统的输入和输出设置。

在对话过程中,用户可以打断以询问更多细节,或者暂停一段时间后再继续。

为了使对话更加自然,谷歌还提供了十种声音以供用户选择。谷歌称,“这就像你的口袋里有一个伙伴,你可以和它谈论新想法或练习重要的对话。”

Open AI此前发布的GPT-4o高级语音模式,也允许用户在对话过程中打断,并能感知和回应用户的情绪波动。在语音设置方面,Open AI提供了四种声音,均与专业的配音演员合作制作。

此外,谷歌还将Gemini Live与其他应用程序和工具连接。谷歌表示,将在未来几周推出Keep、Tasks、Utilities、Calendar、YouTube Music等扩展功能。

谷歌描述了这些功能的具体应用场景。比如用户需要举办一场晚宴,可以让Gemini Live找到特定的食谱,并把食材添加到Keep购物清单中,还能定制一份“让人想起90年代末”的歌单;再比如只需要拍一张音乐会海报的照片,Gemini Live就可以回答用户当天是否有空,并提醒用户买票。

不过,在“Made by Google”大会现场演示Gemini Live功能时,却出现了一点小插曲。谷歌高管Dave Citron询问Gemini Live他的日程表上有没有活动,接连尝试了两次Gemini Live都没有响应,直到第三次换了一个设备才演示成功。

目前,谷歌已向Android手机上的Gemini高级订阅用户提供英语版,并将在接下来的几周内扩展到iOS上,同时提供更多语言模式。谷歌发布的最新款Pixel 9系列手机也搭载了Gemini Live功能。

业内人士认为,Gemini Live的发布是人工智能交互发展的一个重要里程碑。通过引入语音中断和选择功能,谷歌既是在与OpenAI竞争,也是在推动人机交互的方式,从而改变人工智能聊天机器人市场的竞争格局,倒逼其他公司创造出更多自然、实用、吸引人的人工智能助手。

同时,人机交互的创新发展也带来了新的问题和挑战。例如,人工智能将如何快速处理话题变化,同时保持上下文的统一和相关性?如何在不丢失重要线索的情况下处理干扰信息?更重要的是,随着人工智能的深入发展,其与现实生活的边界在哪里?

而OpenAI早在3个月前就已经公开介绍过的GPT-4o,至今尚未完全落地。8月9日,OpenAI发布了一篇关于安全性的博客文章,详细介绍了公司在开发GPT-4o时所做的安全努力,并探讨了这些技术可能对社会带来的风险。

OpenAI在该报告中指出了人工智能的类人社交模式可能造成的风险。OpenAI认为,用户可能会与人工智能建立社交关系,而减少对人类互动的需求。这有利于孤独的个体,但会影响健康的人际关系。

OpenAI透露,在GPT-4o的早期测试时,他们观察到用户与模型的互动语言开始出现微妙的变化,例如,“这是我们在一起的最后一天”等等,这种看似无害的表达,背后可能隐藏着更大的问题。

此外,OpenAI还提到,GPT-4o有时会无意间生成模仿用户声音的输出,这意味着,AI语音引擎可能会被用来欺诈。

而这些安全问题,也是OpenAI把控GPT-4o落地节奏的原因之一。至于谷歌Gemini Live是否解决了类似的安全隐患,并未披露。

所有与安全相关的隐患,无论是我们能够意识到的,还是“潘多拉魔盒”附带的更多可能性,都是人工智能事业需要进一步解决的问题,以保证“技术的进步是为了服务于人类”。

更多内容请下载21财经APP

相关内容

华为仓颉编程语言首个 LT...
IT之家 7 月 1 日消息,华为仓颉编程语言首个 LTS 版本 ...
2025-07-01 21:12:49
数字人出圈、智能体跑通闭环...
近期大火的罗永浩数字人受到行业热议,其神形音容与真人无异,直播首秀...
2025-07-01 16:11:36
瞭望 | AI进高校 治理...
全天候解答疑难问题、辅助查找资料、收集文献、分析数据……“Deep...
2025-07-01 15:42:18
Meta对AI业务大洗牌 ...
Meta Platforms Inc.首席执行官马克·扎克伯格宣布...
2025-07-01 12:46:30
玩美移动宣布推出AI虚拟试...
(全球TMT2025年7月1日讯)玩美移动宣布推出AI虚拟试衣解决...
2025-07-01 12:45:43
“10后玩AI,就像呼吸一...
这里是“AI新榜”的「每日一AI」,我们在这里记录一些人类跟AI对...
2025-07-01 12:45:16

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...