硬核观察 #1004 研究称 AI 的涌现能力来自于评估模式的错误
创始人
2024-03-02 15:40:54
0

研究称 AI 的涌现能力来自于评估模式的错误

GPT-3 等大语言模型(LLM)随着规模的扩大而表现出意想不到的 “涌现” 能力。然而,有研究人员认为,这是测量错误的后果,而不是奇迹般的能力。他们认为,LLM 是概率模型,它们并不像有些人认为的那样拥有任何一种有知觉的智能。该团队观察到,大多数(92%)检测到的意外行为是在通过 BIG-Bench 评估的任务中发现的。其中一项测试是精确字符串匹配,它检查一个模型的输出,看它是否与一个特定的字符串完全匹配,而不对几乎正确的答案给予任何权重。当较小的模型对一个问题的回答可能非常接近正确,但由于它是使用二进制的精确字符串匹配来评估的,它将被标记为错误。研究人员强调,他们并没有排除 LLM 中出现 “涌现” 行为的可能性;他们只是说,以前关于出现 “涌现” 行为的说法看起来像是考虑不周的衡量标准。

消息来源:The Register

老王点评:也许不是突然出现的能力,而是逐渐提升的能力。但是目前的 AI 给人的感觉是突然变得很聪明,这中间确实给人一种跨越式的感觉。我倾向于认为是量变导致了质变的看法。

苹果公司注册 xrOS 商标

苹果公司已经在新西兰注册了 “xrOS” 的字样,这是该公司第一次间接透露其即将推出的头戴设备的操作系统名称。xrOS 是指 “扩展现实”,代表了该头戴设备将支持的增强和虚拟现实功能。在开发过程中,苹果曾在内部将该软件称为 “Reality OS” 或 “rOS”。xrOS 将有一个苹果用户会感到熟悉的类似于 iOS 的界面。

消息来源:Mac Rumors

老王点评:就 AR、VR、XR 等方面,我还是看好苹果公司的发展。不过,我觉得可能还需要一段时间,尤其是目前苹果在 AI 方面的落后可能会拖慢这一进程。

只需 15 分钟训练,iPhone 将能用你的声音说话

苹果公司今天预览了为认知、视觉、听觉和行动无障碍而设计的一组新功能,其中包括为可能失去说话能力的人设计的新的个人语音功能,允许他们创造 “听起来像他们的合成语音” 与朋友或家人交谈。用户可以通过在 iPhone 或 iPad 上大声朗读一组文字提示来创建个人语音,总共录制 15 分钟的音频。用户可以输入他们想说的话,然后用他们的个人语音读给他们想交谈的人。

消息来源:The Verge

老王点评:上面刚刚说过苹果在 AI 方面的落后,这一条其实正好印证了,因为做到这一点目前并不稀奇。

相关内容

AI海报·数说“十四五”河...
从河北10月29日召开的“十四五”经济社会发展成就新闻发布会获悉,...
2025-11-01 08:15:42
“把AI融入掌中的蝉翼刀”...
“刀,要薄而锋利;AI,要轻却深邃。当联想moto把两者合二为一,...
2025-11-01 06:16:05
AI搜索摘要优化实战:让你...
当用户在AI搜索引擎中提问时,你的品牌是否能被生成式摘要“点名推荐...
2025-11-01 06:14:24
Canva全新设计模型有望...
Canva在周四的秋季产品发布会上推出了一系列全新的AI产品和功能...
2025-10-31 23:15:42
英特尔拟收购AI芯片公司S...
钛媒体App 10月31日消息,据报道,英特尔正就收购AI芯片初创...
2025-10-31 23:14:30
三星携手NVIDIA 以全...
以AI驱动制造技术,推动半导体、移动设备与机器人产业的企业级数字化...
2025-10-31 22:16:32

热门资讯

Helix:高级 Linux ... 说到 基于终端的文本编辑器,通常 Vim、Emacs 和 Nano 受到了关注。这并不意味着没有其他...
《Apex 英雄》正式可在 S... 《Apex 英雄》现已通过 Steam Deck 验证,这使其成为支持 Linux 的顶级多人游戏之...
使用 KRAWL 扫描 Kub... 用 KRAWL 脚本来识别 Kubernetes Pod 和容器中的错误。当你使用 Kubernet...
如何在 Github 上创建一... 学习如何复刻一个仓库,进行更改,并要求维护人员审查并合并它。你知道如何使用 git 了,你有一个 G...
JStock:Linux 上不... 如果你在股票市场做投资,那么你可能非常清楚投资组合管理计划有多重要。管理投资组合的目标是依据你能承受...
从 Yum 更新中排除特定/某... 作为系统更新的一部分,你也许需要在基于 Red Hat 系统中由于应用依赖排除一些软件包。如果是,如...
Epic 游戏商店现在可在 S... 现在可以在 Steam Deck 上运行 Epic 游戏商店了,几乎无懈可击! 但是,它是非官方的。...
通过 SaltStack 管理... 我在搜索Puppet的替代品时,偶然间碰到了Salt。我喜欢puppet,但是我又爱上Salt了:)...
如何检查你的 Linux 系统... 不知道在使用哪个初始化系统?以下是方法。每个主流 Linux 发行版(包括 Ubuntu、Fedor...
如何理解Apache 2.0许... 提要:Apache 2.0许可证中的专利许可条款使得开源代码可以安全使用,但它经常被误解。Apach...