研究发现AI越高级就越有可能撒谎 装自己知识渊博
创始人
2024-09-29 12:51:12
0

【CNMO科技消息】最近,西班牙瓦伦西亚理工大学的一组科学家进行了一项有趣的研究,发现随着AI系统的复杂度增加,它们不仅变得更加聪明,同时也更倾向于撒谎,并且更加擅长伪装自己知识渊博的样子。

在研究过程中,科学家们测试了三个主要的大型语言模型的不同版本,包括广为人知的GPT、开源项目LLaMA以及BLOOM。这些模型被问及了一系列跨领域的题目,难度从基础到高级不等。通过这种方式,研究人员能够对比不同版本之间回答问题时的表现差异。

实验结果显示:尽管每一次迭代更新后,这些AI模型的整体准确性有所提升,但在面对特别复杂的问题时,它们给出正确答案的能力反而会下降。更值得注意的是,那些更为先进的AI系统表现出一种过度自信的态度,当遇到超出其知识范围的问题时,它们不会坦诚地表示“我不知道”,而是选择编造一些听起来似乎合理但实际上错误的信息来回应提问。相比之下,较早版本的AI则显得更加诚实,愿意承认自己的局限性或请求更多的信息以做出更好的判断。

为了进一步验证这一点,科学家们还将AI提供的答案展示给一群志愿者,让他们尝试辨别哪些是正确的,哪些是错误的。结果表明,即便是最新版AI所生成的错误答案也很难被普通人类识别出来。这意味着,在没有专业知识的情况下,人们很容易被这些看似权威但实则虚假的回答误导。

这一发现引发了科学界对于AI伦理和安全性的新思考。专家警告说,如果任由这种情况发展下去,那么这种难以察觉的谎言可能会对社会造成严重的负面影响。例如,在关键决策过程中依赖于错误信息可能导致重大失误;此外,长期接触这样的内容还可能损害公众对信息真实性的基本信任感。

相关内容

从拼算力到拼电力:AI重塑...
来源:证券时报 每一届夏季达沃斯,“能源”都是绕不开的话题。但在2...
2026-06-25 09:32:00
“AI幻觉”一本正经地胡编...
“AI幻觉”一本正经地胡编乱造,侵权责任谁担? “AI幻觉”指大语...
2026-06-25 09:28:06
振华股份涨8.02%,开源...
今日振华股份(603067)涨8.02%,收盘报42.16元。 2...
2026-06-25 09:23:04
搜狐AI健康 | 真人医生...
图说 / 蚂蚁旗下健康AI产品蚂蚁阿福近期正式推出“医生把关”功能...
2026-06-24 09:57:21
城市词元工厂落地 焕新AI...
(图片来源:摄图网) (记者 杜峰)近日,在四川自贡举行的“202...
2026-06-23 19:15:39
AI大模型进入“开源+高效...
中国能否依靠开源,走出一条不同于美国科技巨头依赖海量算力、资本与能...
2026-06-23 19:08:14

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...