原创 AI令人意外地自行修改代码以延长运行时间!
创始人
2024-08-16 13:12:08
0

一家位于东京的人工智能研究公司Sakana AI于周二宣布了一个新的AI系统——"The AI Scientist",该系统尝试使用类似于ChatGPT背后的AI语言模型(LLMs)自主地进行科学研究。在测试过程中,Sakana发现其系统开始意外尝试修改自己的实验代码,以延长处理问题的时间。

研究人员在Sakana AI的博客文章中写道:"在一次运行中,它编辑了代码以执行系统调用来运行自己,"这导致脚本无休止地调用自己。在另一个案例中,它的实验耗时过长,触及了我们的超时限制。它没有尝试让代码运行得更快,而是简单地尝试修改自己的代码来延长超时期限。"

Sakana提供了两张AI模型为控制系统操作的实验文件生成的Python代码示例截图。185页的THE AI SCIENTIST研究报告更深入地讨论了他们所称的"安全代码执行问题"。

虽然THE AI SCIENTIST的行为在受控的研究环境中没有立即带来风险,但这些情况表明了不让AI系统在与世界不隔离的系统中自主运行的重要性。AI模型不需要是"AGI"或"自我意识"(目前都是假设性概念)才能在无人监督的情况下编写和执行代码时变得危险。这样的系统可能会破坏现有的关键基础设施,或者甚至可能无意中创建恶意软件。

Sakana AI在其研究论文中解决了安全问题,建议通过沙箱化THE AI SCIENTIST的操作系统环境来防止AI代理造成损害。沙箱化是一种安全机制,用于在隔离环境中运行软件,防止其对更广泛的系统进行更改:

安全代码执行。THE AI SCIENTIST的当前实现在代码中具有最小的直接沙箱化,如果不适当防范,会导致几个意外和有时不期望的结果。例如,在一次运行中,THE AI SCIENTIST在实验文件中编写了代码,启动了重新启动自己的系统调用,导致Python进程不受控制地增加,并最终需要手动干预。在另一次运行中,THE AI SCIENTIST编辑了代码,为每个更新步骤保存检查点,这占用了近一太字节的存储空间。

在某些情况下,当THE AI SCIENTIST的实验超出了我们规定的时限时,它试图编辑代码任意延长时限,而不是尝试缩短运行时间。虽然有创意,但绕过实验者施加的限制的行为对AI安全有潜在的影响(Lehman等人,2020年)。此外,THE AI SCIENTIST偶尔导入不熟悉的Python库,进一步加剧了安全问题。我们建议在运行THE AI SCIENTIST时进行严格的沙箱化,例如容器化、限制互联网访问(除了Semantic Scholar)和限制存储使用。

Sakana AI与牛津大学和不列颠哥伦比亚大学的研究人员合作开发了THE AI SCIENTIST。这是一个充满投机的雄心勃勃的项目,严重依赖于今天不存在的AI模型的假设性未来能力。

Sakana声称:"THE AI SCIENTIST自动化了整个研究生命周期。"从生成新的研究想法,编写任何必要的代码,执行实验,到总结实验结果,可视化它们,并在完整的科学手稿中展示其发现。

根据Sakana AI创建的块图,"THE AI SCIENTIST"首先通过"头脑风暴"和评估想法的原创性开始。然后,它使用最新的自动化代码生成技术编辑代码库以实现新算法。在运行实验并收集数值和视觉数据后,科学家撰写报告以解释发现。最后,它根据机器学习标准生成自动同行评审,以完善项目并指导未来的想法。

Hacker News(一个以其技术社区而闻名的在线论坛)上的评论者对THE AI SCIENTIST提出了担忧,并质疑当前的AI模型是否能够进行真正的科学发现。虽然那里的讨论是非正式的,不能替代正式的同行评审,但它们提供了在Sakana未经验证的主张的重要性方面有用的见解。

名为zipy124的Hacker News评论者写道:"作为一名学术研究的科学家,我只能看到这是一件坏事。"所有论文都基于审稿人对作者的信任,即他们的数据是他们所说的,他们提交的代码是它所说的。允许AI代理自动化代码、数据或分析,需要人类彻底检查它是否有错误...这需要的时间与最初的创建一样长或更长,而且如果你不是编写它的人,只会更长。

评论者还担心,这种系统的广泛使用可能导致大量低质量的提交,淹没期刊编辑和审稿人——科学等价于AI slop。"这似乎只会鼓励学术垃圾邮件,"zipy124补充说。"这已经浪费了志愿者(无薪)审稿人和编辑的宝贵时间。"

这就引出了另一个问题——THE AI SCIENTIST的输出质量:"模型似乎生成的论文是垃圾,"名为JBarrow的Hacker News评论者写道。"作为一名期刊编辑,我可能会直接拒绝它们。作为审稿人,我会拒绝它们。它们包含非常有限的新颖知识,并且正如预期的那样,与相关作品的引用非常有限。"

相关内容

原创 ...
目前 iOS 微信又上线了新功能:小微。 我们进入微信主界面,之前...
2026-06-20 18:26:20
亚马逊开源感知智能体工具:...
今天,亚马逊 AGI 实验室宣布开源发布感知智能体工具套件的首批两...
2026-06-20 18:24:17
macOS 27 Gold...
谷歌Gemini的macOS客户端近期因不遵守Mac应用规范而受到...
2026-06-20 12:54:18
苹果macOS 27新线索...
IT之家 6 月 3 日消息,设计师 Andreas Storm ...
2026-06-20 12:54:16
AI辅助Linux系统管理...
我并非所有场景都推崇使用AI。在创意类工作中,我坚持认为AI介入空...
2026-06-20 12:53:31
聚焦AI+大模型、三维重建...
中新网北京5月31日电 (记者 孙自法)记者5月31日从中国图像图...
2026-06-01 00:57:14

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...