“AI科学家”登场 科研自动化时代来了?
创始人
2024-09-12 08:21:59
0

【科技创新世界潮】

◎本报记者 刘 霞

科研过程可以完全自动化吗?一个研究机器学习的国际团队正在勇闯“无人区”。

据《自然》网站近日报道,日本Sakana AI公司和加拿大、英国科学家携手,创建了一种基于大语言模型的“人工智能(AI)科学家”。从阅读文献到提出新假设,再到尝试各种解决方案并撰写论文,整个研究周期,“AI科学家”能一气呵成。

Sakana公司在其官网表示,这位科研“新星”是首个用于自动化科研和开放式发现的综合AI系统,标志着科学发现新时代的开始。尽管它展现出非凡的潜力,但目前并不完美,应警惕“AI科学家”被滥用的风险。

推进流程行云流水

AI技术不断进步,让科学家能借助一些模型来集思广益或编写代码。然而,这些模型仍然需要大量人工监督,或仅囿于执行特定任务。

那么,能否利用基础模型将整个科研过程自动化呢?包括加拿大不列颠哥伦比亚大学机器学习专家在内的团队,成功创建出首位“AI科学家”。

在想法生成阶段,该“AI科学家”基于一个起始模板,先进行“头脑风暴”,提出多个不同研究方向,并进行广泛搜索,以确保某些想法是新颖且有趣的;在实验迭代阶段,对于第一阶段提出的某个想法,“AI科学家”会先开展实验,然后生成图表可视化结果,并给每个图表添加注释;在论文写作阶段,它会模仿标准机器学习会议的风格,撰写出一份文字简练、内容丰富的论文,并自主查找相关论文进行引用;在自动化同行评审阶段,研究团队开发出一个自动化的“AI审稿人”,其评估生成论文的准确性堪与人类相媲美。评估结果和建议可用于改进该项目,实现持续的反馈循环,使“AI科学家”能够迭代改进其研究成果。

在最初的演示中,该“AI科学家”针对扩散模型、Transformer模型(一种用于处理语言数据的神经网络模型),以及AI“领悟”(grokking)等机器学习子领域进行了深入研究,总共生成了10篇论文,每篇论文的成本约15美元。

美国华盛顿大学计算社会科学家杰文·韦斯特表示,该“AI科学家”行云流水般完成了整个科研流程,令人印象深刻,有望加速科学发现的步伐。

功能远非尽善尽美

尽管这位“AI科学家”潜能巨大,但它远非尽善尽美。

Sakana AI公司指出,“AI科学家”目前还不具备视觉功能,因此无法修复论文中出现的图表问题。例如,它生成的图表有时无法读取,表格有时会超出页面范围,页面布局也并不美观。

此外,该“AI科学家”有时会出现想法正确但执行错误的情况,也会因比较不当而生成误导性的结果。在撰写论文和评估结论时,它还可能会犯严重错误。例如,它很难比较两个数字的大小,这是大语言模型的“通病”。为了部分解决这个问题,研究团队确保所有实验结果都可以重复,并存储了所有执行文件。

研究人员预计,未来多模态模型“加入战局”,将助该“AI科学家”一臂之力。

另外,该“AI科学家”只能开展机器学习领域的研究,且缺乏科研过程的关键部分:动手进行实验的能力。

艾伦人工智能研究所计算机科学家汤姆·霍普表示,目前该大语言模型“仍无法提出并制定新颖有用的科学方向”。劳伦斯伯克利国家实验室材料科学家赫布兰德·希德则认为,即使该系统在短期内无法完成更具创造性的工作,仍可将科研过程中一些重复性内容自动化。

Sakana AI也强调,此类系统能否提出真正的变革型想法仍未有定论。未来的“AI科学家”能否发明出像人工神经网络或信息论一样的概念也还是个未知数。

能力越强越需慎用

研究人员表示,为扩大该“AI科学家”的能力,让其能够研究更抽象的领域,如纯数学领域,可能需要调遣语言模型之外的其他技术。

例如,解决数学问题需要逻辑推理,而目前大多数AI模型都不擅长逻辑推理。鉴于此,谷歌深度思维公司开发出AlphaGeometr,将语言模型与符号引擎(使用符号和逻辑规则进行推理)相结合,构建出一种神经—符号混合系统。在今年的奥林匹克数学竞赛中,升级后的AlphaGeometry2在19秒内就解答出一道题,令人类选手望尘莫及。

研究人员坚信,目前的迭代只是个开始。“AI科学家”就像AI科研自动化领域的GPT-1。随着不断迭代,它将如目前的GPT-4一样,引发新的科研革命。

不过,与许多新技术一样,“AI科学家”也打开了“潘多拉魔盒”,甚至可能被滥用。

譬如,“AI 科学家”能自动创建论文并提交,这将显著增加审稿人的工作量,可能阻碍科学质量控制,并给学术进步带来压力。而且,“AI科学家”还可能被用来制造危险的病毒,给人类社会带来潜在危害。

来源:科技日报

相关内容

AI监管松绑!报道:美国放...
美国政府与人工智能公司Anthropic之间的监管对峙出现转机,但...
2026-06-27 08:55:32
字节与Anthropic打...
文 | 最话FunTalk,作者 | 林书,编辑 | 刘宇翔 6...
2026-06-26 22:40:47
在Soul App,他们一...
1980年,英国技术哲学家大卫·科林格里奇在 《技术的社会控制》中...
2026-06-26 22:39:24
曹操出行牵手上海人工智能研...
观点网讯:6月25日,曹操出行与上海人工智能研究院达成战略合作,正...
2026-06-26 18:44:30
SIGCOMM 2026 ...
论文作者均来自北京大学王选计算机研究所,第一作者为吴将凯博士,第二...
2026-06-26 18:43:57
智谱开源GLM 5.2,成...
截至9:57,成长100(980080)跌2.95%,权重股中际旭...
2026-06-26 14:30:51

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
8月20日基金净值:前海开源中... 证券之星消息,8月20日,前海开源中国稀缺资产混合A最新单位净值为1.43元,累计净值为1.43元,...