原创 AI又一突破!用AI理解AI,MIT推出多模态自动可解释智能体MAIA
创始人
2024-08-02 12:39:58
0

撰文 | 马雪薇

从《超体》中以药物刺激大脑,到赛博朋克文化中用电子干涉入侵脑空间,人类对人脑操纵的可能性有过很多幻想。想象一下,如果人类真的可以直接操纵人脑的每一个神经元,会怎样呢?

到那时,人类将能够直接理解这些神经元在感知特定物体时的作用,有希望做出一些非常“科幻”的事情。

在现实生活中,这样的实验在人脑中几乎是难以实施的,但在人工神经网络却是可行的。然而,由于模型往往含有数百万神经,过于庞大且复杂,理解起来需要大量人力,这就使得大规模的模型理解成为一项极具挑战性的任务。

为此,来自麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的研究团队推出了一个利用神经模型自动进行模型理解任务的系统——MAIA,即“多模态自动可解释智能体”。

MAIA 使用预训练的视觉语言模型来自动化理解神经模型的任务。模块化的设计使 MAIA 能够灵活地评估任意系统,并轻松地添加新的实验工具。此外,它可以自动执行复杂的实验,使用迭代实验方法来测试假设,并根据实验结果更新假设。

加州大学伯克利分校助理教授 Jacob Steinhardt 认为,扩大这些方法可能是理解和安全监督人工智能系统最重要的途径之一。但是,研究团队认为, 增强的 MAIA 并不会取代人类对人工智能系统的监督。MAIA 仍然需要人工监督来发现诸如确认偏差和图像生成/编辑失败之类的错误。

真实效果怎么样?

现有的自动化可解释性方法仅仅是一次性地对数据进行标记或可视化,而 MAIA 则能够生成假设,设计实验来测试它们,并通过迭代分析来改进其理解。通过将预训练的视觉-语言模型(VLM)与可解释性工具库相结合,该多模态方法可以通过编写和运行针对特定模型的定向实验来响应用户查询,不断改进其方法,直到能够提供全面的答案。

MAIA 框架的核心是一个由预训练的多模态模型(如 GPT-4V)驱动的智能体,该智能体能够自动执行实验以解释其他系统的行为。它通过将可解释性子例程组合成 Python 程序来实现这一点。

图 | MAIA 架构

研究团队在神经元描述范式上评估 MAIA,研究显示,MAIA 在真实模型和合成神经元数据集上均取得了优异的描述效果,预测能力优于基线方法,并与人类专家相当。

图 | 评估 MAIA 描述

此外,MAIA 在移除虚假特征和揭示偏见方面都表现出良好的应用潜力,可以帮助人类用户更好地理解模型行为,并改进模型的性能和公平性。

用 MAIA 移除虚假特征

虚假特征会影响模型在真实世界场景中的鲁棒性。MAIA 可以识别并移除模型中的虚假特征,从而提高模型的鲁棒性。研究团队使用 ResNet-18 在 Spawrious 数据集上进行训练,该数据集中包含四种不同背景的狗品种。

在数据集中,每个狗品种与特定背景(例如雪,丛林,沙漠,海滩)虚假相关,而在测试集中,品种-背景配对是混乱的。研究团队使用 MAIA 来找到一个最终层神经元的子集,该神经元可以独立于虚假特征鲁棒地预测单个狗的品种,只需改变用户提示中的查询。

结果显示,MAIA 可以有效地移除模型中的虚假特征,从而提高模型的鲁棒性。

用 MAIA 揭示偏见

模型可能存在偏见,导致其在某些情况下表现不佳。而 MAIA 可以自动揭示模型中的偏见。研究团队使用 ResNet-152 在 ImageNet 上进行训练,并使用 MAIA 检查模型输出中的偏见。

在实验过程中,MAIA 被提示生成与特定类别相关的图像,并观察模型对这些图像的响应。之后,MAIA 发现了一些模型对特定子类或与特定类别相关的图像有偏好。

这表明 MAIA 可以帮助识别模型中的偏见,从而改进模型。

图|MAIA 模型偏见检测

不足与展望

虽然 MAIA 在自动可解释性方面展现出巨大潜力,但仍存在一些局限性。

首先,MAIA 的解释能力受限于其使用的工具,如 Stable Diffusion 和 GPT-4。这些工具的局限性(例如图像生成质量、成本、访问限制)会直接影响 MAIA 的性能。未来可以考虑开发更强大的内部工具,或寻找开源替代方案,以提高系统的可靠性和可访问性。

其次,MAIA 的解释并非形式化验证,而是基于实验结果和自然语言描述。这可能导致解释存在偏差或误导。未来可以考虑将形式化验证方法(例如因果推理、理论分析)融入 MAIA,以提高解释的准确性和可靠性。

此外,MAIA 无法完全避免常见错误,例如确认偏差、过度解释、小样本结论等。未来可以考虑引入自我反思机制,使 MAIA 能够识别和纠正自身错误,并提高解释的鲁棒性。

展望未来,这篇论文的共同作者 Rott Shaham 表示:“我认为我们实验室的下一步自然是要超越人工系统,将这些类似的实验应用于人类感知。传统上,这需要手动设计和测试刺激,这是一个劳动密集型的过程。有了我们的智能体,我们可以扩大这个过程,同时设计和测试大量的刺激。”

相关内容

AI监管松绑!报道:美国放...
美国政府与人工智能公司Anthropic之间的监管对峙出现转机,但...
2026-06-27 08:55:32
金龙鱼:成立AI科技应用小...
有投资者在互动平台向金龙鱼提问:“董秘,你好。AI发展如火如荼,结...
2026-06-27 08:54:25
字节与Anthropic打...
文 | 最话FunTalk,作者 | 林书,编辑 | 刘宇翔 6...
2026-06-26 22:40:47
在Soul App,他们一...
1980年,英国技术哲学家大卫·科林格里奇在 《技术的社会控制》中...
2026-06-26 22:39:24
首个开源鸿蒙机器人操作系统...
6月26日,M-Robots开源社区在2026开放原子开源生态大会...
2026-06-26 22:36:34
曹操出行牵手上海人工智能研...
观点网讯:6月25日,曹操出行与上海人工智能研究院达成战略合作,正...
2026-06-26 18:44:30

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
8月20日基金净值:前海开源中... 证券之星消息,8月20日,前海开源中国稀缺资产混合A最新单位净值为1.43元,累计净值为1.43元,...