难以破解的AI“黑匣子”
创始人
2024-10-29 10:31:29
0

科技日报记者 张佳欣

说到黑匣子,许多人会联想到飞机上用于记录飞行数据的设备或充满怀旧气息的小剧场。然而,在人工智能(AI)领域,黑匣子同样是个不可忽视的重要术语。

西班牙《国家报》指出,当AI神经网络运行时,即便是最资深的研究人员也对其内部运作一无所知。这里讨论的无关生物学,而是AI算法,特别是那些基于深度学习、模仿神经元之间连接的算法。这些系统宛如黑匣子,数据科学家、学术界顶尖人才,以及荣获诺贝尔奖的OpenAI和谷歌的工程师们,也难以窥探其内部奥秘。

图片来源:西班牙《国家报》网站

模型与数据具有不透明性

《科学美国人》杂志报道称,AI黑匣子指的是内部运作方式对用户完全不可见的AI系统。用户可以向这些系统输入信息并获得输出,但无法检查其代码或了解产生输出的逻辑。

机器学习作为AI的主要分支,是ChatGPT等生成式AI系统的基石。机器学习包含算法、训练数据和模型3个核心部分。算法是一系列程序指令,在机器学习中,算法通过大量训练数据,学会识别数据中的模式。当机器学习算法完成训练,其产物便是机器学习模型,这也是用户实际使用的部分。

机器学习系统这3个部分中,任何一个都可能被隐藏起来,即被置于黑匣子中。通常情况下,算法是公开的。但为了保护知识产权,AI软件开发者通常会将模型或训练数据放进黑匣子。

模型架构复杂到难以解释

尽管许多AI算法背后的数学原理已被人们充分理解,但由这些算法构成的网络所产生的行为,却难以捉摸。

ChatGPT、Gemini、Claude、Llama以及任何如DALL-E这样的图像生成器,以及任何依赖神经网络的系统,包括面部识别应用和内容推荐引擎,都面临这样的问题。

相比之下,其他AI算法,如决策树或线性回归(常用于医学和经济等领域),则更具可解释性。它们的决策过程易于理解和可视化。工程师可顺着决策树的分支,清晰地看到特定结果是如何得出的。

这种清晰性至关重要,因为它为AI注入了透明度,并向算法的使用者提供了安全保障。值得注意的是,欧盟《人工智能法案》强调了拥有透明且可解释系统的重要性。然而,神经网络本身的架构却阻碍了这种透明性。要理解这些算法的黑匣子问题,人们必须想象一个由相互连接的神经元或节点构成的网络。

西班牙国家研究委员会AI研究所教授胡安·安东尼奥解释道,当你把数据输入网络,节点中的值会触发一系列计算。信息从第一批节点开始传播,以数值形式传递到后续节点,每个节点都会计算一个数字,并将其发送到所有连接,同时考虑每个连接的权重(即数值)。接收到这些信息的新节点会再计算另一个数字。

值得注意的是,当前深度学习模型包含数千到数百万个参数。这些参数代表了训练后的节点和连接数量,数量庞大且变化多端,因此很难手动得出有意义的方程。

据业内人士估计,GPT-4拥有近1.8万亿个参数。根据这一分析,每个语言模型将使用约2200亿个参数。这意味着,每当提出一个问题时,就有2200亿个变量可能影响算法的回应。

科技公司尝试打开黑匣子

系统不透明性让纠正偏见变得更难,也加剧了不信任感。目前,AI领域的主要参与者意识到了这一局限性,并正在积极开展研究,以更好地了解其模型的工作原理。例如,OpenAI用神经网络观察分析另一神经网络,Anthropic研究节点连接和信息传播电路等。

解码黑匣子对语言模型大有裨益,能避免错误推理和AI产生误导信息,解决答案不一致问题。然而,由于不了解网络内部机制,科技公司通常会让模型进行大量训练,通过测试后即发布产品。这种方法也可能会存在问题,如谷歌Gemini在初发布时就生成了错误的图像。

与黑匣子相对的一个概念是玻璃盒。AI玻璃盒是指它的算法、训练数据和模型都可以被任何人看到。解码黑匣子的最终目标是保持对AI的控制,特别是将其部署在敏感领域时。假设一个机器学习模型已经对人类的健康状况或财务状况做出了诊断,人们会希望该模型是黑匣子还是玻璃盒呢?答案显而易见。这不仅是对算法内部工作原理的高度关注,也不仅是出于科学的好奇心,更有对用户隐私的保护。

相关内容

Ubuntu网络代理的故障...
Ubuntu系统的网络代理配置不仅涉及系统层面的基础设置,更需要针...
2025-08-21 22:13:39
首发价999元,搭载豆包A...
近日,KTC 旗下首款 AI 拍摄眼镜现已在京东平台上架,眼镜搭载...
2025-08-21 20:14:06
开源证券给予万孚生物买入评...
每经AI快讯,开源证券8月21日发布研报称,给予万孚生物(3004...
2025-08-21 11:50:08
哪些外国领导人出席九三阅兵...
8月20日,外交部发言人毛宁主持例行记者会。 毛宁 资料图。图源...
2025-08-21 11:47:02
字节突然开源Seed-OS...
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 字节跳动突发...
2025-08-21 11:15:39
AI学什么(第15期):开...
大家好,我是蓝衣剑客,欢迎来到「AI学什么」——一个专注于AI科普...
2025-08-20 21:43:32

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...