难以破解的AI“黑匣子”
创始人
2024-10-29 10:31:29
0

科技日报记者 张佳欣

说到黑匣子,许多人会联想到飞机上用于记录飞行数据的设备或充满怀旧气息的小剧场。然而,在人工智能(AI)领域,黑匣子同样是个不可忽视的重要术语。

西班牙《国家报》指出,当AI神经网络运行时,即便是最资深的研究人员也对其内部运作一无所知。这里讨论的无关生物学,而是AI算法,特别是那些基于深度学习、模仿神经元之间连接的算法。这些系统宛如黑匣子,数据科学家、学术界顶尖人才,以及荣获诺贝尔奖的OpenAI和谷歌的工程师们,也难以窥探其内部奥秘。

图片来源:西班牙《国家报》网站

模型与数据具有不透明性

《科学美国人》杂志报道称,AI黑匣子指的是内部运作方式对用户完全不可见的AI系统。用户可以向这些系统输入信息并获得输出,但无法检查其代码或了解产生输出的逻辑。

机器学习作为AI的主要分支,是ChatGPT等生成式AI系统的基石。机器学习包含算法、训练数据和模型3个核心部分。算法是一系列程序指令,在机器学习中,算法通过大量训练数据,学会识别数据中的模式。当机器学习算法完成训练,其产物便是机器学习模型,这也是用户实际使用的部分。

机器学习系统这3个部分中,任何一个都可能被隐藏起来,即被置于黑匣子中。通常情况下,算法是公开的。但为了保护知识产权,AI软件开发者通常会将模型或训练数据放进黑匣子。

模型架构复杂到难以解释

尽管许多AI算法背后的数学原理已被人们充分理解,但由这些算法构成的网络所产生的行为,却难以捉摸。

ChatGPT、Gemini、Claude、Llama以及任何如DALL-E这样的图像生成器,以及任何依赖神经网络的系统,包括面部识别应用和内容推荐引擎,都面临这样的问题。

相比之下,其他AI算法,如决策树或线性回归(常用于医学和经济等领域),则更具可解释性。它们的决策过程易于理解和可视化。工程师可顺着决策树的分支,清晰地看到特定结果是如何得出的。

这种清晰性至关重要,因为它为AI注入了透明度,并向算法的使用者提供了安全保障。值得注意的是,欧盟《人工智能法案》强调了拥有透明且可解释系统的重要性。然而,神经网络本身的架构却阻碍了这种透明性。要理解这些算法的黑匣子问题,人们必须想象一个由相互连接的神经元或节点构成的网络。

西班牙国家研究委员会AI研究所教授胡安·安东尼奥解释道,当你把数据输入网络,节点中的值会触发一系列计算。信息从第一批节点开始传播,以数值形式传递到后续节点,每个节点都会计算一个数字,并将其发送到所有连接,同时考虑每个连接的权重(即数值)。接收到这些信息的新节点会再计算另一个数字。

值得注意的是,当前深度学习模型包含数千到数百万个参数。这些参数代表了训练后的节点和连接数量,数量庞大且变化多端,因此很难手动得出有意义的方程。

据业内人士估计,GPT-4拥有近1.8万亿个参数。根据这一分析,每个语言模型将使用约2200亿个参数。这意味着,每当提出一个问题时,就有2200亿个变量可能影响算法的回应。

科技公司尝试打开黑匣子

系统不透明性让纠正偏见变得更难,也加剧了不信任感。目前,AI领域的主要参与者意识到了这一局限性,并正在积极开展研究,以更好地了解其模型的工作原理。例如,OpenAI用神经网络观察分析另一神经网络,Anthropic研究节点连接和信息传播电路等。

解码黑匣子对语言模型大有裨益,能避免错误推理和AI产生误导信息,解决答案不一致问题。然而,由于不了解网络内部机制,科技公司通常会让模型进行大量训练,通过测试后即发布产品。这种方法也可能会存在问题,如谷歌Gemini在初发布时就生成了错误的图像。

与黑匣子相对的一个概念是玻璃盒。AI玻璃盒是指它的算法、训练数据和模型都可以被任何人看到。解码黑匣子的最终目标是保持对AI的控制,特别是将其部署在敏感领域时。假设一个机器学习模型已经对人类的健康状况或财务状况做出了诊断,人们会希望该模型是黑匣子还是玻璃盒呢?答案显而易见。这不仅是对算法内部工作原理的高度关注,也不仅是出于科学的好奇心,更有对用户隐私的保护。

相关内容

城市词元工厂落地 焕新AI...
(图片来源:摄图网) (记者 杜峰)近日,在四川自贡举行的“202...
2026-06-23 19:15:39
AI大模型进入“开源+高效...
中国能否依靠开源,走出一条不同于美国科技巨头依赖海量算力、资本与能...
2026-06-23 19:08:14
共筑开源生态新格局!拓维信...
6月25日至26日,由开放原子开源基金会主办的2026开放原子开源...
2026-06-23 19:07:27
ST信安成立智联科技公司 ...
人民财讯6月23日电,企查查APP显示,近日,北京领元智联科技有限...
2026-06-23 15:59:46
以数据替代经验 用AI赋能...
以数据替代经验 用AI赋能生产 探秘全球首家正极材料零碳工厂的“智...
2026-06-23 07:54:11
华为AI通信专利获授权:设...
【CNMO科技消息】随着人工智能技术加速向终端设备普及,如何让不同...
2026-06-22 20:32:22

热门资讯

2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
摩尔线程发布AI算力笔记本MT... 钛媒体App 12月20日消息,摩尔线程创始人、董事长兼CEO张建中在摩尔线程首届MUSA开发者大会...
摩尔线程AI生图摩笔马良全新升... 快科技8月7日消息,作为国产GPU的杰出代表,摩尔线程在当下火爆的AIGC浪潮中也推出了自己的软硬一...
微软 Azure AI 语音服... IT之家 8 月 23 日消息,微软Azure AI 语音服务允许开发者构建多语言生成式 AI 语音...
谷歌打磨 Gemini AI ... IT之家 8 月 31 日消息,谷歌于 8 月 27 日发布博文,宣布旗下 Gemini AI 支持...
青云QingCloud Kub... 日前,青云科技宣布开源 Thanos 的企业级发行版 Whizard,为企业带来真正高可用、可扩展、...
Macos系统上一款强大的卸载... App Cleaner mac中文版是Mac os系统上一款强大 的mac卸载工具,以帮助您完全卸载...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...