MIT团队新系统30倍速提高AI模型构建效率
创始人
2025-02-11 21:43:48
0

(来源:MIT News)

在医疗图像处理、语音识别等应用中,AI 模型需要处理极为复杂的数据结构,这一过程消耗大量计算资源,而这也是深度学习模型能耗巨大的原因之一。

为了进一步提高 AI 模型的效率,麻省理工学院的研究人员开发了一套自动化系统,让深度学习算法开发者能够同时利用两种类型的数据冗余,进而减少了机器学习运算所需的计算、带宽和内存使用量。

现有的优化算法技术大都比较繁琐,并且通常只允许开发者利用“稀疏性”或“对称性”中的一种,两者均为深度学习数据结构中不同类型的冗余。

如今,麻省理工学院研究人员开发的新方法能让开发者从头构建同时利用这两种冗余的算法,在某些实验中该方法将计算速度提升了近 30 倍。

此外,由于该系统使用了一种用户友好的编程语言,因此它可以针对各种应用优化机器学习算法。同时,该系统还可以帮助那些并非深度学习专家,但希望提高他们所用 AI 算法效率的科研人员,因此在科学计算领域也有应用价值。

“长期以来,利用这些数据冗余需要大量部署工作,而现在,科学家只需要告诉系统他们想要计算的内容,而不需要详细说明如何计算。”该系统相关论文的合作者、麻省理工学院博士后 Willow Ahrens 表示。这篇论文将在国际代码生成和优化研讨会上发表。

除了 Willow Ahrens,另外两名作者分别是麻省理工学院计算机科学与人工智能实验室(CSAIL)的 Radha Patel 和电气工程与计算机科学系(EECS)教授、CSAIL 首席研究员 Saman Amarasinghe。

减少计算量

在机器学习中,数据通常以多维数组的形式进行表示和运算,这些数组被称为张量。张量类似于矩阵,即按行和列排列的二维数值阵列。但与二维矩阵不同的是,张量可以有多个维度,这导致张量的运算难度更大。

深度学习模型通过对张量进行重复的矩阵乘法和加法运算来处理数据,这个过程也是神经网络学习数据中复杂模式的方式。由于这些多维数据结构需要进行大规模计算,因此要消耗大量的计算资源和能源。

不过,借助张量中的数据排列方式,工程师们通常可以通过减少冗余计算来提高神经网络的效率。

例如,若一个张量代表来自电商网站的用户评论数据,由于并非每位用户都会对所有产品进行评论,所以该张量中的大多数值可能是零。这种类型的数据冗余被称为“稀疏性”,模型可以通过仅存储和运算非零值,就能节省大量时间和计算资源。

此外,有时张量是对称的,即数据结构的上半部分和下半部分是一样的。在这种情况下,模型只需对其中一半数据进行运算即可,从而减少计算量。这种类型的数据冗余被称为“对称性”。

“但是,当尝试同时利用这两种优化方式时情况会变得更加复杂。”Willow Ahrens 表示。

为了简化这个过程,她和团队开发了一种名为“SySTeC”的新编译器(编译器是一种将复杂的代码转换为机器可处理简单语言的计算机程序),能够通过自动利用张量中的“稀疏性”和“对称性”来优化计算。

在构建 SySTeC 的过程中,他们确定了可利用对称性进行的三个关键优化点。一,如果算法的输出张量是对称的,则只需要计算其中的一半;二,如果输入张量是对称的,则算法只需要读取其中的一半;三,如果张量运算的中间结果是对称的,算法就可以跳过冗余计算。

同步优化

使用 SySTeC 时,开发者只需输入他们的程序,系统会自动针对上述三种对称性对代码进行优化。然后,SySTeC 的接下来会进行额外的转换,只存储非零数据值,从而优化程序以利用稀疏性。最终,SySTeC 生成可以直接使用的代码。

“通过这种方式,我们可以同时获得两种优化的优势。有趣的是,随着张量维度的增加,节省的计算成本就越多。”Willow Ahrens 解释道。

研究人员证实,使用 SySTeC 自动生成的代码,运行速度提升了近 30 倍。

由于该系统是自动化的,因此在科学家需要从头编写算法来处理数据的情况下尤其有用。

展望未来,研究人员希望将 SySTeC 集成到现有的稀疏张量编译器系统中,为使用者提供一个无缝衔接的操作界面。此外,他们还计划用它来优化更复杂程序的代码。

这项工作部分得到了英特尔、美国国家科学基金会、国防高级研究计划局和能源部的资助。

原文链接:

https://news.mit.edu/2025/user-friendly-system-can-help-developers-build-more-efficient-simulations-and-ai-models-0203

相关内容

技术速递|使用 Chrom...
Chroma 网站 https://trychroma.com/ ...
2025-03-12 20:42:04
AI不是大企业专属游戏!蔡...
(图片来源:摄图网) 3月12日上午,阿里巴巴集团董事长蔡崇信在新...
2025-03-12 20:10:10
滨城首个“AI+政务服务”...
科技改变生活,当人工智能遇上政务服务会碰撞出怎样的火花呢?滨州市滨...
2025-03-12 18:40:33
武汉上线双千亿参数政务级A...
3月7日,武汉首义科技创新投资发展集团有限公司、中国电信武汉分公司...
2025-03-12 18:14:05
三友医疗:正在探索AI智能...
金融界3月12日消息,有投资者在互动平台向三友医疗提问:董秘您好!...
2025-03-12 16:40:54
三评“AI焦虑”之企业篇:...
AI是一个庞大的产业体系,企业没必要都追求爆款产品,关键是找准自身...
2025-03-12 16:14:35

热门资讯

原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
支持 AI 扩图,华为 Pur... 2024-07-28 09:05:02作者:姚立伟 华为Pura 70 Pro手机今日推出鸿蒙Ha...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
吞噬星空维妮娜美图/高清壁纸/... 国漫女神|《吞噬星空》维妮娜美图/高清壁纸/AI手机壁纸/无水印 国漫女神|《吞噬星空》维妮娜美图...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 商... 最近,各家的AI 9笔记本开始陆续登场,其实大家并不一定非选AI 9 HX 370,主要是这颗CPU...
AI智能+高效清洁!萤石RS2... 目前扫拖机器人市场的竞争非常激烈,在上下水扫拖一体机市场也出现了很多所谓的创新产品。但是对于这些产品...
2024年度中国银行业发展报告... 21世纪经济报道 记者李愿 北京报道 10月19日,中国银行业协会在2024金融街论坛年会·金融街之...