研究团队新发现:AI大模型看“块头”更要看“密度”
创始人
2025-11-23 10:46:03
0

新华社记者 魏梦佳

近年来,AI的发展遵循着一个简单直接的规则——模型越大、能力越强。这个被称为“规模法则”的路径,催生了今天我们看到的各种强大的AI大模型。但同时,随着模型参数量的增大,模型训练的成本、使用的成本也随之飙升,一定程度上制约了大模型的产业应用进程。

清华大学的一项最新研究成果——大模型“密度法则”20日在国际期刊《自然·机器智能》上作为封面文章发表,为AI发展指出了一个新方向:AI大模型变强,不应只靠“体型”,更要靠“密度”。

“过去,我们往往关心一个AI模型的‘块头’有多大,即参数量有多大,其实我们更应该关心模型的‘能力密度’,即每个单位的参数能展现出的智能水平。”论文第一作者、清华大学计算机科学与技术系助理研究员肖朝军说,“这就好比评价一个武林高手,不是看他块头有多大,而是看他一招一式里蕴含了多少功力。”

研究人员表示,实现这样的“能力密度”,不能靠“模型压缩”。研究发现,强行压缩一个大模型,就像是把一本厚厚的字典强行塞进小本子里,很多内容会丢失,导致“智力”下降,因此需要采用更先进的“数据+算力+算法”体系,才能培养出“高密度”的精干小模型。

通过研究过去几年发布的51个开源大模型,研究人员发现:AI大模型的“能力密度”正以指数级速度增长,大约每3.5个月就翻一倍。

这意味着什么?打个比方,如果今天我们需要一个体育馆大小的“大脑”才能完成某项复杂任务,那么约3个半月后,我们只需要一个客厅大小的“大脑”就够了;再过3个半月,这个“大脑”可能只需要一个背包大小。

据了解,目前,清华大学已与AI企业面壁智能的团队合作推出了系列“高密度”模型,已应用于手机、汽车、智能家居等生活领域。

“AI模型不是越大越好,‘精炼’‘高效’是其未来发展的方向。”肖朝军说,强大的AI大模型在未来将会更广泛地在手机、电脑、汽车等终端上运行。当芯片的计算能力和AI的智能密度这两条快车道交汇时,“端侧智能”的时代或将来临。届时,个人设备有望拥有前所未有的智能,不仅反应更快,还能更好地保护个人隐私。

相关内容

美国人工智能赛道格局生变,...
美国人工智能赛道格局生变。 据最新消息,谷歌云AI基础设施负责人A...
2025-11-23 13:17:10
李飞飞最新长文:AI很火,...
AI很会说话,但还不会理解世界。 前几天,Google的Gemin...
2025-11-23 13:17:01
企业有必要做AI搜索优化吗...
花了10万做百度SEO,半年才来3个精准客户;同行没怎么投广告,却...
2025-11-23 11:15:39
研究团队新发现:AI大模型...
新华社记者 魏梦佳 近年来,AI的发展遵循着一个简单直接的规则——...
2025-11-23 10:46:03
「中国企业出海,AI赋能下...
2025年11月14日,由IT桔子与北京中关村科学城创新发展有限公...
2025-11-23 06:15:01
阿里巴巴DAMO院揭秘:为...
这项由阿里巴巴集团DAMO学院的肖承昊、陈侯鹏等多位研究人员共同完...
2025-11-22 19:16:55

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...