研究表明:用AI训练AI,可能越练越傻
创始人
2024-07-27 19:07:56
0

2024年7月26日,央视财经频道报道:用AI训练AI,可能越练越傻。

该报道可能援引了网络内容:

在AI大模型训练上,一个被寄予厚望的方法是“用大模型自己生成的数据来训练自己”。事实上,当后代模型的训练数据也从网络中获取时,就会不可避免地使用前代模型生成的数据。

来自牛津大学和剑桥大学的研究团队及其合作者给这一设想“泼了一盆冷水”。他们给出了这样一个结论:模型在训练中使用自身生成的内容,会出现不可逆转的缺陷,逐渐忘记真实数据分布,从而导致模型性能下降。

该网络内容援引的是 Nature 上的一篇论文“AI models collapse when trained on recursively generated data”。

图片来源:网易新闻

该文章作者表示,用一个旧模型生成的数据去训练一个新模型,并非不可行,但必须对数据进行严格的过滤。

随着迭代次数的增加,模型生成的样本中低困惑度样本的数量开始积累,表明模型开始忘记真实数据分布中的尾部事件。并且,与原始模型相比,后续迭代模型的性能有所下降,表现为困惑度增加。此外,模型生成的数据中包含大量重复的短语。

例如,一个生成 AI 模型负责生成狗的图像。AI 模型会倾向于重现训练数据中最常见的狗的品种,因此可能会过多地呈现金毛,而非法斗。如果随后的模型在一个 AI 生成的数据集中进行训练,而这个数据集中过多地呈现了金毛,这个问题就会加剧。经过足够多轮次的过多呈现金毛后,模型将忘记诸如法斗这样的冷门品种的存在,只生成金毛的图像。最终,模型将崩溃,无法生成有意义的内容。

图 | 模型会逐渐忽视训练数据中不常见的元素。图片来源:网易新闻

模型会逐渐忘记真实语言中出现的低概率事件,例如罕见词汇或短语。这会导致模型生成的内容缺乏多样性,并无法正确地模拟真实世界的复杂性。并且模型会逐渐生成与真实世界不符的内容,例如错误的日期、地点或事件。这会导致模型生成的内容失去可信度,并无法用于可靠的信息检索或知识问答等任务。此外,模型会逐渐学习到训练数据中的偏见和歧视,并将其反映在生成的内容中。

前有Nature 撰文,后有央视报道,显然,用AI训练AI的效果是有限的,迄今尚未达到训练者的预期。

当前对大模型的训练还得有人的深入参与和严格管理,人对AI仍然起支配作用,人才能更好把握真实世界的信息并准确利用它。

这是人之不幸乎?还是人之幸乎?

参考消息:

Nature最新封面:AI 训练 AI?也许越来越笨|训练_新浪财经_新浪网 (sina.com.cn)

https://finance.sina.com.cn/roll/2024-07-25/doc-incfhhzs6807876.shtml

相关内容

“让AI推荐微信号,我加到...
信息被AI“出卖”? 春节假期期间,赵女士在微信上收到了一个陌生的...
2026-02-27 21:25:08
7.9元/月,AI进入“百...
(文/陈济深 编辑/张广凯) 2月6日,阿里千问APP上线“春节...
2026-02-27 19:20:29
千问抢占AI硬件入口 将在...
2月27日消息,继AI购物春节爆火后,阿里巴巴旗下个人AI助手“千...
2026-02-27 18:48:23
金现代首板涨停 开源证券西...
金现代股价在2月27日强势封板,晋级首板。盘后龙虎榜数据显示,当日...
2026-02-27 17:49:49
Robo.ai与DaBos...
(全球TMT2026年2月27日讯)纳斯达克上市公司Robo.ai...
2026-02-27 12:50:19
瑞芯微就 MPP 开源合规...
2月27日,瑞芯微发布关于 MPP 开源合规事件的通告称,近期,公...
2026-02-27 10:49:59

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...