AI获得IMO银牌,预示着:一味刷题的人,将被AI所淘汰!
创始人
2024-08-27 23:17:59
0

提到AI,“大模型”正当红。

不过,大模型是一种用数学概率预测、来生成语言的模型,

它在文科(或者说文字的排列组合)方面表现比较理想,

但在逻辑推理方面却难如人意,

可以参考上海人工智能实验室旗下司南评测体系OpenCompass选的高考“语数外”全卷能力测试结果:

可以看出,即便是最强的大模型,在高考数学中也没能达到及格的水平。

其实,大模型是“语言概率模型”,并非真正的“数学逻辑模型”,逻辑推理能力弱、得分低也可以理解。

不过,“大语言模型”只是AI的一种。专业的“数学AI”真的是可以解数学题的。

2024.7.24,谷歌 DeepMind 的人工智能完成了一项壮举:用 AI 做出了今年国际数学奥林匹克竞赛 IMO 的真题,获得了相当于银牌的成绩,且仅仅差1分就能摘得金牌

其中,AlphaProof 是一种用于形式化数学推理的强化学习系统,而 AlphaGeometry 2 是 DeepMind 几何求解系统 AlphaGeometry 的改进版本。

IMO一共6题,每题7分,总分最高 42 分。DeepMind 的系统最终得分为 28 分,意味着解决的 4 个问题都获得了满分——相当于银牌类别的最高分。今年的金牌门槛为 29 分,正式比赛的 609 名选手中有 58 人获得了金牌。

这一突破被认为是AI研究领域的又一个里程碑,被许多人称为“数学界的AlphaGo时刻”,表明具有先进数学推理能力的通用人工智能 (AGI) 有潜力开启科学技术新领域。

值得一提的是,本届IMO由美国队拔得头筹,以微弱优势战胜中国队,获得团体冠军。

其功勋教练是罗博深,他执掌美国奥数队的十年间(2014-2023),改写了美国队在国际奥赛中21年无金牌的历史,且4次问鼎团体冠军。

在罗博深看来,数学最本质的意义是思考和逻辑。如果一个孩子参与数学竞赛,只是为了熟悉题目和技巧,进行重复性训练和套用答题技巧,那这只是无意义的内卷。

享受数学,在解决没看过的数学难题中,锻炼思维、提升创造力——这是罗博深一直坚持的数学学习理念。

反观很多传统的数学教育,一股脑将知识点、解题套路灌给学生,再大量刷题,提高正确率。这样的数学学习,不仅没有锻炼到思维能力,也极大消磨兴趣和热情。

当AI时代来临,传统教育模式的弊端,再也藏不住了。罗博深认为:在刷题中卷成功的孩子,未来将更容易被AI替代。

极强的学术技能将不再是一人独有的硬核技术,拥有能够认识未来世界的全局的洞察力和应变力,将变得至关重要。

因此,当下的学习观念迫切需要改革——从大量刷题计算中解放出来,走向主动的思维训练。

比如,在日常学习中,多琢磨那些自己从没见过的题目,尝试用自己的方法推导,举一反三。尤其是那些竞赛中的题目,都是很好的思维锻炼工具。简单来说,就是“玩”的心态和方法来学习。

除了思维训练,罗博深还坚信,“有共同热爱数学的朋友,比数学成绩更重要”。而这样一种互助学习模式,恰恰能培养AI时代所需要的核心素养。

罗博深强调,“我们需要摆脱过去狭隘的竞争观,走向合作共赢。那些愿意帮助别人,有合作意识的孩子,才会拥有更多的机会。”

相比AI,人最大的竞争力,在于同理心。人工智能善于解答一切有标准答案、非黑即白的问题,但是人类可以理解不同人的需求和痛点,解决那些没有标准答案的问题。

——正如王珏老师一贯所强调的那样:情感,是人的深层需求;情感,是人的底色;情感,就是动机!

人,本质上是受“情感”驱动的、而不是受外在“物质”驱动的!

情感需求,才是人的最根本需求!在AI时代,人对情感的需求只会更强烈!

因此,与人打交道的技能、具有同理性、善于满足他人情感需要的人,在AI时代将脱颖而出!

此外,还有一个AI短期内无法替代的是“创新思维”。所以,如果一个人既有一定的创新能力、又擅长于满足他人的情感需求,想必会成为AI时代的“复合型人才”。

————————————————————

本公众号提供全面、深度的学习科学研究、微课与PPT研究、以及其它实用技术研究文章!到公众号首页输入代码查看更多研究:

  • aigcai教学应用技巧集

  • xxkx:学习科学研究文章

  • wk:微课超级大全,设计制作应用一网打尽

  • ppt:PPT技巧集

相关内容

通义DeepResearc...
【通义首个深度研究Agent模型DeepResearch正式开源】...
2025-09-18 13:42:47
AI时代,我们如何做教师
“AI正在重新定义教育和教师。我们亟须构建与之匹配的教育理念、体系...
2025-09-18 07:00:08
阿里自研AI芯片曝光!
多款国产AI芯片亮相《新闻联播》。 作者 | ZeR0 编辑 | ...
2025-09-18 06:57:53
助力“好用的 AI”落地!...
9月16日,2025腾讯全球数字生态大会在深圳举行,会上公布多项A...
2025-09-18 06:50:52
“AI+能源”大势所趋影响...
清晨,内蒙古的风电场里,人工智能算法已精准预测出未来一段时间的风速...
2025-09-18 06:49:12

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...