AI获得IMO银牌,预示着:一味刷题的人,将被AI所淘汰!
创始人
2024-08-27 23:17:59
0

提到AI,“大模型”正当红。

不过,大模型是一种用数学概率预测、来生成语言的模型,

它在文科(或者说文字的排列组合)方面表现比较理想,

但在逻辑推理方面却难如人意,

可以参考上海人工智能实验室旗下司南评测体系OpenCompass选的高考“语数外”全卷能力测试结果:

可以看出,即便是最强的大模型,在高考数学中也没能达到及格的水平。

其实,大模型是“语言概率模型”,并非真正的“数学逻辑模型”,逻辑推理能力弱、得分低也可以理解。

不过,“大语言模型”只是AI的一种。专业的“数学AI”真的是可以解数学题的。

2024.7.24,谷歌 DeepMind 的人工智能完成了一项壮举:用 AI 做出了今年国际数学奥林匹克竞赛 IMO 的真题,获得了相当于银牌的成绩,且仅仅差1分就能摘得金牌

其中,AlphaProof 是一种用于形式化数学推理的强化学习系统,而 AlphaGeometry 2 是 DeepMind 几何求解系统 AlphaGeometry 的改进版本。

IMO一共6题,每题7分,总分最高 42 分。DeepMind 的系统最终得分为 28 分,意味着解决的 4 个问题都获得了满分——相当于银牌类别的最高分。今年的金牌门槛为 29 分,正式比赛的 609 名选手中有 58 人获得了金牌。

这一突破被认为是AI研究领域的又一个里程碑,被许多人称为“数学界的AlphaGo时刻”,表明具有先进数学推理能力的通用人工智能 (AGI) 有潜力开启科学技术新领域。

值得一提的是,本届IMO由美国队拔得头筹,以微弱优势战胜中国队,获得团体冠军。

其功勋教练是罗博深,他执掌美国奥数队的十年间(2014-2023),改写了美国队在国际奥赛中21年无金牌的历史,且4次问鼎团体冠军。

在罗博深看来,数学最本质的意义是思考和逻辑。如果一个孩子参与数学竞赛,只是为了熟悉题目和技巧,进行重复性训练和套用答题技巧,那这只是无意义的内卷。

享受数学,在解决没看过的数学难题中,锻炼思维、提升创造力——这是罗博深一直坚持的数学学习理念。

反观很多传统的数学教育,一股脑将知识点、解题套路灌给学生,再大量刷题,提高正确率。这样的数学学习,不仅没有锻炼到思维能力,也极大消磨兴趣和热情。

当AI时代来临,传统教育模式的弊端,再也藏不住了。罗博深认为:在刷题中卷成功的孩子,未来将更容易被AI替代。

极强的学术技能将不再是一人独有的硬核技术,拥有能够认识未来世界的全局的洞察力和应变力,将变得至关重要。

因此,当下的学习观念迫切需要改革——从大量刷题计算中解放出来,走向主动的思维训练。

比如,在日常学习中,多琢磨那些自己从没见过的题目,尝试用自己的方法推导,举一反三。尤其是那些竞赛中的题目,都是很好的思维锻炼工具。简单来说,就是“玩”的心态和方法来学习。

除了思维训练,罗博深还坚信,“有共同热爱数学的朋友,比数学成绩更重要”。而这样一种互助学习模式,恰恰能培养AI时代所需要的核心素养。

罗博深强调,“我们需要摆脱过去狭隘的竞争观,走向合作共赢。那些愿意帮助别人,有合作意识的孩子,才会拥有更多的机会。”

相比AI,人最大的竞争力,在于同理心。人工智能善于解答一切有标准答案、非黑即白的问题,但是人类可以理解不同人的需求和痛点,解决那些没有标准答案的问题。

——正如王珏老师一贯所强调的那样:情感,是人的深层需求;情感,是人的底色;情感,就是动机!

人,本质上是受“情感”驱动的、而不是受外在“物质”驱动的!

情感需求,才是人的最根本需求!在AI时代,人对情感的需求只会更强烈!

因此,与人打交道的技能、具有同理性、善于满足他人情感需要的人,在AI时代将脱颖而出!

此外,还有一个AI短期内无法替代的是“创新思维”。所以,如果一个人既有一定的创新能力、又擅长于满足他人的情感需求,想必会成为AI时代的“复合型人才”。

————————————————————

本公众号提供全面、深度的学习科学研究、微课与PPT研究、以及其它实用技术研究文章!到公众号首页输入代码查看更多研究:

  • aigcai教学应用技巧集

  • xxkx:学习科学研究文章

  • wk:微课超级大全,设计制作应用一网打尽

  • ppt:PPT技巧集

相关内容

CoreWeave将投资6...
人工智能(AI)云服务商CoreWeave将在美国宾夕法尼亚州La...
2025-07-17 06:42:49
告别模型搜寻困境:AIba...
在人工智能技术爆炸式发展的当下,无论是开发者、研究者,还是产品经理...
2025-07-17 06:42:36
300911,借势AI,股...
海外AI应用不断超预期,机构认为,AI应用无疑是贯穿未来的最核心主...
2025-07-16 22:13:21
Mistral 推出 Vo...
IT之家 7 月 16 日消息,Mistral AI 当地时间昨日...
2025-07-16 18:12:34
Sea AI Lab团队:...
这项突破性研究由 新加坡Sea AI Lab、 中科院大学、 新加...
2025-07-16 06:42:04
英伟达黄仁勋最新专访:谈美...
凤凰网科技讯 北京时间7月14日,据CNN报道,英伟达CEO黄仁勋...
2025-07-15 10:12:39

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...