瞭望 | AI4S重塑科研未来
创始人
2025-12-08 18:16:14
0

在积极利用AI提升知识积累效率的同时,我们需审慎思考,如何确保科学成果的质量与深度不被速度稀释,并将最终的解释权、决策权等“认知主动权”牢牢掌握在人类自己手中

文 |《瞭望》新闻周刊记者 钱沛杉

11月27日晚,DeepSeek发布其最新数学模型DeepSeekMath-V2,以自验证方式突破了目前AI在深度推理方面的局限,展现了强大的定理推理能力。DeepSeek方面表示,Math-V2让大模型在数学领域不再只是“做题家”,而有可能依靠自身全面、严谨的数学推理能力对科学研究产生深远影响。

将AI引入科学研究并非全新事物。在国内,2018年,中国科学院院士、北京大学国际机器学习研究中心主任鄂维南率先引入AI4S(人工智能驱动科学研究)概念,认为传统科研模式效率较低、学科间壁垒较高,AI可以实现跨学科融合,加速突破。

特别是,当传统物理模型在极端复杂的系统前束手无策时,数据驱动范式可以跳过对微观机制的繁琐推演,利用算法直接从海量数据中寻找规律、构建“隐性”模型,为应对气候变化等紧迫挑战,提供可行路径。

这种模式已影响渗透到科学研究的多个环节,在多个领域催生重大突破,实现科研效率的指数级提升。

在生命科学领域,去年获诺贝尔化学奖的“阿尔法折叠2”AI模型(Alpha Fold2)将蛋白质结构预测周期从数十年缩短至数天,解决了领域内长期困扰的折叠难题;在材料科学领域,科研人员利用AI模拟不同元素组合的性能,缩短新材料设计周期;在环境科学领域,AI实现多模态数据的自动对齐与分析,为森林火灾的预防、监测与生态恢复等提供了更准、更快的解决方案……

一系列显著成果,“刺激”多国加速布局发展AI4S:2024年以来,美国通过行政令、政策文件及专项报告系统性提升AI4S战略地位;欧盟自2022年起开始布局科学AI发展,2025年加快进度,发布“人工智能大陆行动计划”,持续布局欧洲科学AI战略;建设科学AI在线服务平台AI-on-Demand并推动成立AI科学专家组。

我国同样高度重视AI4S发展,从国家部委到地方政府层面积极应对,陆续推出支持政策。国家层面,2023年科技部会同国家自然科学基金委启动“人工智能赋能科学研究”专项部署工作后,今年8月国务院印发《关于深入实施“人工智能+”行动的意见》,第一项重点行动即“人工智能+”科学技术,要求加快探索人工智能驱动的新型科研范式,加速“从0到1”重大科学发现进程。《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》也提出,以人工智能引领科研范式变革。

地方层面,今年7月上海、北京均出台了支持AI4S发展的专项计划,推出了科学智能“百团百项”工程和《加快人工智能赋能科学研究高质量发展行动计划(2025—2027年)》等举措。

政策层面的高度重视支持推动了该领域的快速发展,但与此同时,AI预测成果无法快速转化为实际生产力、数据孤岛问题仍存、复合型人才缺口较大等情况仍存。

学界与业界呼吁,构建包含复合型人才培养体系、多领域协作的开放平台等在内的新型科研生态,并恪守科学伦理,坚持以人为本、科技向善。

在浙江乌镇举办的 2025 年世界互联网大会“互联网之光”博览会现场,一家企业工作人员展示人形机器人同步模仿精细动作(2025 年 11 月 6 日摄) 黄宗治摄 / 本刊

AI挑战科学研究“游戏规则”

过去,科学家们主要通过理论推导、实验观察和计算机模拟来探索世界。如今,AI4S带来了科学研究的另一种可能,即从海量数据中寻找规律。

“海洋科学作为一门实验科学,其经典理论框架已趋于完善。当前学科的一个重要发展方向是追求更高分辨率的观测,旨在通过精细化的尺度研究来突破传统大尺度理论的瓶颈。”中国海洋大学物理海洋教育部重点实验室教授陈显尧介绍。

以预测厄尔尼诺-南方涛动(ENSO)现象为例,受系统混沌性和大气海洋耦合过程季节变化等因素影响,ENSO在春季的预测准确度明显低于其他季节,成为气候预测中的一大难点。2019年,科学家运用机器学习模型突破了这一难题,将可预测时间长度延长数月,并为解释其物理过程提供了新思路。

“AI并非拥有了超乎人类的知识,而是关注到了被人类研究者因先验知识和经验而忽视的物理过程。这些过程虽被观测记录,但传统上被视为‘噪音’而非关键因子。AI的无偏见学习揭示了这些次要因素在长期预测中的决定性作用。”陈显尧认为,AI的引入绝非简单的工具性应用,而是推动动力学理论与观测数据的有机融合。它突破人类思维的可能局限,帮助科学家发现新的科学联系,推动理论创新。

这一模式挑战了传统科学研究的“游戏规则”,在学界引发诸多争议。“经典科学范式是‘自上而下’的,数据驱动范式是‘自下而上’的。”受访者说,在经典科学范式概念下的科学发现,目标是“理解因果”优先,而AI4S的目标则是“实现预测”优先,两者标准存在根本性差异。

标准的调整引发科研体系形态变化——

科研基础设施上,AI4S的根基从传统的精密仪器,转向了以大型计算中心、专用算法库和高质量数据库为核心的新型基础设施。这源于其对海量数据和强大算力的根本依赖。

科研人才角色上,一些科学家的工作重心发生转变。过去科研中软件是被动工具,而生成式AI和强化学习模型,更像是能自主设计实验、提出假设的“能动伙伴”。科学家的核心任务从“如何操作”转变为“如何定义问题、评估结果和引导方向”,形成“人机混合智能”协同探索模式。

科研组织方式上,受上述变动影响,科研活动从传统PI制(课题组长负责制)的“小作坊”模式,向跨学科、平台化、网络化的大团队协作转型。

多位学者认为,AI4S不是对传统科研范式的替代,而是深度融合。中国工程院院士孙凝晖认为,AI4S的终极目标不是替代科学家,而是通过工具进化赋能人类认知进化,“正如望远镜扩展了人类的视野,显微镜打开了微观世界的大门,AI正在成为人类探索未知的‘第三只眼睛’”。

克服现实推进阻碍

中国科学院高能物理研究所研发的Dr.Sai多智能体协同系统,实现高能物理分析全流程自动化,并成功复现四夸克粒子发现过程;北京大学开发的DeepFlameRocket火箭燃烧智能仿真软件,实现对火箭发动机的全流程数值模拟……

如果将2024年称为AI4S的发展元年,2025年,AI4S从概念验证和工具普及进入深度融合和规模化应用的发展阶段,在基础设施构建、平台工具研发、交叉学科应用等方面取得进展。

受访者认为,当前,AI4S不再仅局限于个别案例,而是渗透影响到了各个基础学科和工业研发的毛细血管中,科学发现进入人机协同、加速创新时代。但作为新生事物,在现实推进过程中,仍面临几方面阻碍。

打通数据孤岛。高质量AI-Ready的科学数据稀缺是我国AI4S发展的核心挑战。据了解,AI-Ready数据集是指经过系统化处理、标注和结构化的数据集合,专为人工智能模型的训练和评估设计。这类数据集通常具备高质量、标准化格式和清晰的标注,能够显著降低数据预处理的门槛,帮助研究人员和开发者快速投入模型开发。

北京大学深圳研究生院副院长、科学智能学院执行院长田永鸿认为,海量、高质量的科学数据是AI4S发展的基础,但此类数据仍严重短缺。

一方面,高质量数据集的获取成本高昂。在生命科学领域,有业内人士统计,仅单一类别的蛋白质结构实验数据,采集成本就超过8万元,训练AI模型通常需要百万量级的样本,其成本远超普通科研团队承受范围。

另一方面,数据标注环节存在突出瓶颈。以冷冻电镜图像为例,其标注工作需依赖结构生物学家或电镜专家等专业人员,耗时较长。业内人士透露,国内某生物物理研究机构曾组织20名博士,全职工作6个月,才完成1万张图像标注。这种高度依赖专业人力的标注模式,在效率和规模上难以满足AI训练需求,成为制约AI科研应用的关键因素之一。

此外,AI4S领域数据共享存在制约。田永鸿介绍,科研活动长期以课题组或机构为单位开展,数据分散在不同实验室、机构、个人的电脑中,形成“数据孤岛”。数据所有权、知识产权以及科研竞争关系等因素,阻碍了科学数据的开放共享。

例如,生命健康领域的医疗数据因隐私保护限制,科研可用率较低;材料科学领域数据“碎片化和孤岛化”现象严重,数据规模小,共享机制不完善。

一位长期从事科学数据管理的专家表示:“数据质量直接决定AI模型的可靠性。如果没有足够多、足够好的数据,再先进的算法也是无源之水。”

人类验证能力成瓶颈。工业和信息化部原副部长王江平在相关论坛发言中表示,“AI一天的预测成果,人类需要十年验证”的现象在AI4S领域普遍存在,“AI科学发现能力指数级增长,人类的实验验证和产业化应用能力仍在线性爬坡,这种巨大的能力鸿沟导致海量AI预测成果如同洪水被堵,淤积在实验室无法转化为实际生产力。”

王江平分析,造成“堰塞湖”现象的主要原因一是标准缺失,AI预测结果缺乏统一评估体系;二是验证瓶颈,自动化实验能力不足,“预测—验证”链条不畅;三是政策约束,伦理审查严、审批周期长,加之投资风险高,抑制了企业投入意愿。

田永鸿认为,这一现象属于长期待解决的难题,有望通过AI计算设计实验方案,自动化平台执行并反馈结果,形成“设计—执行—验证”的循环,缩小科研与产业化的鸿沟。

复合型人才短缺。AI4S及更广泛的人工智能所需的复合型人才短缺,是当前我国科技产业发展面临的核心挑战之一。

金融机构高盛在《全球人工智能产业布局》报告中预测,到2030年,中国人工智能产业的人才缺口将超过500万;麦肯锡报告中提到的数字同样不容乐观:到2030年,中国的AI人才供应仅市场需求的1/3。

复合型人才缺口体现在数量上,也在质量上。田永鸿说,传统人工智能人才培养侧重于编程、数学和计算机基础,而科学智能要求学生不仅掌握AI技术,还须具备扎实的数理基础与特定学科知识,包括物理、化学、生物等,“这意味着学生需要同时理解科学问题的本质和AI的求解方法,是典型的多学科深度交叉领域”。这种人才标准的升级,加剧了复合型人才的紧缺状况。

构建科研新生态

AI4S带来的挑战,是“游戏规则”变换在撞击现有体系时产生的结构性张力。

应对这些挑战,有学者认为,需在现有科研组织方式上,构建面向人工智能时代的新型科研生态。这包括培养既懂AI又懂专业的复合型人才,推动数据开放共享以破解“数据孤岛”,并建立适应人机协同的科研评价与伦理治理体系。

构建复合型人才培养体系。转变传统的“专门人才”培养模式,积极构建面向AI4S的复合型人才培养体系。一方面重视培养具备深厚AI技术理论基础和实践应用能力的专业人才;另一方面完善交叉学科人才培养体系,促进科研人员跨学科学习。

北京大学深圳研究生院聚焦AI4S人才短板,设立科学智能学院,推行“双导师制”。

田永鸿介绍,“双导师制”是由一位科学导师与一位AI导师共同指导学生,科学导师负责把握重要科学问题方向,AI导师则设计技术路线。双导师从一开始即共担责任,解决合作意愿与知识产权分配问题。同时,学院设立专门的交叉学科学位评定分会,从制度上保障跨学科论文的评审质量,使学生归属清晰、评价有据。

“这一模式将交叉人才培养从过去的零散合作转变为系统化、制度化的体系,为复合型创新人才的成长提供了坚实基础。”田永鸿说。

陈显尧认为,人才培养的关键,在于引导学生从传统的理论思维范式,转向并掌握一种与AI相结合的思维方式,“我们正处在实践的初级阶段,有效的方法是让学生从解决具体科学问题入手,在实践中亲眼见证这种新方法的可行性,从而逐步建立新的科研思维路径。”

平台建设向平台模式转变。传统的个体科学家或单一研究团队开展科学研究的“作坊模式”已不能适应AI4S的研究方式,“平台模式”能够整合来自不同领域的多元主体,形成研究网络。培育AI4S创新联合体,促进数学、计算机科学、建模仿真与各学科的协作,是打造世界领先创新集群的关键。

国内高校和研究机构已布局多家AI4S研发平台。如,中国科学院建立ScienceOne基于科学基础大模型的智能科研平台;北京科学智能研究院研发的“玻尔科研空间站”AI科研平台集成“读文献—做计算—做实验—多学科协同”等功能等。

但AI4S领域的共性技术平台建设仍侧重于基础支撑层,成果仍以个别研发案例为主,缺少针对半导体、新能源、新材料等细分场景下单一类别的专业支撑平台。

对此,受访者建议,应面向重点应用领域,构建一批AI4S共性技术研发平台,依托云厂商,以及医药健康、新材料、工业等重点领域优势企业,协同高校院所、科研机构和创新企业组建各领域创新联合体,探索通过成立合资公司、共建干湿闭环实验室、搭建高能级创新平台等,加速科技工程创新突破。

推动科研数据共享。田永鸿认为,数据共享是释放AI4S潜力的基础,须加快打破“数据孤岛”,推动科研数据的有效整合与开放共享。

受访者建议,加速推进AI4S关键领域“科研数据可信空间”建设,促进医药健康、新材料、工业等领域的高质量科学数据和合成数据资源的集中,加强科学数据的标准化建设,创新数据资源共享的技术和制度,引导数据的可信流通和交易。

田永鸿建议加强数据、工具、人才、模型四要素的协同进化——数据需要标准化工具加工,通过人才训练模型,模型再反哺数据更新。“未来,我们希望能集研发数据采集、模型训练、科学发现与实验验证闭环融合,成为全流程智能化实验设施与设备,打造覆盖主要研究机构、科学设施和实验室的数智云化协同科学研究平台网,让科学家远程调用资源,最大化发挥数据价值。”田永鸿说。

推动科学伦理治理。在伦理治理方面,需要从科学共同体自治走向社会共治。AI4S带来算法不透明性、算法歧视、数据隐私问题以及结果的不可解释性等伦理挑战。需强化AI4S的科技伦理治理研究,加强科技伦理宣传与教育,建立健全AI4S的社会共治体系和机制。

受访者表示,当前阶段,AI的主要作用是加速科学发现,其优势是在现有范式下进行高效预测与计算。但真正颠覆性的科研突破,仍依赖人类独有的科学直觉、对复杂事实的深刻辨析,以及融入了情境与文化背景的宏观判断。

在积极利用AI提升知识积累效率的同时,我们需审慎思考,如何确保科学成果的质量与深度不被速度稀释,并将最终的解释权、决策权等“认知主动权”牢牢掌握在人类自己手中。

相关内容

服装行业退货率高,问题出在...
近日,一家服装潮牌代工厂借助AI快速上新的案例,引发了争议。 不再...
2025-12-08 18:46:22
瞭望 | AI4S重塑科研...
在积极利用AI提升知识积累效率的同时,我们需审慎思考,如何确保科学...
2025-12-08 18:16:14
从“工具”到“体验”:企业...
过去几年,中国数字经济迈入高速迭代期。无论是人工智能的产业应用,还...
2025-12-08 16:15:41
中信建投:AI大模型与应用...
瑞财经 严明会 近日,中信建投指出,DeepSeek V3.2发布...
2025-12-08 15:17:11
自变量机器人参与成立Rob...
2025年深圳国际人工智能展览会上,一台名为“小量”的机器人正有条...
2025-12-08 14:16:12
直播预告|开放模型时代:中...
在全球AI浪潮中,开源不仅是一种协作方式,更成为推动技术民主化、加...
2025-12-08 13:15:39

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...