瞭望 | AI4S重塑科研未来_linux资讯

瞭望 | AI4S重塑科研未来

创始人

2025-12-08 18:16:14

0次

在积极利用AI提升知识积累效率的同时，我们需审慎思考，如何确保科学成果的质量与深度不被速度稀释，并将最终的解释权、决策权等“认知主动权”牢牢掌握在人类自己手中

文 |《瞭望》新闻周刊记者钱沛杉

11月27日晚，DeepSeek发布其最新数学模型DeepSeekMath-V2，以自验证方式突破了目前AI在深度推理方面的局限，展现了强大的定理推理能力。DeepSeek方面表示，Math-V2让大模型在数学领域不再只是“做题家”，而有可能依靠自身全面、严谨的数学推理能力对科学研究产生深远影响。

将AI引入科学研究并非全新事物。在国内，2018年，中国科学院院士、北京大学国际机器学习研究中心主任鄂维南率先引入AI4S（人工智能驱动科学研究）概念，认为传统科研模式效率较低、学科间壁垒较高，AI可以实现跨学科融合，加速突破。

特别是，当传统物理模型在极端复杂的系统前束手无策时，数据驱动范式可以跳过对微观机制的繁琐推演，利用算法直接从海量数据中寻找规律、构建“隐性”模型，为应对气候变化等紧迫挑战，提供可行路径。

这种模式已影响渗透到科学研究的多个环节，在多个领域催生重大突破，实现科研效率的指数级提升。

在生命科学领域，去年获诺贝尔化学奖的“阿尔法折叠2”AI模型（Alpha Fold2）将蛋白质结构预测周期从数十年缩短至数天，解决了领域内长期困扰的折叠难题；在材料科学领域，科研人员利用AI模拟不同元素组合的性能，缩短新材料设计周期；在环境科学领域，AI实现多模态数据的自动对齐与分析，为森林火灾的预防、监测与生态恢复等提供了更准、更快的解决方案……

一系列显著成果，“刺激”多国加速布局发展AI4S：2024年以来，美国通过行政令、政策文件及专项报告系统性提升AI4S战略地位；欧盟自2022年起开始布局科学AI发展，2025年加快进度，发布“人工智能大陆行动计划”，持续布局欧洲科学AI战略；建设科学AI在线服务平台AI-on-Demand并推动成立AI科学专家组。

我国同样高度重视AI4S发展，从国家部委到地方政府层面积极应对，陆续推出支持政策。国家层面，2023年科技部会同国家自然科学基金委启动“人工智能赋能科学研究”专项部署工作后，今年8月国务院印发《关于深入实施“人工智能+”行动的意见》，第一项重点行动即“人工智能+”科学技术，要求加快探索人工智能驱动的新型科研范式，加速“从0到1”重大科学发现进程。《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》也提出，以人工智能引领科研范式变革。

地方层面，今年7月上海、北京均出台了支持AI4S发展的专项计划，推出了科学智能“百团百项”工程和《加快人工智能赋能科学研究高质量发展行动计划（2025—2027年）》等举措。

政策层面的高度重视支持推动了该领域的快速发展，但与此同时，AI预测成果无法快速转化为实际生产力、数据孤岛问题仍存、复合型人才缺口较大等情况仍存。

学界与业界呼吁，构建包含复合型人才培养体系、多领域协作的开放平台等在内的新型科研生态，并恪守科学伦理，坚持以人为本、科技向善。

在浙江乌镇举办的 2025 年世界互联网大会“互联网之光”博览会现场，一家企业工作人员展示人形机器人同步模仿精细动作（2025 年 11 月 6 日摄）黄宗治摄 / 本刊

AI挑战科学研究“游戏规则”

过去，科学家们主要通过理论推导、实验观察和计算机模拟来探索世界。如今，AI4S带来了科学研究的另一种可能，即从海量数据中寻找规律。

“海洋科学作为一门实验科学，其经典理论框架已趋于完善。当前学科的一个重要发展方向是追求更高分辨率的观测，旨在通过精细化的尺度研究来突破传统大尺度理论的瓶颈。”中国海洋大学物理海洋教育部重点实验室教授陈显尧介绍。

以预测厄尔尼诺-南方涛动（ENSO）现象为例，受系统混沌性和大气海洋耦合过程季节变化等因素影响，ENSO在春季的预测准确度明显低于其他季节，成为气候预测中的一大难点。2019年，科学家运用机器学习模型突破了这一难题，将可预测时间长度延长数月，并为解释其物理过程提供了新思路。

“AI并非拥有了超乎人类的知识，而是关注到了被人类研究者因先验知识和经验而忽视的物理过程。这些过程虽被观测记录，但传统上被视为‘噪音’而非关键因子。AI的无偏见学习揭示了这些次要因素在长期预测中的决定性作用。”陈显尧认为，AI的引入绝非简单的工具性应用，而是推动动力学理论与观测数据的有机融合。它突破人类思维的可能局限，帮助科学家发现新的科学联系，推动理论创新。

这一模式挑战了传统科学研究的“游戏规则”，在学界引发诸多争议。“经典科学范式是‘自上而下’的，数据驱动范式是‘自下而上’的。”受访者说，在经典科学范式概念下的科学发现，目标是“理解因果”优先，而AI4S的目标则是“实现预测”优先，两者标准存在根本性差异。

标准的调整引发科研体系形态变化——

科研基础设施上，AI4S的根基从传统的精密仪器，转向了以大型计算中心、专用算法库和高质量数据库为核心的新型基础设施。这源于其对海量数据和强大算力的根本依赖。

科研人才角色上，一些科学家的工作重心发生转变。过去科研中软件是被动工具，而生成式AI和强化学习模型，更像是能自主设计实验、提出假设的“能动伙伴”。科学家的核心任务从“如何操作”转变为“如何定义问题、评估结果和引导方向”，形成“人机混合智能”协同探索模式。

科研组织方式上，受上述变动影响，科研活动从传统PI制（课题组长负责制）的“小作坊”模式，向跨学科、平台化、网络化的大团队协作转型。

多位学者认为，AI4S不是对传统科研范式的替代，而是深度融合。中国工程院院士孙凝晖认为，AI4S的终极目标不是替代科学家，而是通过工具进化赋能人类认知进化，“正如望远镜扩展了人类的视野，显微镜打开了微观世界的大门，AI正在成为人类探索未知的‘第三只眼睛’”。

克服现实推进阻碍

中国科学院高能物理研究所研发的Dr.Sai多智能体协同系统，实现高能物理分析全流程自动化，并成功复现四夸克粒子发现过程；北京大学开发的DeepFlameRocket火箭燃烧智能仿真软件，实现对火箭发动机的全流程数值模拟……

如果将2024年称为AI4S的发展元年，2025年，AI4S从概念验证和工具普及进入深度融合和规模化应用的发展阶段，在基础设施构建、平台工具研发、交叉学科应用等方面取得进展。

受访者认为，当前，AI4S不再仅局限于个别案例，而是渗透影响到了各个基础学科和工业研发的毛细血管中，科学发现进入人机协同、加速创新时代。但作为新生事物，在现实推进过程中，仍面临几方面阻碍。

打通数据孤岛。高质量AI-Ready的科学数据稀缺是我国AI4S发展的核心挑战。据了解，AI-Ready数据集是指经过系统化处理、标注和结构化的数据集合，专为人工智能模型的训练和评估设计。这类数据集通常具备高质量、标准化格式和清晰的标注，能够显著降低数据预处理的门槛，帮助研究人员和开发者快速投入模型开发。

北京大学深圳研究生院副院长、科学智能学院执行院长田永鸿认为，海量、高质量的科学数据是AI4S发展的基础，但此类数据仍严重短缺。

一方面，高质量数据集的获取成本高昂。在生命科学领域，有业内人士统计，仅单一类别的蛋白质结构实验数据，采集成本就超过8万元，训练AI模型通常需要百万量级的样本，其成本远超普通科研团队承受范围。

另一方面，数据标注环节存在突出瓶颈。以冷冻电镜图像为例，其标注工作需依赖结构生物学家或电镜专家等专业人员，耗时较长。业内人士透露，国内某生物物理研究机构曾组织20名博士，全职工作6个月，才完成1万张图像标注。这种高度依赖专业人力的标注模式，在效率和规模上难以满足AI训练需求，成为制约AI科研应用的关键因素之一。

此外，AI4S领域数据共享存在制约。田永鸿介绍，科研活动长期以课题组或机构为单位开展，数据分散在不同实验室、机构、个人的电脑中，形成“数据孤岛”。数据所有权、知识产权以及科研竞争关系等因素，阻碍了科学数据的开放共享。

例如，生命健康领域的医疗数据因隐私保护限制，科研可用率较低；材料科学领域数据“碎片化和孤岛化”现象严重，数据规模小，共享机制不完善。

一位长期从事科学数据管理的专家表示：“数据质量直接决定AI模型的可靠性。如果没有足够多、足够好的数据，再先进的算法也是无源之水。”

人类验证能力成瓶颈。工业和信息化部原副部长王江平在相关论坛发言中表示，“AI一天的预测成果，人类需要十年验证”的现象在AI4S领域普遍存在，“AI科学发现能力指数级增长，人类的实验验证和产业化应用能力仍在线性爬坡，这种巨大的能力鸿沟导致海量AI预测成果如同洪水被堵，淤积在实验室无法转化为实际生产力。”

王江平分析，造成“堰塞湖”现象的主要原因一是标准缺失，AI预测结果缺乏统一评估体系；二是验证瓶颈，自动化实验能力不足，“预测—验证”链条不畅；三是政策约束，伦理审查严、审批周期长，加之投资风险高，抑制了企业投入意愿。

田永鸿认为，这一现象属于长期待解决的难题，有望通过AI计算设计实验方案，自动化平台执行并反馈结果，形成“设计—执行—验证”的循环，缩小科研与产业化的鸿沟。

复合型人才短缺。AI4S及更广泛的人工智能所需的复合型人才短缺，是当前我国科技产业发展面临的核心挑战之一。

金融机构高盛在《全球人工智能产业布局》报告中预测，到2030年，中国人工智能产业的人才缺口将超过500万；麦肯锡报告中提到的数字同样不容乐观：到2030年，中国的AI人才供应仅市场需求的1/3。

复合型人才缺口体现在数量上，也在质量上。田永鸿说，传统人工智能人才培养侧重于编程、数学和计算机基础，而科学智能要求学生不仅掌握AI技术，还须具备扎实的数理基础与特定学科知识，包括物理、化学、生物等，“这意味着学生需要同时理解科学问题的本质和AI的求解方法，是典型的多学科深度交叉领域”。这种人才标准的升级，加剧了复合型人才的紧缺状况。

构建科研新生态

AI4S带来的挑战，是“游戏规则”变换在撞击现有体系时产生的结构性张力。

应对这些挑战，有学者认为，需在现有科研组织方式上，构建面向人工智能时代的新型科研生态。这包括培养既懂AI又懂专业的复合型人才，推动数据开放共享以破解“数据孤岛”，并建立适应人机协同的科研评价与伦理治理体系。

构建复合型人才培养体系。转变传统的“专门人才”培养模式，积极构建面向AI4S的复合型人才培养体系。一方面重视培养具备深厚AI技术理论基础和实践应用能力的专业人才；另一方面完善交叉学科人才培养体系，促进科研人员跨学科学习。

北京大学深圳研究生院聚焦AI4S人才短板，设立科学智能学院，推行“双导师制”。

田永鸿介绍，“双导师制”是由一位科学导师与一位AI导师共同指导学生，科学导师负责把握重要科学问题方向，AI导师则设计技术路线。双导师从一开始即共担责任，解决合作意愿与知识产权分配问题。同时，学院设立专门的交叉学科学位评定分会，从制度上保障跨学科论文的评审质量，使学生归属清晰、评价有据。

“这一模式将交叉人才培养从过去的零散合作转变为系统化、制度化的体系，为复合型创新人才的成长提供了坚实基础。”田永鸿说。

陈显尧认为，人才培养的关键，在于引导学生从传统的理论思维范式，转向并掌握一种与AI相结合的思维方式，“我们正处在实践的初级阶段，有效的方法是让学生从解决具体科学问题入手，在实践中亲眼见证这种新方法的可行性，从而逐步建立新的科研思维路径。”

平台建设向平台模式转变。传统的个体科学家或单一研究团队开展科学研究的“作坊模式”已不能适应AI4S的研究方式，“平台模式”能够整合来自不同领域的多元主体，形成研究网络。培育AI4S创新联合体，促进数学、计算机科学、建模仿真与各学科的协作，是打造世界领先创新集群的关键。

国内高校和研究机构已布局多家AI4S研发平台。如，中国科学院建立ScienceOne基于科学基础大模型的智能科研平台；北京科学智能研究院研发的“玻尔科研空间站”AI科研平台集成“读文献—做计算—做实验—多学科协同”等功能等。

但AI4S领域的共性技术平台建设仍侧重于基础支撑层，成果仍以个别研发案例为主，缺少针对半导体、新能源、新材料等细分场景下单一类别的专业支撑平台。

对此，受访者建议，应面向重点应用领域，构建一批AI4S共性技术研发平台，依托云厂商，以及医药健康、新材料、工业等重点领域优势企业，协同高校院所、科研机构和创新企业组建各领域创新联合体，探索通过成立合资公司、共建干湿闭环实验室、搭建高能级创新平台等，加速科技工程创新突破。

推动科研数据共享。田永鸿认为，数据共享是释放AI4S潜力的基础，须加快打破“数据孤岛”，推动科研数据的有效整合与开放共享。

受访者建议，加速推进AI4S关键领域“科研数据可信空间”建设，促进医药健康、新材料、工业等领域的高质量科学数据和合成数据资源的集中，加强科学数据的标准化建设，创新数据资源共享的技术和制度，引导数据的可信流通和交易。

田永鸿建议加强数据、工具、人才、模型四要素的协同进化——数据需要标准化工具加工，通过人才训练模型，模型再反哺数据更新。“未来，我们希望能集研发数据采集、模型训练、科学发现与实验验证闭环融合，成为全流程智能化实验设施与设备，打造覆盖主要研究机构、科学设施和实验室的数智云化协同科学研究平台网，让科学家远程调用资源，最大化发挥数据价值。”田永鸿说。

推动科学伦理治理。在伦理治理方面，需要从科学共同体自治走向社会共治。AI4S带来算法不透明性、算法歧视、数据隐私问题以及结果的不可解释性等伦理挑战。需强化AI4S的科技伦理治理研究，加强科技伦理宣传与教育，建立健全AI4S的社会共治体系和机制。

受访者表示，当前阶段，AI的主要作用是加速科学发现，其优势是在现有范式下进行高效预测与计算。但真正颠覆性的科研突破，仍依赖人类独有的科学直觉、对复杂事实的深刻辨析，以及融入了情境与文化背景的宏观判断。

在积极利用AI提升知识积累效率的同时，我们需审慎思考，如何确保科学成果的质量与深度不被速度稀释，并将最终的解释权、决策权等“认知主动权”牢牢掌握在人类自己手中。■

数据 DeepSeek 陈显预测人工智能科学领域科研范式发展陈显尧田永鸿模型

上一篇：从“工具”到“体验”：企业AI落地的路径拐点

下一篇：OPPO A6l大屏AI手机官宣明日开售

瞭望 | AI4S重塑科研未来

相关内容

热门资讯