“先导杯”上的三张面孔,照亮了国产AI生态的未来
创始人
2025-11-16 17:16:28
0

9月初的2025世界智能产业博览会期间,中科曙光协同AI芯片、AI整机、大模型等20多家产业链上下游企业,共同发布了国内首个AI计算开放架构,被外界解读为国产智算的“安卓模式”。

一个礼拜前的世界互联网大会乌镇峰会期间,中科曙光发布了采用AI计算开放架构的全球首个单机柜级640卡超节点scaleX640,标志着国产智算生态从架构层开放走向了工程级落地。

相比封闭生态,开放的产业生态系统更加复杂,需要更多的开发者参与其中,而人才一直是整个产业的短板。能否培养出产业需要的人才生力军,直接关系到国产AI生态的发展进程。

草蛇灰线,伏脉千里。

时间回到2020年,中科曙光联合国家先进计算产业创新中心和一众知名高校、企业、学术机构共同筹办了第一届先导杯。和常规赛事最大的不同,“以实践为导向”始终是先导杯的鲜明标签,紧跟前沿创新和产业痛点,在高校和产业间搭建了一座桥梁。

刚刚结束的第六届先导杯上,来自三个参与者的故事,终于让外界读懂了中科曙光多年的坚持:并非是一个割裂的赛事,正在用“教学训赛”的综合培养模式,为中国AI产业培养后备力量。

01 “我们要解决人才的断层”

山东科技大学的王威,目前在计算机科学与工程学院参与相关领域的研究工作。在此之前,他拥有国家超算中心多年的工作经历。

横跨产业界和学术界的“两栖”经历,让他对中国AI和高性能计算领域的人才现状,有一种旁人难及的清醒认知。“最大的难点之一,就是人才培养和产业需求之间,存在一个断层。

王威在采访中多次提及“人才断层”,人工智能和高性能计算日新月异,而多数高校的教学内容还停留在课本上面,与产业界的真实场景严重脱节。结果就是,产业界迫切需要能“直接能够在国产平台上深度参与项目”的人才,高校毕业生却需要“一个很长的学习周期”才能真正上手。

作为第六届“先导杯”ONNX Runtime算子优化赛题的出题人,王威瞄准了“脱节的断层”。

在赛题设计上,王威坦言:不是一道“练习题”,而是产业界公认的一个“硬骨头”。要求参赛学生基于海光DCU和ONNX Runtime推理框架,在确保输出精度满足误差标准的前提下,针对Attention、BatchNormalization、Conv、LeakyReLU、GroupNormalization核心算子进行性能优化。

背后有着双重考量。

第一是考验学生们的“复合能力”。绝不是简单的编程任务,直接把负载均衡、显存压力、通信瓶颈等技术壁垒抛给了学生。

参赛学生不能再像过去那样只停留在书本概念上,必须打通一条完整的技术链路:首先要把“计算机体系结构中所学的核心知识”真正用上;其次要具备在国产软硬件生态上调试的“工程能力”;最后还要在高强度的试错和优化中,磨炼出解决复杂问题的系统思维。

第二是关乎未来的“职业启蒙”。在“自主可控”的战略下,发展国产AI生态已是必然,但生态的繁荣,归根结底靠的是“人”。

作为高性能计算领域的研究者,王威深知底层优化工作的“枯燥”,“可能三年才能入门,五年才刚刚有感觉。”把真实的产业难题交给学生,希望他们从过去“站在教科书外看概念”,变成“直接调试产业难题的人”,认识到国产AI生态的瓶颈和机会,进而“主动去探索”“深入去学习”。

让王威印象深刻的是,“有时候凌晨一两点,学生们还在问问题”,“去年参加先导杯的本科生,比赛结束后毅然选择攻读高性能计算方向的研究生”,“不少学生参加比赛后,找到了努力的方向”……

在国内的高校中,像王威这样的“布道者”还有很多,他们用源自内心深处的热爱,在学生们心中埋下了投身国产AI生态的种子。当越来越多的种子生根、发芽、开花、结果,曾经制约产业繁荣的人才断层,将被一批批具备工程实操力、系统思维的新生力量“填平”。

02 “打了场从零开始的硬仗”

山西大学的大二学生王嘉宇,是王威老师特别提到的一位选手。在第六届“先导杯”的决赛入围名单中,对比诸多名校的硕士乃至博士团队,刚读大二的王嘉宇无疑是个特例。

因为底层系统人才缺口较大,且存在人才培养标准不一、教育资源分布不均等问题,先导杯在2024年首次面向本科生开放报名,并创新引入了区域赛模式,面向西北、东北等地区开赛。

来自中西部高校的王嘉宇团队,没有被“相对有限的技术资源”束缚,用实打实的成绩证明了先导杯推动教育公平、赋能多元人才的价值。

大多数同学跟着学校课程按部就班时,王嘉宇就主动报名参加了学校的“超算队”。虽然日常训练使用的是学校所能提供的早期算力资源(例如英伟达V100),正是这份来之不易的机会,为王嘉宇打开了迈向超算世界的第一扇门,锻造了在比赛中面对全新平台时的适应力和冲刺力。

王威老师设计的ONNX Runtime算子优化赛题,对王嘉宇团队来说,不亚于是一场从零开始的“硬仗”。

“尽管中科曙光提供的文档和接口兼容性很高,迁移过程并没有想象中艰难,在比赛开始时还是走了一些弯路。由于硬件差异,需要针对海光DCU做更精细的调整,结合算子原理和硬件参数综合优化,导致早期的性能表现不太理想。”

初期的不顺利,并没有吓退王嘉宇团队。

他们花了很长时间学习中科曙光提供的培训课程,在线上积极和其他同学沟通,在技术社区内找资料,遇到不懂的问题就向出题老师请教,乃至整个国庆假期都在实验室“刷性能”。最终找到了算子性能优化的正确路径:“我们发现性能瓶颈更多来自访存而非计算,重新定义了warp大小,并尝试使用warp shuffle优化attention中的归约性能……”

整个采访过程中,王嘉宇每每提到第一次把attention、卷积跑通的细节,言辞中都难掩心中的兴奋劲儿。在他看来,比赛的意义不在名次,在于一次次“啃硬骨头”的过程,一点点去推敲每个性能指标背后的逻辑,看到性能指标不断被刷新,有一种“升级打怪”的快感。

也让我们见证了这支年轻团队强大的自驱力:没有因“平台不熟悉”止步,而是将挑战视为学习的机会,并在比赛过程中形成了问题建模、性能分析、参数迭代、算子验证的工程能力。

王嘉宇团队的故事不会是个例,折射出的是国产AI生态加速成熟的缩影:当先导杯为中西部高校学生搭建起通向前沿技术的舞台,他们能够近距离接触国产智算平台和产业真实问题,在真实的工程环境中验证理论、打磨能力,会有更多潜藏的年轻力量被看见。

03 “国产生态需要我们参与”

如果说王嘉宇是凭借兴趣和自驱力扎进来的“初生牛犊”,国防科技大学的研二学生朱天赐,则是一个“身在局中”的“准工程师”。国防科大的熏陶、“天河超算”的骄傲,在他心中种下了“使命导向”的担当。

早在本科阶段,朱天赐就做过一款手语识别应用,在比赛中拿到了不错的名次,限于算力和数据集的瓶颈,最终没有实现推广应用。那段经历让他意识到:没有智能算力的土壤,应用将无法真正扎根。

不同于王嘉宇从零开始的启蒙,朱天赐作为队长参加了GMRES和ONNX两道赛题的角逐,想要深入了解国产AI生态的真实痛点。

“之前在学校课程学的是碎片化的知识,知道什么是体系结构、并行计算、内存带宽等概念,就像是零件盒里的螺丝、齿轮、弹簧,并没有组装成能够运行的机械。通过先导杯的比赛,第一次把碎片化的知识,变成了解决实际问题的系统化能力。

朱天赐遇到的第一个难题是优化“矩阵向量乘”算子,一个看似基础但极度考验体系结构理解的任务。

由于“矩阵向量乘”算子的性能瓶颈在于访存,海光DCU的Wavefront是64线程,和英伟达的32线程不同,意味着以前的优化习惯、经验参数不再适用,需要重新思考数据如何分块、访存如何对齐、调度如何设计。

为了解决这些问题,朱天赐和队友们一遍遍跑实验、画访存路径、调tile size、做规约策略对比。有时候性能曲线不达标,就从硬件特性倒推数学计算、从数学表达式反推访存行为、从访存行为再反推并行策略……“纯理论不会直接带来性能提升,真正能提升性能的,是把理论转换成工程路径的能力”。

“硬核”的比赛过程,让朱天赐对国产AI生态有了更深刻的认知:国产算力平台的性能成熟度超出了预期,而且上手门槛比较低,但体系还不够完善,仍需更多开发者参与和打磨。

亲自上阵填补“缺口”经历,悄然影响了朱天赐的“自我定位”:以前,他更多站在知识体系的外环,作为旁观者学习别人怎么做;现在,意识到自己正处在国产AI生态的前线,是需要主动“补位”的那群人。

谈到毕业后的职业规划时,朱天赐坚定表示:将从事算子优化、编译优化等方面的工作,为国产AI生态的繁荣添一块砖。

04 写在最后

过去十年,中国的AI生态解决了“有没有”的问题。未来十年,问题将变成——“谁来用、谁会用”。算力、架构、模型都可以通过技术迭代逐步补齐,唯有人才,是决定生态上限的“不可替代变量”。

先导杯的价值,在于把产业最真实的需求、最难啃的技术点、最具挑战性的任务,提前放到了年轻人面前,让他们在最初的职业启蒙阶段就认识到:国产AI生态不是某一家厂商、某一所高校的战役,而是一场面向未来的长期工程,需要更多“敢打硬仗”的建设者加入。

有理由相信,最终改变国产AI生态曲线的,不是某一代架构、某一次发布会,而是被点燃的年轻力量。

相关内容

“先导杯”上的三张面孔,照...
9月初的2025世界智能产业博览会期间,中科曙光协同AI芯片、AI...
2025-11-16 17:16:28
智能重塑影像生态聚合未来 ...
【环球网科技综合报道】11月15日,2025人工智能+大会分论坛—...
2025-11-16 16:17:19
数读中国|AI“正忙” 跃...
央广网北京11月16日消息(记者郑少纯 尚天宇 冯丽)在广东,人形...
2025-11-16 08:45:58
韩国AI发展可向中国借力
吕本富 在全球人工智能领域,韩国正加紧追赶中美的发展步伐。今年8月...
2025-11-15 12:45:42
“AI赋能,智汇孝感—全国...
11月14日下午,“AI赋能,智汇孝感——全国科算智药创新创业大赛...
2025-11-15 12:17:00
吕本富:韩国AI发展可向中...
在全球人工智能领域,韩国正加紧追赶中美的发展步伐。今年8月,韩国政...
2025-11-15 07:16:02

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...