2025年7月18日,在2025年RISC-V中国峰会第二日的“高性能计算分论坛”上,中国移动云能力中心芯片技术总监刘亚南从产业政策、RISC-V的优势、RISC-V产业的现状和挑战等方面入手,分享了其对于当前RISC-V如何在数据中心领域落地等问题进行了探讨。
△中国移动云能力中心芯片技术总监刘亚南
政策引领,中国RISC-V产业加速发展
在国家级的产业政策方面,由于美西方的高端芯片对华封锁、国内高端芯片发展受到压制,使得国家鼓励在芯片卡脖子领域进行科技创新,建设国产芯片生态体系;在地方政府层面,也从传统的淡单纯资金补贴转向了产业链、创新链、资金链、人才链”系统化布局;在企业层面,中国移动集团也在持续深化科技创新战略布局,发挥央企引领作用,带动芯片产业链上下游联合创新。
刘亚南进一步指出,今年4月,还有传闻称工信部牵头八部委发了一个鼓励在在全国推广RISC-V的文件。中国移动董事长杨杰也在各种场合表示要支持做软硬件的融合创新。当然我们中国移动做科技创新,更多是通过产业链协同来引领和协助大家做芯片和软硬件结合的创新。在地方层面,主要是北京和上海比较积极,比如北京有开芯院,上海有开放处理器产业创新中心。
打破X86、Arm垄断,RISC-V性价比优势明显
从产业分析来看,目前服务器中芯片成本占比过半,且被国外芯片龙头企业垄断。IDC的数据显示,目前基础型服务器当中,CPU、GPU芯片成本占比约30%;高性能服务器当中,CPU、GPU芯片成本占比高达50%-83%。在这当中,英特尔和AMD的x86 CPU在全球服务器市场占比约86%、英伟达凭借CUDA生态壁垒,其GPU在全球服务器市场占比超90%。
此外,从云厂商的角度来看,通用芯片已经越来越难以满足需求。而定制或自研芯片,能大幅提升性价比、提高能效比、构建差异化竞争力。
据刘亚南介绍,定制的Intel 8378C相较非定制的8358P,性能可以提升个位数百分比,成本则可以降低两位数百分比;如果用基于Arm架构的中兴珠峰处理器,相比定制的Intel 8378C,整机性能可以提升两位数百分比,价格也可以降低两位数百分比,性价比提升明显;如果采用RISC-V架构的服务器处理器,相比中兴珠峰,还能够带来两位数百分比的成本降低。
目前亚马逊、谷歌、阿里巴巴、华为、百度、腾讯、微软等众多的云巨头都有在定制/自研芯片,并进行规模部署,以实现深度降本,实现差异化竞争。“云计算已经进入淘汰赛,定制与自研芯片,将成为核心竞争力。”刘亚南说道。
那么,中国移动为什么要选择RISC-V呢?众所周知,X86是封闭架构,由英特尔和AMD主导,其指令集是“黑盒”;Arm架构则是由Arm公司主导,属于封闭指令集+单一授权微架构,仅对少数厂商开放Armv8指令集授权,且费用较高,后续指令集升级需要重新授权;RISC-V刚好是相反的,指令集完全开放,微架构竞争充分。
刘亚南指出,RISC-V的优势可以总结为三个“开放”,即开放指令集、开放赛道和开放生态。RISC-V契合了未来的发展趋势,可以打造从架构到算法的闭环路径。选择RISC-V,则意味着能够立足自主、拥抱开放、加速协同创新,未来有望实现国产处理器从“可用”、“好用”,再到“引领”的跃升。
谈及目前的国产服务器CPU厂商,目前主要有6家,包括C86架构的海光信息和兆芯、Arm架构的华为和飞腾、自研架构的龙芯和申威。刘亚南透露:“这6大企业当中,可能又一家要转向RISC-V。当时这家企业的大佬还说‘你们这帮做RISC-V的是乌合之众’,但是现在情况完全不同了,因为六大家都通过了国测。我特别想看做RISC-V那一家能否先通过国测,因为这是对央企的部署,特别是信创领域,是非常重要的风向标。”
进军高性能计算市场,RISC-V短板正快速补齐
虽然目前RISC-V还存在着性能有待提升,软件生态不成熟的弊端,但是在众多头部厂商的纷纷押注和引领之下,人才纷纷涌入,叠加RISC-V的ISA没有历史包袱,这也使得RISC-V CPU性能正在逐渐接近主流的X86、Arm CPU的性能,生态也加速进化,这两方面的短板正快速补齐。
比如,以SiFive、Ventenna、Tenstorrent为代表的国际RISCV厂商,主要在高性能、Chiplet、RISC-V DataFlow方向布局;而国内以开芯院、知合计算、进选时控等为代表国产RISC-V,则主要在产业生态、高性能、IOMMU虚拟化等方向发力。
刘亚南指出,处理器的单核心Specint 2006得分达到15分/GHz,是数据中心CPU主流门槛,RISC-V需突破门槛,并持续提升、性能需要对标主流的数据中心CPU才有机会。
由于目前光罩尺寸已经达到了极限,通过提高芯片面积来提升性能已经受到了限制,叠加先进制程工艺发展也已大幅放缓,Chiplet已成为大芯片的必选项,因此代工与先进封装协同尤为重要。这也为RISC-V架构处理器在性能上追赶主流架构提供了机会。
目前不少的国产RISC-V CPU已经突破了Specint 2006得分达到15分/GHz这个门槛,比如阿里达摩院的玄铁C930已经达到了15.2分/GHz,开芯院“香山”开源RISC-V处理器内核“昆明湖V2”也达到了15分/GHz,配合编译器优化还能提升到18.5分/GHz。这也意味着国产RISC-V CPU已经有了与主流x86、Arm CPU直接竞争的机会。
“除了需要在性能上实现对标主流主数据中心CPU之外,RISC-V也需要找准落地场景。目前通算集群承载用户业务,迁移到RISC-V需要过程,而存储与智算偏后端集群,RISC- V有望率先突破。”刘亚南解释称:“其实数据中心也是分化的,内部的集群也是分前端集群和后端集群,前端是通算的,而智算和存储是后端集群。特别是智算集群比较特殊,因为它跑的主要是PyTorch、TensorFlow、算子库,运行时还要集合通信,它承载的用户软件种类不如通算,而且可以结合RISC-V做更多的创新。”
AI软件栈是最大痛点,RISC-V可凝聚同识
从市场端来看,IDC的数据显示,2027年中国智算云、一体机及端侧芯片市场的规模分别为126亿元、468亿元、283亿元。对此,刘亚南认为,RISC-V CPU可以先尝试进入一体机市场,同时进入AIPC等端侧市场,但是未来智算云市场将会成为竞争新焦点,而普惠和性价比将成为RISC-V突破的优势。
而从智算芯片的架构来看,目前主要有:主流的通用的GPU/GPGPU架构;主打能效核定制化的DSA(domain specific architecture,领域专用架构),包括NPU(比如华为昇腾、寒武纪)、PE级别数据流(Tenstorrent)、FU级数据流(比如,谷歌TPU)、专用ASIC,但是这类芯片编程难度高、兼容性差,软件成为最大的痛点。
刘亚南解释称,AI软件栈和CPU软件栈是完全不一样的,AI软件栈厚重混乱,且被CUDA深度绑定,并且仍在不断进行渗透。而CPU软件栈简单统一,通过ISA实现软硬解耦。当前AI栈的问题是烟囱式重复、云化困难,芯片厂商演进负担重。包括GPU和DSA芯片厂商,它们都需要独立构建对接主流框架与模型的AI软件栈,AI软件栈和上层框架对接,和DL编译器、算子库对接的都要做一遍,运行的驱动均需要自己开发和维护,整体来说,投入巨大、演进也比较困难。
比如,摩尔线程的团队差不多有1000人,其中有六七百人是做软件的。同样,为什么英伟达说自己是一家软件公司?因为,从人员配比来说,它就是一家软件公司。而且这种人力开销是重复性投入,大家的底层都是比较相似的,都需要自己做一遍。
相比之下,如果基于开放的RISC-V来做AI软件栈,那么它可以最大化复用,芯片厂商可以轻装上阵,能够聚焦创新,加速演进。“那么RISC-V的AI指令集层面有没有优势?我认为没有优势。RISC-V的优势是什么?我认为它最大的优势是可以凝聚同识,用RISC-V做CPU也是一样的,它最大的优势就是凝聚共识,底层重复性的东西可以通用。此外,在开放的RISC-V生态和标准指令集下,软硬件可以实现解耦,芯片厂商可以发挥指令集与架构可定制的优势,聚焦创新。”刘亚南说道。
RISC-V面临的挑战
从RISC-V的AI路线来看,目前主要有两大方向:RISC-V CPU+AI(IME/AME/AI加速器),做矩阵扩展,CPU依然是占据更多的芯片面积;AI+RISC-V,TPU/GPU内部集成RISC-V。刘亚南认为,随着RISC-V的持续发展,未来最终可能会走向RISC-V=AI的一个融合状态。
对于RISC-V芯片往大算力方面发展所面临的挑战,刘亚南认为,供应链国产化将成为短期内最大的瓶颈与短板。比如在高端工艺方面,国产先进工艺良率不高、产能不足、配套也不成熟;国产先进工艺落地少、 IP与PDK优化不足;内存带宽(先进的HBM)不足,制约CPU智算扩展与GPU国产化。我们需要抓住国产化机遇,通过架构创新、2.5D、 3D先进封装与异构集成,开辟算力提升新路径。
“虽然国产RISC-V芯片公司会面临盈利的挑战,我们公司也有要实现自己的KPI的挑战,但总体来说前途是光明的,一定会胜利。过个过程不会是一蹴而就的,特别是在数据中心领域,这个周期可能会比较长。”刘亚南展望道。
编辑:芯智讯-浪客剑