昇腾910系列芯片目前只是“能用”,尚未实现“好用”。软件生态是决定未来能否好用的关键,也是华为AI服务器芯片领域与英伟达进一步拉近差距的关键
文 |《财经》研究员 吴俊宇
编辑 | 谢丽容
能力可对标英伟达AI(人工智能)服务器芯片的国产选手目前极少,其中包括华为昇腾、百度昆仑芯、海光,以及摩尔线程等创业公司。目前,出货量最大国产AI芯片是华为昇腾。
美国商务部工业安全局2023年10月出台“出口管制规则”,美国向中国断供了英伟达的A100/A800、H100/H800等高性能AI芯片。英伟达仅被允许向中国市场出售“阉割版”的H20芯片。该芯片带宽、性能均有缩水,单卡理论性能仅为H100的20%左右。随后,华为的昇腾910系列成了极少数能规模替代英伟达国产AI芯片。
《财经》从多位供应链人士处了解到,按保守计算,2024年华为昇腾910系列芯片出货量约为30万枚。同期,中国市场英伟达H20系列芯片出货量约为70万枚。
2018年,华为为了应对美国未来可能步步紧逼的出口管制,开始发展鲲鹏CPU(中央处理器)服务器芯片、昇腾AI服务器芯片。2023年10月美国出台“出口管制规则”后,昇腾AI芯片因此出货量激增。
今年3月,华为副总裁、ICT产品组合管理与解决方案部总裁马海旭在华为中国合作伙伴大会2024公开演讲中提到,2023年“鲲鹏+昇腾”生态产值为300亿-400亿元。多位产业链人士对《财经》预估,2024年“鲲鹏+昇腾”生态产值将增至600亿-700亿元。这一数据未得到过华为方面的证实。
目前,昇腾910B是正在销售的主力芯片,昇腾910C是即将发售的新一代产品。昇腾910B理论性能与英伟达A100系列接近。但由于软件生态和应用适配尚不成熟,在部分企业的实际业务场景中,它无法释放全部性能。
AI服务器芯片设计和制造确实难,实现了这两步之后,要发挥芯片全部性能,更需要软件生态的支持——包括芯片的软件开发工具(如编译器、调试器和性能分析工具等),数量足够多的使用者和开发者。
10月25日,华为昇腾计算业务副总裁史沛在山东省昇腾人工智能产业峰会表示,为做大昇腾生态,华为推出了包括CANN计算架构等一系列开发工具。昇腾在2018年至今的6年内,发展了超过300万开发者。
昇腾的软件生态起步晚,目前和英伟达存在较大差距,但差距在缩小。
出货快速增长
2023年10月,美国出台“出口管制规则”后,行业共识是,华为昇腾芯片是极少数的可替代选项之一。其他的可选项还包括百度昆仑芯、海光、摩尔线程等,但这些厂商目前出货量有限。
华为没有正式公开过鲲鹏、昇腾相关业务的详细收入情况。不过,“鲲鹏+昇腾”的整体产值可以从营收数据上印证华为在追赶英伟达AI服务器芯片方面的情况。今年3月,华为中国合作伙伴大会2024上,马海旭在公开演讲中提到的一组数据是,2023年“鲲鹏+昇腾”生态的产值为300亿-400亿元。不过,他没有披露这组数据的明确统计口径和统计范围。
有多位产业链人士对《财经》表示,“鲲鹏+昇腾”生态指的是,鲲鹏系列CPU服务器、昇腾系列AI服务器的整机(含芯片、存储、机柜等周边配件)销售额。今年5月,曾有多位产业链人士对《财经》预估,2024年“鲲鹏+昇腾”生态产值将增至600亿-700亿元。这一数据未得到过华为方面的证实。
一枚昇腾910系列芯片的价格超过10万元。《财经》从多位供应链人士处了解到,按保守计算,2024年华为昇腾910系列芯片出货量约为30万枚。但华为通常不会直接向客户销售芯片,而是通过服务器厂商(华鲲振宇、神州鲲泰、湘江鲲鹏、清华同方等企业)销售搭载昇腾910系列芯片的AI服务器。
目前大型科技公司(如字节跳动、阿里、腾讯、百度、蚂蚁金服等)、电信运营商(如中国移动、中国电信、中国联通)、部分大型央国企以及地方城市均在大规模采购昇腾910服务器。(相关报道见《财经》3月15日)
中国移动、中国电信作为央国企,承担着国产智算采购的重要任务,因此这两家电信运营商也是昇腾服务器的重要买家。2024年中国移动公开发布的两个国产智算采购招标标案(《2024年至2025年新型智算中心采购》《2023年-2024年新型智算中心(试验网)采购(标包12)》)总金额为216亿元,采购了总计超过9200台昇腾AI服务器。一台AI服务器通常会搭载4卡-8卡。这意味着中国移动的昇腾AI芯片公开招标采购规模至少在3.6万卡-7.4万卡之间。
亟须解决软件生态薄弱问题
昇腾服务器销量快速增长,意味着软件生态适配问题被加速提上日程。
昇腾910系列芯片目前只是“能用”,尚未实现“好用”。有华为人士今年4月曾对《财经》表示,昇腾910系列芯片软件适配远未到理想状态。2023年英伟达被禁售后,昇腾虽然吃到了一波红利,但是软件生态薄弱问题很快暴露了。部分客户买到搭载昇腾910芯片的服务器后,并不能充分利用这些算力资源。
软件生态一直被认为是芯片的核心“护城河”。芯片的软件生态包括开发工具(如编译器、调试器和性能分析工具等)、足够的开发者和使用者。因为芯片的软件开发工具需要开发者长期反馈才能逐渐迭代改进。开发者越多,意味着软件开发工具的迭代速度越快。基于芯片开发出的应用稳定性等指标也会逐渐提升。芯片的算力性能在这过程中才能得到充分挖掘。
英伟达的AI芯片难以被替代的一个重要原因是,它拥有CUDA软件生态。这套生态发展至今已有18年历史。它能够为英伟达的AI芯片增加易用的编程接口,降低开发者使用学习和适配成本。
英伟达官网显示,截至2024年6月,英伟达生态在全球有2800万开发者。基于CUDA的开发工具,用户可以快速开发应用。大部分开发者也已经习惯了用CUDA开发跑在英伟达AI芯片上的应用。
不过,昇腾的软件生态在快速扩张。华为公开披露的数据显示,2022年6月,昇腾仅有200万开发者,到了2023年6月,昇腾拥有超过300万开发者。开发者迅速增加,意味着昇腾的软件开发工具会得到进一步完善,昇腾的芯片性能也能得到进一步挖掘。
昇腾社区公开信息显示,昇腾CANN计算架构是提升昇腾AI处理器计算效率的关键平台,其中包括一系列开发工具,让开发者快速开发基于昇腾的AI应用和业务。华为昇腾的CANN计算架构,正在中国市场尝试建立起“类CUDA”的生态。
短时间内“重起炉灶”,建立一套能够替代英伟达的软件生态并不容易。《财经》多方了解到,为加速完善软件生态,华为甚至为百度、腾讯、中国移动、中国电信等昇腾服务器采购方派出了驻厂工程师,专门解决昇腾的适配问题。华鲲振宇是昇腾服务器重要生产厂商。今年4月,华鲲振宇相关人士曾对《财经》提到,目前昇腾服务器生产厂商也有适配人员,负责解决这一问题。
为用好已购买的昇腾910系列芯片,一些科技企业也在主动进行适配。在山东省昇腾人工智能产业峰会上,一位百度飞桨生态负责人提到,华为与百度经历十个月,共同投入了数十人的工程师团队持续迭代适配。目前,百度的飞桨AI框架已经适配昇腾910,可以让跑在昇腾910的模型性能得到充分释放。
在一部分芯片技术人士看来,昇腾软件生态的完善是“双向”的。这不仅需要华为持续迭代开发工具,还需要其他大型科技公司主动适配自己的业务场景。这样才能让昇腾实现“能用”到“好用”的正向循环。
责编|王祎