曝光最强超算架构、开源自动驾驶模型,黄仁勋亮出物理AI“全家桶”
创始人
2026-01-07 09:46:24
0

文 | 赛博汽车

2026CES的聚光灯下,黄仁勋没有仅仅谈论芯片的算力,而是描绘了一个即将被智能体深度融入的现实世界。

AI的第二个拐点已经到来——从理解语言到理解物理世界,从软件智能体到具身智能体”。

当地时间15日,英伟达CEO黄仁勋身穿标志性皮衣登台,围绕“物理AI”展开了一场90分钟的主题演讲。

英伟达CEO黄仁勋

他指出,物理AI不仅涵盖视觉与语言理解,更融合重力、摩擦、惯性等物理动态,能够在真实世界中执行复杂任务,未来将重塑全球1000万家工厂与20万个仓库的运作模式。

这一愿景背后,依托三大技术支撑:Newton物理引擎,实时计算物理世界模型,响应时间低于0.01秒,适用于机器人及自动驾驶场景;Cosmos基础模型平台,支持多模态物理世界理解,已训练1000亿参数,推理延迟降至1毫秒;GPU+LPU混合算力架构,GPU负责训练,LPU专注低延迟推理,效率提升100倍,成本降低90%

黄仁勋强调:AI的价值不再仅由算力决定,而由场景定义。物理世界正是AI最大的应用场景。”为此,英伟达将持续提供算力基石,并在自动驾驶、机器人等领域推动开源产品落地。

黄仁勋指出,“开放模型已触及前沿,虽然仍稳固地落后前沿模型六个月,但每隔六个月,一个新的模型就会出现。英伟达不仅开源模型,还将开源训练数据,让开发者真正理解模型的构建过程。”

01 Rubin架构正式登场,下半年量产

任何技术革命都离不开底层算力的支撑。我们必须每年推动计算技术向前进步,一刻也不能延迟。发布会上,黄仁勋正式发布了英伟达下一代AI数据中心机柜架构——Vera Rubin

该架构命名致敬天文学家Vera Rubin她在暗物质研究领域取得了突破性进展,其研究成果彻底改变了人类对宇宙的认知。

而这,也是每一代英伟达GPU架构的命名习惯。

黄仁勋此次披露了Rubin架构的更多细节:它由六类芯片构成,包括Vera CPURubin GPUNVLink 6交换机、ConnectX-9 SuperNICBlueField-4数据处理单元和Spectrum-6以太网交换机,共同组成Vera Rubin NVL72机架。

作为首款定制CPU+GPU协同设计的产品,采用台积电2nm工艺,集成了Rubin GPU与专为智能体推理打造的Vera CPU,算力实现显著跃升

Rubin架构包含3360亿个晶体管,NVFP4 数据类型下,Rubin GPU推理性能达50 PFLOPS,是Blackwell GB2005倍;NVFP4训练性能高达35 PFLOPS,是Blackwell 3.5倍。

为满足庞大的计算资源需求,每款Rubin GPU都配备了8 HBM4 显存堆栈,提供288GB 的容量和22 TB/s 的带宽。

与此同时,随着大型语言模型从激活所有参数以生成给定输出词元的密集架构,转向每个词元仅激活部分可用参数的专家混合(MoE)架构,这些模型的扩展效率得以相对提高。然而,模型内部专家之间的通信需要大量的节点间带宽。

为此,Vera Rubin数据中心架构引入了用于规模内扩展网络的NVLink 6,将单GPU的互连带宽提升至3.6 TB/s(双向)。每颗NVLink 6交换芯片提供28 TB/s的带宽,而每个Vera Rubin NVL72机架配备9颗这样的交换芯片,总规模内带宽达到260 TB/s

NVIDIAVera CPU集成了88个定制的Olympus Arm核心,采用“spatial multi-threading”(空间多线程)设计,最多可同时运行176个线程。用于将Vera CPURubin GPU进行一致性连接的NVLink C2C互连,其带宽提升了一倍,达到1.8 TB/s。每颗Vera CPU可寻址最多1.5 TBSOCAMM LPDDR5X内存,内存带宽最高可达1.2 TB/s

为了将Vera Rubin NVL72 机架扩展为每组包含八个机架的DGX SuperPod,英伟达推出了两款采用Spectrum-6 芯片的Spectrum-X 以太网交换机,每颗Spectrum-6 芯片可提供102.4 Tb/s 的带宽,Nvidia 将其应用于两款交换机中。

据黄仁勋介绍,每个Vera Rubin NVL72机架可提供3.6 exaFLOPSNVFP4推理性能2.5 exaFLOPSNVFP4训练性能连接至Vera CPU54 TBLPDDR5X内存以及20.7 TBHBM4内存,带宽达1.6 PB/s

Blackwell相比,Vera Rubin在训练MoE模型时所需的GPU数量仅为四分之一;在MoE推理场景下,其每token成本最高可降低10黄仁勋表示,Rubin能在相同机架空间内大幅提升训练速度,并输出更多token

他透露,Rubin系列芯片已经全面投产,并将于今年下半年推出,重要应用于物理AI训练、机器人模拟、自动驾驶仿真等领域,其订单规模已达3000亿美元,微软下一代Fairwater AI超级工厂、CoreWeave将成为首批应用者。

除了发布新产品,黄仁勋也公布了一些“老朋友”的进展:Blackwell Ultra量产加速,2026Q2全面供货,单机算力提升50%的同时功耗降低30%,适配机器人边缘计算场景。

02 自动驾驶机器人,构建开放技术栈

芯片是算力的基石,场景则是“物理AI”的价值所在。其中,自动驾驶是核心落地场景之一。

在黄仁勋看来,当前辅助驾驶系统在应对“长尾场景”时仍面临挑战。传统将感知与规划分离的辅助驾驶架构,在突发或异常情况下存在泛化与可解释性不足的问题。

为此,英伟达发布首个专为自动驾驶汽车设计的“推理”AIAlpamayo,这是一个新系列的开放模型、模拟工具和数据集,专为基于推理的驾驶系统而设计。该系列引入基于思维链的VLAVision-Language-Action)推理模型,用于对复杂驾驶场景进行逐步推演和逻辑表达,以提升决策透明度。

Alpamayo系列包括三部分:

一是Alpamayo1,一款约100亿参数规模的思维链推理模型,已在Hugging Face上开源,以使汽车能够理解周围环境并解释其行动,用于研究、模型蒸馏及开发辅助工具。

二是AlpaSim,一套完全开源的端到端辅助驾驶仿真框架,已在GitHub发布,支持在多种环境和边缘案例中进行闭环训练和评估。

三是物理AI开放数据集,包含超过1700小时的真实道路驾驶数据,覆盖不同区域和环境条件,并包含一定比例的复杂和罕见场景。

这些工具共同构成了一个自我强化的开发闭环,助力构建基于推理的自动驾驶技术栈。

不过,Alpamayo 模型并非直接在车端运行,而是作为大规模的“教师模型”。开发者可以对其进行微调和蒸馏,转化为各自完整自动驾驶技术栈的核心骨架。黄仁勋指出,Alpamayo系列为一个内聚的开放生态系统,任何汽车开发商或研究团队都可以在此基础上进行开发。

据黄仁勋透露,Alpamayo将率先搭载于2025款梅赛德斯-奔驰CLA车型,后续通过OTA升级逐步推送高速公路脱手驾驶、城市全场景自动驾驶、端到端自动泊车等功能,并逐步登陆美、欧、亚市场。Lucid、捷豹路虎、Uber DeepDrive等企业希望基于Alpamayo实现L4 级自动驾驶。

有意思的是,知名特斯拉投资者Sawyer Merritt分享了英伟达发布会视频和相关细节,指出Alpamayo将率先搭载梅赛德斯CLA。特斯拉CEO马斯克很快回复道:“这正是特斯拉正在做的。他们会发现,达到99%很容易,但解决分布的长尾问题超级难。”

此外,黄仁勋还指出,升级后的Drive Thor算力达到2000TOPS,已斩获15+车企订单,将于2027年量产。

“我们的愿景是,未来有一天,每一辆汽车、每一辆卡车都将实现自动驾驶。”黄仁勋指出,自动驾驶汽车的时代已经全面到来,自动驾驶汽车将成为“首个大规模的、面向主流市场”的物理AI应用场景。

除了自动驾驶以外,具身智能也是物理AI的一大应用市场。英伟达为机器人推出的“大脑”Cosmos也再度升级,它主要被用来生成符合现实世界物理规律的合成数据。

此次Cosmos主要升级了三部分。

Cosmos Transfer 2.5Cosmos Predict 2.5:开源、完全可定制的世界模型,为物理 AI 实现基于物理原理的合成数据生成与机器人策略评估的仿真支持。

Cosmos Reason 2:开源推理视觉语言模型(VLM),使智能机器能够像人类一样看见、理解物理世界并采取行动。

Isaac GR00T N1.6:专为人形机器人打造的开放式推理视觉语言行动(VLA)模型,可解锁全身控制能力,并借助Cosmos Reason 增强推理和上下文理解。

从重新定义算力极限的Rubin架构,到为自动驾驶注入思维链的Alpamayo,机器人“大脑”Cosmos升级,英伟达的战略图谱清晰显现:它正致力于成为智能体理解并行动于物理世界的“使能层”。

相关内容

百年守护 因AI而“声”动
2025年,故宫博物院迎来建院百年。 这一百年,是实物守护的百年—...
2026-01-08 08:17:11
八部门:建设高水平人工智能...
工信部等八部门印发《“人工智能+制造”专项行动实施意见》。其中提到...
2026-01-07 18:46:19
老黄解锁 Rubin,AI...
在 AI 需求带动本轮存储 “超级” 周期的情况下,存储行业在昨晚...
2026-01-07 18:18:18
AMD 推出锐龙 AI 嵌...
新闻亮点 全新 AMD 锐龙 AI 嵌入式 P100 和 X1...
2026-01-07 18:17:03
美国AI服务写字楼 中国A...
►文 观察者网 刘媛媛 1月2日,美国《纽约时报》发表报道《在中国...
2026-01-07 13:47:14
英伟达GeForce No...
IT之家援引博文介绍,Linux 用户此前如果想要运行 GeFor...
2026-01-07 11:16:38

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
原创 华... 想在竞争残酷的市场中发力,必须要带来一些激进的卖点,但是随着功能特性的提升,硬件也必须要进行给力才可...