5月20日消息,据外媒HPCwire报道,英伟达(NVIDIA)近期正式将首款自研Vera CPU 送到了客户手中,Anthropic、OpenAI、xAI 与Oracle Cloud Infrastructure(OCI)已率先收到首批系统,标志着这款为代理AI 设计的处理器从发布已经走向了实际部署。英伟达大规模与高性能计算副总裁Ian Buck 亲自交付了设备,凸显公司正把AI 基础设施的竞争重心延伸到GPU之外的CPU 层级。
据了解,英伟达的这批Vera CPU 已于5月15日送达三家顶尖客户的AI实验室:Anthropic 位于旧金山SoMa 的办公室、OpenAI 的Mission Bay 总部,以及xAI 在帕罗奥图(Palo Alto)的据点。随后于5 月18 日送到位于圣塔克拉拉(Santa Clara)的Oracle AI Customer Excellence Center。
英伟达表示,Vera CPU是专为代理式AI 工作负载打造的新型CPU,因为这类模型不只是在“回答”,还要进一步执行工具呼叫、协调流程、撷取长上下文与处理即时工作,对CPU 的需求远高于传统推理场景。
英伟达此前已于3月的GTC大会上正式发布了Vera CPU,并将其视为下一个规模可达数十亿美元的业务。这次正式交付,也代表者英伟达Vera CPU开始进入生产环境。英伟达指出,Vera CPU 采用88颗英伟达自研Olympus 核心,具备1.2 TB/s 内存带宽,以及每核心性能提升约50%,目标是在高负载、平行且即时的工作中,提升整体AI 工厂效率与回应速度。
据介绍,Anthropic 由计算负责人James Bradbury 接收Vera CPU系统,并表示扩充算力是模型成长的重要加速器;OpenAI 则由负责计算基础设施的萨钦·卡蒂(Sachin Katti)接手,英伟达甚至在现场打开机壳展示内部结构。 xAI 方面,马斯克(Elon Musk)亲自听取说明并询问核心数、内存配置与散热设计,该公司正评估将Vera CPU用于强化学习与代理式模拟流程。
Oracle Cloud Infrastructure主管Karan Batta 表示,公司计划自今年起部署数十万颗英伟达 Vera CPU,因为代理式AI 需要在大规模下维持持续性能。
英伟达也指出,OCI 是首家在超大规模(hyperscale)规模部署Vera CPU的云端服务商,意味着企业客户可望取得更接近生产级的代理式AI 基础设施。
编辑:芯智讯-浪客剑
上一篇:2026 AI硬件元年|BLINBLIN F20:耳畔全能智能体,重新定义跨境效率
下一篇:没有了