OpenAI与Cerebras达成数十亿美元合作协议以扩展AI推理基础设施
创始人
2026-01-24 11:50:40
0

OpenAI已与AI芯片初创公司Cerebras Systems签署了一项价值数十亿美元的协议,购买其计算能力,以确保有足够的基础设施来应对激增的用户需求以及数据中心和网络资源面临的日益增长的压力。

根据协议,OpenAI将使用Cerebras设计的芯片来运行部分ChatGPT推理工作负载,承诺在三年内购买多达750兆瓦的计算能力。

这一举措反映了大规模AI服务对电力供应、网络和数据中心间连接造成的压力,OpenAI正在寻找比英伟达主导的GPU更快、更具成本效益的替代方案。

OpenAI高管警告称,公司正面临计算能力的限制,其工具现在每周被超过8亿人使用。这需要更多合作伙伴来扩展基础设施。

与Cerebras的合作是OpenAI多元化基础设施努力的一部分,包括与博通合作开发定制AI芯片以及计划部署AMD最新的加速器,旨在控制成本并减少对英伟达的依赖。

基础设施重构趋势

OpenAI对专用推理能力的大规模承诺显示了大型AI平台如何重新设计基础设施,以支持超越单一加速器模型的延迟敏感工作负载。

分析师预计,未来几年AI工作负载将变得更加多样化和要求更高,这将推动对针对推理性能调优的架构需求,并对数据中心网络造成额外压力。

Counterpoint Research研究副总裁Neil Shah表示:"这促使超大规模厂商对其计算系统进行多元化,将英伟达GPU用于通用AI工作负载,内部AI加速器用于高度优化的任务,而Cerebras等系统用于专门的低延迟工作负载。"

因此,在超大规模运营的AI平台正在推动基础设施提供商从单一的通用集群转向更加分层和异构的基础设施策略。

Cybermedia Research行业研究组副总裁Prabhu Ram表示:"OpenAI转向Cerebras推理能力反映了AI数据中心设计方式的更广泛转变。这一举措与其说是为了取代英伟达,不如说是为了在推理规模扩大时实现多元化。"

在这个层面上,基础设施开始类似于AI工厂,城市规模的电力传输、密集的东西向网络和低延迟互连比峰值FLOPS更重要,Ram补充道。

TechInsights半导体分析师Manish Rawat表示:"在这种规模下,传统的机架密度、冷却模型和分层网络变得不切实际。推理工作负载产生连续的、延迟敏感的流量,而不是间歇性的训练突发,这推动架构转向更扁平的网络拓扑、更高基数的交换和计算、内存和互连的更紧密集成。"

多元化带来的挑战与机遇

英伟达基于GPU的模型仍是行业标准,但随着AI集群规模扩大,特别是互连需求增加,它变得更加复杂且能效较低。

Ram表示:"Cerebras的晶圆级架构减少了多GPU结构固有的通信开销,在推理吞吐量和成本方面提供了潜在优势。"

然而,分析师警告称,多元化带来了自身的运营挑战。

Rawat说:"这种转变增加了运营复杂性。运行异构加速器需要管理多个软件堆栈、不同的故障模式以及跨数据中心的更复杂的容量编排。"

OpenAI面临着将高度变化的需求与专用计算能力的长期承诺相匹配的任务,同时确保工作负载能够实时动态路由到最高效的加速器。最小化编排和利用率方面的差距将是关键。

随着OpenAI将其基础设施分布在多个架构中,管理这些投资的生命周期是另一个担忧。Shah表示:"硅生命周期(18至24个月)与设施生命周期(15至20年)之间存在日益扩大的差距。考虑到芯片创新的步伐,超过100亿美元的专用硬件在数据中心甚至完全投入使用之前就可能在技术上过时,这是一个合理的风险。"

随着AI基础设施的扩展,电力、冷却和网络正成为主要限制因素。Ram补充道:"能够将计算架构与电网规模的电力和高效数据传输相结合的供应商将定义AI基础设施的下一阶段。"

Q&A

Q1:OpenAI为什么要与Cerebras合作?

A:OpenAI面临计算能力限制,其工具每周被超过8亿人使用,需要寻找比英伟达GPU更快、更具成本效益的替代方案。通过与Cerebras合作,OpenAI可以获得专门的低延迟推理能力,减少对单一供应商的依赖。

Q2:这次合作的规模有多大?

A:根据协议,OpenAI承诺在三年内从Cerebras购买多达750兆瓦的计算能力,这是一项价值数十亿美元的大规模合作。OpenAI将使用Cerebras的芯片来运行部分ChatGPT推理工作负载。

Q3:多元化基础设施会带来哪些挑战?

A:多元化增加了运营复杂性,需要管理多个软件堆栈、不同的故障模式以及更复杂的跨数据中心容量编排。此外,还面临硅生命周期与设施生命周期不匹配的风险,专用硬件可能在数据中心完全投用前就技术过时。

相关内容

OpenAI与Cerebr...
OpenAI已与AI芯片初创公司Cerebras Systems签...
2026-01-24 11:50:40
无畏契约闪退崩溃解决技巧及...
无畏契约是拳头游戏旗下颇具人气的战术射击类作品,凭借高操作门槛与强...
2026-01-24 11:17:39
中信证券:AI应用仍具备较...
钛媒体App 1月20日消息,中信证券研报表示,AI应用板块成为2...
2026-01-24 10:49:45
ChatGPT也开始内测广...
文 | 庄帅 手机屏幕的光映在脸上,一位美国网民随口问ChatG...
2026-01-24 10:17:39
eBay将向未经授权的AI...
IT之家 1 月 24 日消息,eBay 将从 2026 年 2 ...
2026-01-24 10:17:32
马斯克与微软、OpenAI...
来源:财联社 财联社1月16日讯(编辑 夏军雄)世界首富埃隆·马斯...
2026-01-24 09:48:57

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...