OpenAI绕过英伟达,发布超高速AI编程模型
创始人
2026-02-13 20:48:32
0

周四,OpenAI发布了首个在非英伟达硬件上运行的生产级AI模型,在Cerebras芯片上部署了全新的GPT-5.3-Codex-Spark编程模型。该模型以每秒超过1000个Token的速度生成代码,据报告比其前代产品快约15倍。作为对比,Anthropic的Claude Opus 4.6在新的高价快速模式下,速度约为标准模式68.2 Token/秒的2.5倍,尽管它是比Spark更大更强的模型。

"Cerebras一直是我们出色的工程合作伙伴,我们很高兴能将快速推理添加为新的平台能力,"OpenAI计算部门负责人Sachin Katti在声明中表示。

Codex-Spark是一个研究预览版,面向ChatGPT Pro订阅用户(每月200美元)通过Codex应用、命令行界面和VS Code扩展提供。OpenAI正在向精选设计合作伙伴推出API访问。该模型配备128,000个Token的上下文窗口,发布时仅处理文本。

此次发布基于OpenAI本月早些时候推出的完整GPT-5.3-Codex模型。完整模型处理重量级智能体编程任务,而OpenAI将Spark调整为速度优先而非知识深度。OpenAI将其构建为纯文本模型,专门针对编程进行调优,而不是处理更大版本GPT-5.3所承担的通用任务。

在评估软件工程能力的两个基准SWE-Bench Pro和Terminal-Bench 2.0上,据OpenAI称,Spark的表现优于较老的GPT-5.1-Codex-mini,同时以更短时间完成任务。该公司未分享这些数据的独立验证。

据传闻,Codex的速度一直是痛点;当Ars在12月测试四个AI编程智能体构建扫雷游戏克隆时,Codex耗时约为Anthropic Claude Code的两倍才产生可用游戏。

编程智能体军备竞赛

从背景来看,GPT-5.3-Codex-Spark每秒1000个Token代表着比OpenAI通过自有基础设施提供的任何产品都有相当大的飞跃。根据Artificial Analysis的独立基准测试,OpenAI在英伟达硬件上最快的模型远低于这个标准:GPT-4o约为每秒147个Token,o3-mini约为167个,GPT-4o mini约为52个。

但按Cerebras标准,每秒1000个Token实际上是适中的。该公司在Llama 3.1 70B上测得每秒2100个Token,在OpenAI自己的开放权重gpt-oss-120B模型上报告每秒3000个Token,这表明Codex-Spark相对较低的速度反映了更大或更复杂模型的开销。

AI编程智能体度过了突破性的一年,OpenAI的Codex和Anthropic的Claude Code等工具在快速构建原型、界面和样板代码方面达到了新的实用水平。OpenAI、谷歌和Anthropic都在竞相推出更强大的编程智能体,延迟已成为决定胜负的关键;编程速度更快的模型让开发者迭代更快。

面对Anthropic的激烈竞争,OpenAI一直在快速迭代其Codex产品线,在CEO萨姆·阿尔特曼因谷歌的竞争压力发出内部"红色警报"备忘录后,于12月发布了GPT-5.2,然后在几天前推出了GPT-5.3-Codex。

摆脱英伟达依赖

Spark更深层的硬件故事可能比其基准分数更重要。该模型运行在Cerebras的Wafer Scale Engine 3上,这是一个餐盘大小的芯片,Cerebras至少从2022年起就围绕它建立业务。OpenAI和Cerebras在1月宣布合作伙伴关系,Codex-Spark是其首个产品成果。

过去一年,OpenAI一直在系统性地减少对英伟达的依赖。该公司在2025年10月与AMD签署了大规模多年协议,11月与亚马逊达成380亿美元云计算协议,并一直在设计最终由台积电制造的自定义AI芯片。

与此同时,与英伟达计划中的1000亿美元基础设施协议至今未果,尽管英伟达随后承诺200亿美元投资。路透社报告称,OpenAI对某些英伟达芯片在推理任务上的速度不满,而这正是OpenAI设计Codex-Spark要处理的工作负载类型。

无论底层使用哪种芯片,速度都很重要,尽管可能以准确性为代价。对于整天在代码编辑器中等待AI建议的开发者来说,每秒1000个Token可能不再像精心驾驶拼图锯,而更像运行开料锯。只是要小心你在切什么。

Q&A

Q1:GPT-5.3-Codex-Spark是什么?有什么特点?

A:GPT-5.3-Codex-Spark是OpenAI发布的专门用于编程的AI模型,运行在Cerebras芯片上。它最大的特点是生成代码速度极快,每秒超过1000个Token,比前代产品快约15倍。该模型专门针对编程任务调优,优先考虑速度而非知识深度。

Q2:Codex-Spark的速度相比其他AI编程工具如何?

A:Codex-Spark每秒1000个Token的速度远超OpenAI之前的模型,比如GPT-4o约为每秒147个Token。相比Anthropic的Claude Opus 4.6快速模式也有明显优势。不过按Cerebras芯片的标准这个速度还算适中,该公司在其他模型上曾测得更高速度。

Q3:为什么OpenAI要使用Cerebras芯片而不是英伟达?

A:OpenAI正在系统性地减少对英伟达的依赖。据报告,OpenAI对某些英伟达芯片在推理任务上的速度不满意。Cerebras的Wafer Scale Engine 3芯片在推理速度上表现更好,正好满足快速编程任务的需求,这也是OpenAI与Cerebras合作的重要原因。

相关内容

极光GPTBots.ai率...
当企业开始大规模应用AI,两个问题始终绕不开:它够可靠吗?用得起吗...
2026-02-13 21:50:32
苹果研究团队解析用户如何期...
苹果一项名为《计算机使用智能体用户体验设计空间映射》的研究显示,虽...
2026-02-13 20:49:18
OpenAI绕过英伟达,发...
周四,OpenAI发布了首个在非英伟达硬件上运行的生产级AI模型,...
2026-02-13 20:48:32
字节发布AI视频模型,影视...
截至2月13日13点30分,上证指数跌0.82%,深证成指跌0.7...
2026-02-13 17:19:25
开源鸿蒙PC办公神器!卓奕...
当开源鸿蒙正式进军PC领域,传统的安卓应用兼容方案难以满足PC端办...
2026-02-13 16:49:37
Soul开源实时数字人模型...
IT之家 2 月 13 日消息,社交平台 Soul 官方今天在公众...
2026-02-13 16:48:36

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...