AIPress.com.cn报道
最近关于Claude Code和Codex谁更强的讨论,又热起来了。
这很像体育圈里的梅罗之争。
都是大公司的当家编程花旦,免不了总被拉出来比一比,每个支持者都有自己的理由。
Codex的粉丝说如果你现在还在虔诚地用Claude Code,并且坚信它绝对更强,那就去装个Codex,连续用一周再说。结果下面很快就有人更公正的发言:这事根本没有绝对答案,关键看你在做什么任务。
紧接着有双担网友出现,表示每天同时使用Codex和Claude Code,他认为:Codex更适合边界明确、问题范围清晰的任务,Claude Code更擅长那种需要跨文件理解、需要综合判断的活。
最后得出了答案:你连续用Codex一周,可能会被Codex说服;你连续用Claude Code一周,也可能被Claude Code说服。没有谁能无条件碾压谁。
但Claude Code的忠实用户可不这么想。
有人说自己已经把Claude调教到了一个非常高的稳定度,能自己迭代、测试、修复、重复、最后交付,甚至接近“100%可靠”。虽然有时候慢一点,但胜在稳定。在这种用户看来,Codex目前根本没法比。Anthropic的发布节奏比ChatGPT快十倍不是没有原因的,归根结底就是Anthropic在软件开发这个方向上,AI能力远超OpenAI。
也有人反过来举例,Codex的支持者说Claude Code修了4个小时都没搞定的bug,Codex一把就做掉了。这样的例子拿出来,当然足够让支持者更坚信自己那边才是“正统”。
俩家粉丝的争吵一直不休,引爆这次争论的是Codex昨天迎来的大更新。
Codex CLI 0.117.0这次带来了几个非常关键的新能力。
第一个是插件系统正式上线。可以把技能、MCP服务器、hooks和应用打包成一个插件来安装,也支持用户自己做插件。同时也可以自己做插件分享给别人。这等于给Codex开了一个“应用商店”。
第二是Agents v2,它引入了一套新的Agent之间双向通信机制。每个Agent都有自己的路径,比如/root/worker/tester,于是任何Agent都可以和别的Agent通信,消息里会带有发送者、接收者和内容,实现了真正意义上的双向通信。这意味着用户可以搭建一个由多个AI智能体组成的协作团队,各司其职还能互相沟通。
第三是App Server能力增强,现在可以发送shell命令、监听文件变化、连接远程WebSocket,还能直接调出提示历史。
这些东西单独看都不算惊艳发布,但未来的发展方向已经非常清楚:Codex正在从一个写代码的助手,往一个可编排、可联动、可扩展的Agent系统方向走。
而这次真正让Codex粉丝和不少开发者兴奋的,是Hooks终于来了。
这个功能之前Claude Code已经有了,而Codex一直没跟上,社区里呼声很高,现在终于补上了。
钩子这个东西,对于想把Codex当成真正的自动化工具来用的人来说,是个关键能力。
Hooks本质上就是一个可插入的扩展机制,可以让用户在Codex生命周期的不同环节插入自定义脚本。比如用户可以在会话开始时自动加载上下文,在用户发Prompt前检查敏感信息,在Bash命令执行前做规则校验,在执行后自动分析结果,在停止前强制再跑一轮测试。更进一步,它还可以把对话送到日志分析系统里、自动总结会话形成持久记忆、接入CI流程、在成功时自动部署、失败时自动通知。
以前很多AI编程助手,本质上还是“你问它答”的高级工具。哪怕它会写代码、会调试、会执行命令,最终仍然缺一层能把这些动作接进真实工程流程的机制。Hooks就是那块缺失的基础设施。它不一定最显眼,但一旦有了,Codex就开始更像一个真正能在工作流里跑的Agent,而不只是一个代码聊天框。
目前这套Hooks机制还在实验阶段,而且Windows支持暂时关闭。
Codex支持五种钩子事件。
SessionStart在会话启动或恢复时触发。
PreToolUse在工具调用之前触发,目前只支持拦截Bash命令,你可以用它来阻止危险操作,比如有人要执行rm -rf之类的命令。
PostToolUse在工具执行之后触发,虽然没法撤销已经执行的操作,但可以根据输出结果做后续处理。
UserPromptSubmit在用户提交提示词时触发,可以加额外的上下文信息或者直接拦截某些提示。
Stop在任务停止时触发,你可以让它自动判断是否需要继续执行,比如跑完测试发现还有失败的用例,就自动再来一轮。
钩子的配置文件放在~/.codex/hooks.json或者项目目录下的.codex/hooks.json里,Codex会自动发现并加载。每个钩子通过matcher字段来匹配触发条件,支持正则表达式。多个匹配的钩子会并发执行,互不影响。
听起来复杂,但它的意义其实很简单:从现在开始,可以让Codex在不同节点自动做更多事,而不需要靠一堆外部包装脚本来缝合。
这也是为什么有人会说,Hooks是Codex一直缺的“原语”。有了它,Codex和Claude Code之间的竞争就不再只是模型层面的能力比较,而开始比拼谁更像真正可编排的开发环境助手。
当然,面对Codex的大更新,社区里的Claude Code粉丝提到,Claude Code目前已经有24个hooks,而Codex新增之后还差19个才能在数量上追平。
虽然这个说法未必能完全代表能力差距,但至少说明一点:大家对AI编程工具的期待已经拉高。
所以回到最初那个问题:Claude Code还是Codex更强?
真正的答案可能没那么适合做情绪化站队。Claude Code现在依然被很多人认为在跨文件理解、长链路判断和复杂代码上下文里更稳。而Codex则在快速执行、明确任务、Agent编排和扩展能力上越来越有自己的味道。二者的竞争焦点,正在从“单次生成质量”慢慢转到“谁更适合真实开发过程”。
其实Codex和Claude Code的竞争对开发者来说是好事。Codex在补齐钩子、插件这些基础设施层面的短板,Claude Code在跨文件理解和复杂任务处理上持续保持优势。两边都在快速迭代,功能差距在不断缩小。
所以呢,也别再让工具饭圈化了,今天你家哥哥代码写得好,明天我家姐姐Bug修得快。建议两边粉丝握手言和,毕竟到最后,帮你写代码的AI换了一个又一个,加班的还是自己啊。
上一篇:建发合诚:3月23日召开业绩说明会,中信建投、开源证券参与
下一篇:没有了