快报的内容
时间:2026年2月5日(周四)
地点:OpenAI官方发布(美国)
人物:OpenAI首席执行官Sam Altman在模型发布后几分钟内在X平台上发文表示:”我非常喜欢用这个模型来开发,它带来的进步感受,远远超过基准测试所显示的幅度。”
发生了什么事:OpenAI正式发布了GPT-5.3-Codex,称其为迄今为止能力最强的编程代理。此次发布的时间点被精准安排在竞争对手Anthropic推出其旗舰模型升级版Claude Opus 4.6的同一时刻,两大模型同步亮相被业内观察人士视为”AI编程大战”的第一枪。
技术亮点:
- 在Terminal-Bench 2.0测试中得分77.3%,较上一代GPT-5.2-Codex的64.0%提升13个百分点,大幅超越Anthropic Opus 4.6的65.4%
- 在SWE-Bench Pro真实世界软件工程评测中取得57%的成绩
- 在OSWorld可视化桌面环境测试中得分64%
- 完成同等任务所需token数量不到上一代的一半,单个token推理速度提升超过25%
里程碑意义:GPT-5.3-Codex是OpenAI首个在自身创建过程中发挥关键作用的模型。Codex团队使用其早期版本来调试自身的训练过程、管理部署基础设施,并诊断测试结果和评估情况,实现了”AI开发AI”的闭环。
能力扩展:OpenAI明确表示,Codex正从一个只能编写和审查代码的代理,进化为一个几乎可以完成开发者和专业人士在电脑上所做任何事情的代理。这一能力扩展涵盖了调试、部署、监控、撰写产品需求文档、编辑文案、开展用户研究、制作演示文稿,以及在电子表格应用中分析数据等。
安全特性:该模型是OpenAI首个在”准备度框架”下被归类为在网络安全相关任务上具备”高能力”的模型,同时也是首个被直接训练用于识别软件漏洞的模型。
可用性:GPT-5.3-Codex已立即向付费ChatGPT用户开放,覆盖所有Codex使用场景,包括桌面应用、命令行接口、IDE扩展和网页端,API接口预计随后推出。
快报总结
OpenAI GPT-5.3-Codex的发布不仅是技术上的重大突破,更是AI编程领域竞争格局的重要转折点。该模型在编程能力、执行效率和自我迭代方面都达到了新的高度,特别是其参与自身开发的能力,标志着AI发展进入了自我增强的新阶段。与Anthropic的同步发布凸显了企业级AI编程市场竞争的白热化,预示着未来软件开发模式将发生根本性变革。
内容参考来源
- AI编程大战打响!OpenAI推出GPT-5.3-Codex,与Anthropic同步发布新模型 – 华尔街见闻 https://wallstreetcn.com/articles/…
- OpenAI推出GPT-5.3-Codex – 证券时报网 https://www.stcn.com/article/…
- OpenAI最强AI智能体编程模型:GPT-5.3-Codex登场,基准测试全面霸榜 – 搜狐网 https://www.sohu.com/a/…
- 被对手怼暴后,OpenAI 发布最强代码模型 – 新浪网 https://k.sina.com.cn/article/…





没有回复内容