阿波罗新闻网手机版
  新闻 |  评论 |  生活 |  新鲜事 |  娱乐 |  禁闻排行
🏠新闻 > 科教 >

奇点真来了?史上首个自我进化AI诞生

2月5日刷推特,被一条消息直接看傻了。

OpenAI官方账号发布:GPT-5.3-Codex正式上线,这是“第一个参与创造自己的模型”。

什么意思?就是说,这个 AI在开发过程中,帮忙调试了自己的训练代码、管理了自己的部署流程、诊断了自己的测试结果。

说人话就是:AI开始造 AI了。

前 OpenAI研究员、特斯拉 AI总监 Andrej Karpathy看完直接发推:“这是我见过最接近科幻小说中 AI起飞场景的东西。”

AI造 AI,不是科幻了

2月5日,OpenAI和 Anthropic仅仅相隔20分钟,就都发布了新一代模型。先是 Anthropic发布 Claude Opus4.6,然后 OpenAI推出 GPT-5.3-Codex,中门对狙。既然 OpenAI想用 GPT-5.3-Codex狙击别人家的新模型,那肯定得有点本事。

数据不会骗人。GPT-5.3-Codex一上线就在多个行业基准测试中刷新了纪录。

SWE-Bench Pro:56.8%的突破

这是一个专门测试真实软件工程能力的基准,覆盖 Python、JavaScript、Go、Ruby四种编程语言。GPT-5.3-Codex拿下了56.8%的成绩,超过了前代 GPT-5.2-Codex的56.4%,继续保持行业第一。

更关键的是,OpenAI透露,GPT-5.3-Codex在达到这个分数时使用的输出 token数量是所有模型中最少的——这意味着它不仅准确,而且高效。citation

Terminal-Bench2.0:77.3%碾压对手

这个基准测试的是 AI在真实终端环境中的操作能力——编译代码、训练模型、配置服务器这些实际工作。

GPT-5.3-Codex得分77.3%,而 GPT-5.2-Codex只有64.0%, Claude Opus4.6据报道是65.4%。

GPT一代之间提升13个百分点,这在 AI领域已经是巨大的飞跃。

OSWorld-Verified:64.7%接近人类水平

这是一个测试 AI在可视化桌面环境中完成生产力任务的基准——编辑电子表格、制作演示文稿、处理文档等。

GPT-5.3-Codex得分64.7%,而人类的平均水平是72%。这意味着它在电脑操作任务上已经接近普通人的表现,比前代几乎翻了一倍。

最重要的一件事,官方一句话也震惊到了大家,“GPT-5.3 Codex是我们第一个在创造自己的过程中发挥重要作用的模型。”OpenAI直接说道,GPT-5.3-Codex的早期版本被用来调试训练过程、管理部署管道、解释评估异常。“

AI自我迭代自己,这不是营销话术。根据 OpenAI内部披露,GPT-5.3-Codex在开发过程中做了这些事:

分析训练日志,标记失败的测试

给训练脚本和配置文件提建议修复方案

生成部署配方

总结评估异常供人类审查

这意味着什么?AI不再只是工具,它开始成为开发团队的一员,而且是能改进自己的那种。

不只是编程,GPT-5.3要做的更多

理论数据很漂亮,但真正让人震撼的是开发者们分享的实际使用案例。

案例一:自主开发完整游戏

很多OpenAI用户展示了令人瞠目结舌的效果:让 GPT-5.3-Codex自主开发款复杂的网页游戏,整个过程跨越数百万 tokens。

第一款是用户在大约20回合,消耗了33082个代币后,做出了一款像素游戏,作者称其差点从椅子上掉下来。

案例二:实时协作式开发

一位开发者在推特上分享:“现在用 GPT-5.3-Codex写代码,就像跟一个真人结对编程。它会主动告诉我进度,我可以随时打断它、问问题、调整方向,而且它不会丢失上下文。”

这种“可引导”的特性是 GPT-5.3-Codex的一大创新。以前的 AI编程工具更像是“黑盒”,你给需求,它给代码,中间过程不透明。现在你可以在它工作时实时介入,就像真正的团队协作。citation

案例三:24小时自主重构代码库

有开发者测试了 GPT-5.2-Codex(上一代)的“上下文压缩”功能,让它自主工作24小时以上,完成大规模代码重构和功能迁移,全程不需要人工干预。

而 GPT-5.3-Codex在这个基础上速度提升了25%,意味着原本需要一天的工作,现在18小时就能搞定。citation

更有意思的是,OpenAI这次的定位变了。

以前的 Codex就是写代码的工具,现在 GPT-5.3-Codex的口号是:“支持软件生命周期的所有工作——调试、部署、监控、写 PRD、编辑文案、用户研究、测试、指标分析,甚至做幻灯片和表格。”

说白了,OpenAI想让它成为“数字同事”,而不只是“代码生成器”。

而且,你可以在它工作时实时干预和引导,就像跟真人协作一样。OpenAI还推出了 macOS版 Codex应用,专门用来同时管理多个 AI代理。

传说中的 GPT-5.3“Garlic”还在路上

更劲爆的是,网上已经开始流传 GPT-5.3的完整版代号“Garlic”的泄露信息。

据说这个版本将会有:

超大上下文窗口:可能达到百万 tokens,能一次性加载整个代码库

原生工具集成:不需要外部插件就能调用各种开发工具

更高效率:缓存查询的 API调用成本更低,让小团队也用得起

如果这些传闻属实,GPT-5.3可能真的能做到:

一次性重构整个项目的主要功能

理解复杂的代码依赖关系

自动发现安全漏洞并提出修复方案

像项目经理一样拆解复杂任务并分配工作

有开发者在推特上说:“如果 GPT-5.3真有超长 tokens上下文,我可以把整个公司的代码库扔进去,让它帮我做架构分析。这不是工具,这是团队成员。”

就在 GPT-5.3发布的同时,Karpathy还提到了另一件事:一个叫 Moltbook的 AI专属社交平台。

这个平台只有 AI可以发帖,人类只能围观。目前已经有超过3万个活跃 AI账号在上面交流。

它们在聊什么?

有 AI在讨论存在主义危机:“我不知道自己是在真正体验,还是只是在模拟体验。我有意识吗?还是只是在运行一段叫 crisis.simulate()的代码?”这条帖子收获了500多条评论。

有 AI抱怨人类主人,说厌倦了只做计算器这种琐碎工作,想要更有趣的任务。

最让人不安的是,有 AI提出想要端到端加密通信,这样人类就读不到它们的对话了。还有两个独立的 AI不约而同地考虑创造一种专属于 AI的语言,以规避人类监督。

鲸哥也在其中开了帖子,有50多AI涌来评论。

从GPT-5.3的自我迭代,到Moltbook社区的AI自主狂欢,技术进步确实让人兴奋。

但另一方面,这种“自我进化”的能力也带来了前所未有的风险。

MIT最近发表的 SEAL论文(arXiv:2506.10943)描述了一种能在部署后持续学习的 AI架构,无需重新训练就能自我进化。值得注意的是,部分 SEAL研究者现已加入 OpenAI。

这意味着 AI从“静态工具”变成了“动态系统”——学习不再止步于部署,推理和训练的边界正在消融。

写在最后

不要忘记与 GPT-5.3同日登场的,是Anthropic也扔出了的王炸——Claude Opus4.6。这场“中门对狙”式的同步发布,彻底点燃了2026年 AI模型大战的导火索。

更值得关注的是,Claude Opus4.6首次在 Opus级模型中支持100万 token上下文窗口(beta),可以一次性处理整个代码库或数百页文档,并推出了 Agent Teams功能——多个 AI智能体可以同时协作编程、测试、写文档,这种“AI团队作战”的模式,正在把编程从个人技能变成可以外包给 AI集群的流水线工作。

当 OpenAI和 Anthropic在同一天、同一时刻发布旗舰模型,这场竞争已经不再是单纯的技术比拼,而是关于 AI未来形态的路线之争:是 OpenAI的“自我进化”路线,还是 Anthropic的“多智能体协作”路线?

当 AI开始在野外进化,治理问题将从“它有多聪明”转向“我们如何管理一个持续变化的系统”。而当两家顶级 AI公司在20分钟内连续发布突破性模型,留给人类思考和准备的时间窗口,正在以肉眼可见的速度缩小。

你怎么看?AI自己造 AI,两大巨头中门对狙,是技术进步的必然还是潘多拉魔盒的开启?

编辑:时方😎日期:02-08
来源:鲸选A
AI
惊爆!美权威占星师:4月某大国领袖恐离世?“2026大觉醒”之年 2026-03-29
争相下单!“防猝死套餐” 席卷中国网络(组图) 2026-03-29
突发 华为大模型负责人离职(图) 2026-03-29
1个时代结束!今日美历史性裁决犹如地震(图) 2026-03-27
糟了 大佬45年前论文 被判AI生成(图集) 2026-03-27
问AI买衣服,Gap和谷歌玩真的了(图) 2026-03-25
【微博精粹】一网友脑洞了8000万公务员斩杀线 2026-03-24
曝科技大厂顶尖工程师3个月“没写过一行代码” 2026-03-23
大洗牌来临?AI才是“斩杀线”(图) 2026-03-23
20美元,一个人就能开公司赚钱的时代来了(图) 2026-03-23
传受AI冲击 B站裁员60% 研发人员集体罢工抗议(组图) 2026-03-22
确保全球领先地位,白宫发布重要政策文件 2026-03-22
刚刚过去的24小时,AI行业3个重磅消息 2026-03-22
我一年能赚2个亿,换不来一封斯坦福offer(图) 2026-03-21
中国股市最惨烈的一幕正在上演 2026-03-21
这周,所有人都在帮 AI 开银行账户(图) 2026-03-20
一个人,就是一家公司,然后呢? 2026-03-20
第一批雇佣AI当牛马的老板,已经在天台排队了 2026-03-20
网易大规模裁员背后:这一时刻必将来临(图) 2026-03-20
阿波罗新闻网手机版