奥特曼：ChatGPT不是AGI！OpenAI最强开源模型直击DeepSeek

新智元报道

编辑：桃子犀牛

【新智元导读】代码截图泄露，满血版o3、o4-mini锁定下周！更劲爆的是，一款据称是OpenAI的神秘模型一夜爆红，每日处理高达260亿token，是Claude用量4倍。奥特曼在TED放话：将推超强开源模型，直面DeepSeek挑战。

近了，近了！

全网多个流出的代码截图显示，满血版o3、o4-mini，以及o4-mini high，有极大概率在下周发布。

不仅如此，在OpenRouter平台上，一款神秘模型Optimus Alpha（ELO得分1387）直接霸榜，据称就是o4-mini。

另一款Quasar模型也杀入竞技场TOP 5，奥特曼对其亮眼的表现做出了回应

这款模型最大亮点在于，上下文长达100万token，一举超越了Claude 3.7 Sonnet。

更令人震惊的是，OpenRouter数据显示，Optimus Alpha才上线没几天一夜爆红，每日处理token数量高达260亿。

另一边，OpenAI正在为开源模型做准备，上周内部召开讨论会，邀请了AI社区大佬提建议。

在TED最新对谈中，奥特曼再次回应了DeepSeek，「我们正在开发一款强大且媲美顶尖LLM的开源模型」。

不论是o4系的发布，还是OpenAI开源模型登场，都足以让AI圈兴奋一段时间了。

o4系模型出世，直接霸榜？

大佬Matthew Berman从更多公开测试的蛛丝马迹中，发现了神秘模型Optimus Alpha的一些亮点。

卓越的多文件协同处理能力
出众的设计美学感知
对复杂系统的直觉式理解
闪电般的响应速度
自如切换抽象层级的能力

在Aider多语言编程方面，可与o3-mini-medium、Grok 3相媲美，拿下53%的分数。

创意写作v3基准上，它甚至击败了Gemini 2.5 Pro，ELO得分1320.8。另外，在SQL的生成上，平均得分为0.830，其中80%为满分。

可以明确的是，新模型专为编程和技术任务构建。在SQL查询生成、Web开发和系统设计方面的性能，均超过了任何公开可用的工具。

比如，在Roo Code社区中，Optimus Alpha使用量已是Claude模型的4倍，深受广大开发者欢迎。

在编码测试中，Matthew给出一个简单的指令——为我创建一个带有功能购物车的电子商务网站。

Optimus Alpha便智能地设计出完整的UI界面，还制作出了「抽屉式购物车」，要知道大多数AI都会失败。

再比如，一次性生成贪吃蛇游戏。

Optimus Alpha可以做到自定义渐变色用于贪吃蛇，深绿色的头部可便于视觉区分。

而且，简洁直观的操控界面，完整的游戏机制，都印证了其编码能力的强大。

最关键的是，代码生成速度令人惊叹，这体验就像随时召唤一位世界顶级工程师。

更强的o4系模型已预定，那么关于开源模型，OpenAI又有怎样的规划呢？

不如，一起看看TED大会上，奥特曼如何回应的AI开源竞赛，以及关于当前爆火GPT-4o生图、AI下一个突破、对就业创造力影响。

GPT-4o承包创意工作，人类怎么办？

周五，奥特曼现身温哥华TED大会现场，与TED负责人Chris Anderson进行了一场深入的对谈。

对谈一开始，Anderson用最近爆火的Sora生图功能生成了一张图片，图片中奥特曼正向他分享着惊人的信息。

Anderson表示这图画的还不错，至少是个B+。接着他又展示了一张图片，这次他让Sora描绘一下智能和意识的区别。

这张图真的让Anderson感到震惊了，因为这显然不只是图像的生成，它似乎理解了你想要什么。

对此奥特曼表示，这个图像生成的功能是GPT-4o的一部分，包含里面的所有智能。

「这也是为什么它能做出这些让人惊叹的事情。」

面对如此智能的AI，Anderson不禁问奥特曼，「我的未来该怎么办？」。

奥特曼说人们对此有两种看法。一种是「天啊，它把我做的事全干了，我该咋办？」。

而另一种是「每次技术革命都这样」，新的工具能提升人的能力，让人做的更多。

「所以适应起来应该不难。」

这时，Anderson突然冒出一句：「这会不会是个版权问题啊？」

观众哄堂大笑，现场还夹杂着掌声。看来大家都对这个问题很感兴趣。

奥特曼的回应是，如果艺术家愿意把自己的风格授权给别人用，那么可以为他们设计分成机制。

也就是说，未来不只是「版权」问题这么简单了，「风格」也将会成为重要的车资产。

不过，真正棘手的，在海量的AI作品面前，要怎么区分「灵感借鉴」和「抄袭模仿」呢？

OpenAI将推最强开源LLM

Anderson问奥特曼，DeepSeek的出现有没有让你有点慌？

奥特曼认为开源很重要。就在昨晚，他们还在开会讨论开源模型的参数和方向。

OpenAI正打算开源一款非常强大的模型，性能比现在所有的开源模型都要好。

奥特曼还强调了一下，虽然他们在开源方面行动的有点晚，但他们会做的很好。

虽然DeepSeek势头迅猛，但并没有影响ChatGPT的增长速度。

「我从来没见过任何一家公司有这种增长速度。ChatGPT的增长简直疯狂！」奥特曼表示。

根据上次公布的数据，OpenAI每周有5亿的活跃用户，而且还在飞速增长。

奥特曼还提到了新的「记忆」功能。模型会慢慢了解你，陪你走过人生的不同阶段。

他希望OpenAI能继续保持专注，做出这个领域里最顶尖的产品。

AI双突破，2年研究半天搞定

奥特曼预计AI将在两个方向上有重大的突破。

首先是在科学领域。

奥特曼说他相信科学发现是让人们生活越来越好的最重要推动力。有了新发现，我们就能用更少的资源做更多的事，把「可能」的边界往外推。

OpenAI最新的模型已经开始让科学家们兴奋了，他们的效率比以前高得多。

借助AI工具，很快会开始看到在对抗疾病方面的一些实质性进展。

至于物理学，奥特曼说可能需要更长时间，但很期待。

另一个重要方向是软件开发。

奥特曼说未来几个月，这个领域就会发生翻天覆地的变化。

他说一些工程师现在一个下午就能完成以前两年才能做完的工作！

对于外界的一些传闻，奥特曼说他们并没有偷偷藏着有意识的模型，以及能自我改进的模型。

奥特曼还对他们模型的安全性很有信心。

「有人会说各种事情，但现在全球大概有10%的人正在使用我们的系统，我们对自己的安全记录非常骄傲。」

他还透露，OpenAI已经准备好了一旦发现危险就迅速叫停的机制。

这就是一个不断试错的过程：把系统推向现实世界，在风险还相对可控的时候收集反馈，发现问题，然后解决。

ChatGPT不是AGI

奥特曼说ChatGPT还不能算是AGI，因为它还不能自己持续学习、提升。

它也没办法在自己不擅长的领域主动变强，自主地探索新科学、更新知识库。

甚至还不能像人类一样坐在电脑前完成各种知识型工作。

对于到底什么是AGI这个问题，奥特曼直接讲了个笑话：「你把10个OpenAI的研究员关一个屋子里，让他们定义AGI，估计能整出14个不同的答案。」

目前都没有个统一的说法。

所以比起「AGI啥时候来」，更重要的是认识到我们正处在AI能力指数级增长的曲线上。

你可以说「这是我眼中的AGI」，别人可以说「超级智能在那儿」，但不管咋样，我们都得面对这个超级厉害的系统带来的好处，同时想办法让它安全。

整场近一小时对谈中，奥特曼其他的一些精彩观点：

要盯紧AI智能体的安全问题。
奥特曼分享成为父亲对他个人产生了深远的影响，他否认了AI会对他的孩子未来构成风险，但也承认有更大的责任去塑造一个对孩子有积极影响的世界。
奥特曼还描述了一个未来，AI将比他的孩子更聪明，但他认为这是一个好事。持续的创新、丰富的资源和智能AI将会无缝融入日常生活，未来一代人将会觉得当前人们又辛苦又落后。

参考资料：

https://x.com/TheMattBerman/status/1910813233008509191

https://www.youtube.com/watch?v=5MWT_doo68k

https://x.com/FutureJurvetson/status/1910820537783423078