社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

奥特曼:ChatGPT不是AGI!OpenAI最强开源模型直击DeepSeek

新智元 • 6 天前 • 24 次点击  



  新智元报道  

编辑:桃子 犀牛
【新智元导读】代码截图泄露,满血版o3、o4-mini锁定下周!更劲爆的是,一款据称是OpenAI的神秘模型一夜爆红,每日处理高达260亿token,是Claude用量4倍。奥特曼在TED放话:将推超强开源模型,直面DeepSeek挑战。

近了,近了!

全网多个流出的代码截图显示,满血版o3、o4-mini,以及o4-mini high,有极大概率在下周发布。

不仅如此,在OpenRouter平台上,一款神秘模型Optimus Alpha(ELO得分1387)直接霸榜,据称就是o4-mini。

另一款Quasar模型也杀入竞技场TOP 5,奥特曼对其亮眼的表现做出了回应

这款模型最大亮点在于,上下文长达100万token,一举超越了Claude 3.7 Sonnet。

更令人震惊的是,OpenRouter数据显示,Optimus Alpha才上线没几天一夜爆红,每日处理token数量高达260亿。

另一边,OpenAI正在为开源模型做准备,上周内部召开讨论会,邀请了AI社区大佬提建议。

在TED最新对谈中,奥特曼再次回应了DeepSeek,「我们正在开发一款强大且媲美顶尖LLM的开源模型」。

不论是o4系的发布,还是OpenAI开源模型登场,都足以让AI圈兴奋一段时间了。


o4系模型出世,直接霸榜?


大佬Matthew Berman从更多公开测试的蛛丝马迹中,发现了神秘模型Optimus Alpha的一些亮点。

  • 卓越的多文件协同处理能力

  • 出众的设计美学感知

  • 对复杂系统的直觉式理解

  • 闪电般的响应速度

  • 自如切换抽象层级的能力

在Aider多语言编程方面,可与o3-mini-medium、Grok 3相媲美,拿下53%的分数。

创意写作v3基准上,它甚至击败了Gemini 2.5 Pro,ELO得分1320.8。另外,在SQL的生成上,平均得分为0.830,其中80%为满分。

可以明确的是,新模型专为编程和技术任务构建。在SQL查询生成、Web开发和系统设计方面的性能,均超过了任何公开可用的工具。

比如,在Roo Code社区中,Optimus Alpha使用量已是Claude模型的4倍,深受广大开发者欢迎。

在编码测试中,Matthew给出一个简单的指令——为我创建一个带有功能购物车的电子商务网站。

Optimus Alpha便智能地设计出完整的UI界面,还制作出了「抽屉式购物车」,要知道大多数AI都会失败。

再比如,一次性生成贪吃蛇游戏。

Optimus Alpha可以做到自定义渐变色用于贪吃蛇,深绿色的头部可便于视觉区分。

而且,简洁直观的操控界面,完整的游戏机制,都印证了其编码能力的强大。

最关键的是,代码生成速度令人惊叹,这体验就像随时召唤一位世界顶级工程师。

更强的o4系模型已预定,那么关于开源模型,OpenAI又有怎样的规划呢?

不如,一起看看TED大会上,奥特曼如何回应的AI开源竞赛,以及关于当前爆火GPT-4o生图、AI下一个突破、对就业创造力影响。


GPT-4o承包创意工作,人类怎么办?


周五,奥特曼现身温哥华TED大会现场,与TED负责人Chris Anderson进行了一场深入的对谈。

对谈一开始,Anderson用最近爆火的Sora生图功能生成了一张图片,图片中奥特曼正向他分享着惊人的信息。

Anderson表示这图画的还不错,至少是个B+。接着他又展示了一张图片,这次他让Sora描绘一下智能和意识的区别。

这张图真的让Anderson感到震惊了,因为这显然不只是图像的生成,它似乎理解了你想要什么。

对此奥特曼表示,这个图像生成的功能是GPT-4o的一部分,包含里面的所有智能。

「这也是为什么它能做出这些让人惊叹的事情。」

面对如此智能的AI,Anderson不禁问奥特曼,「我的未来该怎么办?」。

奥特曼说人们对此有两种看法。一种是「天啊,它把我做的事全干了,我该咋办?」。

而另一种是「每次技术革命都这样」,新的工具能提升人的能力,让人做的更多。

「所以适应起来应该不难。」

这时,Anderson突然冒出一句:「这会不会是个版权问题啊?」

观众哄堂大笑,现场还夹杂着掌声。看来大家都对这个问题很感兴趣。

奥特曼的回应是,如果艺术家愿意把自己的风格授权给别人用,那么可以为他们设计分成机制。

也就是说,未来不只是「版权」问题这么简单了,「风格」也将会成为重要的车资产。

不过,真正棘手的,在海量的AI作品面前,要怎么区分「灵感借鉴」和「抄袭模仿」呢?


OpenAI将推最强开源LLM


Anderson问奥特曼,DeepSeek的出现有没有让你有点慌?

奥特曼认为开源很重要。就在昨晚,他们还在开会讨论开源模型的参数和方向。

OpenAI正打算开源一款非常强大的模型,性能比现在所有的开源模型都要好。

奥特曼还强调了一下,虽然他们在开源方面行动的有点晚,但他们会做的很好。

虽然DeepSeek势头迅猛,但并没有影响ChatGPT的增长速度。

「我从来没见过任何一家公司有这种增长速度。ChatGPT的增长简直疯狂!」奥特曼表示。

根据上次公布的数据,OpenAI每周有5亿的活跃用户,而且还在飞速增长。

奥特曼还提到了新的「记忆」功能。模型会慢慢了解你,陪你走过人生的不同阶段。

他希望OpenAI能继续保持专注,做出这个领域里最顶尖的产品。


AI双突破,2年研究半天搞定


奥特曼预计AI将在两个方向上有重大的突破。

首先是在科学领域。

奥特曼说他相信科学发现是让人们生活越来越好的最重要推动力。有了新发现,我们就能用更少的资源做更多的事,把「可能」的边界往外推。

OpenAI最新的模型已经开始让科学家们兴奋了,他们的效率比以前高得多。

借助AI工具,很快会开始看到在对抗疾病方面的一些实质性进展。

至于物理学,奥特曼说可能需要更长时间,但很期待。

另一个重要方向是软件开发。

奥特曼说未来几个月,这个领域就会发生翻天覆地的变化。

他说一些工程师现在一个下午就能完成以前两年才能做完的工作!

对于外界的一些传闻,奥特曼说他们并没有偷偷藏着有意识的模型,以及能自我改进的模型。

奥特曼还对他们模型的安全性很有信心。

「有人会说各种事情,但现在全球大概有10%的人正在使用我们的系统,我们对自己的安全记录非常骄傲。」

他还透露,OpenAI已经准备好了一旦发现危险就迅速叫停的机制。

这就是一个不断试错的过程:把系统推向现实世界,在风险还相对可控的时候收集反馈,发现问题,然后解决。


ChatGPT不是AGI


奥特曼说ChatGPT还不能算是AGI,因为它还不能自己持续学习、提升。

它也没办法在自己不擅长的领域主动变强,自主地探索新科学、更新知识库。

甚至还不能像人类一样坐在电脑前完成各种知识型工作。

对于到底什么是AGI这个问题,奥特曼直接讲了个笑话:「你把10个OpenAI的研究员关一个屋子里,让他们定义AGI,估计能整出14个不同的答案。」

目前都没有个统一的说法。

所以比起「AGI啥时候来」,更重要的是认识到我们正处在AI能力指数级增长的曲线上。

你可以说「这是我眼中的AGI」,别人可以说「超级智能在那儿」,但不管咋样,我们都得面对这个超级厉害的系统带来的好处,同时想办法让它安全。

整场近一小时对谈中,奥特曼其他的一些精彩观点:

  • 要盯紧AI智能体的安全问题。

  • 奥特曼分享成为父亲对他个人产生了深远的影响,他否认了AI会对他的孩子未来构成风险,但也承认有更大的责任去塑造一个对孩子有积极影响的世界。

  • 奥特曼还描述了一个未来,AI将比他的孩子更聪明,但他认为这是一个好事。持续的创新、丰富的资源和智能AI将会无缝融入日常生活,未来一代人将会觉得当前人们又辛苦又落后。

参考资料:
https://x.com/TheMattBerman/status/1910813233008509191
https://www.youtube.com/watch?v=5MWT_doo68k
https://x.com/FutureJurvetson/status/1910820537783423078

图片


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181015
 
24 次点击