北京时间11月7日凌晨2点,OpenAI在美国旧金山举行首场开发者大会。在会上,该公司将GPT大模型更新到GPT-4 Turbo版本,并进一步完善大模型开发的业务架构,包括推出吸引软件开发者的“商店”产品、推出版权盾、提供API开发助手等。
有软件开发者表示,他们看到了“iPhone时刻”,AI工程师的规模料将急速增长。
OpenAI也建立起更完善的业务架构,新推出的“GPT商店”令人想到苹果公司在2008年推出的“应用商店”。这个“商店”还将提供API助手,模式和苹果公司十分相似,或也将吸引更多开发者围绕GPT模型开发应用。
这意味着,AI创业公司又是一夜无眠,苹果也要睡不着了
【导读】OpenAI的首届开发者大会正式召开,Altman在现场发布了强大的GPT-4 Turbo,用户可以创作自己的GPT帮自己挣钱!还有更多炸裂的新功能,我们一起来看看吧。
今天,万众期待的OpenAI第一届开发者大会终于来了!
OpenAI的CEO Altman在分享了GPT-4的数十项新增功能和改进,并降低了平台许多服务的定价:
新的GPT-4 Turbo模型,功能更强大、更便宜并支持128K上下文窗口。
最为关键的是,发布了GPTs功能,能让每个用户自己制作自己「定制化的ChatGPT」,还能通过即将发布的「GPT Store」来让自己定制的GPT为自己挣钱!
而且,OpenAI还发布了新的「助手API」,使开发人员能够更轻松地构建自己的辅助AI应用,并可以调用模型和工具。
平台还继续更新了新的多模态功能,包括视觉、图像(DALL·E 3)和文本转语音。
一上来,Altman先秀了一下GPT过去获得的成绩,包括高达1亿的周活跃用户,以及吸引了200万开发者根据API进行开发。紧接着Altman推出了GPT-4的升级版——GPT-4 Turbo,新的GPT-4 Turbo 模型功能更强大、更便宜并支持高达128K的上下文窗口。上下文窗口对比前代提升了16倍,而128K相当于整整300页书!新的API赋予了开发者更多的自由度,包括引入了JSON:通过函数调用,开发者可以向模型描述应用或外部API的函数,并让模型智能地选择输出包含参数的JSON对象来调用这些函数。
包括能够在一条消息中调用多个函数:用户可以发送一条消息请求多个操作,例如「打开车窗并关闭空调」,这在以前需要与模型进行多次往返。GPT-4 Turbo提高了函数调用的准确性,而且在需要仔细遵循指令的任务上比以前的模型表现更好。新的模型自然也包括了更新的训练数据,GPT-4 Turbo的知识库更新到了今年4月份,相比于前代提升了一年半,不会再像以前的chatGPT一样,对2022年非常敏感并拒绝回答。接下来展示的是GPT-4 Turbo在多模态方面的新能力。GPT-4 Turbo可以接受图像作为聊天完成API中的输入,从而实现生成字幕、详细分析真实世界图像和阅读带有数字的文档等用例。例如,BeMyEyes使用这项技术来帮助盲人或视力低下的人完成日常任务,例如识别产品或浏览商店。开发人员可以通过在API中使用gpt-4-vision-preview来访问此功能。OpenAI计划为主要的GPT-4 Turbo模型推出视觉支持,作为其稳定版本的一部分。而定价取决于输入图像大小。例如,将1080×1080像素的图像传递给GPT-4 Turbo的成本为0.00765美元。开发人员可以集成DALL·E 3,通过Images API将DALL·E 3指定为模型,直接将其导入到应用和产品中。Snap、可口可乐和Shutterstock等公司都使用了DALL·E 3以编程方式为其客户和活动生成图像和设计。与之前版本的DALL·E相比,新的API包含内置审核功能,可帮助开发人员保护其应用程序免遭滥用。OpenAI提供不同的格式和质量选项,每张生成的图像起价为0.04美元。另外,开发人员可以通过文本转语音API从文本生成人类质量的语音。Altman也在现场展示了一段API生成的非常自然且优美的声音。新的文本转语音API提供六种预设声音可供选择,同时推出了针对实时用例,以及针对质量进行了优化的版本。在语音识别方面,现场发布了开源的Whisper large-v3,提高了跨语言的性能。OpenAI将在之后的API中支持Whisper v3。OpenAI为GPT-4微调创建了一个实验性访问程序。与GPT-3.5相比,GPT-4微调需要更多的工作才能实现对基本模型的有意义的改进。Altman表示将允许开发者对16K版本的GPT-3.5进行微调。而对于有更高需求的组织,OpenAI还推出了一个定制模型计划,让选定的组织有机会与专门的OpenAI研究人员团队合作,针对他们的特定领域训练定制GPT-4。包括修改模型训练过程的每个步骤,从执行额外的特定领域预训练,到运行为特定领域量身定制的自定义后训练过程。组织将拥有对其自定义模型的独占访问权限。根据OpenAI现有的企业隐私政策,自定义模型不会提供给其他客户或与其他客户共享,也不会用于训练其他模型。此外,提供给OpenAI用于训练自定义模型的专有数据不会在任何其他上下文中重复使用。为了帮助用户扩展应用程序,OpenAI将所有付费GPT-4客户的每分钟token数量限制增加了一倍。OpenAI通过系统中内置的版权保护措施来保护客户——Copyright Shield。当用户面临有关版权侵权的法律索赔时,OpenAI可以介入并保护客户,并支付由此产生的费用。GPT-4 Turbo的输入比GPT-4便宜3倍,为0.01美元,输出便宜2倍,为0.03美元。GPT-3.5 Turbo输入比之前的16K型号便宜3倍,为0.001美元,输出便宜2倍,为0.002美元。而微调后的GPT-3.5 Turbo 4K模型输入便宜4倍,为0.003美元,输出便宜2.7倍,为0.006美元。微调还支持16K上下文,价格与4K版本相同。——大大降低了开发者的成本,以至于Altman在现场表示「团队为此付出了很大的努力」。除了GPT-4 Turbo,OpenAI还发布了新版本的GPT-3.5 Turbo,默认支持 16K上下文窗口。新的GPT-3.5 Turbo支持改进的指令跟踪、JSON模式和并行函数调用。开发人员可以通过在API中调用gpt-3.5-turbo-1106来访问此新模型。另外,稍稍令人惊讶的是,发布会现场还邀请了微软的CEO纳德拉,现场表现出其乐融融的合作关系。纳德拉表示将继续增进基础设施方面的支持,通过GitHub Copilot等产品赋能开发者,并高度重视安全性问题。发布会之所以叫「OpenAI开发者大会」,最核心的原因就是他们发布的GPTs。通俗来说,GPTs就是OpenAI自己做了一个专门给ChatGPT套壳的工具,让所有人都能用这个套壳工具,「开发」自己专属的「套壳ChatGPT」。然后月底,OpenAI就会上线自己的「APP Store」——「GPT Store」,给所有「套壳GPTs」提供一个展示并且将能力变现的平台。当OpenAI自己给ChatGPT套壳,就没有那些套壳GPT什么事情了。按照OpenAI自己在发布会上的演示,GPTs有两个官方的「钦定」发展方向:1. 让用户通过GPTs创建一个背后由GPT-4加持的智能体生态。2. 让即使「完全没有代码能力」的用户,也可以做出「定制版的GPT」。我们具体来看看OpenAI是如何展示这两个产品方向的。OpenAI Agent
大概在4个月前,OpenAI的元老成员,Andrej Karpathy曾经做过一个小范围的线下演讲,引起了不小的轰动。他鼓励更多的开发者和AI研究人员去做「智能体」相关的事情,认为AI智能体在未来会有很大的机会。4个月后,OpenAI的工作人员走上第一届OpenAI开发者大会,介绍了ChatGPT在智能体方向上的应用实例。
她首先演示了,通过GPTs,自己如何把自己手机上的日程表和自动化平台Zapier链接的起来。然后这个工作人员的GPT,此时就成为了一个简易的智能体,首先识别出了日程中可能出现冲突的地方。接着,工作人员决定现在要和Sam Altman请个假,去做日程上安排的事情了。她就和自己的GPT说,帮我给Sam说一下我得走了。GPT就自动地帮她通过手机给Sam发了条信息说,她必须要出门一趟。Sam瞬间就收到了这条信息。这是第一次,OpenAI官方发布了一个自己的智能体解决方案!可能多年之后,当人们的生活,已经在AI和智能体的加持之下,发生了翻天覆地的变化。这个发布会上的场景会像我们现在不断翻看乔帮主发布iPhone的视频片段一样,反复被人提及吧。根据OpenAI官方的说法,就像之前的插件功能一样,用户可以将自己的GPT集成到外部数据或与现实世界完成交互。例如,可以把GPT集成到自己的旅行列表数据库、连接自己的电子邮件收件箱或电子商务订单中,从而在自己的生活中发挥更大的作用。开启OpenAI的「APP Store」时代
而实现这一切功能的基础,就是一个人人可以定制化,几乎没有任何门槛的GPT开发平台。按照OpenAI的说法,不需要代码能力,每个人都能通过自然语言和GPT交互,用自己的想法和数据定制一个自己专属的GPT。然后Sam Altman在发布会上就花了3分钟,自己演示了一下制作自己的「创业导师GPT」全流程。Altman说,当年他还在Y Combinator做CEO的时候,他就特别想拥有一个自己的对外聊天机器人,帮助自己回答不同创业者提出的重复性问题。首先,他先用自然语言告诉GPT Builder自己想建立一个专门帮助创业者的聊天机器人。GPT Builder就自动生成了类似于之前「定制化指令」一样的文档,帮助这个GPT定了一个「创业导师」的人设。然后Sam Altman向GPT上传了一份自己做Y Combinator CEO时期的演讲稿,包括了大量自己和创业者沟通的文字记录。然后简单修改了一下GPT Builder生成的,建议用户提出的创业问题,再生成了一个产品图标,他的这个「创业导师GPT」就完成了。在右边的预览屏幕中,「Sam Altman定制版创业导师」就可以开始对外营业,回答创业提出的具体问题了。Altman自己提了一个问题:「初创公司初期在招人的时候,需要看重哪3个品质?」看了看回答之后,他满意地说,「不错,这些回答都是我自己在各种场合反复强调过的话。」Altman接着说,每个用户创造出来的GPT,可以只对自己可见,完成自己的认为,也可以在OpenAI的平台上对外发布。而且企业还可以定制化完全本地的GPT来满足自己业务的具体需求!而对于那些用户喜欢并且愿意付费购买的GPT,OpenAI会和它们的作者共享收益,共建生态。而对于专业开发者来说,ChatGPT API功能也迎来了巨大的更新。OpenAI想要通过这个「助手API」(Assistant API)构建一个「API Agent」,来帮专业的开发者们更加高效地使用ChatGPT的API。这个「助手API」最核心的功能就是,能够调用模型和工具来执行「代码解释器」,「检索」,以及「函数调用」的功能。这样就能将开发人员从以前繁琐的开发过程中进一步解放出来,把精力专注于构建AI应用的核心部分。而且助手API能够支持无限长的线程,开发人员从此可以将线程状态管理移交给OpenAI,从而完全不受上下文窗口大小的约束。发布会现场,OpenAI就演示了如何构建助手的过程,自然语言+简单勾选几个选项,就能完成。而应用程序马上就能调用这个创建好的API,瞬间得到10个巴黎旅游景点的地图标记。而让更多开发者惊喜得合不拢嘴的是,所有的API价格都下降了至少1/3,而且不再根据上下文窗口长度区分费率。https://openai.com/blog/new-models-and-developer-products-announced-at-devday
ChatGPT王炸升级!
更强版GPT-4上线,API定价打骨折,
发布现场掌声没停过
内容来源:量子位( 公众号 QbitAI) 梦晨 明敏 发自 凹非寺
OpenAI在首届开发者日上,正式公布自定义GPT。CEO山姆·奥特曼现场登台演示,3分钟不到,只凭几步操作做好一个“创业导师GPT”。接下来,“创业导师GPT”就可以根据奥特曼本人过去的演讲内容,回答创业相关问题。刚刚出炉的新GPT,可以在公司内部共享或对所有人公开。从此,“GPT开发者”像“iOS开发者”一样成为了新的职业,让AI替你赚钱的梦想成真了。新版本GPT-4 Turbo,支持128k上下文,知识截止更新到2023年4月,视觉能力、DALL·E3,文字转语音TTS等等全都对API开放……
这边发布会进行着,ChatGPT网页版同步更新,最新知识截止现场就实装了。对这次发布的种种,OpenAI创始成员Andrej Karpathy总结到“在计算中看到了一个新的抽象层”。将会有更多的开发者和更多的GPT。GPT可以读、写、听、说、看、画、思考,使用现有计算作为工具,成为重点领域的专家,参考自定义数据,在数字世界中采取行动,以自定义方式说话或行动,以及共同协作。系好安全带。
每个人都能定制GPT
它让过去一段时间里大家想象的GPT帮你做一切,成为现实。无需编程,每个人通过对话聊天的方式,即可构建一个专属技能的GPT。而且每个人能同时拥有多个专长GPT,可以是你自己创建的,也能从GPTs商店里拿别人的来用。OpenAI透露GPTs商店将在本月晚一点的时候推出。它能成为你的宠物顾问,基于多模态能力解答毛孩子遇到的各种问题。还能帮你给朋友发消息,奥特曼现场就收到了一条由ChatGPT代发的信息。整个过程就是和构建助手GPT Builder唠嗑,告诉它你想要做什么即可。奥特曼说,想要构建一个创业公司助手,能够给创始人提供各种商业建议,并且不断拷问他们为啥不能发展得更快(现场爆笑)。然后GPT Builder就输出了一个GPT,它会更进一步询问用户给新生GPT做更多定制信息。比如希望突出哪些方面、规避哪些问题等。同时用户能控制构建的GPT能不能上网、是否具备图像生成、代码生成能力,以及上传知识文档加强专业能力。现场只进行了3轮和GPT Builder的对话,就构建好了一个Startup Menter。用户可以设置这个GPT是仅自己可用,还是能和他人共享。由此企业可以构建一个仅限内部使用的GPT。本周三企业用户就能使用GPTs了。同时OpenAI强调,他们已经构建了新系统来筛查监管这些自定义GPT,以防出现有害GPT。多模态API来了
既然是开发者日,API的更新也是重头戏,总共分为两大项:GPT-4 Turbo版本主打一个非常6+1,6项能力增强+大降价。当然GPT3.5 Turbo也更新到1106的新版本,在内部评估中,格式遵循任务(例如生成 JSON、XML 和 YAML)提高了 38%。接下来还有一个重头戏,Assistants API,也是让开发者在自己的应用程序中构建类似Agent体验的第一步。Assistant API拥有持久且无限长的线程,允许开发人员将线程状态管理移交给 OpenAI 并解决上下文窗口约束。支持检索功能,利用模型之外的知识来增强,例如专有领域数据、产品信息或用户提供的文档。支持代码解释器功能,与ChatGPT Plus中的一样,可以在沙盒执行环境中编写和运行Python代码,可以生成图形和图表,并处理具有多种数据和格式的文件。函数调用功能也迎来更新,现在可以一次性调用多个函数,并把响应合并到消息输出中。发布会现场演示了构建Assistant的过程,只需要自然语言描述指令,以及勾选启用的工具。接下来就能在应用程序中调用,在得到10个巴黎旅游景点的同时更新地图标记。在检索和函数调用演示中,让AI给每个线下参加活动的观众账号发了500美元的使用额度,狠狠羡慕了。对于没有线下参会的更多开发者,OpenAI也准备了API降价大礼包。GPT-4 Turbo的输入降价到原来的1/3,为1美分每千token。输出降价到原来的1/2,为3美分每千token。同时不再设置上下文长度区分,统一128k,与原来的gpt-4-32k版本相比更为划算。Assistants API这边,代码解释器按会话次数收费,每次三美分。检索则根据容量和天数收费。One More Thing
针对近期OpenAI与微软不合,在销售上产生摩擦的传闻,OpenAI这次拉来了微软CEO纳德拉站台表态。与此同时,刚刚连发了两大大模型产品的马斯克,在联机打暗黑四。参考链接:
[1]https://www.youtube.com/watch?v=U9mJuUkhUzk
[2]https://openai.com/blog/new-models-and-developer-products-announced-at-devday
[3]https://openai.com/blog/introducing-gpts
为伟大思想而生!
AI+时代,互联网思想(wanging0123),
第一必读自媒体
商务合作、投稿及内容合作,请联系后台小编
或271684300@qq.com