OpenAI 周一宣布了一款新的旗舰生成式 AI 模型,他们称之为 GPT-4o——“o”代表“omni”,指的是该模型处理文本、语音和视频的能力。GPT-4o 将在未来几周内在公司的开发人员和面向消费者的产品中“迭代”推出。
OpenAI 首席技术官 Mira Murati 表示,GPT-4o 提供“GPT-4 级别”的智能,但改进了 GPT-4 跨多种模式和媒体的能力。
“GPT-4o 通过语音、文本和视觉进行推理,”Murati 周一在 OpenAI 旧金山办公室的流媒体演示中说道。“这非常重要,因为我们正在研究我们自己与机器之间交互的未来。”
GPT-4 Turbo是 OpenAI 之前的“领先的”最先进的”模型,它接受了图像和文本组合的训练,可以分析图像和文本以完成从图像中提取文本甚至描述这些图像的内容等任务。但 GPT-4o 添加了语音功能。
GPT-4 Turbo是 OpenAI 之前的“领先的”最先进的”模型,它接受了图像和文本组合的训练,可以分析图像和文本以完成从图像中提取文本甚至描述这些图像的内容等任务。但 GPT-4o 添加了语音功能。这可以实现什么功能?各种各样的事情。 图片来源:OpenAIGPT-4o 极大地改善了 OpenAI 的人工智能聊天机器人ChatGPT的体验。该平台长期以来一直提供语音模式,使用文本转语音模型转录聊天机器人的响应,但 GPT-4o 对此进行了增强,让用户更像助手一样与 ChatGPT 进行交互。 例如,用户可以向 GPT-4o 支持的 ChatGPT 提问,并在 ChatGPT 回答时打断它。OpenAI 表示,该模型提供“实时”响应能力,甚至可以识别用户声音中的细微差别,从而生成“一系列不同情感风格”(包括唱歌)的声音。
GPT-4o还升级了ChatGPT的视觉能力。给定一张照片或一个桌面屏幕,ChatGPT 现在可以快速回答相关问题,主题范围包括“此软件代码中发生了什么?”到“这个人穿什么牌子的衬衫?”
穆拉蒂说,这些功能未来将进一步发展。虽然今天的 GPT-4o 可以查看不同语言的菜单图片并进行翻译,但在未来,该模型可以允许 ChatGPT 例如“观看”现场体育比赛并向您解释规则。
“我们知道这些模型变得越来越复杂,但我们希望交互体验实际上变得更加自然、轻松,并且让您根本不关注 UI,而只关注与 ChatGPT 的协作,”穆拉蒂说道。“在过去的几年里,我们一直非常专注于提高这些模型的智能......但这是我们第一次在易用性方面真正迈出一大步。”
OpenAI 声称,GPT-4o 的多语言能力也更强,在大约 50 种语言中的性能得到了增强。该公司表示,在 OpenAI 的 API 和微软的 Azure OpenAI 服务中,GPT-4o 的速度是 GPT-4 Turbo 的两倍,价格是 GPT-4 Turbo 的一半,并且具有更高的速率限制。
目前,语音并不是所有客户的 GPT-4o API 的一部分。OpenAI 以滥用风险为由,表示计划在未来几周内首先向“一小群值得信赖的合作伙伴”推出对 GPT-4o 新音频功能的支持。
从今天开始,GPT-4o 可在 ChatGPT 免费套餐中使用,并向 OpenAI 高级 ChatGPT Plus和Team计划(消息限制“高出 5 倍”)的订阅者提供。(OpenAI 指出,当用户达到速率限制时,ChatGPT 将自动切换到GPT-3.5,这是一种较旧且功能较弱的模型。)以 GPT-4o 为基础的改进的 ChatGPT 语音体验将在下个月或下个月为 Plus 用户提供 alpha 版本。因此,除了以企业为中心的选项之外。
在相关新闻中,OpenAI 宣布将在网络上发布更新后的 ChatGPT UI,其中包含新的、“更具对话性”的主屏幕和消息布局,以及适用于 macOS 的 ChatGPT 桌面版本,用户可以通过键盘快捷键提问或采取行动讨论截图。从今天开始,ChatGPT Plus 用户将首先访问该应用程序,Windows 版本将在今年晚些时候推出。
在其他地方,GPT Store是 OpenAI 的库和创建工具,用于基于其 AI 模型构建的第三方聊天机器人,现在可供 ChatGPT 免费层的用户使用。免费用户可以利用以前付费的 ChatGPT 功能,例如允许 ChatGPT “记住”未来交互偏好的记忆功能、上传文件和照片以及在网络上搜索及时问题的答案。
温馨提示:为了不错过每一期干货,强烈建议可以星标此公众号。更新不易,希望大家能够多多支持,点赞、在看支持。
B站请搜索“CG资源站”
https://space.bilibili.com/142853317
微博请扣一波@C4DSKY
https://weibo.com/C4DSKY
更多优秀资源请访问:
C4DSKY.COM
加入VIP,海量资源免费获取
网站会员介绍:http://c4dsky.com/vip
VIP专区:http://c4dsky.com/tag/vip
免责声明
本资源仅作为学习交流,其版权归出版社或者原作者所有,本公众号不对所涉及的版权问题负责。微店售卖的价格绝对不是商品价格,而是整理资料或录制教程的成本,如原作者认为侵权,请联系我们,我们立即删除文章,谢谢!
分享、收藏、在看和点赞,至少可以点一个嘛