#人工智能 OpenAI 即日起开始向部分 ChatGPT Plus 订阅用户推出高级语音模式,支持进行实时对话并且还可以使用摄像头识别内容。该功能也就是 OpenAI 春季发布会中演示的内容,现在开始邀请少量用户测试,到秋季将面向所有 ChatGPT Plus 用户推出。查看全文:https://ourl.co/105193在 OpenAI 春季发布会中该公司演示了 ChatGPT 的高级语音模式,这种语音模式是实时交互的,例如在 AI 进行说话时用户可以打断并继续补充内容,AI 也可以感知幽默或者讽刺等并做出回应。
与此前的 ChatGPT 语音功能最大的区别在于,此前的语音交互是先将语音转换为文本内容再发送给 AI,然后生成回复后 AI 再将其朗读出来,这个过程会增加交互的延迟时间。
而高级语音模式不需要进行转换 (只是用户看不到转换过程),整个对话过程非常流畅并且交互延迟也比较低,高级语言模式也支持多模态可以调用摄像头实时识别内容。
目前只有少部分已经开通 ChatGPT Plus 的订阅用户可以受到邀请,OpenAI 将逐渐扩大该功能的使用范围,预计到秋季大部分 ChatGPT Plus 订阅用户都可以使用高级语音模式。
值得注意的是 OpenAI 还强调自从演示高级语音模式后,该公司一直在努力提高语音对话的安全性和质量,高级语音模式预设了四种声音,还添加了防止模仿名人声音的限制。
同时高级语音模式也同样存在各种安全限制,例如安全围栏功能会阻止对暴力或者版权内容的请求,即便用户进行诱导,AI 可能也会拒绝输出此类内容。
已经开通 ChatGPT Plus 的用户请检查自己的邮箱,如果收到高级语言功能的邀请,OpenAI 会发送一封电子邮件进行说明。