社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容

蓝点网 • 1 年前 • 302 次点击  

OPENAI 昨天晚上宣布 ChatGPT 将支持语音对话,该功能仅限于 Android 和 iOS 版 ChatGPT,并且可以上传图片由 ChatGPT 进行分析、识别并给出回答。

当这个功能可用后,用户转到 ChatGPT 设置里点击新功能,然后就可以开启语音对话功能,还可以从 5 个声音里选择一个。

OPENAI 表示:

新的语音功能由心的文本转语音模型提供支持,能够仅从文本和几秒钟的样本语音中生成类似人类的音频。我们与专业配音演员合作创作了每一个声音,我们还使用我们的开源语音识别系统 Whisper 将您的声音转录为文本。

第二个功能是图像识别功能,用户可以使用移动端 ChatGPT 拍照或选择照片发送给 AI,然后 ChatGPT 会像素级分析图片内容并按照用户提问给出详细的回答,例如分析工作图表、在设备工作异常时进行故障排除等等。

OPENAI 表示:

图像理解由多模态 GPT-3.5 和 GPT-4 提供支持,这些模型将其语言推理技能应用于广泛的图像中,例如照片、屏幕截图、包含文本的和图像的文档等。

新功能将在接下来几周推出,首先获得该功能的是 ChatGPT Plus 和企业版用户,不过这些功能也会在后续支持免费版用户,同时也会开放 API 给开发者们。

最后,OPENAI 上周推出了图像生成模型 DALL-E 3,这个模型将可以与 ChatGPT 集成,将在 10 月份推出。

好消息:安卓厂商真的卷起来了!

WebP漏洞影响QQ等多款软件

印度月船3号着陆器已失联

火绒应用商店下载 这下没人催了吧

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/162207
 
302 次点击