当地时间25日,OpenAI宣布ChatGPT迎来重磅更新:这个聊天机器人如今“会看、会说、会听”——换言之,ChatGPT加入了语音与图像功能。未来两周内,Plus用户与企业用户便能体验新功能,开发人员等其他用户群体也有望在不久的将来体验。其中,最受外界关注的是ChatGPT的图像理解能力。据介绍,用户可以向ChatGPT展示一张或多张图片,排查为何烧烤炉无法启动,检查冰箱里的菜能做什么美食,或分析复杂图表得出数据。若想让ChatGPT关注图片中的特定部分,还可以使用APP中的绘图工具高亮标注。在OpenAI给出的示例视频中可以看到,当用户向ChatGPT发送一张自行车照片、询问如何调低车垫时,ChatGPT不仅会自发观察自行车型号、辨认零部件、给出详细步骤,还会看说明书,并分辨用户现有工具能否完成这项工作。值得注意的是,同日发布的一篇论文中,OpenAI将这一能看图的模型称作GPT-4V(ision)。该模型在2022年已完成训练,之后在2023年早些时候开始早期测试访问。借助GPT-4V,今年3月OpenAI与Be My Eyes组织合作开发Be My AI,可为盲人与视力障碍人士描述外界世界。测试表明,Be My AI可为50万盲人和视力障碍用户提供工具,满足他们在信息、文化和就业方面的需求。另外,OpenAI还测试了GPT-4V的验证码破解及地理定位能力,前者表明模型具备解决谜题与执行复杂视觉推理任务的能力,后者则展现出了模型在搜索物品/地点的用处。但这两项功能将涉及网络安全及隐私问题。至于本次更新的另一语音识别与生成功能,OpenAI表示,用户可以用这一功能为孩子讲述睡前故事,还可以在吵架时作为帮手。OpenAI与专业配音演员合作,提供了5种不同的声音。另外,公司还与Spotify展开合作,通过这一功能将播客翻译为其他语言,同时保留播客主持人的声音。值得一提的是,数据显示,近期ChatGPT流量回升。SimilarWeb数据显示,9月11日那一周,ChatGPT流量较前一周增长约12%。另一家分析公司Sensor Tower报告称,8月最后两周全球ChatGPT应用程序用户每周增长超过10%。据悉,流量增长的主要原因为学生开始返校,且印度及巴西市场迎来增长。