OpenAI 推出了实时语音的 API,也就是 ChatGPT 里面的高级语音功能,付费开发者就可以使用。你也可以打造自己的实时语音对话功能了!再也不需要像以前先 Whisper 转录,ChatGPT 生成,再文本转语音。
不过价钱不算便宜,但也可以接受,每分钟音频输入大约 0.06 美元,音频输出约 0.24 美元。不考虑输入,10 分钟的输出音频就是 3 美元。
付费的 API 用户现在就可以使用了,实时 API 的音频功能由 GPT-4o 模型 gpt-4o-realtime-preview 提供支持,使用的是 Web Socket 通信,网页和移动 App 对 Web Socket 通信都有很好的兼容。
视频中是 SpeakAI 基于实时语音 API 打造的 Live Roleplays App,可以让 AI 当你的口语老师 宝玉xp的微博视频
不过价钱不算便宜,但也可以接受,每分钟音频输入大约 0.06 美元,音频输出约 0.24 美元。不考虑输入,10 分钟的输出音频就是 3 美元。
付费的 API 用户现在就可以使用了,实时 API 的音频功能由 GPT-4o 模型 gpt-4o-realtime-preview 提供支持,使用的是 Web Socket 通信,网页和移动 App 对 Web Socket 通信都有很好的兼容。
视频中是 SpeakAI 基于实时语音 API 打造的 Live Roleplays App,可以让 AI 当你的口语老师 宝玉xp的微博视频