在5月13日公布的信息中,OpenAI 正在部署一些特别的功能,可以使得ChatGPT进行类似电话通话能力。
OpenAI已经部署了必要的 WebRTC 服务器来实现这一功能。最初,作者认为 WebRTC 仅用于他们的语音模式,但后来发现实际上是通过Livekit来实现的。
这使得用户将能直接在ChatGPT的界面上通过语音与其进行对话,类似于打电话。这可能使ChatGPT更加互动和实用。
目前ChatGPT支持的语音功能主要是语音到文本的转换,用户可以通过语音输入信息,然后 ChatGPT 将这些语音信息转换为文本进行处理,并以文本形式回复。这一过程涉及到语音识别技术,但整个交互仍然是基于文本的。
而 OpenAI 在 ChatGPT 中尝试整合电话通话功能,意味着他们可能在扩展到更直接的语音交流,也就是用户和 ChatGPT 可以通过实时的语音对话进行互动,而不是单纯的语音输入和文本输出。这种方式将模拟真实的语音对话,使得交流更加自然流畅,不需要用户查看屏幕即可进行交流。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/48402.html