语音识别、自然语言处理和生成式人工智能解决方案提供商Deepgram宣布公开发布文本转语音 (TTS) 技术Aura API,可提供类人质量的对话,其计算速度比其他语音AI替代方案更快、更高效。Aura专为想要构建实时对话式语音AI代理的开发人员而设计,这些代理可以以自然且引人入胜的方式与客户、员工和其他用户进行交互。
Deepgram认为,语音将成为我们与技术交互的主要方式,要实现这一点,人工智能系统必须经过高度调整,才能以极低的延迟实现大规模的自然对话。Aura可以在几分之一秒内根据任何文本输入生成语音,包括来自ChatGPT等LLM的响应。这使得与能够处理复杂和动态场景的人工智能代理能够进行流畅且自然的对话。Aura提供多种不同的声音选择,非常适合需要最高程度的安全性、保密性、速度和规模的对话用例和偏好。
Aura完美补充了Deepgram的Nova-2语音转文本API,该API提供业界领先的音频流准确性和转录速度,并在Spotify、花旗银行、NASA和Twilio等全球企业和组织中实施。通过此版本,Deepgram为开发人员提供了一个完整的语音AI平台,为他们提供了所需的基本构建块(从转录到情感分析再到语音合成),以构建未来的高吞吐量、实时AI代理。
“在看到抢先体验产品的巨大需求后,我们很高兴向公众推出文本转语音API Aura。 AI科学家和工程师利用深度学习和GPU技术的最新进展,创建了先进的TTS解决方案,其性能在市场上占优势。”Deepgram首席执行官兼联合创始人Scott Stephenson说道。“通过Aura,我们使开发人员能够创建能够真正理解和响应人类语音的语音AI应用程序,为增强客户体验、生产力和创新开辟新的可能性。”
信息源于:businesswire
版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。