Cartesia 融资 6400 万美元,利用 Sonic 2.0 推进实时语音 AI

语音 AI 正在变得更快、更智能、更自然。专注于实时 AI 驱动语音技术的公司 Cartesia 在由 Kleiner Perkins 领投的 A 轮融资中筹集了 6400 万美元。这笔资金将加速研究、扩大团队并完善其最新语音模型 Sonic 2.0,该模型拥有业界先进的延迟和语音克隆功能。

要点:

  • 由 Kleiner Perkins 领投的 6400 万美元 A 轮融资,支持团队成长和人工智能进步。
  • Sonic 2.0 模型实现了完整模型的 90ms 延迟,实时应用的 40ms 延迟。
  • 卓越的语音克隆功能可捕捉复杂的口音并微调语音风格。
  • 提供 99.9% 的正常运行时间和设备上部署选项。

Sonic 2.0 旨在生成超逼真、低延迟的语音,非常适合对话式 AI、创意内容制作和实时通信等应用。该模型利用状态空间架构,其规模是前代的两倍,同时保持了更高的速度和效率。它为完整模型提供了 90 毫秒的延迟,在实时应用中甚至更快,延迟仅为 40 毫秒,这些性能指标超越了竞争对手。

Cartesia 融资 6400 万美元,利用 Sonic 2.0 推进实时语音 AI

除了速度之外,Cartesia 的技术在语音克隆方面也表现出色,能够生成栩栩如生的语音,捕捉细微的差别、口音和音调变化。这使得它特别适用于精度至关重要的用例,例如客户服务、内容本地化和辅助功能工具。该公司还推出了 Sonic Turbo,这是一款增强版,旨在提供更快的合成速度。

Cartesia 的基础设施专为企业可靠性而构建,正常运行时间高达 99.9%,并符合 SOC-2 和 HIPAA 标准。Sonic API 专为开发人员设计,提供强大的实时性能和设备部署功能,可使 AI 驱动的语音应用程序在各个行业中更加无缝衔接。

首席执行官 Kar 强调,语音 AI 即将变得无处不在,实时 AI 生成的语音将越来越多地为从呼叫中心到虚拟助理等各种应用提供支持。“这是语音 AI 之年,它将无处不在,”他在公告中说道。

利用这笔资金,Cartesia 旨在进一步完善其语音 AI 模型,集成语音转换器和填充编辑等新功能,并推动流媒体架构和设备推理方面的进步。随着 AI 竞赛的加剧,Cartesia 对速度、控制和自然性的关注可能会使其成为不断发展的语音 AI 生态系统中的关键参与者。

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/56584.html

(0)

相关推荐

发表回复

登录后才能评论