Cartesia 融资 6400 万美元，利用 Sonic 2.0 推进实时语音 AI

AIGC • 2025年3月12日下午2:52 • 行业资讯

语音 AI 正在变得更快、更智能、更自然。专注于实时 AI 驱动语音技术的公司 Cartesia 在由 Kleiner Perkins 领投的 A 轮融资中筹集了 6400 万美元。这笔资金将加速研究、扩大团队并完善其最新语音模型 Sonic 2.0，该模型拥有业界先进的延迟和语音克隆功能。

Sonic 2.0 旨在生成超逼真、低延迟的语音，非常适合对话式 AI、创意内容制作和实时通信等应用。该模型利用状态空间架构，其规模是前代的两倍，同时保持了更高的速度和效率。它为完整模型提供了 90 毫秒的延迟，在实时应用中甚至更快，延迟仅为 40 毫秒，这些性能指标超越了竞争对手。

除了速度之外，Cartesia 的技术在语音克隆方面也表现出色，能够生成栩栩如生的语音，捕捉细微的差别、口音和音调变化。这使得它特别适用于精度至关重要的用例，例如客户服务、内容本地化和辅助功能工具。该公司还推出了 Sonic Turbo，这是一款增强版，旨在提供更快的合成速度。

Cartesia 的基础设施专为企业可靠性而构建，正常运行时间高达 99.9%，并符合 SOC-2 和 HIPAA 标准。Sonic API 专为开发人员设计，提供强大的实时性能和设备部署功能，可使 AI 驱动的语音应用程序在各个行业中更加无缝衔接。

首席执行官 Kar 强调，语音 AI 即将变得无处不在，实时 AI 生成的语音将越来越多地为从呼叫中心到虚拟助理等各种应用提供支持。“这是语音 AI 之年，它将无处不在，”他在公告中说道。

利用这笔资金，Cartesia 旨在进一步完善其语音 AI 模型，集成语音转换器和填充编辑等新功能，并推动流媒体架构和设备推理方面的进步。随着 AI 竞赛的加剧，Cartesia 对速度、控制和自然性的关注可能会使其成为不断发展的语音 AI 生态系统中的关键参与者。

本文来自作者投稿，版权归原作者所有。如需转载，请注明出处：https://www.nxrte.com/zixun/56584.html