2025年 4 月 2 日,AI 转录和音频智能提供商 Gladia 宣布推出 Solaria,这是一种下一代自动语音识别 (ASR) 模型,旨在重新定义联络中心和其他语音优先平台的实时通信。
虽然外包长期以来一直是联络中心行业的一种成本削减策略,但企业现在面临着一个新的关键挑战:大规模提供无缝、多语言支持。全球 49% 的高管报告称,语言障碍1导致财务损失,对可扩展、高质量多语言解决方案的需求从未如此强烈。Solaria 现在利用人工智能语音技术帮助企业增强和扩展其客户服务运营,该技术提供 40 多种语言覆盖范围,并且不会影响质量或速度。
Solaria:面向全球客户体验的企业级模型
Solaria 是专为实现真正的全球可扩展性而构建的语音转文本 (STT) 引擎,旨在满足当今联络中心的需求,其中 AI 自动化和人工代理都需要高精度、低延迟和实时多语言支持才能成功。
该模型在语音识别方面取得了业界领先的成果,不仅准确率无与伦比,处理速度也超快。最近的基准测试显示,Solaria 在英语、西班牙语、法语和其他常用语言中的平均词准确率 (WAR) 达到了无与伦比的 94%,同时保持了 270 毫秒的超低延迟,使对话感觉自然且反应灵敏。
虽然实时 STT 通常仅以速度来衡量,但对于跨地区提供无缝服务的企业来说,准确性和语言覆盖范围也同样重要。
与其他优先考虑速度而非可用性的 STT 模型不同,Solaria 在业界领先的准确性和速度与无与伦比的语言覆盖范围之间取得平衡——总共 100 种语言,独家支持 42 种语言,竞争对手无法与之匹敌。对于人口密集的市场和主要外包中心,如 孟加拉国、 印度和 菲律宾,Solaria 现在可提供本地语言的母语级准确性。
通过所有支持语言的母语级转录、实时代码转换和翻译,企业可以不受限制地扩展到全球市场。
Solaria 专为企业级语音自动化而设计,可提供:
- 在塔加洛语、孟加拉语、旁遮普语、泰米尔语、乌尔都语、波斯语和马拉地语等普及型语言中具有一流的准确度。
- 能够使模型适应行业特定术语(如医学或金融术语)并提取关键数据,如姓名、地址和数字。
- 自适应语音处理,确保在嘈杂的呼叫中心环境中保持高准确度。
- 企业级数据安全,完全符合 GDRP、HIPPA 和 SOC 2。
随着 Solaria 加入其产品组合,Gladia 允许企业通过改进人工智能语音代理来增强客户服务,使 IVR 和虚拟助手在多种语言中更加可靠,同时还通过实时转录和翻译优化人工辅助工作流程,帮助代理提供更有效的帮助。
Gladia 首席执行官兼联合创始人 Jean-Louis Quéguiner 表示:“语音是与世界沟通的最自然方式——自动语音识别首次缩小了这种鸿沟,使人类和人工智能能够真正使用同一种语言。借助 Solaria,我们在人工智能语音技术方面取得了突破,为企业带来了新机遇,提高了效率,并在不同的语言和市场中提供更加无缝、更具影响力的客户体验。Solaria 专为下一代语音平台而打造,随时准备在全球范围内引领这一转型。”
Gladia 为全球 700 多家企业客户提供服务,包括 Attention、Circleback、Method Financial 和 VEED.IO,提供企业级服务和可扩展性,并在美国和 欧洲拥有专门的支持和基础设施,确保关键任务应用程序的可靠性能。希望在全球范围内扩展、优化运营成本和增强客户体验的公司可以立即开始使用 Gladia 的 API 进行构建。
作为 Solaria 发布的一部分,Gladia 与 LiveKit 合作,后者是实时 AI 语音代理开源开发框架,旨在为 AI 驱动的应用程序提供实时多语言翻译功能。通过与 Gladia 的 API 无缝集成,开发人员可以立即获得全球语言能力。
继 2024 年完成1600 万美元 A 轮融资和今天推出 Solaria 之后,Gladia 朝着成为领先的端到端 API 音频基础设施提供商迈出了重要的一步——结合语音识别、生成式 AI 和语音生成功能,帮助企业用户和开发人员充分挖掘实时音频数据的潜力。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/57165.html