语音生成初创公司Resemble AI利用人工智能技术恢复旧音频

音频技术 • 2024年1月20日上午11:19 • 行业资讯

语音生成初创公司Resemble AI专注于提升音频的保真度。这家初创公司还为企业提供了人工智能语音生成器，用于创建更逼真的配音，并推出了“ ResembleEnhance ”这种开源工具，旨在提升历史音频的质量。

这项新服务可以对一段失传已久的历史演讲进行录音，然后利用人工智能技术使其听起来像是刚刚录制的。

这家加拿大公司表示，ResembleEnhance的特点在于双模块方法，结合了先进的降噪器（消除静态背景嗡嗡声和嘶嘶声）和人工智能驱动的语音增强器。这种组合不仅可以消除不需要的噪声，还可以丰富音频的整体质量。

它是如何工作的？

Resemble AI降噪器使用一种叫做UNet的AI模型，有助于区分录音中出现的不同类型的声音。它擅长从音轨中过滤掉不需要的噪声，只留下语音作为焦点。

一旦UNet完成工作，增强器模块就会启动，扩展音频带宽并纠正失真。该公司表示，这种双重功能确保最终输出不仅没有噪声，而且还具有现代录音的丰富性。

作为一款开源工具，ResembleEnhance可以免费使用，这在传统上昂贵的媒体恢复服务市场中是一个引人注目的选择。ResembleEnhance的主要受益者是依赖清晰音频质量的行业，例如播客、娱乐和教育等。此外，该工具还为历史记录提供了新的生命力，有可能为过去提供更清晰的见解。

该工具的发布恰逢对高质量数字内容的需求空前高涨之际。与此同时，ResembleEnhance的开源性质使其成为目前由高成本专有解决方案主导的市场中的潜在颠覆力量。

人工智能在音频和视频增强方面的融合可能会为更全面的媒体恢复解决方案铺平道路。

通过将此工具与使用生成式AI或其他模型来升级和增强图像和面部的其他视频增强器（例如GPEN或著名的GFPGan）相结合，用户现在可以用自己的计算机以最低的投资获得专业的结果。

信息源于：decrypt