从拨号电话到线上会议,从引吭高歌到电台转播,通过将声音信息采集后储存、放大或是传输来服务于艺术演绎、社交生活、工作调度。人类社会发明并使用传递声音的技术已逾百年。
而在不断循环的采集、传输、播放的历程中,还有一样东西自始至终相伴左右,那就是噪声。
它有可能是街道旁采访时汽车的鸣笛、办公室语音通话通话时键盘的敲击、又或者是厨房里传来的哗哗水声。
人类使用工具驾驭声音的历史,也能看作是一场对抗噪声的战争。
AI,对抗噪声的新武器
给麦克风穿上皮毛大衣来对抗外景的风声,带上厚厚的海绵来降低环境中无处不在的细小杂音,甚至建立满布隔音棉的房间来为歌声服务。
但在进入互联网时代后,数字化浪潮中,降噪不再是囿于硬件设备的专利。
线上会议、连麦开黑、多人聊天室……声音经过采集之后,会在几十毫秒内完成传输并开始播放,实时互动的场景中如何提高通话质量成为了降噪战争的新命题。
如今,通过AI算法对拾取到的音频信息进行处理,抛去无效的噪声信息,获得更加纯净的人声或音乐,降噪技术在线上线下的各类场景中都着大量的应用。
传统的降噪算法能够有效的过滤风声、引擎声等持续性的噪声,而在面对突发性噪声较多的复杂环声音环境时则显得有些力不从心。
AI技术的出现,让我们有了对抗噪声的新武器。
而要实现良好的降噪效果,往往需要在算法模型、实时性以及性能占用这三点进行选择取舍,能处理更多噪声的算法往往意味着更大的计算量,而更大的计算量又会让加大降噪对于机器性能的占用,当性能不足时,降噪的实时性就会下跌,带来延迟或是降低最终的降噪效果。
合理的分配算法资源、在优先的数据集中考虑更多的场景、在新场景中AI的模型的拓展能力,这些都是使用AI降噪所面临的难点。
如何在平衡计算量与降噪能力的同时实现最佳实际效果,就是AI降噪研发过程中最大的难题。
ZEGO AI降噪正式上线
ZEGO AI降噪在原有降噪能力的基础上,针对处理非稳态的突发性噪声做了重点优化升级,经过实际测验,ZEGO AI降噪对于:鼠标,键盘声、敲击、空调、厨房碗碟磕碰、嘈杂餐厅、环境风声、咳嗽、吹气等非人声噪声有着良好的过滤能力,降噪效果明显,噪声过滤超80%。
不仅如此,ZEGO AI降噪在处理时延、性能占用上与传统降噪几乎持平,在不增加算力负担的前提下,提高了降噪性能。
- 噪声过滤80%
- CPU性能占用与传统降噪持平
- 处理时延与传统降噪持平
AI降噪的推出,将为语音聊天、线上会议、连麦开黑等场景带来更好的通话效果,能在不增加性能负担、处理实验的前提下优化实际通话体验,有利于远程通话在更多环境苛刻的场景中发挥作用,拓宽RTC的实际应用场景,让实时互动技术融于无形。
未来,我们还将不断迭代优化,继续探索和拓宽技术的边界,不断为用户提供更优质的实时互动服务。直达>>ZEGO AI降噪开发者文档
版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。