低噪音创新:声音如何促进电信业的未来

声波有多种应用,但并不总是广为人知:它们不仅用于通信,还可用于冷却或加热建筑物、监测鸟类迁徙或控制电视。随着社会的变化,声学领域涉及许多创新,为日常挑战提供解决方案。

电信世界也不例外。

• 声学涉及与声音相关的所有现象:声波的发射、传播、捕获和感知。
• 电信最初专注于语音通信,现在已成为声学研究的重点:编码、识别、语音合成等。
• 如今,声音继续提供许多创新:虚拟现实的声音沉浸;自然空间的环境声音识别(检测偷猎或砍伐树木活动、物种种群测量以评估生物多样性);城市空间(安全)或家庭的环境声音识别(检测人员跌倒情况);以及人机交互中声音信息补充甚至替代视觉信息。

声学在电信领域的地位

电信(或信息和通信技术 ICT)从一开始就专注于语音通信。

声学长期以来一直是研究活动的关键问题,包括语音编码、语音合成和语音识别方面的工作。

通信技术的多样化可能导致人们对声学问题的兴趣下降。然而事实并非如此,恰恰相反。随着技术的发展,研究人员将重点放在新领域,从而产生了一系列创新(图 1):声音沉浸、自动声音识别(例如可用于监测自然或城市环境和家庭)、声音控制的脑机接口等。

低噪音创新:声音如何促进电信业的未来
图 1:电信领域的变革历史及其对声学研究的影响。

回顾数十年来为未来 ICT 服务的声学探索

从不同维度的声音

20 世纪 90 年代出现了远程呈现的概念(即让视频会议的参与者产生身处同一空间的错觉),并开始了沉浸式通信的首批研究。

声音空间化立即被认为是沉浸式体验的重要组成部分,但它需要重新审视整个音频链,从录音到重放,更不用说 3D 音频编解码器了。这些新技术在与雷恩歌剧院合作的“唐璜”现场直播中在现实世界的大规模场景中进行了测试。观众非常喜欢,无论是通过雷恩市政厅的广播还是通过平板电脑,这场活动都引起了轰动,使大量人能够欣赏演出(在医院、监狱等)。

Orange与弗劳恩霍夫研究所等其他参与者一起参与了 MPEG-H Audio 3D 格式的开发,该格式支持沉浸式音频内容的广播,并在 3D 音频格式和再现系统(5.1 多声道设备、耳机等)领域提供了极大的灵活性。如今,虚拟现实的扩展正在构建中。最近,作为另一个标准化机构(3GPP)的一部分,IVAS(沉浸式语音和音频服务)编解码器在语音通信服务中引入了沉浸感。

2000 年代,智能手机的成功使耳机的使用变得大众化。声音沉浸感随即变成了双耳(图 2),Orange 为法国广播电台和法国电视台发起的“ BiLi ”(双耳聆听)项目做出了贡献,旨在为大众开发耳机上的声音沉浸感。

低噪音创新:声音如何促进电信业的未来
图 2:位于拉尼翁的 Orange 公司消声室中用于测量双耳传递函数的系统

金耳朵

电影《狼之歌》 (Antonin Baudry,2019 年)让观众沉浸在“金耳朵”的日常生活中,他是一位精通水下噪音的潜艇专家,能够识别这些噪音(动物、地震、渔业活动、潜艇等)。他确实用耳朵监视着漆黑的海洋。

现在看来,我们可以将“迷你金耳朵”设备(带有麦克风和自动声音识别功能)引入各种环境。这种方法已经在生物声学领域广泛用于监测自然区域,例如打击森林砍伐和偷猎,或评估生物群落内物种的存在。

随着物联网 (IoT) 和互联环境(智能环境、智能建筑等)的革命,任何物体都可以配备传感器和分析功能,并可以进行通信。如果传感器是麦克风,声音分析可以检测事件(例如,人跌倒)或识别情况以触发操作。在医疗保健领域,OSO-AI 根据这一原理为护理人员提供远程患者监控支持。声音还可用于工厂机器的预测性维护。每个人都知道,汽车嗡嗡声的细微变化是零件磨损或未来故障的征兆。

通过思想来控制

联网的机器和环境可以通过语音助手来控制。这种交互形式很有吸引力,因为它非常直观。

通过思想控制甚至可能走得更远:这是脑机接口 (BCI)的前景。最初的实验使用了视觉数据,但音频也具有某些优势:设备简单(扬声器或耳机)、隐私(如果使用耳机)以及可能实现卓越的响应能力和 3D 音频。其原理是向用户呈现不同的声音,每种声音都与一个特定的动作相关联(例如:打开灯、更换电视频道等)。用户集中精力聆听与他们选择的动作相对应的声音。接下来的挑战是如何在他们的大脑活动中识别他们所关注的声音。

2022 年,Orange 开展的一项初步研究证明了听觉 BCI 概念的可行性。下一步是优化所用声音的设计,以最大限度地提高其可检测性,同时使其听起来尽可能悦耳。

但这还不是全部

所有这些例子都说明了声学技术带来的创新的丰富性和多样性。

未来同样充满机遇。虽然虚拟现实目前提供的是视觉体验,但通过其他感官方式来丰富它,将有可能消除现实世界和虚拟世界之间的界限。为此,为虚拟现实耳机配备 3D 声音是必不可少的第一步,特别是因为声音天生就具有很强的沉浸感。此外,从认知的角度来看,听觉信息可以补充甚至强调视觉信息。人们已经观察到它在记忆和学习方面的好处。

机器学习革命也正在大力投资音频信号处理工具,并且结果已经非常有希望(编码、降噪等)。

信息源于:hellofuture

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐

发表回复

登录后才能评论