在本文中,我将讨论和比较一些流行的音频编解码器的主要特性。特别是,我将重点关注从用户的角度(而不是从算法的角度)最相关的方面。
如果您一直想知道 MP3、AAC、AC3、WAV、WMA 和 Opus 之间到底有什么区别,那么本文适合您。
比特率
在我们开始之前注意“比特率”。编解码器的比特率是指它用于编码一秒原始音频的(平均)比特数。比特率以 kbps(每秒千比特)为单位表示。一千比特是 1,000 比特。大多数情况下,比特率是编码期间的可调参数。
比特率很重要,因为它直接影响编码文件的大小(在存储应用中)和音频传输所需的网络带宽(在流媒体和广播应用中)。比特率越低,编码音频的大小和网络带宽要求就越低。
现在让我们直接来看一些流行编解码器的特性。
MP3
MP3 是迄今为止最著名的音频编解码器,在大众的想象中几乎是数字音频的代名词。MP3 在 90 年代迎来了数字音频革命。
MP3 在 1993 年被 ISO 标准化为 MPEG-1 Audio Layer III。
MPEG-2(第 3 部分)包括对 MP3 的扩展,支持较低的采样率(16、22.05、24 kHz)和高达 5.1 的通道。但是这些采样率丢弃了大量的人类可听频率(即分别高于 8、11.025 和 12 kHz)。因此,它们不适用于所有类型的音频。
现在介绍有关 MP3 的一些事实。
支持的采样率 (kHz) | 32、44.1、48(MPEG-1);16、22.05、24 (MPEG-2) |
推荐比特率 | 48 kHz 立体声为 128 kbps 或更高;支持高达 320 kbps |
支持的最大通道数 | 立体声; 5.1 仅在比特率低于 32 kHz 的 MPEG-2 中受支持 |
标准化 | ISO/IEC 11172-3 (MPEG-1) ISO/IEC 13818-3 (MPEG-2) |
专利/特许权使用费 | 免费使用(所有专利均已过期) |
容器 | MP4、MPEG-1、ADTS、3GP |
解码器支持 | 广泛可用; 几乎所有网络浏览器和消费类音频设备都支持 MP3 |
常见应用 | 互联网上的音乐和音频、个人音频设备 |
AAC
ISO 在 MPEG-2 和 MPEG-4 中将 AAC 标准化为 MP3 的继承者。AAC 是高级音频编码的缩写。AAC 具有多项改进和新的编码技术,可以在相同的音频质量下显着提高比 MP3 的比特率。另一种看待这一点的方式是,AAC 在相同的比特率下提供比 MP3 更好的音频质量。
AAC 比 MP3 更通用。它支持范围更广的采样率、比特率和通道数。它还具有用于不同用例和应用程序的各种变体。一些变体是 AAC LC(低复杂性)、AAC Main、AAC LD(低延迟)和 HE-AAC(高效率)。
支持的采样率 (kHz) | 8 至 192 |
推荐比特率 | 48 kHz 立体声为 96 kbps 或更高;支持任意比特率 |
支持的最大通道数 | 多达 48 个通道 |
标准化 | ISO/IEC 13818-7 (MPEG-2) ISO/IEC 14496-3 (MPEG-4) |
专利/特许权使用费 | OEM 和最终用户软件供应商(例如,媒体播放器)需要向专利持有人支付专利使用费 |
容器 | MP4、ADTS、3GP |
解码器支持 | 广泛可用; 大多数网络浏览器和消费类音频设备都支持 AAC |
常见应用 | 互联网上的音乐和音频、个人音频设备;数字广播(广播和电视) |
AC3 (Dolby Digital)
AC3 是杜比的音频编解码器。杜比为 AC3 使用市场名称“Dolby Digital”。在电影院、家庭影院和广播中,杜比数字几乎是“环绕声”的代名词。
杜比数字 (Dolby Digital) 支持多达 5.1 声道——左、右、中、左环绕、右环绕和一个低频增强声道。环绕声声道使制作人能够从听众周围的任何方向产生声音感。
杜比将 AC3 升级为 EAC3。EAC3 支持 7.1 声道。杜比将 EAC3 称为“Dolby Digital Plus”。AC3 程序将在支持 EAC3 的设备和软件上播放。
杜比技术使音频适应播放设备上的实际扬声器数量。因此 AC3 和 EAC3 可以在杜比认证的立体声设备上正常播放。
支持的采样率 (kHz) | 32, 44.1, 48 |
推荐比特率 | 48 kHz、5.1 声道音频为 192 kbps 或更高;立体声 96 kbps 或以上 |
支持的最大通道数 | AC3 中的 5.1;EAC3 中的 7.1 |
标准化 | ATSC A/52:2012 的附件E,以及ETSI TS 102 366 V1.2.1 (2008–08)的附件 E |
专利/特许权使用费 | AC3可免费使用(所有专利均已过期);EAC3产品需要杜比授权 |
容器 | MP4、CFF、UltraViolet |
解码器支持 | HD DVD 播放器、蓝光光盘播放器、数字电视、Apple 设备、MS Edge (Windows 10)、FFmpeg、Netflix、Vudu、Amazon Fire TV、许多智能手机 |
常见应用 | 电影院、数字电视、AVR、HD DVD、蓝光光盘、OTT 流媒体 |
Opus
Opus是一种开源、免版税的音频编解码器,专为交互式音频应用程序(VoIP、视频会议等)而设计。根据设计,它是音频编解码器中延迟最低的之一。
Opus 是 SILK(Skype 的语音编解码器)和 CELT(Xiph.org 的音频编解码器)的组合。它支持三种模式——仅 SILK、仅 CELT 和混合(SILK 和 CELT 的组合)。模式是根据被编码的内容来选择的。它甚至允许在流中间的模式之间切换。
Opus 在 2012 年被 IETF 标准化后,人气稳步上升,目前在互联网和 VoIP 应用中得到广泛支持和使用。WhatsApp 使用 Opus 作为其 VoIP 编解码器。
Opus 仅支持单声道和立体声通道。
支持的采样率 (kHz) | 8、12、16、24 或 48 kHz |
推荐比特率 | 48 kHz 立体声为 96 kbps 或更高;支持 6 kbps 到 510 kbps – 在较低的比特率下通常优于 AAC 和 MP3 |
支持的最大通道数 | 立体声 |
标准化 | IETF(互联网工程任务组)的 RFC 6716 |
专利/特许权使用费 | 免费使用,开源 |
容器 | MP4、Ogg、WebM、MPEG-TS |
解码器支持 | 几乎适用于所有广泛使用的浏览器、操作系统和媒体播放器;Opus 支持在 WebRTC 实现中是强制性的 |
常见应用 | VoIP,实时互动通讯 |
WAV
WAV 是波形音频文件格式的缩写。它不是编解码器。它是一种音频文件格式,通常用于存储未压缩的音频。它属于 RIFF 文件格式家族。
有关采样率、通道数和位深度的信息是 WAV 文件头的一部分(或准确地说是fmt sub-chunk)。它支持这些参数的任何值(适合分配的位数)。
它在音频专业人士中很受欢迎,因为它尽可能接近原始录制的音频。它在专业音频编辑软件和媒体播放器中得到广泛支持。由于数据量大,它不适合消费者或最终用户应用程序。
WMA
WMA(Windows Media Audio)是 Microsoft 开发的专有音频编解码器系列。WMA 是Microsoft Media Foundation的一部分。它旨在成为我们上面讨论的更广泛支持的编解码器的竞争对手。
WMA 系列包含四种编解码器——WMA、WMA Pro、WMA Lossless 和 WMA Voice。虽然 WMA 最多可以包含 48 kHz 立体声,但 WMA Pro 最多支持 7.1 声道和采样率高达 96 kHz。WMA 比 WMA Pro 更常用。
大多数适用于 Windows 操作系统的媒体播放器都可以播放 WMA 文件。它们包括 Windows Media Player(当然!)、VLC、Media Player Classic (MPC) 系列、Winamp 和 RealPlayer。
WMA 编码可以使用 Windows Media Foundation、Windows Media Player、Windows Movie Maker、RealPlayer 和 Adobe Audition 等进行。
支持的采样率 (kHz) | 8、11.025、16、22.05、32、44.1、48、88.2、96(仅限 WMA Pro 中的 88.2 和 96) |
推荐比特率 | 128 kbps 或更高的 48 kHz 立体声(取决于编码器,第三方编码器实现也可用) |
支持的最大通道数 | 立体声(WMA);7.1 (WMA 专业版) |
标准化 | 所有权 |
专利/特许权使用费 | 专有技术;授权给第三方 |
容器 | ASF |
解码器支持 | 适用于 Windows 操作系统的大多数软件媒体播放器 |
常见应用 | Windows 设备上的语音、音乐和音频播放;OTT 流式传输到 Windows 设备 |
作者:Mohammed Harris
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/5391.html