音频技术的文章 - 实时互动网个人中心

技术文章

人工智能如何改变配音、翻译和本地化的游戏规则

人工智能配音是 NAB 2025 展会上最具活力的创新领域之一，但人工智能也在开辟令人兴奋的新领域，尤其是在音频翻译领域。为了找到人工智能能带来真正投资回报的具体应用案例，SVG …

音频技术

2025年4月27日

行业资讯

NAB 2025 回顾：人工智能与音频的结合成为可能

在 NAB 2025 上，人工智能（AI）作为一种概念和现实是一个重要的话题。 Telos Alliance 在展会上首次展示了其 Minnetonka Audio AudioT…

音频技术

2025年4月15日

技术文章

开源PJSIP环境下回声抑制处理机制和优化讨论

回声消除或者回声抑制是语音呼叫中经常遇到的问题。这种问题取决于SIP终端的回声处理能力。很多SIP终端使用硬件处理，一些软电话只能使用软件算法来处理。处理的结果也有很大差别。本文章…

音频技术

2025年4月8日

技术文章

OGG 与 MP3 有什么区别？哪种音频格式更好

本文将探讨数字音频格式的世界，比较 OGG 和 MP3。我们将讨论 OGG 和 MP3 的主要区别，包括音质、文件大小和兼容性等。什么是 OGG？ OGG 是一种免费的开源比特流…

音频技术

2025年3月28日

行业资讯

增值：音频在流媒体变革中的作用

2024 年夏季奥运会在直播方面创造了历史。根据媒体研究专家 Nielsen 的数据，美国全国广播公司（NBC）的 Peacock 流媒体服务对夏季奥运会的报道使收视率比 7 月份…

音频技术

2025年3月27日

技术文章

从8kHz到48kHz：音频带宽扩展算法的演进

本文介绍使用音频带宽扩展（Audio Bandwidth Extension, ABE）来改善语音质量。带宽扩展旨在估计缺失的高频内容，换句话说，即提高语音信号的分辨率，从 4-8kHz 扩展到 16kHz。

音频技术

2025年3月26日

技术文章

解决视频通话无声问题：如何检测基于浏览器的应用程序中的音频路由问题

有没有过这样的经历：在视频通话中，尽管音频效果很好，但对方却听不到你的声音？我在构建基于浏览器的视频 KYC（Know Your Customer）解决方案时就遇到过这样的难题，正…

音频技术

2025年3月20日

技术文章

空间音频技术：理想与现实的博弈

在2025年的今天，”空间音频”（Spatial Audio）、”杜比全景声”（Dolby Atmos）等术语已经成为消费电子展会的…

音频技术

2025年3月6日

技术文章

常见的 VoIP 音频质量问题及其解决方法

通话故障、延迟和音频失真不仅令人讨厌，还会破坏商务沟通。本文将列举一些常见的 VoIP 音频质量问题，如丢包、延迟和回音，以及消除这些问题的专业解决方案。

音频技术

2025年3月4日

技术文章

人工智能正在快速实现音频内容的自动化生成

人工智能正在进一步涉足音频内容生成领域，并极大地改变了其发展。谷歌、Meta 和微软等知名供应商以及 Revoicer 和 WellSaid 等初创公司正在利用生成式人工智能，提供…

音频技术

2025年2月24日

技术文章

音频流服务的系统设计

音频流应用程序的系统设计在如何处理特殊业务需求方面具有独特性。通常，音频流需要在有限的网络通信通道带宽内传输大量数据。一个成功的音频流媒体服务必须能够处理来自不同地理位置的数百万…

音频技术

2025年2月18日

技术文章

杜比全景声 (Dolby Atmos) 如何提升流媒体音频质量

流媒体服务彻底改变了人们的媒体消费方式，使高质量的音频和视频比以往任何时候都更容易获得。随着技术的进步，音频质量发生了重大转变，而杜比全景声是该领域最具突破性的创新之一。杜比全景声…

音频技术

2025年2月12日

技术文章

PC 中沉浸式音频体验的高级信号处理

在数字创新时代，音频质量已成为 PC(personal computing) 的一个决定性特征。无论是游戏、视频会议、内容创建还是媒体消费，对沉浸式的高品质音频体验的需求都在不断增…

音频技术

2025年1月23日

技术文章

xLSTM-SENet：重新定义单通道语音增强

语音处理系统通常难以在嘈杂的环境中提供清晰的音频。这一挑战影响了助听器、自动语音识别 (ASR) 和说话人验证等应用。传统的单通道语音增强 (SE) 系统使用 LSTM、CNN 和…

音频技术

2025年1月16日

技术文章

人工智能和音频：技术进入广播声景的影响

人工智能 (AI) 已在专业音频领域占有重要地位。它正在自动化和简化诸如编辑、混音、母带制作以及越来越多的音乐创作和生成等任务。它使制作人和工程师能够更快、更高效地工作，并提供新的…

音频技术

2025年1月16日

技术文章

Nexa AI 发布 OmniAudio-2.6B：用于边缘部署的快速音频语言模型

音频语言模型 (ALM) 在各种应用中发挥着至关重要的作用，从实时转录和翻译到语音控制系统和辅助技术。然而，许多现有解决方案都面临着诸如高延迟、大量计算需求以及对基于云的处理依赖等…

音频技术

2024年12月17日

技术文章

噪声增强 CAM（连续自回归模型）：推进实时音频生成

自回归模型（Autoregressive models）用于生成离散标记序列。在该方法中，下一个标记由给定序列中的前一个标记决定。最近的研究表明，自回归生成连续嵌入序列也是可行的。…

音频技术

2024年12月9日

技术文章

沉浸式音频第二部分：为下一代声音混音

几十年来，混音控制台不断适应专业音响的发展，以容纳更多的输入，这主要是由音乐制作推动的；当磁带的容量在 20 世纪 90 年代达到 48 个音轨的最大值，录音转到（理论上）无限的虚…

音频技术

2024年12月5日

技术文章

沉浸式音频第 1 部分：专注于捕捉的工具包

有关广播沉浸式音频的讨论往往集中在输出方面：主要是扬声器的数量和位置，尤其是头顶的四个扬声器。在美国，杜比全景声（Dolby Atmos）是主流的沉浸式音频格式，这通常已成定局。然…

音频技术

2024年12月5日

行业资讯

体育直播为何需要新一代音频技术

高质量音频是体育直播的重要组成部分。出色的音频可强化体育赛事的直播效果，并创造出令人难忘的时刻，引起更深层次的共鸣。再现体育场或赛道的独特音效，为电视观众创造真正引人入胜的体验非常…

音频技术

2024年11月27日

音频技术认证作者