人工智能和音频:技术进入广播声景的影响

人工智能 (AI) 已在专业音频领域占有重要地位。它正在自动化和简化诸如编辑、混音、母带制作以及越来越多的音乐创作和生成等任务。它使制作人和工程师能够更快、更高效地工作,并提供新的创作可能性。即便如此,人们仍担心人工智能生成内容可能会失去人类的创造性投入以及伦理影响。

人工智能和音频:技术进入广播声景的影响

SVG 询问了一些行业思想领袖对专业音频发展中这一转折点的看法。

NBC Sports 音频工程高级总监 Karl Malone

我很高兴能够看到新的 AI 工具在广播音频方面能取得怎样的成就。我们已经开始使用 Cedars、Isotopes 和上混引擎来处理复杂的任务,而在欧洲足球比赛中使用Kick来混合球效应该足以让我们认真对待自动化和智能技术。

人工智能的魅力在于它能够分析场景并评估比人类更多的音频信号参数。尽管人工智能在大脑、手和眼的协调方面表现出色,但我们根本无法与人工智能的计算预见能力相媲美。它可以实时处理信息,预测结果,并根据其分析和针对特定情况所接受的特定训练做出决策或提供建议。

然而,定义 A1 作品的艺术细微差别和创造性专业知识是无可替代的,这使得 AI 不适合单独为大型广播节目混音。尽管如此,AI 可以非常有效地处理辅助输出,例如为第二屏幕源创建专用混音——例如,专注于将近距离球特效和广播评论混合为单独的音频源。

人工智能还可以帮助对大量节目源进行质量控制,以便能够检查音频和视频中是否存在各种视觉和音频混合问题:音频和视频不同步、视频分辨率伪影、质量波动、音频缺失、剪辑、元数据定时、相位等。它可以提醒 MCR/BOC 操作员仔细查看或聆听。

最终,我们会决定是否要在这些早期阶段使用它,因此不会强迫任何人实施。

铁三角广播和制作业务开发总监 Gary Dixon :

音频是动态的,值得一听的时刻通常是不可预测的:例如赛车中的碰撞、人群的爆发,或者音乐会上音符停留时间稍长。专业音频和麦克风中的人工智能将特别用作在不可预测的音频情况下快速调整硬件的工具。硬件在增益结构、动态和一般均衡方面可能存在局限性,而人工智能可以帮助人类对这些情况做出反应。

但要让音频吸引人类,最终的监控和调整还是需要人类来完成的。人工智能是人类更好地应对有趣的人性所导致的不可预测事件的工具。

Lawo营销内容主管 Christian Scheck

从内容创作的角度来看,生成式人工智能非常强大。就视频而言,已经可以将一些信息输入生成式人工智能引擎,以获得可用的素材。

同样,在音频方面,人工智能引擎编写和演奏的音乐开始让词曲作者和表演者感到害怕,而视频中人工生成的画外音和广播中的现场评论则成功欺骗了越来越多的听众,使他们相信他们正在听人类说话。

人工智能在生成隐藏式字幕方面发挥了很好的作用,这曾经是一项耗时的任务,但现在可以在几分钟内完成。然而,结果仍然需要人工检查一致性、语调以及至关重要的准确性。

在广播行业,更先进的算法可以帮助音频工程师应对快速增长的工作量,尤其是在需要监督和交付多种演示和混音格式的沉浸式音频混合场景中——所有这些都来自一个控制台和一个 A1。

归根结底,AI 在现场制作场景中的成功将取决于它如何应对意外情况。它很可能成为基于 Lawo 解决方案的媒体制作的强大助手,但它是否能够取代 DSP 音频或高质量视频处理仍有待观察。

人工智能还可以通过其他方式增加价值。例如,在 HOME Apps 等基于软件的现代平台上,人工智能可以简化流程监控,大大缩短调试时间,缩短停机时间,并协助进行数据分析和预测故障情况。

其他应用可能包括先进的自动混合算法或应用程序和服务的智能部署,以便在计算资源有限的场景中最大限度地提高硬件和软件的利用率。

然而,人工智能需要与业务治理层面相结合,因为它也带来了许多挑战。

Q5X 首席执行官 Paul Johnson:

人工智能将在许多方面发挥重要作用,扩大体育赛事期间从运动员和官员那里获取音频的范围。语音转文本技术的速度和质量大幅提升,将促进实时音频处理,从而过滤和纠正比赛音频中的脏话和其他不受欢迎的语言,并实时翻​​译成多种语言。这将增加现场比赛音频,这一直受到球迷的欢迎。一旦 [音频/视频] 被捕获为文本记录,存档音频/视频的索引就会变得更加容易,存档对于后期制作也更有用。人工智能在将宽格式视频源中的适当音频与自动数字变焦关联起来方面也至关重要。最终,人工智能将能够混合多个音频输入,使声音聚焦并跟踪数字变焦的目标。

从 Q5X 的角度来看,AI 是一种推动体育赛事现场音频广泛使用的赋能技术,随着处理能力和速度的提高,AI 将继续发展。我们专注于在比赛期间安全地捕捉来自球员和裁判的高质量音频。这种高质量音频是 AI 发挥魔力之前所需的输入。

Shure 市场开发经理 Ben Escobedo:

尽管人们经常批评 AI 一词只是生成图像或文本的“好玩的玩具”,但未来它有望成为音频行业的宝贵合作伙伴。AI 将帮助自动执行重复性任务并应对复杂挑战,改善音频工作流程并为操作员节省大量时间。AI 助手(例如 Microsoft Copilot)需要一流的音频质量才能有效捕捉和处理语音。Shure 致力于实现这一目标。

人们普遍担心人工智能可能会取代音频行业的职业。然而,人工智能应该被视为助手,而不是替代品。尽管人工智能在不断进步,但人类的理解和有效沟通能力仍然远远优于人类。现场直播和声音制作需要快速、现场思考来解决决定节目成败的关键问题——这是人工智能目前无法复制的。

作者:Dan Daley
原文:https://www.sportsvideo.org/2025/01/15/ai-and-audio-implications-as-the-technology-moves-into-the-broadcast-soundscape/

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/55337.html

(0)

相关推荐

发表回复

登录后才能评论