增强x265开源HEVC视频编码器: 降低比特率和场景变化检测的新技术

由于对带宽的要求越来越高,特别是随着更高的设备分辨率的出现,对降低视频传输比特率而不影响视觉质量的需求也在增加。HEVC视频编码标准适合解决这一问题,它能以比其前身(H.264/AVC)低得多的比特率提供高视频质量。

这篇文章探讨了两种增强 x265 开源视频编码器的新技术:运动补偿时域滤波方案和基于直方图的场景变化检测方案。

这些技术有助于提高编码增益和提高视频编码效率。

技术 1:运动补偿时域滤波方案

x265 编码器符合H.265/MPEG-HEVC 视频编码标准,在开源框架、广播和流媒体服务提供商中广受欢迎。它包含了 HEVC 标准中定义的几乎所有工具,并具有平衡编码器性能和输出质量的算法优化。

该编码器通过利用 AVX2 和 AVX-512 指令最大限度地提高 x86 CPU 的性能,从而进一步提高效率。

最近的 x265 开发工作主要集中在增强运动补偿时域滤波 (MCSTF),该滤波用作预处理步骤,以进一步提高编码增益。

该方案有效地减少了图片中的噪声,特别是在内容包含高噪声水平的情况下。通过利用从不同视频内容分辨率的运动估计中获得的运动向量,MCSTF 识别最佳时间。

增强x265开源HEVC视频编码器: 降低比特率和场景变化检测的新技术

低通滤波的对应关系。分层运动估计方案可实现高效的运动矢量处理,有助于提高降噪能力。

目标受众和可用性:

运动补偿时域滤波方案是减少使用 x265 视频编码器编码的视频中的噪声的强大工具。这在内容包含高噪音水平的场景中非常有用。认为该技术有价值的应用程序和用户包括:

(1) 广播公司和流媒体服务提供商:通过利用 HEVC 视频编码标准的优势,这些提供商可以显着降低其 OTT 内容的比特率,而不会影响视觉质量。

运动补偿时域滤波方案增强了编码,提高了编码增益并提高了视频传输效率。

(2) 视频流平台和内容分发网络(CDN):随着对流式传输高质量视频内容的需求不断增长,这些平台可以利用运动补偿时空过滤方案来优化带宽利用率。通过减少视频噪声,该方案可以实现更高的压缩比,同时为观众提供愉悦的视觉体验。

技术2:基于直方图的场景变化检测方案

增强 x265 编码器的另一个重点领域是场景变化检测

自动提取关键视频信息对于索引、场景分析和提高编码效率至关重要。所提出的基于直方图的场景变化检测方案提出了一种新颖的算法,用于检测逐渐和突然的场景变化,同时降低了计算复杂度。

该算法通过将每个图片/帧划分为多个区域并分别计算每个区域的图片统计数据(直方图、方差、平均像素强度)来进行操作。根据亮度和色度方差确定阈值,并评估区域直方图和整个图片的平均直方图之间的差异。通过考虑强度对比度和方差,该算法有效地检测场景变化。

增强x265开源HEVC视频编码器: 降低比特率和场景变化检测的新技术
图2 基于直方图的场景变化检测

实验结果证明了所提出方案的可靠性和效率,显着节省了比特率并降低了计算复杂性。该算法检测场景变化的能力会影响视频中 I 帧的位置,从而有助于降低比特率并提高编码效率。

目标受众和可用性:

基于直方图的场景变化检测方案提供了一种有效的解决方案,用于自动检测使用 x265 编码器编码的视频中的场景变化。认为该技术有价值的应用程序和用户包括:

(1)视频索引和场景分析系统:场景变化检测对于自动从视频中提取关键信息进行索引和场景分析至关重要。基于直方图的方案可以实现可靠、高效的场景变化检测,增强这些系统的功能并提高其准确性。

(2)视频流媒体平台和内容推荐引擎:通过检测场景变化,流媒体平台可以优化视频分割,完善内容分类,为观看者提供更准确的推荐。基于直方图的场景变化检测方案使这些平台能够有效地识别和分析视频中的过渡。

结论

在保持视觉质量的同时降低视频传输比特率的持续需求导致了增强 x265 开源视频编码器的新技术的开发。

  • 运动补偿时域滤波方案利用运动矢量和分层运动估计来减少图像噪声。
  • 同时,基于直方图的场景变化检测方案自动检测场景变化,从而提高编码效率。

这些技术扩展了 x265 编码器的功能,使其成为本地和基于云的 HEVC 编码的流行选择。通过整合这些进步,视频流服务提供商、开源框架和其他用户可以显着降低比特率,优化带宽需求,并有效地提供高质量的视频内容。

总体而言,x265 编码器的持续开发工作表明了我们致力于不断增强视频编码增益并满足行业在带宽、视觉质量和场景分析方面不断变化的需求。

接下来是什么?以下是一些可以建立在所提出的两种技术基础上的技术想法:

联合优化:探索联合优化运动补偿时空滤波方案和基于直方图的场景变化检测方案的可能性。研究这两种技术如何相互补充,以进一步提高视频编码效率和视觉质量。

自适应滤波策略:在运动补偿时域滤波方案中开发自适应滤波策略。探索根据内容特征(例如场景复杂性、运动强度或噪声水平)动态调整过滤参数的技术。这种自适应方法可以优化不同类型视频的降噪效果,进一步提高视觉质量。

运动估计细化:研究运动补偿时域滤波方案中运动估计细化的先进技术。探索提高运动矢量估计的准确性和效率的方法,例如分层或预测算法,以增强时间对应性并实现更好的降噪。

场景变化检测优化:通过探索替代统计测量和特征表示来提高准确性,增强基于直方图的场景变化检测方案。考虑结合深度神经网络等机器学习技术来学习复杂的场景变化模式并增强检测性能。

多模态方法:结合不同的模态,例如音频和视觉提示,以实现更强大和更准确的场景变化检测。研究如何将音频分析技术(例如音频能量或频谱内容的突变)与基于直方图的方案集成,以提供多模式场景变化检测解决方案。

能源效率优化:考虑运动补偿时空滤波方案和基于直方图的场景变化检测方案的能源效率优化。探索可以降低计算复杂性或功耗,同时保持甚至增强编码增益和场景检测精度的技术。

硬件加速:研究硬件加速技术,例如利用 GPU 或专用硬件架构,以进一步增强这两种技术的性能。探索并行处理和优化的内存访问模式如何加快这些方案的执行,并以降低的功耗实现实时或近实时视频编码。

通过追求这些技术思想,所提出的技术可以进一步细化和扩展,从而在视频编码、降噪、场景变化检测和整体视频处理方面取得进步。

作者:Ashok、Santhoshini Sekar 和 Shivakumar Narayanan。

本文为原创稿件,版权归作者所有,如需转载,请注明出处:https://www.nxrte.com/jishu/28580.html

(2)

相关推荐

发表回复

登录后才能评论