AVS3 vs VVC:AVS标准解析系列三

AVS3与VVC作为正在制定的新一代视频编码标准,具有相似又独立的编码工具。本文将从各个模块的编码工具对AVS3和VVC进行简要对比和分析。

表1  AVS3与VVC的编码技术对比

图片
图片

表1中对比了AVS3和VVC对应的重要编码结构和工具。针对更高分辨的图像和视频,AVS3和VVC均扩展了最大编码单元为128×128,并采用了基于四叉树-二叉树的编码单元划分结构。不同的是AVS3新增了扩展的四叉树划分结构,进一步将编码单元划分为四个不等的子单元。而VVC采用的是三叉树划分结构,将编码单元划分为三个子单元。两者都能直接地包围块边界上的小对象并灵活地捕获中间部分的特性。编码块的划分是视频编码的核心技术,更大的编码单元块和更灵活的编码单元划分结构可以充分根据视频内容的特性进行划分处理,极大地提高了编码性能。AVS3中针对帧内预测单元采用了衍生模式树结构(DT), VVC中使用了帧内子块划分结构(ISP),两者都是AVS2中的帧内短距划分的增强版,能有效减小帧内预测单元远距离边界的残差。而对于帧间的预测单元,VVC中采用了三角划分模式,使用非方形的对角划分预测,可以更适应复杂多变的视频场景。

在帧内预测模式中,VVC扩展了角度预测模式至65个,并增加MPM至6个,如图1所示。相比于AVS3的30个角度模式加2个MPM,可以有效地提升预测准确性并保持保证编码比特的消耗。色度线性模型预测模式也同时应用在AVS3和VVC中,作为色度的扩展模式可以大幅提升色度分量的编码性能,减少编码比特的同时也提升了亮度分量的性能。为了有效消除帧内预测边界像素点的块效应,AVS3和VVC中均采用了帧内滤波技术。AVS3通过分析参考像素与预测值的关系,训练得到针对不同块大小和不同位置像素点的滤波系数;VVC则是利用滤波和未滤波的参考像素对预测值进行加权滤波。两者都可以有效消除帧内边界像素点的块效应。除此之外,VVC还采用多行预测技术,扩充参考边界为多行,可减小单行预测引入的噪声。

图片
图片
图1 VVC中的65个角度方向和多行预测的参考行

在帧内预测模式中,AVS3和VVC均保持了前向、后向和双向的预测模式,并使用8插头的DCT滤波进行分像素的插值滤波,只是滤波系数略微不同。在skip/direct/merge模式中,AVS3和VVC从候选建立、运动矢量修正等方面进行了提升。包括使用基于历史信息的运动矢量预测(HMVP)扩充运动矢量列表;使用高级运动矢量表达技术(UMVE)对运动矢量进行精细化的修正;采用仿射变换补偿(Affine)对具有缩放、旋转、透视运动和其他不规则运动的物体进行更准确的预测。AVS3和VVC中均扩展了运动矢量精度的候选,AVS3中增加至5个运动矢量精度,而VVC中增加为3个运动矢量精度。基于此,AVS3对固定的运动矢量精度绑定了基于历史信息的运动矢量候选,在性能和复杂度之间达到了较好的平衡。VVC中则通过子块时域运动矢量预测技术(SbTMVP)增加了运动矢量预测的候选,做法如图2所示,从时域同位块为当前编码块的每个子块导出运动矢量候选。两者都可以提升运动估计的准确性。除了上述技术,VVC中还新增了多项帧间预测技术。包括使用解码端运动矢量修正技术(DMVR)进一步修正双向预测的运动矢量。如图3所示,DMVR在编解码端均利用模板匹配的方式修正当前运动矢量而不需要传递语法元素;使用双向光流技术(BDOF)进行像素点级别的运动信息修正;使用帧内帧间结合预测技术(CIIP)提升merge模式的预测准确性。在运动矢量存储方面,AVS3采用了16×16的存储单元相比于VVC的8×8存储单元减轻了硬件存储的负担但损失了编码性能。

AVS3 vs VVC:AVS标准解析系列三
图2 SbTMVP的运动矢量导出过程
图片
图3 DMVR解码端的双向模板匹配过程

对于变换模块,AVS3和VVC均增加了DCT8和DST7两种主变换核,并扩展最大的变换块大小为64×64。AVS3中采用基于位置的变换技术对处于不同位置的变换单元使用不同的行列变换核,能有效地适应帧间残差的分布规律,并在提升变换性能的同时具有较低的复杂度。VVC中则采用了多变换核选择技术(MTS)通过率失真优化的方式选择最优的行列变换组合方式,复杂度较高但大幅提升了变换模块的性能。AVS3中对变换单元中左上角的4×4块采用了基于KLT二次变换,而VVC中则对4×4和8×8块使用了低频不可分离的二次变换(LFNST)。不可分离的变换相比于分离的变换具有更好的变换性能,但存储和计算复杂度高,对硬件设计不友好。VVC中采纳了基于归零的不可分离二次变换技术,实现了继多候选变换技术的又一次技术跨越,提供了变换模块性能的显著提高。

图片

在量化模块,AVS3中仍采用率失真优化量化技术(RDOQ),VVC中在此基础上提出了依赖的标量量化(DSQ)。两者都是结合量化和熵编码过程,通过率失真代价选择最优量化系数大幅降低码率提升编码性能。但依赖的标量量化相比于独立的量化减小了因调整量化系数引起的失真,进一步提升了编码性能。

AVS3与VVC均支持灵活的参考结构,其B帧的两个参考帧列表也均不再限制参考帧的显示顺序。不同的是,AVS3中通过解码顺序索引的差来标识被参考的帧,而在VVC中,通过参考帧之间的显示距离来进行标志。针对监控视频等视频内容,AVS3可通过在系统层额外传输知识图像以用作参考,而VVC中支持设置图像为长期参考帧,实现该类视频的高效编码。

下一代视频编码标准主要面向8K超高清视频,而8K超高清视频的处理相比4K超高清其计算量成倍增加,与此同时,受到半导体工艺的限制,单核计算能力的提升逐渐达到瓶颈,有必要通过并行处理方法进行加速,实现低延时的编解码处理。在AVS3中,采用了基于分片的并行编码设计,可将图像按矩形划分成多个区域,相比于以往的Slice划分能够进一步提升并行粒度。在VVC中,除了HEVC的Slice、Tile划分基础上,增加了brick级并行,其中,brick由Tile中的一行或数行CTU组成,brick之间的熵解码过程独立。

总体来说,AVS3和VVC作为同一代标准,拥有相似的编码框架和编码工具。但基于相似的编码思想,两者的编码技术都各有创新。

作者:冯亚楠 | 来源:公众号——青榴实验室

系列阅读:

AVS概述和发展史(AVS标准解析系列一)

AVS标准解析系列二:AVS3视频编码关键技术

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐

发表回复

登录后才能评论