8K超高清视频质量客观评测方法研究

8K超高清视频质量评估是确保用户视觉体验的重要环节,由于8K超高清视频具有复杂度高、数据量大等特点,如何对8K超高清视频质量进行客观有效的评估,是目前一项研究热点。本文深入研究了影响8K超高清视频质量的关键因素,提出了一套8K超高清视频质量的客观评测方法。

作者:国家广播电视总局广播电视规划院 王惠明 欧臻彦 王倩男 刘汉源
来源:选自2022年第10期《现代电视技术》

目前,8K超高清电视节目已进入我国百姓生活,成为满足人民群众美好生活需求的一项重要举措。高质量的8K超高清节目,能够给观众带来更丰富、更真实的视觉享受;而低质量的8K节目,则会损害8K品牌,影响我国超高清电视的健康发展。因此,对8K超高清视频质量的科学评估,是一项重要而迫切的工作。

由于8K超高清电视具有复杂度高、数据量大等特点,如何科学高效地评估8K超高清视频质量,是一个业界难题。本文所说的8K超高清视频质量,主要是指视频的技术质量,用于反映视频拍摄、制作的技术水平。对于技术质量的评估,传统方法主要依靠专业人员的主观评价,这种方法工作量大,且对评估条件要求苛刻,不易实施。因此,基于客观测试的评估方法呼声很大。

本文首先研究了影响8K超高清视频质量的关键因素,进而针对性提出了8K超高清视频质量的客观评测方法,并建立了一套8K超高清视频质量的评测指标体系,可实现对8K超高清视频质量的有效评估。

一、影响8K超高清视频质量的关键因素

提到8K超高清,多数人都会联想到5个技术特征:分辨率、帧率、色域、动态范围、量化深度。相比于传统高清电视,8K超高清在这5个维度确实都有大幅提升,能够为观众带来更好的视觉体验。而从实际应用来看,除了这5个因素之外,还有一项重要因素,那就是压缩损伤。如图1所示,这6个因素将对8K视频质量产生不同的影响。

图片

1. 分辨率

分辨率,是超高清视频的典型特征,也是影响画面清晰度的最重要因素。分辨率本质上描述的是每帧图像的像素总数,我们可以把这些像素理解为一个个容器,只有具备了足够数量的容器,才有可能获得足够的清晰度。但是,只有容器是不够的,还需要考虑容器中的内容。
图片

如图2所示,当所有像素的像素值都相同时,这个画面其实是一个平场信号,没有纹理,无法评估清晰度;而当像素排列是黑白条纹时,就可以根据条纹的密度来评估清晰度,因此,对于8K超高清视频而言,分辨率决定了其清晰度的上限。

分辨率与屏幕尺寸和观看距离具有重要关系。目前家庭用户观看高清电视机的距离大约2.1米,如果保持收视习惯不变,当采用8K超高清分辨率后,由于像素数量提升了16倍,在保证足够PPD的情况下,屏幕尺寸可以大幅提升,从而带来更宽的观看视野,使人更加身临其境。因此,分辨率不仅直接影响画面的清晰度,同时也是影响视频临场感和真实感的关键因素。

2. 色域

色域是保障画面色彩还原准确性、提升色彩细腻程度的关键因素,也是超高清视频与其他视频的重要区别之一。

广播电视多年以来一直采用的是ITU-R BT.709色域,如今随着显示技术的发展,显示设备的色域越来越宽。ITU-R BT.2020标准中规定的超高清色域是基于CIE 1931 XYZ空间,将R、G、B三基色色度坐标选在了可见光谱色轨迹上,包含了大部分真实表面色。
图片

如图3所示,从色域的覆盖面积来看,BT.2020色域是ITU-R BT.709色域的1.9倍,因此超高清色域能够更好地还原自然界的真实色彩,从而使视频体验更加逼真。

色域对视频质量的影响,首先是色域面积的大小问题。对于色彩丰富的场景,色域的大小决定了画面能否呈现出应有的色彩饱和度以及色彩层次,当用BT.709视频去展示BT.2020色域场景时,高饱和的色彩将出现色彩过曝。另一个影响,是色域的匹配问题。虽然人们往往并不知道一个视频的真实场景颜色,但是,当视频色域与显示终端不匹配时,可能导致画面效果与人眼的经验感知不一致,从而产生不真实感。例如,观众看到红旗不是红色,或者树叶不是绿色,等等。

3. 高动态范围

高动态范围(HDR)是保障画面亮度动态,增加画面层次感和真实感的关键因素。

HDR技术具有3个关键要素:暗部、亮部、曲线。

“暗部”主要指画面黑电平的亮度,传统电视的黑电平亮度在0.01cd/m²到0.1cd/m²之间。HDR要求更高一些,ITU-R BT.2390报告书的实验结果表明0.005cd/m²的黑电平亮度才能让90%观看者满意,如图4所示。黑电平亮度的高低,决定了图像暗部层次的细节展现能力。

图片

“亮部”是图像的高光亮度和漫射白亮度。自然界真实景物其实可以达到非常高的亮度,如果要做到所见即所得,那么显示设备的亮度理论上应该与真实景物亮度一致,但是以目前的产品水平而言,显然还无法实现,业界通常认为10000cd/m²的高光已经能够满足人眼需求。制作HDR视频时,其实不是一味追求高亮度,更重要的是整体亮度和高光亮度的协调,使得画面有明亮的感觉,同时又有丰富的层次和高光细节。

“曲线”是指图像信号的非线性转换,包括OETF、EOTF和OOTF。非线性转换的目的主要有两个,一是由于数字编码的资源有限,为有效利用资源,对不同亮度的区域分配不同的比特资源。另一个是早期为了弥补CRT显示器的EOTF特性而加入的。HDR标准对曲线的定义包括两类,一类是PQ曲线,另一类是HLG曲线。PQ曲线采用绝对亮度原理,即场景的每一个亮度都严格对应输出电信号的一个样值,是一一对应的关系。而HLG的曲线是采用相对亮度的原理,每个场景中的最大亮度对应于输出电信号的最大值,实际亮度与电信号是比例关系。

HDR技术在超高清视频中的应用可实现更大曝光动态范围,能更好提取和显示高光及暗部细节,丰富色彩和层次,提升画面质感,增强纵深感,使画面更趋近自然。

4. 帧率

帧率是保证画面连贯性和物体边缘清晰度的重要因素,尤其对于8K超高清,摄像机的轻微摇移都可能造成画面边缘的模糊,因此,需要结合高帧率来提升画面效果。

电视技术发展初期,视频帧率相对较低,因此使用隔行扫描技术来提高画面切换频率,弥补帧率的不足,例如50I(帧率25Hz)。随着技术的发展和用户收视体验需求的提升,对电视帧率的要求也在不断提高,尤其是在分辨率提高到4K和8K后,单纯增加图像的像素数量而不提高帧率,只能提高两维静态图像分辨率,无法重现高质量的活动图像。高帧率可以很大程度上改善低帧率情况下经常出现的运动画面跳跃和边缘模糊现象。我国8K超高清电视行业标准规定的帧率是50P起步,其目的就是为了保障8K超高清的极致视频体验。

5. 量化深度

量化深度,是提升画面层次,让画面更细腻、过渡更自然的重要因素。

多年来,标清电视和高清电视一直沿用的8比特或10比特量化。随着图像质量的不断提升,量化比特数的要求也越来越高。其决定因素主要是人眼视觉系统对图像对比度的敏感函数,也就是人眼所能察觉到的灰阶不连续的临界点。
图片

根据不同的数学模型,可以绘制不同的临界曲线,例如ITU-R BT.2246中的Barten和Schreiber曲线,如图5所示。

ITU研究了SDR条件下不同量化比特数与对比度重现特性的关系。如果以Schreiber曲线为临界线,则10比特量化即可满足要求。如果以Barten(flat)曲线为临界线,则即使是12比特也无法完全满足要求。如果以Barten(ramp)曲线为临界线,则12比特足够,10比特不够。相关的试验模型,本质目的都是为了让画面的层次更加细腻,使得画面中的灰阶变化更加均匀,从而进一步提升人眼的观看舒适性。

6. 编解码压缩损伤

正如前面所述,当节目制作环节把8K超高清视频的五大维度把控好之后,技术特点基本上都能得到充分的发挥,视频质量也能达到较高水平。然而,大部分用户看到的8K超高清视频,实际都不是制作环节直接输出的视频,而是经过网络传输分发之后的视频。由于网络带宽资源有限,视频传输分发的编码码率通常比较低,并且主要采用4:2:0压缩,此时,编码压缩所造成损伤多种多样,可能出现块效应、噪声、模糊、色彩失真等问题,这些问题对视频质量具有重要影响,有时甚至比节目制作更重要。

如图6所示,左半边为无压缩视频,右半边为压缩编码后的视频,可以看到,压缩视频质量损伤较为明显。因此,编解码压缩损伤是视频质量不可或缺的一项内容。

图片

二、8K超高清视频质量客观评测方法

1. 概述

前面已经提出了影响8K超高清视频质量的关键因素,评估8K超高清视频质量需要从这些关键因素入手进行多维度综合考虑,才能得到较为准确的评估结果。评估的方法通常包括主观评价和客观测试,主观评价与实际观看体验更加接近,但是测试组织难度较大,周期较长,仅适合于要求高、规模小的测评。而常规的测试,更适合采用客观测试方法。为此,本文研究提出了一种面向8K超高清视频质量的客观测试方法,如图7所示。

图片

该方法以8K超高清视频的关键要素为出发点,围绕各要素,从视频格式参数和视频图像内容两个层面,分别设计了基于空域和频域的8K图像清晰度评测、基于色域的图像显示色彩评测、基于光信号域的高动态范围评测、基于时域的有效帧率评测、信号量化特性评测、8K无参考图像质量评测等,从而实现对8K视频在清晰度、连贯性、色彩、层次、真实感等方面的质量评估。

2. 视频格式参数检测方法

视频格式参数是一个视频的基础信息,它标称了视频最终制作环节的视频格式。视频格式参数是衡量视频质量的必要条件,但不是充分条件,因为高质量的8K视频,其视频格式一般都是符合8K标准的,而视频格式符合8K标准了,其视频质量并不一定能够达到8K视频应有的质量要求。

本文研究的视频格式参数检测算法,主要按照我国超高清电视视频格式的技术参数标准GY/T307—2017《超高清晰度电视系统节目制作和交换参数值》和GY/T 315—2018《高动态范围电视节目制作和交换图像参数值》的相关要求,对被测视频文件中的视频格式参数进行自动提取,包括有效像素数、帧率、彩色体系、量化比特数、动态范围、幅型比、扫描模式、取样结构等,并与标准中的相关技术要求进行对比分析,判定视频格式是否符合标准的要求。

3. 基于频域和空域的8K图像清晰度评测

在8K视频中,有一部分是由低分辨率上变换而来的,上变换的过程,本质上是插值的过程,如果效果不好,很容易造成画面模糊、清晰度降低。另外,由于拍摄虚焦或设备处理不当,也可能导致清晰度降低。本文围绕图像清晰度的特性,研究提出了基于频域和空域的频谱特征分析算法,该算法基于超高清视频数据库,对视频空域特征和频谱特征进行分析,研究图像清晰度与空域特征和频谱特征方面的内在联系,并采用基于机器学习的频谱分析模型进行训练,使得训练后的模型能够对未知的被测视频进行自动分析,并预测该视频的清晰度。

4. 基于色域的图像显示色彩评测

传统的视频色彩测量,通常会采用闪电图(lighting)和矢量图(vector)来衡量视频信号的色彩饱和度和相位情况。而对于8K超高清视频,由于涉及不同的伽马曲线,并且是BT.2020色域,基于视频信号的闪电图和矢量图并不能反映真实的显示色彩特性。

例如,同一个图像的HLG/BT.2020和SDR/BT.709版本,如图8所示,从矢量图来看,显然SDR/BT.709矢量信号更饱满,而如果通过专业监视器正确显示呈现后,实际是HLG/BT.2020视频色彩更饱和,二者有所矛盾。

图片

如图9所示,如果通过CIE色度图进行分析,可以看到HLG/BT.2020的色域分布更广,与人眼的主观感知更加接近。因此,只有通过正确地呈现计算,才能有效评估色彩的实际情况。

图片

本文研究提出的基于色域的图像显示色彩分析算法,就是突破基于信号的测量方式,通过相关算法,将被测8K视频每个像素值,按照其EOTF曲线类型(HLG、PQ、SDR)和色域类型,映射到CIE色度空间,再通过对CIE坐标值的计算分析,得到图像中各像素的色域分布情况,实现对图像色域的定量分析。基于现阶段的应用需求,重点统计分析的是视频中BT.2020色域帧数的占比。高质量的8K视频,通常具有BT.2020色域帧,但是,如果画面场景本身的色彩范围比较窄,拍摄的视频没有达到BT.2020色域也属正常情况。

5. 基于光信号域的高动态范围评测

传统的视频亮度测量与色彩测量类似,都是基于视频信号域的波形测试。而对于高动态范围8K视频,其实际显示亮度与EOTF曲线和色域息息相关,基于视频信号的分析往往不能反映实际观看感受。本文研究提出的基于光信号域的高动态范围评测方法,也是通过相关算法,将被测 8K 视频每个像素值,按照其EOTF曲线和色域,转换为与人眼感知更接近的CIE亮度信息,并对所有像素的亮度信息进行计算分析,从而得到图像的亮度及对比度特征,实现对图像高动态范围的定量分析,如图10所示。

图片

在HDR视频制作过程中,如果控制不当,镜头切换时图像可能出现较大的亮度差。有研究表明,过大的亮度差容易引起人眼的不舒适,严重时甚至会引发癫痫。因此,在评估HDR时,还需要考虑帧间亮度差,即对所有图像帧进行平均显示亮度检测,计算帧间显示亮度差。

6. 基于时域的有效帧率评测

众所周知,帧率越高,视频效果越好。但是,高帧率视频的制作,需要很多必要条件,成本也很高,尤其对于一些早期拍摄的8K节目,往往只有25P或30P,这些节目在后期制作时可能通过帧率上转换(也称为插帧),将25P转为50P。转换后,视频格式参数中的帧率值变成了50P,视频中每秒的帧数也的确是50帧,但是,插帧出来的画面与原生50P拍摄的画面,往往存在质量差异。

插帧的方式主要有三类,第一类是采用帧复制或帧平均方式,这种方法最简单,画面效果也最差;第二类是运动补偿方式,是对视频中的前后帧进行运动预测,得到中间帧,提高画面内容的自然度;第三类是采用AI算法插帧,这种算法不再依赖前后帧的数学运算,而是用AI模型“造”出中间帧。

不同算法的插帧效果参差不齐,为了筛选出较低质量的插帧视频,本文研究提出了基于时域的有效帧率分析算法,对被测8K视频进行逐帧计算分析,利用特定的算法,检测视频帧中是否存在插帧图像,从而预测该视频是否存在视频帧率上转换,实现对视频有效帧率的分析。

7. 信号有效量化特性评测

信号量化深度是影响图像画面细腻程度的关键因素,真正的高质量视频,其量化比特数应尽量达到10bit以上。然而,部分8K视频由于各种原因,在前期制作过程中的图像量化只有8bit,最后输出成品节目时,再通过软件上采样,形成10bit。比特数的上采样,有不同的方法,包括末尾填零、填充固定数值或随机填充等,也有通过AI算法实现的比特增强。但是,本质上,上采样后的信号,实际有效量化比特数其实只有8bit。

本文研究提出的信号有效量化特性分析算法,采用基于空域特征的方法,分析被测视频样值中比特位特征,从而预测该视频是否存在量化比特数的上采样,筛选出量化特性不好的画面。

8. 8K无参考图像质量评测

针对压缩编解码损伤质量的评估,主要是通过图像质量测试模型来实现。由于被测8K视频通常是泛在的视频,一般找不到原始的参考源视频,因此,本文研究的测试模型是一种基于机器学习的8K无参考图像质量评测模型,基于视频质量主观评价数据库进行训练,得到最优模型参数,实现对8K图像帧的无参考客观质量评价,进而利用视频时域特征,对图像帧进行加权分析,得到整个视频的最终质量评分。

三、8K超高清视频质量评测指标体系

针对前文所提出的8K视频质量客观评测方法,为了实现对相关评测结果的量化和评分,更简洁地描述8K视频的整体质量,本文研究提出了一套评测指标,并对大量8K超高清视频进行指标试验测试,总结出各项指标的量化评估方法及综合加权系数,形成一套评测指标体系,如表1所示。

图片

1. 客观感知视频质量

客观感知视频质量是指通过客观测量方法所获得的反映主观感知效果的视频质量指标。本文通过8K无参考评价模型对每帧图像进行单帧评分,再对所有帧进行加权平均,得到视频的最终得分,分值越高,表明视频中图像整体质量越好。

2. 原生帧率画面占比

原生帧率画面占比是指被测视频中,刨除“插帧图像”之外的图像帧数与视频总帧数之比,原生帧率画面占比越高,说明视频中插帧画面越少。

3. BT.2020图像帧占比

BT.2020图像帧占比是指被测视频中BT.2020图像帧的帧数与视频总帧数之比。其中,BT.2020图像帧是指一帧图像内超出BT.709色域的像素占比达到1%的图像帧。

4. HDR图像帧占比

HDR图像帧占比是指被测视频中,HDR图像帧的帧数与视频总帧数之比。其中,HDR图像帧是指一帧图像内亮度超过203cd/m²的像素占比达到1%且帧内对比度达到10000:1的图像帧。

5. 图像亮度特性

图像亮度特性主要衡量视频中帧平均亮度过高或帧间亮度差过大的情况,通过统计相关频次进行评分。

6. 有效量化特性

有效量化特性是对被测视频图像帧中的像素量化比特信息进行分析,并与标称值进行比对,当实际分析结果与标称值一致时,说明量化特性符合预期,最后统计符合预期的图像帧数占比。

四、结束语

基于本文提出的评测方法,广播电视规划院已经研发了一套8K超高清视频质量自动化评测系统,并且在全国第一只8K超高清节目扶持资金“北京市8K超高清视频制作专项扶持项目”中进行了应用,为项目扶持提供了重要技术支撑。但是8K超高清视频质量的评测是一项复杂的工程,本文所提出的客观评测方法在一定程度上实现了对高质量和低质量8K视频的鉴别,但仍然存在很多改进的空间。广播电视规划院也将持续推进相关研究和测试,不断完善评测方法和系统,力争为行业提供更好的技术服务,助力我国超高清产业健康发展。

本文受国家重点研发计划资助(National Key R&D Program of China),“4K超高清电视制播系统研制”项目,项目编号:2019YFB1804300(课题一:2019YFB1804301)

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐

发表回复

登录后才能评论