AI 算法在视频图像超清修复中的应用

近年来,随着AI 技术的发展,AI 算法广泛应用于计算机图形学(Computer Graphics)和计算机视觉(Computer Vision)的研究中,在图像的感知与处理上形成了一些新技术,总体概括为AI 图像处理技术。其中AI 图像修复技术的应用与我们电视制作领域密切相关。

传统图像处理主要基于数学和物理分析的方法来改变图像的一些属性。比如对图像进行降噪处理,或者增强图像色度等。由于数学和物理模型具有局限性,因此传统图像处理发展遇到瓶颈,增强或衰减图像的某些特性的同时,会导致产生额外的失真或劣化。比如在对图像进行降噪处理时,图像分辨率会有所降低。AI 图像处理在传统图形科学的基础上,引入了AI 深度学习算法,帮助我们解决了这一问题。通过图像结构的深度了解,利用图像冗余性,对因传统图像处理而丢失的图像信息进行补画,从而降低额外图像失真。以深度学习为代表的机器学习,正在逐渐席卷整个图形学研究领域。研究者们逐渐发现,当传统的基于物理的模型发展遇到瓶颈的时候,机器学习的方法也许能够帮助我们解释这些复杂的数理模型。毕竟只有理解了图像的深层结构,才能更好地指导图像的生成和处理。

一 AI 图像处理技术介绍

1. 补画(Image Inpainting)

图像补画技术是一个传统计算机图形学的问题。问题本身很直观:在一幅图像上挖去一部分,如何利用其他信息将缺失部分补全,并且让人眼无法辨别出补全的部分。

这个问题对我们人类似乎很容易,通过我们大脑的想象把它补画出来,但是这个任务对于计算机却显得格外困难,首先这个问题没有唯一确定的解,其次如何利用其他信息?如何判断补全结果是否足够真实?这些问题都必须解决。

随着近几年深度学习在视觉领域取得卓越的效果,视觉领域研究的前沿已经基本被深度学习占领。在这样的形势之下,越来越多的图形学研究者也开始将目光投向深度学习。在图形学和视觉交叉的领域,一系列问题的研究正在围绕深度学习火热展开,特别是在图像编辑(image editing)和图像生成(imagegeneration)方面,已经初见成效。我们讨论的问题,图像补画(image inpainting),正是介于图像编辑和图像生成之间的一个问题。早期基于深度学习的图像补画技术是利用图像已知部分的信息来补全未知部分。如果图像已知部分找不到相似的补丁,那算法将无法进行。利用数据挖掘(data-driven)的方法解决这些问题。对于图像已知部分找不到相似补丁的问题,利用存在的大量图片素材,发现补丁信息,并采用块操作,提高补画效率。该算法对于有着很强帧间和行间相关性的视频修补具有很好效果。图1为训练图库对补全画面的影响。

image.png

2. 图像超分辨率重建

基于卷积神经网络的图像超分辨率重建,是通过端到端的学习来建立低分辨率图像和原始高分辨率图像之间的非线性关系。

第一步:将低分辨率图像通过传统线性插值方法放大到和原始图像同样的尺寸,作为网络的输入。第二步:图像块的提取和特征表示,利用卷积网络的性质提取图像块的特征。

第三步:非线性映射。增加卷积核的个数,将第一步提取的特征,映射到更高维度的空间,建立一种非线性映射关系。

第四步:超分辨率图像重建。再做一次卷积运算, 将高维特征空间映射到高分辨率图像。图像超分辨率实验结果如图2 所示。

3. 帧率提升

帧率提升,对于提高运动图像清晰度具有重要作用。根据我国4K 电视技术标准,帧率为50 帧,而高清电视标准帧率为25 帧。如何提高视频图像帧率,运动估计算法至关重要。运动估计有两种方法,单向运动估计和双向运动估计。

(1)单向运动估计

单向运动估计原理:块匹配算法是将图像分为大小相同的边长为N 的正方形像素集合,假设当前帧为fn,相邻帧为fn-1,以当前帧中坐标为X (x, y) 的某点为中心的宏块BXn,参考帧中相同位置的宏块称为BXn-1,要求BXn 的运动矢量,则通过搜寻包括BXn-1 在内的一个更大的若干宏块组成的区域,按照一定的匹配准则,找到与BX 最相似的块,求出BXn到最相似的块的位移MV,则认为MV 是块BXn 从当前帧fn 到相邻帧fn-1 的运动轨迹,这就是单向运动估计的一般原理。

image.png

(2)双向运动估计

双向运动估计的主要思想可以概括为:以待插帧中的待插块中心为原点坐标,将围绕此中心点的一个边长为R 的正方形定义为搜索区,将此搜索区映射到前一帧和当前帧,以原点对称点的方式寻找最佳匹配块的搜索方案。

(3)运动矢量场的校正

统计出现次数最多的矢量的次数与待修改矢量出现次数的差大于修正阈值时,才进行矢量修正。

(4)运动补偿

通过设置待插值像素,控制两原始帧在生成新的图像帧时所占的比例。待插值像素参数在(0,1)之间时对应着双向运动矢量场插帧 ,待插值像素参数在0 或者1 时对应着单向运动矢量场插帧 。

(5)去除块现象

通过运动估计和插值算法得到内插帧后,会发现帧内产生块现象,这时应该通过合适的去块效应算法来消除或者减轻块效应,得到高质量的内插帧。

4. 彩色增强技术

这里主要介绍近年来比较流行的基于色彩恒常(color constancy)特性的色彩增强。在现代生理学和心理学的启发下,美国物理学家Land 等人设计出了Retinex( 视网膜皮层) 模型,并在符合人眼的颜色恒常性理论前提下,提出了基于Retinex 的图像增强算法。这种算法建立的基础是假设人眼感知目标的亮度和颜色由环境光照和目标表面的反射光照决定,保持目标的颜色恒常性主要就是估计环境光照,并去除环境光照的影像,这样就得到了准确的目标颜色和亮度信息。这种算法具有高动态范围压缩、高色彩保真度和良好的局部细节增强等特点,引起了众多国外学者的兴趣。为准确估计亮度分量,选取计算路径常见有一维和二维的区别。

一般情况下,可以认为算法只有迭代次数一个参数。由图3 可见,迭代次数越小,图像的对比度越小,连读越亮,动态压缩范围越小。迭代次数越大,图像的对比度越强烈。从直方图上看,迭代次数小时,直方图会聚集在一起,随着迭代次数等增加,直方图逐渐分布到全部动态范围内。 当迭代次数特别大时,图像会和原始图像很接近。

image.png
image.png

可见,对一些偏暗图像的增强效果还是很明显。经过测试证明,这个算法对于我们在正常光照下拍摄的照片进行处理有意想不到的效果,可以产生类似HDR 的效果。

二 节目超清修复实例

如何运用AI 图像处理技术进行超清晰度修复,我们首先要对原始视频图像进行分析,找出需要修复的选项。不同时代拍摄制作的节目视频技术指标不同,应用的修复方法也不尽相同。下面就我们在对央视四大名著标清版进行超清晰度修复试验项目应用AI 技术的修复方法进行阐述。

央视四大名著电视剧《红楼梦》《西游记》《三国演义》和《水浒传》都拍摄于上世纪80~90 年代,拍摄设备均模拟标清摄像机,采用标清模拟磁带录制。由于受当时技术条件限制和后期磁带保存环境影响,这4 部电视剧均出现了清晰度差、脱磁、噪波大、边缘锯齿及色彩失真等问题。

根据这些问题我们确定修复目标是:

◆降噪。在最大限度保持原有画面清晰度的情况下去除画面上的噪波。

◆修复画面损伤。去除边缘锯齿和画面拉道等损伤。

◆增强画面分辨率。将标清画面增强处理为高清画面。

◆色彩增强。将色彩空间由BT.601 色域增强为BT.709 色域。

◆宽高比变换。将4:3 画幅变换为16:9 画幅。

确定修复目标后,我们测试并确定的修复技术方法:根据对标清版四大名著电视剧技审结果,确定这4 部电视剧修复成高清版需修复项目为:

◆采用低损失的小波算法降噪器去除图像上的噪波,并用AI 算法辅助补画丢失图像细节,使得降噪后的画面基本保持原有图像分辨率。图5 所示的两个截图,显示了降噪+ 补画后的效果。

image.png

◆采用AI 补画算法和AI 边缘处理算法,对图像缺失部分进行补画,对物体边缘进行重构。

image.png

◆采用AI 超分辨率算法提高画面分辨率,采用帧率提升算法提高视频帧率,增强运动画面清晰度。

image.png

◆采用AI 色彩增强技术,辅助人工主观色彩评价,增强图像色域范围。

◆ AI 人脸识别技术,辅助人工主观评价,对4:3画面按16:9 重新构图,输出16:9 画幅图像。

image.png

三 总结

传统图像处理技术与AI 算法结合,突破了传统图像处理技术瓶颈。降噪技术与AI 补画技术结合,在降噪的同时,保持了原有图像清晰度;上变换技术与AI 清晰度增强技术结合,达到超清晰度变换;调色技术与AI 色彩增强技术结合,拓展了图像色域范围。结合AI 算法的图像处理技术对老节目图像修复具有突破性意义。

参考文献:

[1] C. Dong, C. C. Loy, K. He, and X. Tang. Image super-resolution using deepconvolutional networks. IEEE.

[2] https://blog.csdn.net/piaoxuezhong/article/details/78248219.

[3] 杨爱萍,董翠翠,侯正信,等. 基于多帧运动估计的帧率提升算法[J]. 计算机应用研究,2012,29(10):4.

转载请注明来源:《现代电视技术》 作者:中国国际电视总公司 罗威

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐

发表回复

登录后才能评论