人脸检测是计算机视觉中应用最广泛的应用之一。它是计算机视觉和模式识别中一个基本而重要的问题。在过去的十年中,多种人脸特征检测方法被引入。然而,基于深度学习和卷积神经网络(CNN)的方法最近取得了巨大的成功。
1. 什么是人脸检测?
人脸检测是一种确定数字图像中人脸的位置和大小的计算机技术。给定一幅图像,人脸识别的目标是确定是否存在人脸,并返回每个检测到的人脸的边界框。其他物体,如树木、建筑物和身体从数字图像中被忽略。人脸检测可以看作是对象类检测的一种具体情况,其任务是找到属于给定类的图像中所有对象的位置和大小。
人脸检测是所有人脸分析算法的第一步,包括人脸对齐、人脸识别、人脸验证和人脸分析。此外,人脸识别还应用于基于内容的图像检索、视频编码、视频会议、人群监控和智能人机界面等多个领域。
基于深度卷积网络的人脸检测,在严重遮挡和头部姿态变化情况下实现高召回的面孔。
2. 人脸检测发展阶段
开端
自20世纪90年代出现以来,人脸检测一直是一个具有挑战性的研究领域。在2000年之前,尽管有很多研究,人脸识别的实际性能还远远不能令人满意,直到Viola和Jones提出了里程碑式的工作。从Viola-Jones (Viola and Jones 2004)的开创性工作开始,人脸检测取得了很大的进展。Viola和Jones率先使用Haar特征和AdaBoost训练人脸检测器,达到了期望的准确性和效率(Viola和Jones 2004年),这激发了后来几种不同的方法。然而,它有几个关键的缺点。首先,它的feature size比较大。此外,它也不能有效地处理非正面的面孔。
早期阶段-机器学习
早期的方法主要是利用计算机视觉领域专家提取不同类型的手工特征,并用传统的机器学习算法训练有效的检测分类器。这些方法的局限性在于,它们往往需要计算机视觉专家来制作有效的特征,并且每个单独的组件都是单独优化的,使得整个检测管道往往是次优的。为了解决第一个问题,人们投入了大量精力来提出更复杂的特征,如HOG(定向梯度直方图)、SIFT(尺度不变特征变换)、SURF(增强健壮性)和ACF(聚合信道特征)。为了增强检测的健壮性,已开发出针对不同视角或姿态分别训练的多个检测器的组合。然而,此类模型的训练和测试通常更耗时,并且对检测性能的提升相对有限。
现阶段-深度学习
近年来,利用深度学习方法进行人脸识别取得了显著的进展,特别是深度卷积神经网络(CNN)在各种计算机视觉任务中取得了显著的成功。与传统的计算机视觉方法相比,深度学习方法避免了手工制作的设计流水线,并主导了许多著名的基准评估,如ImageNet大规模视觉识别挑战(ILSVRC)。最近,应用了最先进的通用目标检测器之一——Faster R-CNN,并取得了很好的效果。此外,通过对CNN cascade、region proposal network (RPN)和Faster R-CNN进行联合训练,实现了端到端优化。使用难负例挖掘和ResNet实现更快的R-CNN人脸检测算法,在FDDB等人脸检测基准上实现了检测性能的显著提升。
3.人脸检测方法
人脸检测是计算机视觉中的一个难题。这主要是因为人脸是一个动态的物体,在外观上具有高度的可变性。近年来,人脸识别技术取得了显著进展。然而,高性能的人脸检测仍然是一个非常具有挑战性的问题,特别是在存在许多微小人脸的情况下。
人脸部位检测有两种方法,(1)基于特征的方法和(2)基于图像的方法。
3.1. 基于特征的方法
技术:基于特征的方法试图找到不变的人脸特征进行检测。其基本思想是基于观察,即人类视觉可以毫不费力地检测出不同姿态和光照条件下的人脸,因此,尽管存在这些变化,但必须有一致的属性或特征。人们已经提出了各种各样的方法来检测面部特征,然后推断出一张脸的存在。例如:边缘检测器通常提取面部特征,如眼睛、鼻子、嘴巴、眉毛、肤色和发际线。基于提取的特征,建立统计模型来描述它们之间的关系,并验证图像中是否存在人脸。
优点:易于实现,传统方法。
缺点:基于特征的算法的一个主要问题是,图像特征可能会由于光照、噪声和遮挡而严重损坏。此外,人脸的特征边界会被削弱,阴影会导致强大的边缘,这使得感知分组算法毫无用处。
3.2. 基于图像的方法
技术:基于图像的方法尝试从图像中的例子学习模板。因此,基于外观的方法依靠机器学习和统计分析技术来寻找“人脸”和“无人脸”图像的相关特征。学习到的特征以分布模型或判别函数的形式,用于人脸检测任务。例如:基于图像的方法包括神经网络(CNN)、支持向量机(SVM)或Adaboost。
优点:性能好,效率更高缺点:难以执行。为了提高计算效率和检测效率,通常需要降维。这意味着通过获得一组主要特征来考虑降低特征空间的维数,保留原始数据的有意义的属性。
4.人脸检测应用
人群监测:人脸检测用于检测频繁出入的公共或私人区域的人群。
人机交互:多个基于人机交互的系统使用面部识别来检测人的存在。
摄影:一些最近的数码相机使用人脸检测来自动对焦。移动应用程序使用面部识别来检测幻灯片中感兴趣的区域。
面部特征提取:像鼻子、眼睛、嘴巴、肤色等面部特征可以从图像中提取。
性别分类:利用人脸检测方法构建了检测性别信息的应用程序。
人脸识别:人脸识别系统旨在通过数字图像或视频帧来识别和验证一个人。
市场营销:人脸检测在市场营销中变得越来越重要,它可以分析客户行为,或用于定向广告。
出席:人脸识别用于检测人的考勤情况,常与生物识别相结合用于门禁管理。
5.主要挑战
人脸检测的挑战,是导致人脸识别准确率和检测率下降的原因。这些挑战包含复杂的背景,太多的面孔在图像中,奇怪的表情,照明,较低的分辨率,人脸遮挡,肤色,距离和方向等。
不寻常的表现:人脸在图像中可能会表现出意想不到的或奇怪的面部表情。
灯饰:一些图像部分可能有很高或很低的照明或阴影。
皮肤类型:检测不同颜色的人脸是检测的一个挑战,需要更广泛的训练图像的多样性。
距离:如果距离相机太高,物体大小(脸大小)可能太小。
取向:人脸的朝向和对摄像机的角度影响人脸检测率。
复杂的背景:场景中大量的物体会降低检测的准确性和速度。
一张图片里有很多张脸:一个具有大量人脸的图像是非常具有挑战性的准确检测率。
面部遮挡:人脸可能会部分被眼镜、围巾、手、头发、帽子和其他影响检测率的物体所隐藏。
低分辨率:低分辨率图像或图像噪声会对检测率产生负面影响。
人脸检测数据集在尺度、姿态、遮挡、表情、外观和光照方面具有高度的可变性。
版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。