人脸检测是计算机视觉和模式识别中的一个基础性和重要问题,近几十年来得到了广泛的研究。人脸检测是人脸识别、人脸识别和人脸聚类等许多后续应用的重要步骤之一。近十年来提出了许多人脸检测方法,早期的文献研究主要集中在计算机视觉领域的专家提取不同类型和工艺的特征,并培训有效的分类人员,以便使用传统的机器学习算法进行检测和识别。近年来,与传统的计算机视觉方法相比,深度学习方法,特别是深度卷积神经网络(CNN)在从图像分类到目标检测和语义分割等各种计算机视觉任务中取得了显著的成功,随着深度学习在计算机视觉领域的普及,探索深度学习解决人脸检测任务的研究也日益受到重视。一般来说,人脸检测可以看作是计算机视觉中一种特殊的目标检测任务。因此,研究人员试图通过探索一些成功的深度学习技术来解决一般目标检测任务中的人脸检测问题。下文主要介绍了当前主要的人脸检测算法和相关工作以及WIDER FACE人脸检测数据集。
- WIDER FACE人脸检测数据集
公共可用基准,如FDDB,AFW和PASCAL FACE促进了人们对人脸检测研究的兴趣和进展。然而,随着算法性能的提高,需要更具挑战性的数据集来触发进展并激发新的想法。当前的人脸检测数据集通常包含几千个人脸,在姿态、比例、面部表情、遮挡和背景杂波方面的变化有限,因此很难评估真实世界的性能。为了便于未来的人脸检测研究,引入了是现有数据集的10倍大的WIDER FACE [1]数据集。数据集由32203个带有393703个标记的人脸的图像组成,包含丰富的注释,包括遮挡、姿势、事件类别和面边界框。
使用WIDER FACE数据集,通过实验测试了有代表性的人脸检测方法,相比其他人脸检测数据集有更好的效果。因此,WIDER FACE可以作为目前最为有效的人脸检测算法训练源。
- 主流人脸检测算法
在计算机视觉文献中,人脸检测已经研究了几十年。现代人脸检测算法可分为四类:基于级联的方法、基于部件的方法、基于通道特征的方法和基于神经网络的方法。
Viola和Jones [2]的开创性工作引入了积分图像来计算恒定时间内的Haar-like特征。然后利用这些特征学习用于人脸检测的具有级联结构的AdaBoost分类器。后来的各种研究都遵循类似的思路。在这些变体中,SURF cascade实现了有竞争力的性能。Chen [3]等人在相同的级联框架下,共同学习人脸检测和对齐,获得了良好的检测性能。基于部件的方法中熟知的一个是可变形部件模型(DPM)。可变形部件模型将一个面定义为一组部件,并通过潜在支持向量机对部件的连接进行建模。与基于级联的方法相比,基于部件的方法对遮挡具有更强的鲁棒性。聚合通道特性(ACF)最初由Dollar等人[4]提出以解决行人检测问题。后来,杨等人[5]将此思想应用于人脸检测。特别是,梯度直方图、积分直方图和颜色通道等特征被组合起来,用于学习具有级联结构的增强分类。最近的研究表明,利用深度卷积网络的高容量,使用深度学习可以进一步改进人脸检测。我们预计,新的WIDER FACE数据可以有利于通常需要大量数据进行训练的深卷积网络。
- 基于MTCNN多任务级联卷积神经网络进行的人脸检测
该MTCNN [6]由3个网络结构组成(P-Net,R-Net,O-Net)。Proposal Network (P-Net):该网络结构主要获得了人脸区域的候选窗口和边界框的回归向量。并用该边界框做回归,对候选窗口进行校准,然后通过非极大值抑制(NMS)来合并高度重叠的候选框。Refine Network (R-Net):该网络结构还是通过边界框回归和NMS来去掉那些false-positive区域。Output Network (O-Net):该层比R-Net层又多了一层卷基层,所以处理的结果会更加精细。作用和R-Net层作用一样。但是该层对人脸区域进行了更多的监督,同时还会输出5个地标(landmark)。
MTCNN多任务级联卷积神经网络使得人脸识别速度快效果好,在人脸检测和特征点定位的任务上,MTCNN具有实时处理的性能,利用了检测和对准之间固有的关系来增强他们的性能。特别在预测人脸及脸部标记点的时候,通过三阶的级联卷积神经网络对任务进行从粗到精的处理。解决了传统算法对环境要求高、人脸要求高、检测耗时高的弊端。
- 基于深度学习的Faster R-CNN人脸检测
深卷积神经网络(CNNs)在计算机视觉的许多领域占据着主导地位。在目标检测中,基于区域的CNN检测方法是目前主要的研究范式。这是一个发展迅速的领域,最近几年提出了三代基于区域的CNN检测模型,其性能和处理速度都在不断提高。
经过R-CNN和Fast RCNN的积淀,Ross B. Girshick [7]在2016年提出了新的Faster RCNN,Jiang等人[8]也在阐述了Faster RCNN在各大人脸检测基准上的训练结果。在结构上,Faster RCNN已经将特征抽取,proposal提取,bounding box regression,classification都整合在了一个网络中,使得综合性能有较大提高,在检测速度方面尤为明显。
Sun, Xudong等人[9]也提出了基于Faster RCNN的改进方法。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。