1人脸识别技术综述控制工程陈龙斌12013002342摘要:简要介绍了人脸识别技术的研究背景及其发展历程;对人脸识别技术的常用方法进行了分类总结;重点对近年来人脸识别方法的研究进展进行综述并对各种方法加以评价;总结了现阶段存在的研究困难并提出今后的发展方向。关键词:人脸识别;人脸检测;人脸定位;特征提取1引言随着计算机和生物医学工程技术迅速发展,利用生物特征来鉴别个人身份成为安全验证首选方式,具有普遍性、安全性、唯一性、稳定性等。可选的生物特征包括生理特征(如人脸、指纹、虹膜掌纹等)或行为特征(如笔迹、语音、步态等)。人脸识别技术是一种最友好的生物识别技术(非接触、非侵犯),它结合了图像处理、计算机图形学、模式识别、可视化技术、人体生理学、认知科学和心理学等多个研究领域。人脸识别应用领域:身份鉴定、身份确认、视频监控、面部数据压缩。从二十世纪六十年代末至今,人脸识别算法技术的发展共经历了如下四个阶段:1.基于简单背景的人脸识别人脸识别研究的初级阶段。利用人脸器官的局部特征来描述人脸。但由于人脸器官没有显著的边缘且易受到表情的影响,因此它仅限于正面人脸(变形较小)的识别。2.基于多姿态/表情的人脸识别人脸识别研究的发展阶段。探索能够在一定程度上适应人脸的姿态和表情变化的识别方法,以满足人脸识别技术在实际应用中的客观需求。3.动态跟踪人脸识别人脸识别研究的实用化阶段。通过采集视频序列来获得比静态图像更丰富的信息,达到较好的识别效果,同时适应更广阔的应用需求。4.三维人脸识别为了获得更多的特征信息,直接利用二维人脸图像合成三维人脸模型进行识别,即将成为该领域的一个主要研究方向。人脸识别系统,是指不需要人为干预,能够自动获取人脸图像并且辨别出其身份的系统。包括:数据采集、人脸检测与跟踪、人脸识别这三个子系统。目前国内比较成熟的人脸识系统有:1.中科奥森人脸识别系统2.南京理工的人脸识别系统3.深圳康贝尔人脸识别系统2人脸识别技术的研究范围主要包括以下几个方面:1.人脸检测:在输入的图像中寻找人脸区域。2.人脸的规范化:校正人脸在尺度、光照和旋转等方面的变化。3.特征提取:从人脸图像中映射提取一组能反映人脸特征的数值表示样本。4.特征匹配:将待识别人脸与数据库中的已知人脸比较,得出相关信息。5.表情/姿态分析:让计算机感知表情变化,分析理解人的情绪。6.生理分类:对人脸生理特征分析,得出性别、年龄、种族等信息。人脸识别流程人脸识别的技术难点在于:1.复杂条件下人脸检测和关键点定位2.光照变化3.姿态4.表情5.遮挡6.年龄7.低质量照片8.大规模人脸识别9.样本缺乏10.海量数据学习.11信息采集设备带来的问题2图像预处理人脸图像获取设备有照相机、摄像机、扫描仪等。包括静态图像和动态图像。常见格式有BMP、GIF、JPEG、TIFF、PSD、PNG、SWF、SVG等。常用的图像预处理方法有灰度化、二值化、几何校正、直方图修正、滤波、锐化、像素平均法等。2.1图像去噪一般来说,自然界中的噪声可以看成是一种随机信号。根据图像获取的途径不同,噪声的融入也有多种方式:1.图像是直接以数字形式获取的,那么图像数据的获取机制会不可避免地人脸图像获取人脸检测定位人脸区域预处理特征抽取人脸特征对比识别结果人脸特征库3引入噪声信号;2.在图像采集过程中,物体和采集装置的相对运动。或采集装置的抖动,也会引入噪声,使图像变的模糊不清;3.在图像数据的电子传输过程中,也不同程度的引入噪声信号。这些噪声信号的存在,严重的情况会直接导致整幅图像的不清晰,图象中的景物和背景的混乱。对于用于人脸识别的图像。由于噪声的引入,将不可避免地造成识别率的下降。对图像噪声的消除可以通过两个途径:空间域滤波或频率域滤波。消除噪声的方法很多,对于不同的噪声应该采用不同的除噪方法。主要的方法是:线性滤波、中值滤波、维纳滤波以及小波去噪等。2.2增强对比度为了使人脸在图像中更为突出以便于下一步的特征提取,增强图像对比度是很有必要的。增强对比度有很多种方法,常见的有直方图均衡化和“S”形变换等方法。“S”形变换方法将灰度值处于某一范围(人脸特征范围)内的像素灰度分布差距拉开,从而保证了对比度的提高,但此方法降低了其他灰度值的对比度。而直方图均衡化则是将像素的灰度分布尽量展开在所有可能的灰度取值上,这样的方法同样能使得图像的对比度提高。将彩色图像转化成灰度图像是人脸识别方法中常见的处理过程,虽然转化过程丢失了一部分色彩信息,但是灰度图像拥有更小的存储空间和更快的计算速度。文献[1]给出了一种能够将RGB色彩转换成灰度级且适于突出人脸区域对比度的转换模型:5.0144.0587.0299.0,bgryxf;其中f代表灰度值,r,g,b分别表示Red,Green,Blue分量的值。文献[2]通过将人脸彩色图像从RGB色彩空间转换到RIQ色彩空间,得到了更适于频谱分析的特征分量。42.3二值化图像经过灰度变换后仍然是比较复杂的,因此需要将多层次的灰度图像进行简化。二值化就是一个很好的选择。对于分析理解图像特征和识别图像大有裨益。原理就是通过一些算法,设定黑白二色的阈值,将图像中的像素颜色均转换为黑白二值,“1”表示黑色,“0”表示白色,这种图像称之为二值图像,便于特征提取。2.4锐化使用梯度微分锐化图像时,会使噪声、条纹等得到增强。但是Soble算子引入了平均因素,对图像中的随机噪声有一定的平滑作用;不过由于它算法的特殊性会产生边缘粗而亮的不良后果。Sobel边缘检测算子使用一个水平的有向算子和一个垂直的有向算子,每一个逼近一个特定的偏导数矩阵。按照特定算法求这两个偏导矩阵的几何平均值,然后将该平均值赋给待求点的灰度值。3人脸检测与定位人脸自动识别系统包括两个主要技术环节:人脸检测与定位和特征提取与人脸识别。从人脸自动识别技术所依据的理论来讲,人脸检测与人脸识别都是模式识别问题。人脸检测是把所有的人脸作为一个模式,而非人脸作为另一个模式,人脸检测的过程就是将人脸模式与非人脸模式区别开来。人脸识别是把每一个人的人脸作为一个模式来对待,不同人的脸属于不同的模式类,人脸识别的过程是将属于不同人的脸归于各自的模式。换句话说,人脸检测强调的是人脸之间的共性,而人脸识别则要区分不同人脸之间的差异,二者同属于模式分类问题。人脸检测与定位是指检测图像中是否有人脸,若有,将其从背景中分割出来,并确定其在图像中的位置。主要方法有:3.1基于模板的方法第一步建立一个标准的人脸模板,需要包含人脸的各个局部特征。第二步对全面检查输入图像,计算与标准人脸模板中各局部特征的相似系数,与之前设定的阀值比较,判定是否存在人脸。(1)固定模板匹配法:根据先验知识确定一个人脸检测模版。该模版包含人脸轮廓以及五官模型,计算样本图像区域与模板中人脸轮廓的相似性来徐略确定人脸大致区域,接着通过检测该区域中是否含有五官模型中要求的要素,如果有就可以判定该区域就是人脸区域。由于很难用一个通用的人脸模版来模拟出所有脸型,而且人的面部特征变化很大,致使这种方法很有局限性,目前该方法只作为粗检的手段。(2)变形范本法:考虑到人脸是可变形体,该方法通过非线性最优化方法求得一个参数模板,该模版如果能使能量函数最小,那么它就能描述所求参数特征。该方法稳定可靠,而且与姿态和光照无关,但是能量函数的系数适应的范围不广而且计算量过大。该方法比较成熟,实现起来比较简单,但是效率并不高。53.2基于特征的方法人脸模式的变化满足一定的规律,所以可以归纳描述人脸特征的规则,如灰度分布、比例关系、纹理信息等。该方法首先检测出人脸面部特征的位置,然后根据各特征之间的几何关系来定位人脸。主要有以下两种方法:基于器官特征的方法:该方法首先提取五官的图像特征。该特征可以用几何、灰度、空间等来描述。然后通过五官位置和相互之间几何关系来检测人脸。虽然每个人脸都不同,但是可以用轮廓规则、五官分布规则。对称性规则、运动规则来制定人脸判定规则。基于肤色的方法:人脸肤色在颜色空间上的分布相对集中,而且与图片中其他部分是基本不重合的。当表情变化或者面部转动时,肤色并不会变,在人脸检测时有很强的稳定性。用肤色信息检测人脸时,要选择合理的色度坐标。通常的做法是将彩色的R、G、B分量归一化以便突出色度信息。相比于亮度而言,人对色度更加敏感。所以YCbCr这样一个色差模型更符合人类视觉特点。其中,Y是亮度信号,CrCb是色度信号。虽然基于肤色的方法不够准确,但是能够简单快速地定位人脸3.3基于外观学习的方法---目前的主流方法这是一种学习型的方法。将人脸检测视为区分“非人脸样本”与“人脸样本”的模式识别问题,通过对大量人脸样本集和非人脸样本集的学习、训练产生建立起一个能正确识别人脸样本的分类器。然后扫描整个待检测图像,用分类器判别是否包含人脸。有很多种不同策略的分类器,如下所示:(1)隐马尔科夫模型:描述信号统计特性。其过程是一个双重随机过程。特征序列与状态序列之间的并没有严格的一一对应关系。这种模型对于状态序列来说是隐的。因为外界只能看到各个时刻的输出值,看不到其中复杂过程。(2)支持向量机:兼顾模型的复杂性和学习能力,寻找一个平衡点。对有限样本的情况下非常适用。通过构造风险最小的分类面来解决一个受限二次规划问题。(3)人工神经网络:是一种模仿大脑神经突触联接的结构进行信息处理的数学模型。边训练边测试,并把在错误结果作为“反面教材”,进一步修正分类器。预先将足够量“正、反”图像样本和其识别结果输入网络,通过训练它就能识别类似的图像是否包含人脸。但是想要获得期望的性能,调整网络结构参数的工作量很大。3.4Adaboost方法该方法中文意思是自适应性提升算法,是一种应用了迭代思想的机器学习方法。Viola于2001年开创性地将其应用到人脸检测方面,并且融合了积分图和级联分类器于其中。其核心思想是使大量弱分类器联合成为一个强分类器。虽然该方法源于PAC学习模型,但是并不过多地关注弱学习算法的先验知识,而是经过若干次迭代自适应地降低弱学习的错误率。每次用样本集训练后,重新确定每个样本的权重。将新的数据集交给下层分类器继续训练。作为最终决策分类器的6是历次训练得到的分类器的级联。既保证了效率又兼顾了检测正确率。Haar特征和积分图像密切相关,计算量较小应用于Adaboost算法中用来描述人脸面部灰度特征可以提升特征提取速度。将样本图像中的Haar特征提取出来后,需要通过训练,选出最优的Haar特征转换成弱分类器,最后将弱分类器级联后用于人脸检测。3.4.1Haar特征该特征其实就是矩形特征。它虽然仅能描述水平、垂直、中心环绕型的特征比较粗略但是对于边缘、线段等简单图形结构很敏感。在给定数据有限时,也能将特定区域的状态编码出来,并且检测速度上比基于像素的系统优异得多。对于检测器来说一副图像内的矩形特征数量是很大的,比如24乘24的检测器特征数量已经达到了160000个。此时只有选出合适的矩形特征组成的强分类器才能较好的检测出人脸。由多个全等的黑色或白色相邻矩形组合成的模版,其特征值用所有白色和黑色矩形的像素总差值来定义。该特征模版包含有:边缘特征、线性特征、和特定方向特征,如下图3-1所示。要对弱分类器进行训练,就要找出在子窗口中特征模板的所有形态。图3-1特征模版分类眼睛和鼻子的颜色和周围的灰度有区别,鼻梁两侧和鼻尖的灰度也是有差异的。所以可以得到如下图3-2和下图3-3所示的矩形特征和人脸特征的匹配。7图3-2特征匹配图3-3特征匹配3.4.2积分图特征数量很多导致特征计算的工作量很大,采用积分图可以有效地简化计算。对原始图像中的每个像素进行少量类比于微积分的简单计算就能得到积分图像。其主要思想是:预先将图像各特定矩形区域像素之和保存到内存中的某个数组中,当需要该值时,直接从数组中取出即可,不用再重新计算。积分图在多种尺度下计算不同特征时,所耗的时间是一样的,有效地降低了计算量。8图3-4矩形区域3.4.3积分图单个弱分类器并不能直接拿来供分类使用,所以要将其优化组合成