论文题目:人脸识别算法综述学院:电子与信息工程学院专业:电子信息工程姓名:王鑫海学号:20071305054学科:信号与信息处理前沿学科老师:周晓彦二O一O年十月二十日信号与信息处理前沿课程论文2人脸识别算法总述王鑫海20071305054南京信息工程大学电子信息工程摘要:人脸识别是人工智能领域的一个研究热点,是一种基于信息处理的模式识别。本文首先对人脸识别中的常用算法进行了分类综述,并分析了人脸识别工程中存在的困难,然后展望了人脸识别技术今后的发展和研究方向。关键词:人脸识别;特征提取;特征脸;算法1引言广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。人脸识别技术[6],即是利用计算机技术对输入的静态图像或者视频流序列中的图像提取有效的识别特征,并以此辨明身份的一门技术。它涉及到模式识别、图形图像处理、计算机视觉、生理学、心理学以及认知学等诸多学科的知识,并与基于其它生物特征的身份鉴别方法以及计算机人机感知交互的研究领域都有密切联系。首先需要进行人脸检测与定位,判断其是否存在人脸并明确人脸图像位置。其次依据归一化后人脸图像信息,对每个人脸图像进行特征提取,找出其所蕴涵的个性化特征。最后将其与已知的人脸进行对比,从而识别每个人脸的身份。早在上世纪六、七十年代,人脸识别技术就引起了研究者的浓厚兴趣;进入九十年代之后,由于高速度高性能的计算机的出现,人脸识别技术取得了重大进展。而自美国“9.11”事件以后,人脸识别在信息安全领域的作用逐渐显现出来,人脸识别技术得到了前所未有的重视。国内外对于人脸识别的研究发展,技术趋势分别经历了三个阶段:机械式的识别阶段、机器自动识别初级阶段、机器自动识别高级阶段。第一阶段为机械式的识别阶段,是以Betillon,Allen和Parke为代表,主要研究人脸识别所需要的面部特征。该阶段的识别依赖于人的操作,需要利用操作员的某些先验知识来进行。在Bertillon的系统中,用一个简单的语句与数据库中某一张脸相联系,同与指纹分析相结合,提供了一个较强的识别系统;为了提高识别率,Allen为待识别设计了一种有效和逼真的摹写;Parke则用计算机实现了这一想法,并产生了较高质量的人脸灰度图模型。这一阶段工作的特点是识别过程全部依赖于操作人员,显然这不是一种可以完成自动识别的系统。第二阶段为人机交互式初级阶段,主要是采用机器自动识别的手段进行识别。代表性工作有:Goldstino,Hannon和Leks用几何特征参数来表示人脸正面图像,他们采用21维特征向量表示人脸面部特征,并设计了基于这一特征表示法的识别系统;Kaya和Kobayashi则采用了统计识别方法,用欧氏距离来表征人脸特征,如嘴唇与鼻之间的距离,嘴唇的高度等;更进一步地,.T.Kanad(M.Ngao)设计了一个高速且有一定知识导引的半自动回溯识别系统,创造性地运用积分投影法从单幅图像上计算出一组脸部特征参数,再利用模式分类技术与标准人脸相匹配,Kanad的系统实现了快速、实时的处理,是一个很大的进步。这个阶段需要利用操作员的某些先验知识,仍然摆脱不了人的干预。第三阶段为机器自动识别高级阶段,是真正向实用化发展的机器识别阶段,这一阶段识别率和自动化程度得到了提高。随着计算机的大型化、高速化和人脸识别的方法的发展,人们已提出了许多成熟、高效的方法,很多产品已用于实际应用。目前世界上的商用识别系统主要有Idnetix(原Visionics)公司的“FaceIt”系统,Viisage公司的“FaceID”系统,Cognitec公司的“FaceVACS”系统以及HumanScan公司的“BioID”系统等。人脸识别技术在国家重要机关及社会安防领域具有广泛而特殊的用途。例如:证件和各信号与信息处理前沿课程论文3类金融卡持有人的身份验证、公安系统的视觉监控等。同其它人体生物特征(如:指纹、掌纹、虹膜、语音等)识别技术相比,人脸识别技术的隐蔽性最好,是当今国际反恐安防最重视的科技手段和攻关目标之一。此外,人脸识别技术还可用于多媒体数据库的视频检索,以及多媒体制作等方面。近几年,随着计算机硬件和软件技术的发展,基于人脸识别技术的表情信息提取也成为可能,它可以用于改进人机交互方式,从而产生更加人性化、智能化的计算机系统。人脸识别技术的发展正是受到商业应用需求的推动,以及相关技术的发展而得到空前的重视,成为图像识别和理解领域中的研究热点。虽然人类具有很强的检测和识别人脸的能力,但是要建造一个高性能的自动人脸识别系统却是一个极其复杂的课题.人脸识别的性能受到人脸内在生理变化和外界环境变化的影响较大,这使得该课题极富挑战性.视觉是一种复杂的信息处理任务,它的研究涉及计算机技术和心理/神经生物科学,早期的理论框架由D.Maar于20世纪80年代初期提出,他把视觉信息处理划分为三个不同层次来描述:①计算理论;②算法;③实现机制。[4]近几年的研究表明,人类视觉数据处理是多层次的过程,其中最低层的视觉过程(视网膜功能)起信息转储作用,即将大量图像数据转换成较为抽象的信息,这一任务由视网膜中的两类细胞完成:低层次的细胞对空间的响应与小波变换作用类似,高层次的细胞则依据低层次细胞的响应,而作出具体的线、面乃至物体模式的响应。这表明在视觉处理过程中,神经元并不是随便地不可靠地把视觉图像的光照强度转手投射到感觉中枢,它们可以检测模式单元,区分物体的深度,排除无关的变化因素,并组成一个使人感兴趣的层次结构。人脸识别不仅有着以上普通视觉过程的特点,而且具有以下独特之处:针对人脸识别,大脑中存在一个专门的处理过程。经过长期的研究,人们发现大脑对人脸形状有着特殊的兴趣;不同的局部特征作用对识别的贡献也不同。研究也表明,头发、人脸轮廓、眼睛以及嘴巴对识别和记忆有着重要影响,鼻子的作用则不是很重要。通常来讲人脸的上部比下部对识别作用更大些;不同空间频率上信息的作用不同。低频信息代表了整体的描述,高频信息包含了局部的细节。对于性别的判断,仅利用低频信息就足够了,但对身份识别没有高频信息就无法完成;光照对视觉的影响。有实验表明,从人脸底部打光会导致识别困难;动态信息比静态信息更利于识别。研究发现,对熟悉的人脸,人类的识别能力在动态场景中要高于静态场景;面部表情的分析与人脸识别并行处理。通过对脑部受损的病人研究表明,表情的分析与识别虽有联系,但是总体来说是分开处理的。2人脸识别常用算法一般总的来说可以分为两种,一种是基于先验信息,一种是基于训练样本。早在20世纪60年代,人脸识别就引起了广大研究者的注意,上个世纪90年代以来,随着社会对人脸识别系统的迫切需求,人脸识别研究再次成为热门课题.当前世界各国有许多机构都在从事这方面的研究,并受到军方、警方以及许多大公司的高度重视和资助.一般来说,人脸识别系统包括图像摄取、人脸定位、图像预处理、以及人脸识别(身份确认或者身份查找)。系统输入一般是一张或者一系列含有未确定身份的人脸图像,以及人脸数据库中的若干已知身份的人脸图象或者相应的编码,而其输出则是一系列相似度得分,表明待识别的人脸的身份。目前常见的人脸识别基本算法可分为以下几类:基于几何特征的人脸识别、基于子空间分析的人脸识别、基于弹性图匹配的人脸识别、基于神经网络的人脸识别和基于隐马尔可夫模型的人脸识别等.静态人脸识别系统主要有三个步骤:人脸的检测和定位、人脸的特征提取和人脸识别,在这些步骤之前还应有预处理这一步,即对采集到的图像先进行预处理,以达到位置校准和灰度归一的目的,然后寻找人脸,如果有则确定人脸的位置并提取人脸,然后提取人脸特征,最后根据提取的特征进行识别。下面对人脸识别中的常用算法进行介绍。2.1基于几何特征的人脸识别信号与信息处理前沿课程论文4在众多的人脸识别方法中,基于几何特征的方法[4]是最早被用于人脸识别的.这类识别方法将人脸用一个几何特征矢量来表示,用模式识别中的层次聚类的思想设计分类器达到识别目的。其基本原理是:人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每张人脸千差万别。识别所用的几何特征是以人脸器官的形状和几何关系为基础的特征矢量,其分量通常包括人脸指定两点间的欧式距离、曲率、角度等等。在这种基于几何特征的识别中,不同特征的相似性度量主要依赖于特征矢量的匹配情况进行判决。基于集合特征的识别方法的优点有符合人类的习惯,易于理解,对光照变化不是很敏感,具有一定的抗干扰能力。从图像中抽取稳定的特征比较困难,当有遮挡时会出现误提取;当面部表情变化很大,或者姿态变化很大时,鲁棒性1较差;几何特征模型的准则过于简单,一般的几何特征只描述了器官的基本形状与结构关系,忽略了细节特征,会使部分信息丢失。2.2基于特征子空间分析的人脸识别(主成分分析法PCA)特征脸方法[7]是人脸识别技术中的一种典型方法,又称为主成分分析法(PCA)。SIROVICH和KIRBY首先采用PCA算法来表示人脸。它根据一组人脸训练样本构造主特征向量空间,即特征子空间(特征脸),这些特征向量是由图像的生成矩阵的主特征值所对应的特征向量组成,这些主特征向量所占的能量是总能量的90%(一般取这个数)以上,其余的小能量向量被剔除。生成矩阵可以是图像的协方差矩阵、总类内离散度矩阵等等。这个子空间是降维的,维数比原数据空间要小得多,任何一幅待识别人脸图像都可以向此特征空间投影并获得一组坐标系数,这组系数表明了该图像在子空间中的位置,从而可以作为人脸识别的依据。任何一幅人脸图像都可以表示为这组特征向量的线性组合,其加权系数(图像向空间投影得到的系数)称为该图像的代数特征。识别的时候,将待识别的图像投影到这个特征子空间,将得到的投影系数与各个已知人脸图像的系数进行比较,通过一定的准则,例如k-近邻法,取未知样本的k个近邻,看这k个近邻中多数属于哪一类,就把待识别的图像归入哪一类。特征脸方法比较简单易懂,得到了广泛的使用,但单独使用的计算量较大,所以PCA经常与其它方法配合使用,例如小波变换2与PCA的结合,使PCA的降维效果得到改善。与PCA不同,线性判别分析(LDA)是以样本的可分性为目标的,其基本思想是寻找一个投影方向,使训练样本投影到该方向时类内离散度最小而类间离散度最大.不过,LDA只有在训练集样本数较多时,性能才优于PCA.完整的PCA主成成分分析法进行人脸识别的应用包括几个步骤[1]:1)人脸图像预处理;2)读入人脸库,训练形成特征子空间;3)把训练图像和测试图像投影到上一步骤中得到的子空间上;4)选择一定的距离函数进行识别。2.2.1人脸图像的预处理直接用特征脸识别人脸图像有一定的局限性,要想让系统准确地识别人脸必须保证2个条件:1)待识别图像中人脸尺寸接近特征脸中人脸尺寸;2)待识别人脸图像必须为正面人脸图像,当待识别图像不满足此条件时,误识率很高。所以预处理需要进行剪切人脸和旋转人脸。归一化人脸库后,将库中的每人选择一定数量的图像构成训练集,其余构成测试集。设归一化后的图像是n×m,按列相连就构成N=n×m维矢量,可视为N维空间中的一个点,可以通过K2L变换用一个低维子空间描述这个图像。实践表明,人类在识别物体时,主要依靠的是图像的相位谱信息,高阶统计量对图像识1鲁棒性,是指控制系统在一定(结构,大小)的参数摄动下,维持某些性能的特性。2小波变换:以某些特殊函数为基将数据过程或数据系列变换为级数系列以发现它的类似频谱的特征,从而实现数据处理。信号与信息处理前沿课程论文5别来说非常有用.独立分量分析(ICA)不但考虑了训练样本的一阶和二阶统计信息,还考虑了高阶统计信息,其基本思想是通过线性变换,从训练样本中找到一组互相独立的基(独立分量),并以此来描述样本数据.前面提到的PCA方法实际上是在二阶统计量上的去相关,而ICA则是在所有阶统计量上的去相关,从而使信号的二阶统计量和高阶统计量都得到了有效利用,ICA