基于Gabor小波和人工神经网络的人脸识别

q550
2 ℃
2020-04-27

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

基于Gabor小波和人工神经网络的人脸识别摘要人脸识别是计算机视觉领域中非常活跃的一个研究方向，在图像、生物、工业等民用领域及军事领域中有着广泛的应用，其中以目标特征的提取为难点与重点。本文研究的目的是提高Gabor目标识别算法的鲁棒性，降低负面因素对识别效果的影响。首先介绍了常用的分类规则，分析了人工神经网络以及BP算法的优缺点。给出了一种变步长学习速率的改进方法，优化了BP神经网络，为后文的识别研究提供了较好的分类器支持。关键词：神经网络，Gabor滤波器，特征提取，人脸识别AbstractTheautomatictargetrecognitionisapopissueinthecomputervisionarea，thathasbeenusedabundantlyinmanyfieldssuchasimage，biology,industryandSOon，especiallyinmilitarycircles．DuringATR’Staches，extractingfeatureoftargetimageshouldbethemostdifficultandimportantone．TheaimofthispaperistoenhancetherobustnessofcorrespondingGaboralgorithmandtoweakentheeffectofnegativefactors．Firstly,somemainclassifiersarepresented，andsomeadvantageanddisadvantageofBPnetworkwhichbelongtotheANNareanalysed．AnimprovedmethodwhosestepextentshiftisgiventooptimizetheBPnet，whichsuppliesabetterclassifierforthenextwork．Keywords：Neuralnetwork，GaborJets，Featureextracting，Facerecognition1绪论1.1研究背景及意义人脸识别是生物特性鉴别技术的一个主要方向，它涉及图像处理，模式识别，计算机视觉等多个研究领域，具有十分广泛的应用前景，多年来一直是一个研究热点。相对于其它人体生物特征识别技术，如指纹识别、虹膜识别、掌纹识别，人脸识别技术是最直接、最自然、最容易被人接受的。与其它技术相比，它具有侵犯性小、较少需要或不需要用户的主动配合、样本采集方便、应用场合广泛、潜在的数据资源丰富、设备成本低等优点[1]。人脸识别系统具备操作及流程简单、适用面广、支持一对一或一对多比对、支持多点同时采集比对、带有数据库支持记录及查询功能，对采集现场环境要求较低，可在极短的时间里判断出进出者的身份是否合法，杜绝使用他人钥匙、密码、磁卡等非法进入。人脸识别技术的安全性、可靠性较高，且拥有广泛的市场需求，它可以应用于公安部门的犯人档案管理、犯人辨认查找、刑侦破案、安全验证系统、信用卡验证、医学、档案管理、视频会议、人机交互系统、证件核对、保安监视、门禁控制及至自动柜员机（ATM）等多种场合[2]。人脸识别对人类来说是件自然而然的事情，但对计算机而言，人脸识别却远非一个已解决的课题。所有的人脸都具有相似的结构，在纹理上也十分相近。另外图像受光照、成像角度及成像距离等外界条件影响，具有“一人千面”的特点，欲建立一种具有各种不变性的描述模型还是比较困难的。此外，人脸识别技术研究与相关科学的发展及人脑的认识程度紧密相关[3]。诸多因素都使人脸识别研究成为一项极富挑战性的课题，一方面信息化进程的日益加快，电子商务、重要场所的安全认证、智能化环境等许多应用领域对与人脸有关的信息处理提出了迫切要求；另一方面，硬件和软件技术的发展，为满足实际应用系统对人脸检测、跟踪及识别技术的实时化要求提供了可能性[2]。所以，人脸识别的研究不仅涉及心理学、生理学、人工智能、模式识别、计算机视觉、图像分析与处理等多个学科领域，更是模式识别、人工智能和计算机视觉的典型案例之一[2]。对这一问题的研究和解决，有助于对其他对象识别问题的研究分析和解决，人脸识别也因此成为这些基础研究领域的重要课题之一，具有重要的理论研究价值。1.2国内外研究现状及发展趋势近30年来，人脸自动识别的研究取得了很大的进展，从工程索引（EI）上检索到的相关文献已达数千篇，包括IEEEPAMI在内的重要国际期刊也有专栏甚至专刊报道人脸识别的最新研究进展，同时还出现了专门的国际学术会议，如人脸手势识别国际学术会议[1]。目前人脸识别领域内最著名的国际研究机构包括：美国麻省理工学院媒体实验室及人工智能实验室、南加州大学、CMU卡内基—梅隆机器人研究及交互系统实验室、马里兰大学等。另外，一些国家或地区也有不少研究机构在人脸识别领域进行了大量的研究工作[4]。90年代中后期以来，国内的许多研究机构在自然科学基金、863计划、攀登计划等资助下，开始了对人脸识别的研究。其中主要包括清华大学计算机系、自动化系、电子系以及哈尔滨工业大学、南京理工大学信息学院、中科院自动化所、上海交通大学图像处理与模式识别研究所、中山大学数学系等，他们在人脸识别研究领域都进行了许多很有意义的尝试，积累了经验[5]。1.3人脸识别的常用方法（1）基于几何特征的方法几何特征最早是用于人脸识别的。人脸由眼睛、鼻子、嘴巴、下巴等部件构成，正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别，因此对这些部件的形状和结构关系的几何描述，可以作为人脸识别的重要特征。将人脸用一个几何特征矢量表示，用模式识别中层次聚类的思想设计分类器达到识别目的[6]。这就要求选取的几何特征矢量具有一定的独特性，能够反映不同人脸之间的差别，同时又具有一定的弹性，以消除时间跨度、光照等的影响。几何特征矢量是以人脸器官的形状和几何关系为基础的特征矢量，其分量通常包括人脸指定两点间的欧式距离、曲率、角度等[6]。（2）基于弹性模型匹配方法弹性模型匹配方法的思想是将人脸上的一些特征点作为基准点构成弹性图，每个基准点存储一串具有代表性的特征矢量，采用分级结构的弹性图，去除一些冗余节点，形成稀疏的人脸描述结构[7]。通过测试样本和特征样本的弹性匹配来完成识别。弹性模型匹配方法有很多，例如：在人脸图像上放置一组矩形网格节点，每个节点的特征用该节点处的多尺度Gabor幅度特征描述，各节点之间的连接关系用几何距离表示，从而构成基于二维拓扑图的人脸描述，根据两个图像中各节点和连接之间的相似性进行人脸识别。还有将人脸图像表示为可变形的3D网格表面，将人脸匹配问题转换为曲面匹配问题，利用有限元分析的方法进行曲面变形，根据两幅图像之间变形匹配的程度识别人脸等。（3）神经网络方法目前神经网络方法在人脸识别中的研究方兴未艾。Valentin[8,9]提出一种方法，首先提取人脸的50个主元，然后用自相关神经网络将它映射到5维空间中，再用一个普通的多层感知器进行判别，对一些简单的测试图像效果较好；Intrator[8,9]等提出了一种混合型神经网络来进行人脸识别，其中非监督神经网络用于特征提取，而监督神经网络用于分类。Lee[8,9]等将人脸的特点用六条规则描述，然后根据这六条规则进行五官的定位，将五官之间的几何距离输入模糊神经网络进行识别，效果较一般的基于欧氏距离的方法有较大改善；Laurence[8,9]等采用卷积神经网络方法进行人脸识别，由于卷积神经网络中集成了相邻像素之间的相关性知识，从而在一定程度上获得了对图像平移、旋转和局部变形的不变性，因此得到非常理想的识别结果。神经网络方法在人脸识别上的应用比起前述几类方法来有一定的优势，因为对人脸识别的许多规律或规则进行显性的描述是相当困难的，而神经网络方法则可以通过学习的过程获得对这些规律和规则的隐性表达，它的适应性更强，一般也比较容易实现。（4）基于线性和非线性子空间的方法基于子空间的方法是基于图像像素本身的，主要是利用计算模板和图像灰度的自相关性来实现识别功能，一般来说模板匹配法要优于基于几何特征法[10]。目前，在诸多子空间方法中，应用最广泛的是特征脸法（PCA），这是针对人脸整体特征的研究，利用Karhunen-Lobve变换原理，将图像表示为一些低维的正交基组成的子空间，然后采用最小距离准则进行人脸识别。线性判别分析（LDA）是一种较为普遍的用于特征提取的线性分类方法。它使投影后的模式样本的类间散布矩阵最大而类内散布矩阵最小，也就是说，投影后保证模式样本在新的空间中有最大的类间距离和最小的类内距离，即模式在该空间中有最佳的可分离性。线性判别分析提取的特征向量集强调的是不同人脸的差异而不是照明条件、人脸表情和方向的变化。因而，采用此方法对光照条件、人脸姿态等的变化不太敏感，从而有助于提高识别效果。但是传统的算法常常遇到的一个问题是样本类内散度矩阵通常是奇异的，即“小样本集合问题”。针对这一问题已有了许多改进方法并取得了很好的识别效果。独立分量分析（ICA）是一种很有效的提取方法。与PCA相比，ICA有两个优势：一是ICA获得的独立分量不需要满足正交关系，能够消除象素间的高阶统计相关性，而PCA只能消除象素间的二阶统计相关性；二是ICA获得的一组矢量比本征矢量更具空间局部描述性，具有更好的人脸描述能力。借鉴SVM的Kernel方法，PCA、LDA和ICA等都被扩展到了核空间。与线性子空间方法相比，基于Kernel的方法获得了更好的识别效果[11,12]。（5）其他方法Brunelli等对模板匹配方法作了大量实验，结果表明在尺度、光照、旋转角度等各种条件稳定的情况下，模板匹配的效果优于其他方法，但它对光照、旋转和表情变化比较敏感，影响了它的直接使用。Goudail等人采用局部自相关性作为人脸识别的判断依据，它具有平移不变性，在脸部表情变化时比较稳定。在最近的一些工作中，Benarie等提出VFR的表示框架并将它用于人脸识别的工作中，Lam等人研究了不同视点下的人脸匹配和识别问题，Vetter等人讨论了由单幅人脸图像生成其他视点的人脸图像的可能性，Mirhosseini等则探讨了多种信息融合的人脸识别方法[13]。2Gabor特征提取算法的实现2.1Gabor小波简介由于Gabor特征对光照、姿态具有一定的鲁棒性[7,13]，因此Gabor特征在人脸识别领域的应用非常广泛，目前已经成为了最为主流的人脸特征抽取方法。Gabor特征具有良好的空间局部性和方向选择性[7,13]，可以很好的描述图像的纹理信息，因此许多人脸识别算法都采用Gabor特征作为识别特征。EGM是最早应用Gabor特征进行人脸识别的算法之一，该算法仅对人脸图像中部分关键特征点进行Gabor变换，并将人脸描述为以这些特征点位置为顶点、以其Gabor变换系数为顶点属性、以其关键点位置关系为边属性的属性图，从而将人脸识别问题转化为图匹配问题。通过合理的选择特征点的位置，弹性图可以很好地同时对人脸的关键局部特征及其它们之间的关系进行建模，从而既利用了人脸的图像亮度分布特征，又利用了面部结构信息。GWN方法从最佳描述的角度，通过一个优化过程完全自动地确定特征位置及其相应的小波参数，并最终用这些参数作为人脸的描述来进行人脸识别。但GWN是一种基于参数优化的建模方法，计算复杂度很高，其用于人脸识别的有效性还需要更多的实践检验。GFC算法的基本思想是在粗略对齐人脸图像的前提下，逐像素计算每个像素点的多方向、多尺度Gabor变换特征，形成Gabor特征的人脸表示，然后进一步用Fisher判别分析法提取特征，为了解决逐像素Gabor特征维数过高的问题，Liu采用了简单的下采样处理方法。AdaGabor算法采用AdaBoost算法对高维Gabor特征进行选择的降维，该方法采用机器学习的方法更加客观地利用Gabor特征，从而能在有效降维的同时提高识别性能。Gabor小波与人类视觉系统中简单细胞的视觉刺激响应非