人脸识别技术的研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

人脸识别技术的研究1.引言在信息化飞速发展的今天,计算机的应用领域越来越广,大大减轻了人类的体力劳动和脑力劳动。在对人的计算机自动身份鉴别系统中,指纹、基因、虹膜等方法都为接触式鉴别手段,需要人为的采样,属侵犯式的识别。因人脸识别的非接触式特性现以成为计算机领域的一个研究热点,在国内外引起很高的重视,取得了一系列的成果。在公安、银行、海关等重要部门可以应用人脸识别技术提供方便、高效的检测手段。虽然人可以毫不费力地识别出人脸及其表情,但要计算机自动准确地识别却困难得多。因为人脸具有相似的结构,在纹理上也比较接近,人脸识别系统只能利用不同人脸之间的细微差别来实现正确识别的任务。同时,同一个人在光照、姿态、表情、人脸大小等不同采样条件下所获得的图像有很大的不同,更不用说发型、年龄、化妆以及饰物的变化了,得到的图像可能是正面的也可能是侧面的,此外噪声和掩遮都使问题变得复杂。可见,人脸识别涉及到图像处理、模式识别、人工智能及生理学等多个学科[1],使得人脸识别成为一项极富挑战性的课题。人脸自动识别系统包括三个主要技术环节[2]:首先是图像预处理,由于实际成像系统多少存在不完善的地方以及外界光照条件等因素的影响,在一定程度上增加了图像的噪声,使图像变得模糊、对比度低、区域灰度不平衡等。为了提高图像的质量,保证提取特征的有有效性,进而提高识别系统的识别率,在提取特征之前,有必要对图像进行预处理操作;人脸的检测和定位,即从输入图像中找出人脸及人脸所在的位置,并将人脸从背景中分割出来,对库中所有的人脸图像大小和各器官的位置归一化;最后是对归一化的人脸图像应用人脸识别技术进行特征提取与识别。2.人脸识别技术研究的方法人脸识别的方法大致可以分为基于几何特征、基于代数特征[3]、基于神经网络模型以及基于三维模型等的几大类。2.1基于几何特征是在抽取人脸图像上显著特征的相对位置及其参数的基础上进行识别。最早的人脸识别是用手工的方法确定人脸特征点的位置并将其输入计算机中。识别工作的流程大体如下:首先检测出面部特征点,通过测量这些关键点之间的相对距离(欧式距离),得到描述每个脸的特征矢量,比如眼睛、鼻子和嘴的位置和宽度,眉毛的厚度和弯曲程度等,以及这些特征之间的关系,用这些特征来表示人脸。比较未知脸和库中已知脸中的这些特征矢量,来决定最佳匹配[4]。基于小模板匹配的方法属于几何特征识别,是已知一个小模板,在人脸的大图像中进行匹配,如果匹配成功,就可以确定其坐标位置[5]。基于几何特征的缺点显而易见,对获得的图像要求很高,特征点的定位非常重要,如果人脸有一定的侧向或有装饰物都会很大程度上影响识别的准确性。2.2基于代数特征基于代数特征的人脸识别方法有代表性的是PCA(主元分析法)[6]、K-L(卡胡南-列夫)变换[7]和SVD(奇异值分解)[8]等方法。其主要思想:对于一副由N个象素组成的图像,可以看作是一个N维矢量人脸检测与定位特征提取与识别标准人脸图像识别结果输入图像图像预处理准图像空间,采用不同的变换方法,能够有效的提取主分量,通过对人脸样本集的自相关矩阵的特征矢量的选取,构成一个正交的低维人脸空间,从而达到降低冗余、提高识别率的目的。利用主元分析法(PrincipleComponentAnalysis简称PCA)进行识别是由Anderson和Kohonen提出的。最早将其用于人脸识别中的是Pentland,并因为它的有效很快流行起来。简单地说,它的原理就是将一高维的向量,通过一个特殊的特征向量矩阵,投影到一个低维的向量空间中,表征为一个低维向量,并不会损失任何有用信息。也就是说,通过低维表征的向量和这个特征向量矩阵,可以完全重构出所对应的原来的高维向量。PCA的工作原理如下:将第k幅输入看作一个一维向量记作kx,向量的协主差矩阵记作W,NkTkkxxxxNW1))((1,其中NkkkxNx11,N为人脸图像总数。W为对称矩阵,可以进行对角化:RrTTrrrUUuuW,其中r为W的特征值,ru为相应的特征向量,Ruuu,...,,21为标准正交系,R为W的秩,RuuuU,...,,21,为对角阵,对角线上元素为W的各特征值,将kx在ru上的投影记为rkP:kTrrkxuP则rTkTrkTrkTrkTrkxuxuxuxuEPVal)()()(。由此可见kx在ru上的投影方差就是ru对应的特征值r,因此采用以下步骤进行特征抽取:根据各幅人脸图像kx求出W。求W的前M个最大特征值对应的特征向量。(MR)将各kx在M个特征向量张成的空间中投影,得到M个投影值,以此M个投影值构成的向量kx作为原kx的特征,即完成了高维(R维)向低维(M维)的转化。K-L变换与SVD分解的思想同PCA都差不多,降维到低维向量空间后要运算的分量大大地减少了。采用代数特征识别人脸具有以下的特征:良好的稳定性;位移不变性;特征向量与图像的高度成比例变化;转置不变性等。2.3基于神经网络模型神经网络由许多并行运算的功能简单的单元组成,是一个非线性动力学系统,其特色在于信息的分布式存储的并行协同处理,具有良好的容错能力。神经网络主要的应用是对已经提取主特征的特征值进行分类。比较成熟的是PCA+ANN(主元分析+人工神经网络),用K-L+ANN(K-L变换+人工神经网络)[9]、SVD+ANN(奇异值分解+人工神经网络),也有直接用NN+NN(神经网络+神经网络)进行人脸识别的,不过这样所要计算的分量太大了,训练与工作的时间要长很多。有代表性的神经网络模型有:BP网络、RBF网络、Hopfield模型等。如图所示的是PCA+BP神经网络的例子,其中输入层结点的个数与主元分析后低维向量的个数相等输入到BP神经网络的输入层结点中,隐层结点的个数在构造BP网络时就已经定义好了,输出层结点的个数与样本的数量有关,要能达到分类的目的。2.4基于三维模型三维人脸识别[10]最初是从几何方法发展来的,出发点是希望利用三维的人脸识别处理技术,解决传统二维照片识别中因为人脸的姿态、光照等对识别造成的干扰问题,在三维的基础上进行特征的提取和识别将有更为丰富灵活详尽的信息可以利用。三维数据获取已经成为可能(如三维激光扫描技术、CT成像技术、结构光方法等),使得图形技术得到了应用的可能,可以完成人头三维面貌数据获取。在合成特定人的头部模型时,需要一个基本头部模型,该模型是一个通用的模型,特定人的模型都可以通过对该模型的修改得到。人类面部特征的位置、分布基本上是一样的,因而特定人脸的模型可以通过对一个原始模型中的特征和其它一些网络点位置进行自动或交互调整而得到。系统的内部有一个原始的人头模型,以后所有特定模型的建立都是基于这个原始模型。基于三维模型的识别方法是未来的对人进行识别的方向,因为在三维模型中,可以对人的头部从任意角度获得信息,具有良好的抗干扰能力,基于三维的人脸识别还需要做很多的工作。2.5其他方法HMM(隐马尔可夫模型)方法[11],利用隐马尔可夫模型对人脸进行描述和识别,不是利用各个器官的数值特征,而是把这些特征和一个状态转移模型联系起来,这种模型既考虑了人脸的各个器官的不同表象,又考虑了他们的相互关联,比起孤立地利用各个器官的数值特征有概念上的进步。小波变换[12]是空间(时间)和频率的局部变换,因而能有效的从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析,解决了Fourier变换不能解决的许多困难问题。克服了Fourier变换没有任何时域局部化,用于分解信号的基函数是持续时间很短的高频函数和持续时间较长的低频函数。2.6上述方法的不足之处1)基于几何特征的提取方法,由于时间、光照、摄影机角度等不同,人的面部模式也是千变万化的,这给特征提取造成了困难。2)基于代数特征的识别法在实际应用中取得了一定的成功。由于该方法有一定的稳定性、鲁棒性,这使得对表情的描述不够充分,难以用于表情分析。3)基于神经网络的方法,结构上类似于人脑,但由于原始灰度图像数据量十分庞大,神经元数目通常很多,训练时间很长,而基于冯诺伊曼结构也受到了限制。4)三维人脸识别技术当前还重点停留在理论方法上,研究的效果不很理想。3.结束语人脸识别距真正要达到的目标还有很大的差距,随着科技水平的不断提高,获取特征点的工具准确性的输入层输出层隐层低维分量作为输入向量BP神经网络加强,以及人工智能与对人的视觉、认知、生理、表情等技术引入进来,将推动人脸识别技术的发展。[参考文献][1]张翠平,苏光大.人脸识别技术综述.中国图象图形学报,2000(11)[2]王昆翔,李衍达,周杰.关于人脸图象自动识别研究中的几个问题.公安大学学报,2001(1)[3]周激流,张晔.人脸识别理论研究进展.计算机辅助设计与图形学学报1999(3)

1 / 4
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功