结合局部特征选择基于朴素贝叶斯分类的人脸识别WaelOuarda,HaneneTrichili,AdelM.Alimi,BaselSolaiman,ResearchGroupsonIntelligentMachines,NationalSchoolofEngineeringofSfax,TunisiaITIDepartmentTelecomBretagne,Brest,France摘要:人脸识别在文献中是一种非常流行的生物学解决办法。已有一些方案被提出用于满足个人验证或识别的需要。现有三种类型的人脸识别的方法:局部,全局和混合的方法。在本文中,我们提出一种基于结合了像遗传算法,GramdtShmidt算法,mRmR特征选择算法和朴素贝叶斯分类器的特征选择的人脸识别的方法。我们提出的方案将和一些基于全局特征脸的人脸识别系统进行比较。在本文中我们给出了一项两者在识别率和识别时间方面比较的结果的研究。我们的基于朴素贝叶斯分类器的人脸识别系统,在ORL人脸数据库中的测试结果有78.5%的识别率和相对于基于全局人脸识别系统更快的执行时间。关键词:人脸识别;几何距离;特征提取;贝叶斯分类器;识别率;执行时间Ⅰ.引言生物识别技术是一种产生于人类关于安全访问禁地的思想演变的贡献。生物识别的方法纷繁复杂,各有不同。人脸识别在成本和精度方面是现有的生物识别方法中位列前茅的一种重要的技术。人脸识别基于四个主要的模块:预处理,特征抽取,学习和分类。一些方法已经实现了人脸特征的检测和抽取。下面我们展示了一种遗传算法的人脸生物识别系统。输入图像预处理特征提取特征选择特征分类用户验证预处理:这是用于提升待验证的2D人物形象的特征。在人脸检测中十分有用。有几种类型的过滤器用于增强的颜色,分辨率和最小化iIIwnination和背景的复杂性。人脸检测:人脸检测的方法可以分为四等。有知识基础方法包括使用比如规则1“眼睛是对称的规则2”眼睛区域比鼻子变暗区”等这些规则来定义的脸上地区的方法。这些方法的主要缺点是难以定义一组规则使人脸检测系统局部化人脸。二等的人脸检测的方法是基于模板匹配。我们在这种技术下定义一个函数,这个函数定义了一个包含了像边缘眉毛、眼睛、鼻子和嘴巴等人脸每个部分的人脸模块。这种方法受到人脸姿势变化和咬合的限制。我们也可以使用一个函数,定义一个人脸模板,像特征脸和费舍尔脸这种基于外观的方法。后一种方法是基于人脸特征不变的方法的。特征提取与选择:特征提取与选择是人脸识别依赖的两个步骤。相关特征的选取总是遵循每幅人脸图像特征初采特性。特征提取是为了代表每个人不同于他人的个人面部图像特点。分类:分类的目的就是检查每个输入图像在哪个合适的身份类别里。在已有文献中,有三族的面部识别的方法:全局法,局部法和混合法。软生物特征是最新的研究领域[1][4]。软生物特征的积极性在于运用了软生物特征的简单性和效率性的特点,比如人脸,身体和步态等的几何特征。所有的这些特性都是从传统的人脸识别中推导出来的[3]。在本文中,我们要展示局部法是基于几何距离的。其能帮助人脸识别像全局法那样更具有竞争的性能。局部法比全局法更容易从软生物特征中提取出生物特征。事实上软生物特征定义为语义描述上我们在现实生活中区分彼此的特征[4]。在我们的语义描述中,我们的关注点集中在比如肤色,眼睛的形状,头的形状,嘴的形状,下巴的形状,年龄,性别和民族等等。在本文中我们列举了一些基于全局特征的人脸识别的实验结果。然后,我们详述了我们建议的基于几何特征的方法。其将三种特征选取的方法和朴素贝叶斯分类器相结合。这种方法的目的是通过应用贝叶斯定理的框架融合两个生物系统集成软生物特征来增强系统的性能。主系统由本文构建,二级系统基于用户的软生物特征比如性别和民族。一项经过对比的研究已表明了一些局部法在人脸识别中的优势。Ⅱ.相关研究人脸识别系统在多个应用程序中比使用特别是在移动手机的应用程序中用于人脸的验证。这张表格总结了仅在ORL人脸库中测试过的人脸识别的相关研究。所有的研究在列表中显示,我使用不同分类的基于全局特征的一些基于主成分空间降维分析和线性辨别分析的技术方法。表中所示的识别率是非常重要的。虽然,我们花了更多的时间来评估每个系统性能,但是有两方面原因不容忽视:分类器的复杂性使用起来像神经网络一样,支持向量机和全局特征抽取是基于PCA和LDA。在本文中,我们提出了一种快速的人脸识别的系统,其是基于朴素贝叶斯分类并且结合了局部脸几何距离选择的方法。Ⅲ.结合特征选择和朴素贝叶斯分类的人脸识别方法A.数据准备ORL数据库包括:40人(男女),每人十张相片。该数据库提供了各种各样的姿态和遮挡,如戴眼镜。图二展示了一些人脸组成的示例:ORL数据库关于人脸的注释:我们选出了人脸的33个点,这些点将被用于人脸识别和关于像眼球,眼睛,鼻子,嘴巴和下巴等生物特点的形状的柔软形状分类。33个重点如下:为了给ORL人脸数据库注释,我们模仿选取点为AR人脸数据库注释。使用几乎人脸上相同的点。注释规则-因为脸是对称的,所以我们规定按从左到右的顺序开始。-由眼球到眼睛,我们注释遵循这个规则。-我们从头部开始到下巴结束。图四显示了一个来自ORL人脸库注释的例子。在对来自ORL人脸数据库的400张人脸图像进行注释之后,我们存下了每张图像所有的点数。点数必须类似与图五所示结果。计算距离的设置是基于ORL数据库的人脸的特征点。为了做好设置,我们定义在20个单位距离中选取11个点做人脸识别。其余的点用于之后全局研究的脸部软生物特征分类。图六总结了所有在后面将要作为所选特征输入的距离,更将进一步检查出大多数距离在应用于ORL人脸库的人脸时会有更高的差异。对于每一幅来自数据库的图像,我们定义将要用的所有距离向量为特征向量。每一幅图像我们都存储了距离特征向量。然后,我们将用不止一种方法做特征筛选,检测出合适的能用于区分不同人的距离向量。为了保证在为准备和筛选过程做准备的注释过程的质量,我们研究了每个在数据库注册了姿势表情有不同的人脸部带注释的点的分布。B.特征选取阶段许多特征选择方法已被用于分类。我们注意到三族特征选择的方法:封装式,过滤式和嵌入式[16]。封转法使用训练集作为黑盒和选择任务是基于预测能力。过滤法是基于训练集预处理,其是通过之前选择的变量子集划分的。嵌入法是基于在训练过程中的集成特征选择。为了确保人脸识别系统的鲁棒性,我们不仅仅使用选择器结合的方法。在这项研究中,我们使用了从第一族发布的特征选择的遗传算法[12],来自嵌入式法族和mRmR(最小冗余最大相关性)算法[14]特征选择的格拉姆-施密特正交算法[13]在生物医学背景下运用非常多,并且其是从第三类型的特征选择法中发布的。基于遗传算法的特征选择。我们前面在20距离之间选择了相关的特征。我们也不仅仅用了特征选择的算法。在研究中,遗传算法在特征选择中表现的最具针对性。基于格拉姆-施密特正交算法的特征选择。为了确保这一步特征选择的鲁棒性,我们应用了多个选择算法。接下来的特征选择法叫做格拉姆-施密特正交算法,这个方法在生物医学领域用于筛选相关信息来帮助做关于病人的决策。基于mRmR算法的特征选择。第三个测试的特征选择算法是mRmR特征选择算法。图十显示了这个选择法在前文引用的20个相关距离中的输出情况。表二中我们给出了特征选择器的最相关的特征选择。相结合的特征选择。三个特征选择器相结合的目的在于使用至少由一个特征选择器选出的距离。我们对朴素贝叶斯分类器的输入包括以下七个距离。{D20,D4,D12,D7,D18,D16,D2}。Ⅳ.分区数据对于数据分区,我们使用了前文提到的提到[5]和[6]部分的相同数量的训练集和测试集。-30%的ORL数据库数据用于训练-70%的ORL数据库数据用于测试(详见图12)每个人有十个脸图像。我们使用三个图像训练和七个脸图像进行测试。Ⅴ.人脸特征向量分类我们在这一步中运用朴素贝叶斯分类器进行分类,贝叶斯定理为:注解:•p(cj|d)=d在类cj中的概率这是我们试图计算的东西。•p(d|cj)=在类cj下产生d的概率想象在类cj的条件下,你需要考虑存在特征d的概率。•p(cj)=出现类cj的概率这个只是表示在数据库中cj出现的有多频繁。•p(d)=出现实例d的概率在所有类都一样的情况下,这个可以忽略。我们也把分类和其他相似距离的分类器做了比较:Euclidian和MahCosine距离[5][6]距离向量可修正。Euclidian距离这是一个由毕达哥拉斯公式给出的度量。在欧式平面上,如果A=(x1,y1)和B=(x2,y2),则距离给出为:MahCosine距离MahCosine距离是一个用于评估两个夹角向量变换到马氏空间上的余弦量。I和J两点的MahCosine距离和他们在马氏空间上的投影a和b由下面公式给出:Ⅵ.对比结果本文中我们用了基于人脸部分基于几何距离测量的局部特征法。所有来自ORL人脸数据库的具有高度变化性的重要的距离量都会在结合三种特征选择法后被进行检测。我们提出的方法经过比较研究后在下表和下图中显示,在应用了朴素贝叶斯分类器后,达到了78.75%这样好的识别率和相较于全局法更好的执行时间。在测试中,我们使用的是英特尔酷睿i3处理器,4GB内存和Matlab2009b来运行不同的特征选择和分类计数。Ⅶ.结论和观点在现有文献中,有三类人脸识别的方法:全局法,局部法和混合法。本文中,我们在ORL数据库上我们研究了局部的人脸识别的方法;结果表明局部法速度是快于全局法的。事实上,研究得出所有的方法在识别率上是相似的。局部法主要的优势在于我们可以使用计算结果开启一种新的趋势和软生物特征中号称可以加强识别率的挑战。在接下来的工作中,我们的目标是在加入其他分类器的实验结果中验证本文的对照结果,比如多层神经网络法和支持向量机法。对于接下来的工作,我们打算在贝叶斯框架下融合软硬两种生物特征。基于贝叶斯规则信息融合的目标是证明直接从经典识别中推导出的软生物特征,可以提升面部生物识别体统的性能。鸣谢作者非常感谢来自GeneralDirectionofScientificResearch(DRGST),Tunisia,ARUB旗下计划的资金支持。作者也非常感谢ORL人脸数据库的支持。参考文献[I]AlphonseBertillon:FatherofScientificDetection,1954.[2]AnilK.JainandSaratC.DassandKarthikNandakumarandKarthikN.SoftBiometricTraitsforPersonalRecognitionSystems.ProceedingsofIntemationalConferenceonBiometricAuthentication.HongKongpp731-7382004[3]Samangooei,S.TheUseofSemanticHumanDescriptionasaSoftBiometric.Biometrics:Theory,ApplicationsandSystems,2008.BTAS2008.2ndIEEEInternationalConferenceonppI-7Sept.292008-0ct.I2008[4]AntitzaDantcheva,CarmeloVelardo,AngelaD'Angelo,Jean-LucDugelay.Bagofsoftbiometricsforpersonidentification.MultimediaToolsandApplications,Volume51,Issue2,pp739-777Janvier2011.[5]V.StrucandN.Pavesic,TheCompleteGabor-FisherClassifierforRobustFaceRecognition,EURASIPAdvancesinSignalProcessing,volume2010pages26[6]V.Strucan