燕山大学本科毕业设计(论文)开题报告课题名称:基于Fisher判别的人脸识别研究学院(系):燕山大学里仁学院年级专业:13级检测技术及仪器学生姓名:康立鹏指导教师:付荣荣完成日期:2017年3月25日目录一、综述本课题国内外研究动态,说明选题的依据和意义......................................-1-1.1课题的研究背景及选题依据.............................................................................-1-1.2选题的目的和意义.............................................................................................-2-二、研究的基本内容,拟解决的主要问题.......................................错误!未定义书签。三、方案论证..................................................................................................................-3-3.1Fisher判别分析(LDA)..................................................................................-3-3.2深度学习法........................................................................................................-5-四、研究步骤及措施....................................................................................................-5-五、研究工作进度..........................................................................................................-5-六、主要参考文献..........................................................................................................-6-七、指导教师意见..........................................................................................................-8-八、系级教学单位审核意见:......................................................................................-9--1-一、综述本课题国内外研究动态,说明选题的依据和意义1.1课题的研究背景及选题依据判别分析,是一种统计判别和分组技术,就一定数量样本的一个分组变量和相应的其他多元变量的已知信息,确定分组与其他多元变量信息所属的样本进行判别分组。人脸识别是一个典型的图像模式分析、理解与分类计算问题,涉及模式识别、图像处理和统计学习等多个学科。下面是这两方面的具体阐述及研究动态。Fisher判别:亦称典则判别,是根据线性Fisher函数值进行判别,通常用于梁祝判别问题,使用此准则要求各组变量的均值有显著性差异。该方法的基本思想是投影,即将原来在R维空间的自变量组合投影到维度较低的D维空间去,然后在D维空间中再进行分类。投影的原则是使得每一类的差异尽可能小,而不同类之间投影的离差尽可能大。Fisher判别的优势在于对分布、方差等都没有任何限制,应用范围比较广。另外,图1.1判别分析用该判别方法建立的判别方差可以直接用手工计算的方法进行新样品的判别,这在许多时候是非常方便的。人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。人脸识别系统的研究始于20世纪60年代,80年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在90年后期,并且以美国、德国和日本的技术实现为主;图1.2人脸识别人脸识别系统成功的关键在于是否拥有尖端的核心算法,并使识别结果具有实用化-2-的识别率和识别速度;“人脸识别系统”集成了人工智能、机器识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术,同时需结合中间值处理的理论与实现,是生物特征识别的最新应用,其核心技术的实现,展现了弱人工智能向强人工智能的转化。传统的人脸识别研究主要是基于可见光图像的人脸识别,这也是人们熟悉的识别方式,已有30多年的研发历史。但这种方式有着难以克服的缺陷,尤其在环境光照发生变化时,识别效果会急剧下降,无法满足实际系统的需要。解决光照问题的方案有三维图像人脸识别,和热成像人脸识别。但这两种技术还远不成熟,识别效果不尽人意。迅速发展起来的一种解决方案是基于主动近红外图像的多光源人脸识别技术。它可以克服光线变化的影响,已经取得了卓越的识别性能,在精度、稳定性和速度方面的整体系统性能超过三维图像人脸识别。这项技术在近两三年发展迅速,使人脸识别技术逐渐走向实用化。人脸与人体的其它生物特征(指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提,与其它类型的生物识别比较人脸识别具有如下特点:非强制性:用户不需要专门配合人脸采集设备,几乎可以在无意识的状态下就可获取人脸图像,这样的取样方式没有“强制性”;非接触性:用户不需要和设备直接接触就能获取人脸图像;并发性:在实际应用场景下可以进行多个人脸的分拣、判断及识别;除此之外,还符合视觉特性:“以貌识人”的特性,以及操作简单、结果直观、隐蔽性好等特点。综上所述,人脸识别技术在社会生活的诸多方面都具有广泛的应用,给人们的生产生活都带来了极大的方便,也正是因为如此,我决定选择这个题目作为我的毕业设计题目,从而更深入的认识人脸识别在生活中的应用。1.2选题的目的和意义目的:一方面对典型的Fisher判别方法在人脸识别的应用上进行研究,实现人脸的自动识别。一方面,通过深度学习算法实现对人脸的自动识别并能够在实际生活中应用。意义:人脸识别主要用于身份识别,有望应用身份证、社保卡的身份确认以及门禁等安防系统中。由于视频监控正在快速普及,众多的视频监控应用迫切需要一种远距离、用户非配合状态下的快速身份识别技术,以求远距离快速确认人员身份,实现智能预警。人脸识别技术无疑是最佳的选择,采用快速人脸检测技术可以从监控视频图象中实时查找人脸,并与人脸数据库进行实时比对,从而实现快速身份识别。-3-人脸识别产品已广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗及众多企事业单位等领域。随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。1、企业、住宅安全和管理。如人脸识别门禁考勤系统,人脸识别防盗门等。2、电子护照及身份证。中国的电子护照计划公安部一所正在加紧规划和实施。3、公安、司法和刑侦。如利用人脸识别系统和网络,在全国范围内搜捕逃犯。4、自助服务。5、信息安全。如计算机登录、电子政务和电子商务。在电子商务中交易全部在网上完成,电子政务中的很多审批流程也都搬到了网上。而当前,交易或者审批的授权都是靠密码来实现,如果密码被盗,就无法保证安全。但是使用生物特征,就可以做到当事人在网上的数字身份和真实身份统一,从而大大增加电子商务和电子政务系统的可靠性。具体应用实例:数码相机人脸自动对焦和笑脸快门技术:首先是面部捕捉。它根据人的头部的部位进行判定,首先确定头部,然后判断眼睛和嘴巴等头部特征,通过特征库的比对,确认是人面部,完成面部捕捉。然后以人脸为焦点进行自动对焦,可以大大的提升拍出照片的清晰度。笑脸快门技术就是在人脸识别的基础上,完成了面部捕捉,然后开始判断嘴的上弯程度和眼的下弯程度,来判断是不是笑了。以上所有的捕捉和比较都是在对比特征库的情况下完成的,所以特征库是基础,里面有各种典型的面部和笑脸特征数据。门禁系统人脸识别门禁是基于先进的人脸识别技术,结合成熟的ID卡和指纹识别技术而推出的安全实用的门禁产品。产品采用分体式设计,人脸、指纹和ID卡信息的采集和生物信息识别及门禁控制内外分离,实用性高、安全可靠。系统采用网络信息加密传输,支持远程进行控制和管理,可广泛应用于银行、军队、公检法、智能楼宇等重点区域的门禁安全控制。三、方案论证3.1Fisher判别分析法(LDA)Fisher在1936年的一篇经典论文中解决了这一问题。推导过程用到了矩阵特征值、对向量求微分等矩阵论知识。假设有一集合H包含N个d维样本x1,x2,...,𝑥𝑛,其中N1个属于ω1类的样本记为子集H1,N2个属于ω2类的样本记为H2。若对𝑥𝑛的分量做线性组合可得标量:-4-yn=𝑤T𝑥𝑛,n=1,2,...,N这样便得到一个一维样本𝑦𝑛组成的集合,并可分为两个子集Y1与Y2。从集合上看,如果||w||=1,则每个𝑦𝑛就是相对应的𝑥𝑛到方向为w的直线上的投影。实际上,w的绝对值是无关紧要的,他仅使𝑦𝑛乘上一个比例因子,重要的是选择w的方向。W的方向不同,将使样本投影后的可分离程度不同,从而直接影响识别效果。因此,所谓寻找最好投影方向的问题,在数学上就是寻找最好的变换向量w*的问题。下面先定义几个必要的基本参量以方便叙述。1.在d维空间(1)各类样本均值向量mi𝑚𝑖=1𝑁𝑖∑𝑥𝑥∈𝐻𝑖,i=1,2(2)样本类内离散度矩阵Si和总类内离散度矩阵Sw𝑆𝑖=∑(𝑥−𝑚𝑖𝑥∈𝐻)(𝑥−𝑚𝑖)𝑇,𝑖=1,2𝑆𝑤=𝑆1+𝑆2(3)样本类间离散度矩阵SbSb=(m1-m2)(m1-m2)其中Sw是对称半正定矩阵,而且当Nd时通常是非奇异的。Sb也是对称其正定矩阵,在两类条件下,它的秩大于等于1。2.在一维Y空间(1)各类样本均值𝑚̃𝑚̃=1𝑁𝑖∑𝑦𝑦∈𝑌𝑖,𝑖=1,2(2)样本类内离散度𝑆𝑖̃2和总类内离散度𝑆𝑤̃𝑆𝑖̃2=∑(𝑦−𝑚𝑖̃),𝑖=1,2𝑦∈𝑌𝑖𝑆𝑤̃=𝑆1̃2+𝑆2̃2现在来定义Fisher准则函数。为了投影后,在一维Y空间里各类样本尽可能分得开些,即希望两类均值之差(𝑚1̃−𝑚2̃)越大越好;同时希望各类样本内部尽量密集。即希望类内离散度越小越好。因此,定义Fisher准则函数:𝐽𝐹(𝑤)=(𝑚1̃−𝑚2)̃𝑆1̃2+𝑆2̃2,下面求使JF(w)取极大值时的w*。w*=𝑆𝑤−1(m1-m2)w*就是使Fisher准则函数JF(w)取极大值的解,也就是d维X空间到一维Y空间的最好投影方向。至此,本文已经漂亮的解决了问题的一大半,最后只剩如何在这个一维空间上确定阈值。其实这也好办。比如说,如果以知两类的先验概率,则可以根据Bayes准则;若没有任何先验知识,可以简单的取阈值=𝑚1+𝑚2̃̃2.-5-3.2深度学习法深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深度置信网络(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构