北京交通大学硕士学位论文基于大规模数据库的人脸识别研究姓名:张诗嘉申请学位级别:硕士专业:信号与信息处理指导教师:阮秋琦20090601基于大规模数据库的人脸识别研究作者:张诗嘉学位授予单位:北京交通大学相似文献(4条)1.学位论文李祎基于核技术的子空间分析方法及其在人脸识别中的应用2007核的数学理论诞生于二十世纪初,而基于核技术的学习方法在二十世纪90年代中期才被引入模式分析领域.作为从统计学习理论中发展出来的较新的研究方法,核学习方法具有三个最显著的优点:1.能够高效地分析数据间的非线性关系.2.有效解决了传统模式识别方法的局部极小化和不完全统计分析的缺点(例如后向传播多层神经网络算法和决策树学习算法).3.算法的实现具有很强的模块性.因此高效而富有理论根据.作为核学习方法的一个分支,基于核技术的子空间分析方法在人脸识别领域取得了非常成功的应用.然而,基于核技术的学习方法往往存在两个关键性问题:一是大规模数据库的计算复杂度立方关系问题.二是隐性映射核函数选择问题.本文针对前者做了一定研究.本文的主要工作如下:1.对核学习方法的发展历史、理论基础和典型方案进行了综述.首先针对模式分析中核方法的发展特点,将核方法研究划分为三个历史阶段,对每个阶段研究的特点以及代表性方法进行了总结,给出核方法发展历史简表.进而详细分析了核方法所基于的理论基础:包括核方法的基本数学理论基础内积空间‘希尔伯特空间,核方法的关键核函数,核方法的信息瓶颈核矩阵(Gram矩阵),以及核方法的技巧核的构造.在此基础上,对基于核技术进行模式分析较为成功的两个典型方案:支持向量机和基于核技术的子空间分析方法,加以回顾和综述.最后从理论和应用的角度,归纳了核方法的优势和劣势.2.研究了基于核技术的子空间分析方法的时空代价问题并提出了基于Bagging策略的有效核Fisher判别分析的解决方案.针对KFDA在大规模数据库训练时高时空代价的问题,提出了基于Bagging策略的有效核Fisher判别分析(BKFD)用于人脸识别.通过引入Bagging策略,每个KFDA子分类器的训练集规模都被控制在可以处理的范围,并且这样整体训练过程的时间空间消耗都被降低了.同时,又对Bagging技术在KFDA中的应用进行了技巧性的改进,从而进一步改善了性能.通过在较大规模的FERET人脸库、CAS-PEAL-R1人脸库以及它们的混合库上的对比实验,显示了基于:Bagging策略的有效核Fisher判别分析方法的有效性:该方法不仅能大幅降低训练过程的时空代价,并且能够取得较之传统KFDA和直接Bagging策略更高的识别率.3.对各种基于核技术的子空间分析方法进行了实现,并在通用人脸数据库上进行了比较和评价.介绍了线性子空间分析方法(主元分析、线性判别分析),非线性子空间分析方法(核主元分析、核线性判别分析)的基本思想和具体实现算法.并对其中的6种算法的鉴别准确率进行测试,分别是:主元分析方法,即特征脸(Eigenface)方法;三种不同的线性判别分析方法,包括Fisher脸(Fisherface)方法、DirectLDA(DLDA)方法和简化零空间(NLDA)方法;以及两种基于核技术的方法,核主元分析(KPCA)方法和核线性判别分析(KLDA)方法.发现基于核技术的子空间分析方法在光照变化不咀显,或者类间的光照变化不完全一样,但类内的光照变化大体相同,即使不同也比较均匀,表情变化不太夸张,存在一定姿态变化的数据集上,其优势相对于对应的线性子空间分析方法更明显;反之,对于光照变化是非均匀的,非全局的,存在很多幅侧面打光的人脸图像,同一个人的表情变化比较丰富和夸张的数据集,基于核技术的子空间分析方法反而不如相应的线性子空间分析方法效果好.本文的上述内容不仅对于研究基于核技术的子空间分析方法本身有重要参考价值,同时也对研究核学习方法和人脸识别技术有一定借鉴意义.2.学位论文楚汝峰基于统计学习的多模态生物特征识别2007随着信息化的不断加快,国家公共安全、信息安全等关系国计民生的领域需要高可靠性、高安全性的全新身份识别技术,生物特征识别技术应运而生。但是,仅靠单一生物特征模态(比如人脸、虹膜、指纹、掌纹等)的识别技术,往往由于其自身的一些缺陷和不足,有时难以满足人们对身份识别高准确性和易用性的要求,多种生物特征的有效融合可从多方面改善身份识别系统的性能。本文以人脸生物特征模态为基础,对基于统计学习的多模态生物特征识别算法与系统进行了研究。主要研究内容如下:br ⑴研究了生物特征识别相关的一些基础算法。探讨了基于统计学习的眼睛定位、眼睛状态检测和近红外人脸识别算法,在实际应用中取得了很好的性能。提出了一种基于Gabor幅度特征和统计学习的掌纹识别算法,与现有的方法相比,取得了更好的实验结果。br ⑵提出了一种基于近红外和可见光图像的多模态人脸识别算法。分析了近红外和可见光模态人脸图像的特点,提出了基于分数层融合的多模态人脸识别算法,并构建了相应的原型系统。在室内场景和室外场景两种典型的应用环境中,对该融合算法与系统进行了深入分析和性能评估。br ⑶基于排序测度特征表示的人脸和掌纹识别技术,初步研究了人脸和掌纹多模态分数层融合算法。在大规模数据库上对人脸和掌纹融合算法进行有效性测试。分析了不同的分数归一化方法对识别的影响,并测试比较了不同分数层融合方法的性能,为后续研究提供了有意义的参考。br ⑷提出了一种基于统计学习的人脸和掌纹特征层融合算法。通过合理选择有效的局部特征表示和统计学习方法,有效地利用了人脸和掌纹两种模态中最具互补性的局部特征,构建了高效的多模态融合识别分类器。该算法不仅可以有效提高单一模态生物识别系统的性能,而且可以提高系统的运算效率。3.学位论文崔家礼虹膜图像预处理与合成研究2006随着人类活动范围的增大和现代社会对安全要求的提高,传统的基于标志物或口令的身份鉴别方法由于其自身的缺点已经不能满足社会需求,于是基于生物特征识别的身份鉴别方法应运而生。生物特征识别是指利用人身可测量的特有的行为或生理特征进行身份鉴别的一门技术,例如指纹识别、人脸识别、虹膜识别和步态识别等。在所有的生物特征识别技术中,虹膜识别的准确性是非常高的,而且其采集过程具有非接触性,这些性质决定了虹膜识别在身份鉴别方面具有良好的应用前景,目前已经有基于虹膜识别的身份鉴别系统用在边境通关、机场和ATM机(AutomaticTellerMachine)等场所。虹膜识别系统的一个重要组成部分是虹膜图像预处理,包括图像质量评估、虹膜检测、虹膜分割、归一化、活体检测等。预处理算法非常重要,影响着系统的识别性能和速度,但现有的预处理模块不完整并且还有提升的空间。另外,为了对识别算法进行测试和比较,我们需要建立大规模虹膜图像数据库,但由于现实的原因实际采集大量虹膜图像往往不很方便,而虹膜图像合成可以建立大规模数据库。因此,本文的工作主要针对虹膜图像预处理和合成,主要贡献包括:br 1.提出了两种虹膜检测算法。虹膜检测方法利用虹膜的结构信息解决了图像中虹膜的存在性问题,使预处理模块更加完整。检测结果同时提供了虹膜的粗略位置,为接下来的图像质量评估和虹膜区域分割提供了条件。br 2.提出了两种虹膜分割算法。虹膜分割包括内外圆定位、上下眼睑检测和睫毛检测。我们提出的第一种方法融合了纹理和灰度信息,充分利用了虹膜的特殊属性。第二种方法通过关键点的检测进行虹膜区域分割,提高了虹膜区域分割的速度。br 3.提出了基于ROI(RegionofInterest)的虹膜图像质量评估算法和活体检测算法,建立了一个简单的归一化模型。br 4.提出了基于PCA(PrincipalComponentAnalysis)和Markov随机场的虹膜图像合成算法。我们利用提出的算法建立了一个合成图像数据库,这是第一个合成虹膜图像数据库,同时也是目前已知的最大的虹膜图像库。br 5.提出了基于局部极值点的虹膜识别算法。该方法从二维曲面表达的角度提取局部极值作为特征点,取得了较高的识别率。br 我们用C++语言实现了上述算法,编译成符合BioAPI标准的动态链接库,同时融合上面提出的方法建立了一个实际的虹膜识别系统,在应用中取得了令人满意的效果。4.学位论文邢延超人脸特征自动识别中的理论及方法研究2003该文针对人脸识别系统涉及到的人脸检测、人脸识别、人脸验证和识别策略设计等问题进行了深入研究,提出了一些新的概念、方法和系统结构.该文的主要工作内容如下.1、提出了基于谷极点和支持向量机的假设-验证人脸检测算法,前者用于生成人脸假设,后者用于人脸假设验证.谷极点对面部姿态、光照等变化更加鲁棒,对倾斜人脸检测特别有效,同时具有更高的双眼定位精度.算法中还提出了几种提高检测速度的措施.首先通过提取肤色区域缩小人脸搜索范围,该文提出模糊增强色度表算法,提高了色度表的区分能力,又提出了形态学肤色区域后处理,减轻了后续处理的难度;其次,利用谷运算结果图像的分割结果进一步减少人脸假设数目,为此该文提出了多阈值融合图像分割算法,它有效解决了复杂场景下的多目标自动分割,而且性能稳定.2、人脸识别属于同类模式识别问题,在分析了同类模式识别的特点后,对灰度图像模式中边缘、平坦区域的特性进行了比较.在此基础上,提出了基于纹理增强Hausdorff距离的识别算法:通过对边缘区域分析建立对应关系,然后基于仿射变换约束改进对应关系,最后计算模式间的相似度.该算法融合了几何和纹理信息,在识别率和速度上取得了满意的折中,且对人脸定位误差、光照和表情等变化更加鲁棒.3、提出了基于支持向量机的增强弹性图匹配人脸验证算法.在传统弹性图匹配基础上,首先引入面部几何特征相似度改进几何成本定义,然后将所有成本分量组织为一个向量,利用支持向量机训练,生成新的成本函数.新成本函数具有更高的类间区分能力,而且可以自动确定各成本分量的重要性,避免了反复迭代确定经验权值的麻烦.4、针对现有顺序比较策略效率低下的缺点,提出了基于相似度排序空间的快速查询策略.该方法首先建立基于一组参考脸的相似度排序空间,在查询时只需将输入人脸与参考脸比较,提高了查询速度.对更大规模的数据库,该文又提出了基于分层聚类的树状索引结构,由于采用聚类算法完成子类划分,可有效避免同一类模式被错划到不同子树,松弛因子的引入则以很小的代价提高了查准率,该策略可以保证超大规模数据库应用获得实用的查询性能和速度.两种新策略显著提高了查询速度,同时识别率基本不变,为选取更精确的人脸识别基本算法提供了更大的空间.本文链接:授权使用:西北农林科技大学(xaxbnlkjdx),授权号:fb7d78af-469f-4218-a2b6-9e5a00b4d4d2下载时间:2010年12月28日