上海交通大学硕士学位论文基于人脸的性别识别姓名:许孜奕申请学位级别:硕士专业:模式识别与智能系统指导教师:施鹏飞20090120上海交通大学硕士学位论文摘要第I页基于人脸的性别识别摘要人脸是重要的生物特征之一,人脸图像上蕴含了大量的信息,例如性别、年龄、人种、身份等。人脸的性别识别就是试图赋予计算机根据输入的人脸图像判断其性别的能力。本文基于人脸正面图像进行性别分类。一般而言,人脸性别识别系统分为图像预处理,人脸特征提取和分类器识别三部分。本文针对这三个部分展开研究,并比较了几种不同方案的识别性能。通过对性别识别的重要理论的研究,为了提高性别识别率,本文提出了采用AdaBoost算法提取整体特征,主动表观模型提取局部特征,组合局部与整体特征后使用支持向量机(SVM)进行分类的方法。本文在一个由AR、FERET、CAS-PEAL-R1、网上收集和实验室自行采集所共同组成的,包含21,300余张人脸的数据库上,进行了大量有意义的实验。实验结果显示,融合了整体特征和局部特征后,识别率比基于(单独)整体特征的、基于(单独)局部特征的有很大的提高,达到了90%以上。本文还通过精心设计的对比实验对预处理过程中人脸有效区域的截取和AdaBoost的结构选择等方面给出了合理的建议。上海交通大学硕士学位论文摘要第II页关键词:性别识别,局部特征,整体特征,AdaBoost,支持向量机,主动表观模型上海交通大学硕士学位论文ABSTRACT第III页GenderRecognitionBasedonFaceFeaturesABSTRACTFaceisanimportantbiologicalfeature.Faceimagescontainagreatdealofinformation,suchasgender,age,race,ID,etc.Genderrecognitionisanattempttogivethecomputerstheabilitytodiscriminatethegenderinformationfromafaceimage.Generallyspeaking,onegenderclassificationsystemconsistsofthreemodules,faceimagepreprocessing,facialfeatureextractionandclassifier.Thispaperresearchesonthethreemodulesandcomparessomedifferentmethods.Inthispaper,anovelgenderclassificationmethodbasedonfrontalfaceimagesispresented.Inthiswork,theglobalfeaturesareextractedusingAdaBoostalgorithm.ActiveAppearanceModel(AAM)locates83landmarks,fromwhichthelocalfeaturesarecharacterized.Afterthefusionofthelocalandglobalfeatures,themixedfeaturesareusedtotrainsupportvectormachine(SVM)classifiers.Thismethodisevaluatedbytherecognitionratesoveramixedfacedatabasecontainingover21,300imagesfrom4sources(AR,FERET,CAS-PEAL-R1,).上海交通大学硕士学位论文ABSTRACT第IV页Experimentalresultsshowthatthehybridmethodoutperformstheunmixedappearance-orgeometry-featurebasedmethodsandachieveaclassificationrateover90%.ReasonablesuggestionsontheextractionoffacialregionandtheselectionofAdaBooststructureisgivenbasedoncarefullydesignedexperiments.Keywords:genderrecognition;localfeatures;globalfeatures;AdaBoost;SVM;AAM上海交通大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日上海交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年解密后适用本授权书。本学位论文属于不保密□。(请在以上方框内打“√”)学位论文作者签名:指导教师签名:日期:年月日日期:年月日上海交通大学硕士学位论文第一章绪论第1页第一章绪论1.1性别识别问题描述人脸是重要的生物特征之一,人脸图像上蕴含了大量的信息,例如性别、年龄、人种、身份等。人机交互技术(HCI)的发展使得计算机视觉、人工智能在监控、GUI人机界面设计等方面发挥了越来越重要的作用。随着技术的进步,基于人脸图像模式识别问题也成为近年来研究的热点。其中包括人脸检测、人脸身份识别、人脸属性(性别、年龄、表情、种族等)识别等各类识别问题。基于人脸的性别分类就是让计算机根据输入的人脸图像判断其性别的过程。人脸的性别识别似乎是人们“与生俱来”的能力,但让计算机识别并不容易,即使有大量来自计算机视觉、模式识别、人工智能、心理学等各领域的研究人员的努力,这个问题仍然困扰着他们。赋予计算机同样的能力一直是人类的梦想之一,如果把照相机、摄像头、扫描仪等外设看作计算机的“眼睛”,数字图像就是它看到的“影像”,性别识别的目标就是让计算机从“影像”中找到人脸并正确判断其性别。这种识别过程大体上分为以下步骤:人脸检测/定位计算机首先检测“影像”中是否存在人脸。如果存在,则给出其位置坐标、旋转角度、人脸区域大小等信息,以将人脸分离出来,供后续处理。这一步骤主要受到光照、噪声、面部姿态以及各类遮挡的影响。人脸检测是人脸性别识别的前期工作。同时,它也可以作为独立的完整功能模块用于监测、安保系统。特征提取在检测到的人脸上提取性别特征,即采用某种编码方式表示检测出的人脸。常用上海交通大学硕士学位论文第一章绪论第2页的特征包括以亮度分布信息为代表的整体特征和以五官的位置和形状轮廓信息为代表的局部特征。特征提取之前往往还需要进行预处理,将这些人脸几何上、颜色上归一化,以削弱遮挡、姿态、光照、饰物等因素的影响。性别识别根据提取的面部特征,对待识别人脸的性别做出判断。1.3性别识别的研究意义与典型应用人脸的性别识别的研究始于二十世纪九十年代,问题起初是由心理学家进行研究的[1][2],他们致力于了解人类是如何分辨男女性别的。接着,有人从计算机视觉的角度进行研究,主要目标是要得到一个性别分类器。十多年来人脸的性别识别得到了长足的发展,尤其在近些年,更成为一个热门的研究课题,得到大量来自计算机视觉、模式识别、人工智能、心理学等各领域的研究人员的关注。人脸的性别分类几乎涉及到模式识别的不同方法,如人工神经网络(ANN)、主分量分析(PCA)、贝叶斯决策、支持向量机以及AdaBoost算法等等。性别识别在各个方面都有潜在的广阔的应用前景。性别识别在身份识别中可以充当“过滤器”的功能,利用检测出来的性别信息可以显著降低进行身份识别的搜索数量,从而提高身份认证识别速度与精度。[3]性别识别也是智能人机接口领域的重要研究内容之一。让计算机理解人脸面相的丰富信息并能加以分类,这恰是智能人机接口研究需要解决的问题之一,也是机器智能的重要表现。它的最终解决可以极大的改善目前呆板、不方便的人机交互环境,提供更为个性化的服务。例如可以在大型游乐场所、主题公园的导游车上配备这类系统,让计算机根据使用者不同的性别分布,随机应变地推荐一些更具针对性的商品或者旅游景点。也可以为超市、商店等提供分类更详细的统计信息,提供收集潜在客户数据的自动化途径,帮助其向消费者提供更具针对性的促销服务,从而在一定程度上改变人们的生活质量和生活方式。自2001年美国“9²11”恐怖袭击发生以来,安全性成为了人们日益关注的主要上海交通大学硕士学位论文第一章绪论第3页问题。为此,各国都投入大量物力人力研究并发展各类识别技术。性别识别也能在安保系统、身份验证系统中起到很大的作用,例如在某些需要限制异性出入的场所可以提供实时的视频监控。又例如可以在奥运会中用来监测,防止个别参赛选手“男扮女装”,利用力量、速度、耐力、爆发力等方面的优势,窃取奖牌的舞弊行为。1.4性别识别的研究现状(1)使用人工神经网络进行的探索性的研究从上世纪90年代起国外一些学者开始了人脸性别识别问题的研究,他们致力于理解人类判定性别的视觉处理机制,主要采用的是人工神经网络的方法。如Golomb等[1]训练了两层神经元网络SEXNET,用来识别30³30的人脸图像的性别。Cottrell和Metcalfe[2]差不多同时做了类似的实验,他们先对样本进行主分量分析,然后训练BP神经元网络用于识别人脸的表情和性别。Brunelli和Poggio[4]训练了一个HyperBF网络,使用16个几何特征进行性别分类。Tamura等人[5]训练了一个三层BP网络,在8³8的低分辨率人脸图像上取得了93%的分类结果。Abdi等人[6]用RBF网络和一个感知器进行实验,他们比较了基于几何特征和基于像素分布特征的性别识别方法,两者基本达到了相近的准确率。(2)支持向量机算法Moghaddam等人[7]使用基于RBF核的SVM分类器对21³12的“缩略图”人脸图像进行性别分类,并与一些传统的神经网络方法和线性分类器方法进行了系统的比较,他们发现SVM的分类效果显著好于其他分类器。实验中使用FERET人脸图像库进行了训练和测试,达到了96.6%的准确率。(3)AdaBoost分类算法Shakhnarovich等人[8]将Viola和Jones提出的基于类Haar基特征的AdaBoost方法应用于性别分类问题,训练并完成了一个自动检测、跟踪、性别识别系统,使用普通网络图片的测试正确率达78%,甚至稍好于他们同时训练用作比对的基于RBF核的SVM分类器的分类精度,而且在识别速度上比之快了约1000倍,达到了很好的效上海交通大学硕士学位论文第一章绪论第4页果。清华大学的武勃、艾海舟等人使用AdaBoost算法对基于类Haar基特征的LUT弱分类器进行训练分类。实验中使用了FERET图像库以及从互联网获得的一些人脸图像,将所有人脸图像归一化到36³36大小。他们发现比起普通基于阈值若分类器的AdaBoost方法,LUTAdaBoost方法收敛更快识别效果更佳。他们还将LUTAdaBoost方法使用在人脸图像的年龄分类上,分辨成年人和儿童。Baluja和Rowley[9]使用像素比较操作加上AdaBoost分类器,识别率超过93%,高于相同输入的SVM分类器的结果。(4)基于柔性模型的分类算法Saatci和Town[3]提出了基于主动表观模型的性别与表情识别方法。他们用AAM提取的特征来训练SVM分类器。他们在AR、IMM和