基于MB-LBP人脸检测算法张伦,楚如峰,向世明,廖胜才,斯坦·李生物识别与安全技术研究中心,中国科学院自动化模式识别研究所,国家重点实验室摘要通过使用基于AdaBoost学习算法的矩阵Haar-like特征方法,有效和实时脸部检测已经成为可能。在本文中,我们介绍了一组新的独特的人脸检测矩阵特征方法,称为多块局部二值模式(MB-LBP)。通过局部二进制模式操作,MB-LBP将矩阵区域编码成强度,得到的二值模式可以描述图像的多种局部结构。基于MB-LBP特征,研究出了一种基于AdaBoost学习算法的人脸检测方法。为了处理MB-LBP特征的非度量特征值,算法采用多分支回归树作为弱分类。实验表明,基于MB-LBP弱分类比Haar特征和原始LBP特征更加有区别度。鉴于相同的许多特征,在一个给定的0.001误报率下,所提出的人脸检测比haar-like特征高15%的正确率,比原始LBP特征高8%的正确率。这表明,MB-LBP特征可以捕获更多的图像结构信息,同时在简单地测量矩阵之间的差异下,比传统haar-like特征有更突出的性能。MB-LBP特征的另一优点是其较小的特征集,这使得训练时间要少得多。1引言人脸检测具有广泛的应用,例如自动人脸识别,人机交互,监控等。在最近几年,出现了基于脸部外观检测方案一个实质性的进展。这些方法解决的人脸检测作为两类(人脸/非人脸)的分类的问题。由于人脸外观,光照,表情和其它因素的变化,具有良好的性能的人脸/非人脸分类器应该是非常复杂的。用于构造人脸/非人脸分类的最有效的方法是基于学习的方法。例如,基于神经网络的方法,支持向量机制等。最近,由Viola和Jones提出的基于Boosting算法的检测被认为是在人脸检测的研究的一个突破。实时性能是通过学习一个简单的Haar-like矩阵特征的序列来实现。Haar-like特征编码在两个矩阵区域之间的平均强度的差异,并且可以迅速地通过积分图像进行计算。完整的Haar-like特征集大且包含冗余信息的质量。Boosting算法被引入到选择少数独特的矩阵特征,构建一个功能强大的分类器。此外,使用级联结构进一步加快的计算。李等人用一系列扩展的Haar特征多视图人脸,并改进的Boosting算法。但是,这些Haar-like矩阵特征显得过于简单,并且检测器通常含有成千上万的矩阵特征影响了相当大的性能。大量的选择特征,无论是在训练和测试阶段,导致了较高的计算成本。特别是,在级联的后期阶段,基于这些特征的弱分类器变得太弱以至于无法提高分类性能。提出了其他许多功能来代表面部图像,包括旋转Haar-like特征,人口普查变换,稀疏特征等。在本文中,我们提出了一个新的独特的特征,被称为多块局部二进制模式(MB-LBP)特征,用来表示人脸图像。MB-LBP的基本思想是通过局部二元模式操作器进行编码的矩形区域。MB-LBP特征也可以通过积分图像迅速计算,相比Harr-like特征而言,MB-LBP特征能够捕获更多的图像结构信息,并表现出更鲜明的性能。与局部二元模式相比,在像素之间的局部3×3的邻域计算方面,MB-LBP特征可以捕捉大尺度结构,这些结构可能是图像结构的主要特征。我们直接使用原始LBP算的输出作为特征值。但一个问题是,该值仅仅是一个用于表示二进制字符串符号。对于这种非十进制特征值,多分支回归树被设计为弱分类器。我们实现的特征选择和分类解释的GentleAdaboost算法。然后建造一个级联探测器。MB-LBP的另一优点是详尽组MB-LBP特征的数量比Haar-like特征小得多(尺寸为20×20的子窗口Haar-like特征的约1/20)。基于Boosting算法方法用Adaboost算法,从较大的、完整的特征集合中选择出一个明显的特征集合。这个过程往往花费很多时间,甚至数周。MB-LBP的较小的特征集合可以让这个过程更加简单。本文的其余部分安排如下。第2节介绍了MB-LBP特征。在第3节中,讲述了基于AdaBoost学习算法的特征以及分类解释。级联探测器也在本节所述。实验结果在第4给出第5节总结本文。2多块局部二元模式特征传统Haar-like矩阵特征测量矩形区域(参见图1)的平均强度之差。例如,一个双矩形滤波器的值是两个矩形区域内的像素的总和之间的差。如果我们改变的位置,大小,形状和矩形区域的布置中,Haar-like特征可以捕获在不同的位置,空间频率和方向的强度梯度。Viola和Jones采用3种这些特征用于检测正面人脸。通过使用积分图像,任何矩形滤波器类型,在任何规模或位置,可以在固定的时间进行评估。然而,Haar特征显得过于简单,显示出一定的局限性。(图1)传统的Haar特征这些特性测量矩形区域的平均强度之间的差异(图2)多块LBP特征的图像表示如该图所示,MB-LBP特征通过局部二进制模式进行编码的矩形区域的强度。由此产生的二进制模式可以描述不同的图像结构。与像素之间的局部3×3的邻域计算原局部二元模式相比,MB-LBP可以捕捉大尺度结构。在本文中,我们提出了一个新的独特的矩阵特征,称为多块局部二元模式(MB-LBP)特征。MB-LBP的基本思想是,在Haar-like特征的简单差规则被改变为通过局部二元模式操作者进行编码的矩形区域。原始LBP算法,由Ojala提出,通过阈值与中心像素的值的3×3邻域象素值对于每个像素定义。来编码的矩阵,所述MB-LBP算由中央矩形平均强度Gc。与那些其附近的矩形{g0,...,g8}的比较来定义。通过这种方式,它可以给我们一个二进制序列。可以如下得到的MB-LBP算的输出值:iiciggsLBPMB2)(81其中gc是中心矩形的平均强度,gi(i=0,...,8)是那些其附近的矩阵,0,00,1)(xifxifxs这样的MB-LBP算的更详细的说明可以在图2中找到。我们直接使用生成的二进制模式为MB-LBP特征的特征值。这样的二进制图案可以检测多种图象结构,例如边缘,线,斑点,平坦区域和角落,在不同的尺度和位置。局部二进制与像素之间的局部3×3的邻域计算最初的局部二元模式相比,MB-LBP可以捕捉可能是图像的主要特征大规模的结构。总体上,我们可以得到256种二进制模式,其中一些可以在图3中发现,在4.1节中,我们进行一项实验,用来评估MB-LBP特征。实验结果表明,MB-LBP功能比Haar特征和最初的原始LBP特征更加鲜明。图3、MB-LBP特征值随机选择的子集。MB-LBP的另一优点是MB-LBP特征的详尽的数量集合(以不同比例,位置和纵横比的矩形)比Haar-lke特征小得多。鉴于20×20子窗口的大小,总共有2049MB-LBP特征,这一数额大约1/20的Haar特征(45891)。人们通常使用Adaboost算法,从全部的特征的集合中选择出显著的特征,构建二元分类。由于大量的Haar-like特征集合,训练过程通常花费太多的时间。少量的MB-LBP特征集合使得特征选择的实施显著容易。它应当强调的是的MB-LBP特征值为非十进制。原始LBP操作器的输出仅仅是代表二进制串的符号。在下一节中,我们将介绍如何设计基于MB-LBP特征的弱分类,并应用Adaboost算法选择显著的特点,构建分类。3特征选择和分类器构造尽管MB-LBP特征的特征集比Haar特征小得多,它也含有大量的冗余信息。在AdaBoost算法被用来选择显著功能和构造的二元分类器。这里,AdaBoost算法被采用以解决在一以下三个基本问题提升程序:(1)学习有效特征从大的功能集,(2)构建弱分类器,其中每一个是基于所选择的特征之一,(3)提升弱分类成强分类。3.1AdaBoost的学习我们选择使用Boosting算法中的GentleAdaboost算法,由于它是简单的实现和数值鲁棒性的版本。给定一组的训练实例如(X1,Y1),...,(XN,YN),其中YI∈{+1,-1}是该例子的类标号XI∈RN。推进学习提供了一个连续的过程,以适应形式的加模型MmmxfxF1)(,这里xfm的通常被称为弱学习,和F(x)时称为强学习者。GentleAdaboost算法使用最小化成本函数自适应牛顿步骤:xyFeEJ,其对应于在每一步最小化的加权平方误差。1、从权重开始0,,...,2,1,1xFNiNwi2、重复Mm,...,1(a)用加权最小二乘法拟合出回归函数。(b)更新)()()(xfxFxFm(c)更新)(imixfyiieww并归一化3、输出分类])([)(1MmmxfsignxF表1、GentleAdaBoost算法在每个步骤中,弱分类xfm的选择,以最小化的加权平方误差:NiimiiwsexfywJ12))((3.2弱分类这是常见的定义弱学习者xfm的是最佳的阈值分类功能,它通常被称为一个树桩。然而,它在第2部分中表明的MB-LBP特征值为非十进制。因此,它不可能使用基于阈值的功能作为弱学习。在这里,我们描述了如何设计弱分类器。对于每个MB-LBP特征,我们采用多分支树作为弱分类器。多支树共256个分支,每个分支反映了离散的MB-LBP特征。弱分类可以被定义为:255,...,...0,)(2550kkjkmxajxaxaxf其中,kx表示特征矢量x的第k个元素,并且ja中,j=0,...,255,要了解到回归参数。这些薄弱的学习者通常被称为决定或回归树。我们能找到的最好的基于树的弱分类(参数k,第j用最小平方加权误差恶趣。(2),就像我们会学会在一个节点。恶趣回归tree.The最小化(2))给出了以下参数:ikiiikiiijjxwjxywa)()(由于每个弱学习取决于单一特征,一个特征是在每个step.In测试阶段选择,给定一个MB-LBP特性,我们可以通过这样的多分支树快速得到相应的回归值。这个功能类似于查找表(LUT)弱分类为类Haar特征,所不同的是,LUT的分类给出实值域的分区。4实验在本节中,我们进行了两个实验,以评估建议的方法。(1)比较MB-LBP特征与Haar特征和原始LBP特征。(2)评估对CMU+MIT人脸数据库所提出的检测器。总共10,000面部图像是从不同的来源收集,覆盖在[-30◦,30◦]的范围外的平面和在计划的旋转。对于每一个对准的面的例子,是由以下的随机变换产生4合成面的例子:镜像,随机移位至+1/-1的像素,在平面内旋转15度之内,20%的变化内结垢。那么面对例子进行裁剪和重新调整为20×20像素。完全,我们得到了一组40000脸上例子。超过20000不包含脸部放大图用于收集非面部样本。4.1特征比较在这一节中,我们比较MB-LBP特征与Haar-like矩阵特征和原始LBP特征的性能。在实验中,我们使用26000脸样本,并将它们随机分至两个同样部分,一个用于训练,另一个用于检测。非面部样本被随机地从其中不包含脸部放大图收集。我们的训练集包含13000脸样本13,000非面部样本,并且测试集包含13000脸样本和50,000个非人脸样本。基于AdaBoost的学习框架,三Boosting分类器的训练。他们每个人都包含所选的50Haar特征,传统的原始LBP特点和MB-LBP功能,分别为。然后,他们在测试集评估。图4(a)示出了错误率(平均的误报率和错误拒绝率),为的训练过程中所选择的特征的数量的函数的曲线。我们可以看到对应于MB-LBP特征具有最低误差率的曲线。这表明帽子基于MB-LBP特征的弱分类比较判别。三个分类子测试集可以在图4中找到(二)。它表明在给定的误报率在0.001,分类器根据MB-LBP的ROC曲线设有怎么样了15%的较高正确率(图4)与MB-LBP特征比较结果,Haar-like特征和原始LBP特征。(a)中的曲线表示了错误率的在训练过程中所选择的特征数。(b)中ROC曲线显示了在测试集合中的三个分类分类器性能。比原始LBP功能提高8%。上述所有显