LBP算子介绍

gino8222
1 ℃
2019-10-07

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

LBP算子介绍LBP(LocalBinaryPattern,局部二值模式)是一种用来描述图像局部纹理特征的算子；显然，它的作用是进行特征提取，而且，提取的特征是图像的纹理特征，并且，是局部的纹理特征；原始的LBP算子定义为在3*3的窗口内，以窗口中心像素为阈值，将相邻的8个像素的灰度值与其进行比较，若周围像素值大于中心像素值，则该像素点的位置被标记为1，否则为0。这样，3*3领域内的8个点可产生8bit的无符号数，即得到该窗口的LBP值，并用这个值来反映该区域的纹理信息。如下图所示：原始的LBP提出后，研究人员不断对其提出了各种改进和优化，从而得到了诸如半径为R的圆形区域内含有P个采样点的LBP算子；LBP均匀模式；LBP旋转不变模式；LBP等价模式等等，具体请参考T.Ojala在IEEETPAMI上2002年发表的那篇文章“MultiresolutionGray-ScaleandRotationInvariantTextureClassificationwithLocalBinaryPatterns”。另外，LBP算子的中文参考文章，可以参考以下：（1）基于LBP的人脸识别研究，黄非非，重庆大学硕士毕业论文，2009年（2）基于LBP的特征提取研究，王玲，北京交通大学硕士毕业论文，2009年（3）基于局部二值模式的人脸识别方法研究，周凯，中南大学硕士毕业论文，2009年显而易见的是，上述提取的LBP算子在每个像素点都可以得到一个LBP“编码”，那么，对一幅图像提取其原始的LBP算子之后，得到的原始LBP特征依然是“一幅图片”。不过，这里我们已经将物体从图片（图片可以理解为物体在原始测量空间得到的测量特征）转换为二次特征，也就是得到了我们通常说的“特征”。不过，这个所谓的“特征”并不能直接用于判别分析。因为，从上面的分析我们可以看出，这个“特征”跟位置信息是紧密相关的。直接对两幅图片提取这种“特征”，并进行判别分析的话，会因为“位置没有对准”而产生很大的误差。后来，研究人员发现，可以将一幅图片划分为若干的子区域，对每个子区域内的每个像素点都提取LBP特征，然后，在每个子区域内建立LBP特征的统计直方图。如此一来，每个子区域，就可以用一个统计直方图来进行描述；整个图片就由若干个统计直方图组成；例如：一幅100*100像素大小的图片，划分为10*10=100个子区域，每个子区域的大小为10*10像素；在每个子区域内的每个像素点，提取其LBP特征，然后，建立统计直方图；这样，这幅图片就有10*10个子区域，也就有了10*10个统计直方图，利用这10*10个统计直方图，就可以描述这幅图片了。之后，我们利用各种相似性度量函数，就可以判断两幅图像之间的相似性了；目前，LBP局部纹理提取算子，已经成功应用在指纹识别、字符识别、人脸识别、车牌识别等领域。另一篇，介绍的也不错，这里放上：LBP(localbanarypatter)是一种非常经典的用来描述图像局部纹理特征的算子。1，基本LBPLBP方法自1994年提出，此后就作为一个有效的纹理特征，不断的被人使用和改进。LBP非常简单，也非常有效。左边的图是从一个图片上拿下来的3*3矩阵，矩阵上的值就是像素值，现在我们要计算的中间那个点的LBP。除了它此外的8个点依次与中间点比较，比它(也就是15)大的记成1，比它小的记成0，然后我们就得到右面的图片。然后我们选定一个起始点-这个图片选的是左上角第一个点，然后按照顺时针方向得到一个二进制串10011010，转换为十进制则为154。到此，我们得到了中间点的LBP值--154。对整个图片的所有点都这样处理，也就是以它为中心与附近的8个点相比较，这样就得到整个图所有点的LBP值。那么得到这么个与源图像大小相等的LBP值矩阵有什么用呢？通常我们统计它的直方图，得到一个直方图矩阵向量，然后每一个图片对应一个直方图向量，这个直方图向量就是此图片的一个特征。我们由两个图像的直方图向量从而得到它们的相似度，从而来分类。2，LBP均匀模式LBP(uniformLBP)均匀模式就是一个二进制序列从0到1或是从1到0的变过不超过2次（这个二进制序列首尾相连）。比如：10100000的变化次数为3次所以不是一个uniformpattern。所有的8位二进制数中共有58个uniformpattern.为什么要提出这么个uniformLBP呢，因为研究者发现他们计算出来的大部分值都在这58种之中，所以他们把值分为59类，58个uniformpattern为一类，其它的所有值为第59类。这样直方图从原来的256维变成59维。3，旋转不变模式LBP旋转不变模式LBP能够在图片发生一定的倾斜时也能得到相同的结果。它的定义可以看下图：我们看到中心点的邻居不再是它上下左右的8个点（补充一句，不一定非要是3*3的邻域，这个自己定，但是邻域大了意味着直方图向量维度的增加），而是以它为圆心的一个圈，规定了这个圆的半径和点的个数，就可以求出各个点的坐标，但是点的坐标不一定是整数，如果是整数那么这个点的像素值就是对应点的值，如果不是整数，就用差值的方式得到。其他基于LBP的算法1，MBP将整个邻域内的所有点的中值作为阈值进行比较，中值不是平局值哦，是所有的值按照从小到大排列，最中间的那个。话说这个MBP可以用matlab的一个函数实现:medfilt22，利用邻域内所有点的平局值作为阈值。3，第三种不是在阈值上做改动，而是将大图片切分成小图片，然后再小图片上用LBP方法，然后把小些小图片的直方图矩阵连接起来，成为大图的特征。为什么这么做呢？因为很明显的LBP直方图会丢失局部信息，比如得到一个值为100那么不管你这个值是从哪里得到的--比如人脸，不管是眼睛处得到这个值还是鼻子处得到，应该不管，都放到lable=100这里。