图像分割的阈值法综述(武汉理工大学信息工程学院)摘要:图像分割是由图像处理到图像分析的关键步骤,也是一种基本的计算机视觉技术。这是因为图像的分割、目标的分离、特征的提取和参数的测量将原始图像转化为更抽象更紧凑的形式,使得更高层的分析和理解成为可能。阈值分割法是图像处理最基本的分割方法,它具有计算量小、实现简单等优点,在图像分析和识别中起着重要作用。图像阈值化就是按照灰度级,将图像空间划分成与现实景物相对应的一些有意义的区域,各个区域内部灰度级是均匀的,而相邻区域灰度级是不同的,其间存在边界。它的划分可以通过从灰度级出发,选取一个或多个阈值来实现。关键词:图像分割;阈值Abstract:Imagesegmentationbyimageprocessingtoimageanalysisofthekeysteps,isalsoabasiccomputervisiontechnology.Thisisbecausetheimagesegmentation,objectseparation,featureextractionandtheparametersintheoriginalimageintoamoreabstractandmorecompactform,makingmorehigh-levelanalysisandunderstandingpossible.Thresholdsegmentationmethodisthemostbasicimageprocessingsegmentationmethod,whichhascomputation,andsimpletoachieve,inimageanalysisandrecognitionplayanimportantrole.Imagethreshoidingisinaccordancewiththegraylevel,theimagespaceisdividedintosceneswithrealitythatcorrespondstosomemeaningfulregions,eachregionwithinthegraylevelisuniform,whiletheadjacentregionofgrayscaleisdifferent,thereremainboundary.It’sdividedbystartingfromthegraylevel,selectoneormorethresholdvaluestoachieve.Keywords:ImageSegmentation;ThresholdValues1研究背景在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣,这些部分称为目标或前景(其他部分称为背景),它们一般对应图像中特定的、具有独特性质的区域。为了辨识和分析目标,需要将他们分离提取出来,在此基础上才有可能对目标进一步利用。图像分割就是指把图像分成格局特性的区域并提取出感兴趣目标的技术和过程。这里特性可以是像素的灰度、颜色、纹理等,预先定义的目标可以对应单个区域,也可以对应多个区域。现有的图像分割算法有:阈值分割、边缘检测和区域提取法。本文研究基于阈值法的图像分割技术,研究对象为256级灰度图像。2阈值法的基本原理阈值分割法的基本原理是:通过设定不同的特征阈值,把图像像素点分为若干类。常用的特征包括:直接来自原始图像的灰度或彩色特征;由原始灰度或彩色值变换得到的特征。设原始图像为(x,y)f,按照一定的准则在(x,y)f中找到特征值,将图像分割为两个部分,分割后的图像为:01(,)(,)(,)fxytfxytbgxyb³ìïï=íïïî(1)在实际应用中为了满足速度的要求,常常会采用二值化阈值分割方法来缩减数据量、简化处理分析过程。这尤其适合于在物体与背景有较强对比情况下的分割。若取:b0=0(黑),b0=1(白),即为我们通常所说的图像二值化。3阈值法图像分割方法介绍全局阈值法指利用全局信息对整幅图像求出最优分割阈值,可以是单阈值,也可以是多阈值;局部阈值法是把原始的整幅图像分为几个小的子图像,再对每个子图像应用全局阈值法分别求出最优分割阈值。其中全局阈值法又可分为基于点的阈值法和基于区域的阈值法。最常用的阈值分割方式是将灰度一分为二,所有灰度值大于或等于某阈值的像素都被判属于物体,其它像素被判属于背景;或者相反。阈值分割法的结果很大程度上依赖于阈值的选择,因此该方法的关键是如何选择合适的阈值。由于局部阈值法中仍要用到全局阈值法,因此本文主要对全局阈值法中基于点的阈值法进行了研究。根据阈值法的原理可以将阈值选取技术分为3大类。3.1基于点的全局阈值法3.1.1P-tile法P-tile法是早期的基于灰度直方图的自动阈值选择方法,它假设在亮(灰度级高)背景中存在一个暗(灰度级低)目标,并且已知目标在整幅图像中所占面积比为P%。该方法选择阈值的原则是:依次累计灰度直方图,直到累计值大于或等于目标物所占面积,此时的灰度级即为所求的阈值。该方法计算简单,抗噪声性能较好。不足之处是要预先知道给定目标与整幅图像的面积比P,因此在P未知或P随不同图像改变时,该方法不适用。3.1.2双峰法灰度直方图是数字图像处理中最简单和最有用的工具,它是灰度级的函数,描述的是图像中具有该灰度级的像素的个数。灰度直方图概括了一幅图像的灰度级内容,任何一幅图像的直方图都包括了可观的信息,某些类型的图像还可由其直方图完全描述。对于目标与背景的灰度级有明显差别的图像,通常采用直方图技术来确定阈值,一幅物体与背景对比明显的图像一般具有包含双峰的灰度直方图,物体中的像素产生直方图中的一个峰,而背景产生直方图中的另一个峰。物体与背景的边界附近具有两个峰值之间的灰度级,其像素数目相对较少,从而产生了两峰之间的谷。反过来,如果图像中物体与背景的对比明显,并且各个物体之间的灰度一致性较好,那么其对应的直方图一定是双峰直方图。当分割阈值位于谷底时,图像分割可取得最好的效果。该方法简单易行,但是对于灰度直方图中波峰不明显或波谷宽阔平坦的图像,不能使用该方法。而且,当图像受到噪声影响时,直方图上原本分离的峰之间的谷底被填充,或者目标物体和背景的峰相距很近,此时很难检测到谷底。因此,当下也出现了许多双峰法的改进算法。本文讨论最原始的双峰法。3.1.3类间方差阈值分割最大类间方差法是由日本学者大津于1979年提出的,是一种自适应的阈值确定的方法,又叫大津法,简称OTSU。它是按图像的灰度特性,将图像分成背景和目标两部分。背景和目标之间的类间方差越大,说明构成图像的两部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。因此,使类间方差最大的分割意味着错分概率最小。由大津提出的最大类间方差法,是在判决分析最小二乘法原理的基础上推导得出的,其算法比较简单,是一种方便可行的阈值选取方法。其算法过程如下:(1)首先找出图像中的最高灰度级(L-1);(2)然后分别取从0至L-1的每一灰度级作为阈值k;①计算该阈值所分开两类的各自的出现概率00kiip、111Liikp,对C0和C1类各自所有像素点的灰度级进行基于概率的加权求和(权值为每一个灰度级出现的概率)得到(k)和(k)T,然后对C0和C1类,分别求解像素点的灰度级概率的加权和与两类各自出现的概率的比值,得到C0和C1各自的所有像素点的灰度级平均值0、1;(后文公式中有详细解释)②计算两类间的方差B;(3)找出方差最大的阈值T。下面通过具体公式进行推导:设原始灰度图像灰度级共L级,其中灰度级为I的像素点数为nI,则图像的全部像素数为:nnnLN110(2)归一化直方图,则:10,1LiiiipNnp(3)按灰度级用阈值k划分为两类)1,,2,1(),,2,1,0(C10LkkkC和。因此,C0和C1类的类出现概率分别由下列各式给出:000()kriipkpC(4)1111()1()LiikkrppC(5)设(k)可视为C0类所有像素点的灰度级概率加权求和(权值为灰度级i出现的概率pi):0(k)kiiip(6)整张图像所有像素点的灰度级概率加权求和:10(L)LTiiip(7)相应的,(k)T为C1类所有像素点的灰度级概率加权求和。因此,C0和C1类各自所有像素点的灰度级平均值分别由下列两式给出:00000(i|C)/kkkriiiipipk(8)L-1111111(i|C)/1LTriikikkipipk(9)实际上,此处的平均值仍然沿用了初等数学中加权平均值的最原始定义,即:=对象取值的加权和加权平均值对象数目(10)因此,此处C0和C1类各自所有像素点的灰度级平均值0、1本应当是:=各类所有像素点的灰度级加权求和(权值为每一个灰度级出现的像素点数)该像素点的灰度级平类所拥有均值的像素点数(11)但这里,我们将分子分母同时除以了该图像的总的像素点数目,因此0、1分母变成了类出现概率01,,而分子仍然是一个加权求和式,如C0:0(k)kiiip,只是权值同样由每个灰度级出现的像素点数,变成了每一个灰度级出现的概率。事实上,这样可以避免计算图像的总像素点数,简化了处理过程。由方差的定义:22200(X)()()kkiiiiiiVarpxpx(12)C0和C1的类的方差可由下式得到:2220000000()p(i|C)()/kkriiiiip(13)112221111111()p(i|C)()/LLriikikiip(14)定义类内方差为:2220011W(15)类间方差为:22220101(0101())()BTT(16)3.2基于区域的全局阈值法3.2.1灰度直方图变换法该方法不是直接选取阈值,而是对灰度直方图进行变换,使其具有更深的波谷和更尖的波峰,然后再利用双峰法得到最优阈值。这种方法的一个共同特征是根据像素点的局部特性,对其进行灰度级的增强或减弱的变换。这种方法假设图像由目标和背景组成,并且目标和背景灰度直方图都是单峰分布。边缘算子法和四叉树法是两种常用的灰度直方图变换法。(1)边缘算子法:边缘算子法是采用Laplace算子、Robert算子、Sober算子等对像素点进行灰度级的增强或减弱的变换。对于在灰度均匀分布的区域内的像素点,这些算子对其进行灰度减弱;对于在边缘附近的像素点,这些算子对其进行灰度增强。(2)四叉树法:四叉树法的提出基于这样一个真实:在灰度均匀分布的区域内,灰度的标准方差较小;而在灰度非均匀分布的区域内,灰度的标准方差较大。灰度的标准方差较大的区域可以再分为更小的灰度均匀分布的区域。从原始图像开始,如果它的标准方差超过一个预先设定的值,就把它分为四个象限,对每一个象限再重复进行以上操作,最终把图像分为具有较小的灰度标准方差的块,称之为Q-图像。由于Q-图像的每一小块均具有接近的灰度,因此它的灰度直方图有更深的波谷和更尖的波峰。3.2.2基于灰度级的二次统计值的方法基于点的阈值法的一个缺点是它仅仅利用了灰度级的一次统计特性,例如图像的灰度直方图。基于灰度级的二次统计值的方法通过对灰度级进行二次统计,来改善图像的分割质量,主要有灰度共生矩阵法。灰度共生矩阵法:灰度共生矩阵法M元素是灰度级I,j在相部位置出现的频率,该方法定义了两个灰度直方图a和b,其中a基于M的近对角线元素,b基于M的远对角线元素。在a的波谷与b的波峰重叠的区域,可以得到最优分割阈值。3.3局部阈值法在局部阈值法中,原始图像被分为几个小的子图像再对每个子图像分别求出最优分割阈值。用这种方法分割后的图像在不同子图像的边界处有灰度的不连续分布,因此必须采用平滑技术来消除灰度的不