本章重点:图像分割的基本概念及图像分割分类的基础边缘分割法阈值分割法区域分割法第7章图像分割技术7.1图像分割概述7.2边缘检测7.3阈值分割7.4区域分割7.5彩色图像分割7.6基于分水岭的分割7.7连接成分的标记第7章图像分割技术7.1图像分割概述目的:把图像空间分成一些有意义的区域,与图像中各种物体目标相对应。通过对分割结果的描述,可以理解图像中包含的信息。图像分割是将像素分类的过程,分类的依据可建立在:像素间的相似性非连续性图像分割和集合定义的描述令集合R代表整个图像区域,对R的图像分割可以看作是将R分成N个满足以下条件的非空子集R1,R2,….,RN:图像分割方法和种类以不同的分类标准,图像分割方法可以划分为不同的种类。图像分割应用机器阅读理解OCR录入遥感图像自动识别在线产品检测医学图像样本统计医学图像测量图像编码图像配准的预处理物体的边缘是以图像的局部特征不连续的形式出现的,也就是指图像局部亮度变化最显著的部分,例如灰度值的突变、颜色的突变、纹理结构的突变等,同时物体的边缘也是不同区域的分界处。通常沿边缘的走向灰度变化平缓,垂直于边缘走向的像素灰度变化剧烈。7.2边缘检测7.2.1边缘检测概述根据灰度变化的特点,常见的边缘可分为阶跃型、房顶型和凸缘型边缘检测是基于边界分割方法的最基本的处理。7.2.2边缘检测方法边缘检测的方法很多,主要有以下几种:1、空域微分算子,也就是传统的边缘检测方法。如Roberts算子、Prewitt算子和Sobel算子等。2、拟合曲面。该方法利用当前像素邻域中的一些像素值拟合一个曲面,然后求这个连续曲面在当前像素处的梯度。3、小波多尺度边缘检测。4、基于数学形态学的边缘检测。Prewitt算子用卷积模板为:其中Kirsch算子边缘的梯度大小为其中几种常用的边缘检测微分算子yxPPjiG),(101101101xP111000111yp,7,,1,0:45max,1max),(ktsjiGkk74321kkkkkkkkaaataaasLOG(Laplacian-Gauss)算子Marr和Hildreth将Gaussian滤波器和Laplacian边缘检测结合在一起,形成了LoG(LaplacianofGaussian)算法。即先用高斯函数对图像进行平滑,然后再用拉普拉斯算子进行运算,形成Laplacian-Gauss算法,它使用一个墨西哥草帽函数形式。特点:与高斯滤波器进行卷积,既平滑了图像又降低了噪声,孤立的噪声点和较小的结构组织将被滤除。在边缘检测时仅考虑那些具有局部梯度最大值的点为边缘点,用拉普拉斯算子将边缘点转换成零交叉点,通过零交叉点的检测来实现边缘检测。,2222224222222222)(exp2212)(exp21),(yxyxyxyxyxLOGCanny(坎尼)算子3个准则:信噪比准则定位精度准则单边缘响应准则具体步骤:首先用2D高斯滤波模板进行卷积以平滑图像;利用微分算子,计算梯度的幅值和方向;对梯度幅值进行非极大值抑制。即遍历图像,若某个像素的灰度值与其梯度方向上前后两个像素的灰度值相比不是最大,那么这个像素值置为0,即不是边缘;使用双阈值算法检测和连接边缘。即使用累计直方图计算两个阈值,凡是大于高阈值的一定是边缘;凡是小于低阈值的一定不是边缘。如果检测结果大于低阈值但又小于高阈值,那就要看这个像素的邻接像素中有没有超过高阈值的边缘像素,如果有,则该像素就是边缘,否则就不是边缘。,图像的轮廓(边界)跟踪(boundarytracking)与边缘检测是密切相关的,因为轮廓跟踪实质上就是沿着图像的外部边缘“走”一圈。轮廓跟踪也称边缘点连接,是一种基于梯度的图像分割方法。是指从梯度图中一个边界点出发,依次通过对前一个边界点的考察而逐步确定出下一个新的边界点,并将它们连接而逐步检测出边界的方法。7.2.3边界跟踪具体轮廓跟踪过程大致可分以下三步:(1)确定轮廓跟踪的起始边界点。根据算法的不同,选择一个或多个边缘点作为搜索的起始边缘点。(2)选择一种合适的数据结构和搜索策略,根据已经发现的边界点确定下一个检测目标并对其进行检测。(3)制定出终止搜寻的准则(一般是将形成闭合边界作为终止条件),在满足终止条件时结束搜寻。常用的轮廓跟踪技术有两种:探测法和梯度图法。一种简单的边界跟踪法(二值图像):(1)根据光栅扫描发现像素从0开始变为1的像素时,存储它的坐标(i,j)值。(2)从像素(i,j-1)开始反时针方向研究8-邻接像素,当第一次出现像素值为1的像素记为pk,开始k=1,,也同样存储p1的坐标。(3)同上,反时针方向从pk-1以前的像素研究pk的8-邻接像素,把最先发现像素值为1的像素记为pk+1。(4)当pk=p0而且pk+1=p1时,跟踪结束。在其他情况下,把k+1更新当作k返回第(3)步。右图描述了边界跟踪的顺序。第一步,根据光栅扫描,发现像素p0,其坐标为(3,5)。第二步,反时针方向研究像素p0的8-邻接像素(3,4),(4,4),(4,5),由此发现像素p1。第三步,反时针方问从p0以前的像素,即像素(3,4)开始顺序研究p1的8-邻接像素,因此发现像素p2。这时,因为p0≠p1,所以令pk=p2,返回第三步。反复以上操作,以p0,p1,…,pn的顺序跟踪8-邻接的边界像素。阈值分割算法是区域分割算法中具有代表性的一类非常重要的分割算法。以一定的图像模型为依托,通过取阈值后得到的图像,各个区域可以分离开。最常用的图像模型是假设图由具有单峰灰度分布的目标和背景组成。7.3阈值与图像分割7.3.1阈值分割原理及分类单一阈值的灰度直方图仅使用一个阈值分割的方法称为单阈值分割方法。如果图像中有多个灰度值不同的区域,那么可以选择一系列的阈值以将每个像素分到合适的类别中去,这种用多个阈值分割的方法称为多阈值分割方法。分类:单阈值分割,多阈值分割多阈值的灰度直方图T2T1阈值选取依据:1、仅取决于图像灰度值,仅与各个图像像素本身性质相关的阈值选取——全局阈值。2、取决于图像灰度值和该点邻域的某种局部特性,即与局部区域特性相关的的阈值选取——局部阈值。3、除取决于图像灰度值和该点邻域的某种局部特性之外,还取决于空间坐标,即得到的阈值与坐标相关的阈值选取——动态阈值或者自适应阈值。7.3.2全局阈值原理:假定物体和背景分别处于不同灰度级,图像被零均值高斯噪声污染,图像的灰度分布曲线近似用两个正态分布概率密度函数分别代表目标和背景的直方图,利用这两个函数的合成曲线拟合整体图像的直方图,图像的直方图将会出现两个分离的峰值,如图7-11所示。然后依据最小误差理论针对直方图的两个峰间的波谷所对应的灰度值求出分割的阈值。阈值T图7-11双峰直方图7.3.2全局阈值该方法适用于具有良好双峰性质的图像,但需要用到数值逼近等计算,算法十分复杂,而且多数图像的直方图是离散、不规则的。在实际阈值分割过程中,往往需要能够自动获取阈值,下面的算法可以自动获得全局阈值:1)选取一个的初始估计值T;2)用T分割图像。这样便会生成两组像素集合:G1由所有灰度值大于T的像素组成,而G2由所有灰度值小于或等于T的像素组成。3)对G1和G2中所有像素计算平均灰度值u1和u2。4)计算新的阈值:T=1/2(u1+u2)。重复步骤(2)到(4),直到得到的T值之差小于一个事先定义的参数T0。对于用单一全局阈值无法有效分割的直方图,可以采用自适应阈值进行分割。该类方法的基本步骤如下:1)将整幅图像分成一系列互相之间有50%重叠的子图像;2)做出每个子图像的直方图;3)检测各个子图像的直方图是否为双峰,如果是,则采用最佳阈值法确定一个阈值,否则就不进行处理;4)根据对直方图为双峰的子图像得到的阈值通过插值得到所有子图像的阈值;7.3.3基本自适应阈值阈值的选择对于图像分割结果至关重要。仅凭人眼主观上的感觉很难选择到合适的阈值。4种比较经典的阈值选取方法极小值点阈值选取方法最优阈值选取方法迭代阈值选取方法利用灰度统计直方图的直方图凹性分析的阈值选取方法。7.3.4阈值选取方法原理:通过寻找直方图的极小点确定分割阈值,在确定极小点过程中可能需要对直方图进行平滑。图像的灰度直方图是一种离散分布,其包络曲线则是一条连续的曲线,求其包络曲线h(z)极小值作为阈值。实际图像由于各种因素的影响,其灰度直方图往往存在许多起伏,不经预处理将会产生若干虚假的“谷”。一般先对其进行平滑处理,然后再取包络,这样将在一定程度上消除虚假“谷”对分割阈值的影响。在具体应用时,多使用高斯函数g(z,σ)与直方图的原始包络函数h(z)相卷积而使包络曲线得到一定程度的平滑:极小值点阈值选取方法通常,图像中目标和背景的灰度值有部分交错,分割时总希望减少分割误差。通过背景和目标的灰度概率分布函数可以在一定条件下确定最优阈值。假设一幅图像包含两个灰度级并混有高斯加性噪声。令z表示灰度级值。此时该图像的灰度直方图可以看成是对灰度取值的概率密度函数p(z)的近似。最佳阈值搜寻方法其中概率密度函数较大的一个对应于背景的灰度级,而较小的描述了图像中目标的灰度级。则整体灰度级变化的混合概率密度函数可以表达成:这里u1和u2分别是图像两个灰度级的灰度均值;σ1和σ2分别是相应于均值的标准偏差,p1和p2是两类像素出现的概率,并且必须满足下列限制条件:上述混合概率密度函数中,共含有五个待确定的参数。如果所有参数都己知,那么就可以很容易地确定最佳的分割阈值。121PP假设图像中的暗区域相应于背景,而图像的亮区域相应于图像中的物体,并且可定义阈值T,使得所有灰度值小于T的像素可以被认为是背景点,而所有灰度值大于T的像素可以被认为是物体点。此时,物体点误判为背景点的概率为:这表示在曲线p2(z)下方位于阈值左边区域的面积。将背景点误判为物体点的概率为:总的误判概率为:为了找到一个阈值T使得上述的误判概率为最小,必须将E(T)对T求微分(应用莱布尼兹公式),并令其结果等于零。由此可以得到如下的关系:解出T,即为最佳阈值。如果,则最佳阈值位于曲线和的交点处21PP)(1zp)(2zp概率密度函数并不是总可以估计的。借助高斯密度函数,利用参数可以比较容易得到这两个概率密度函数。将这一结果应用于高斯密度函数,取其自然对数,通过化简,可以得到如下的二次方程:其中:由于二次方程有两个可能的解,所以需要选出其中合理的一个作为图像分割的阈值。讨论:如果两个标准偏差相等,即σ12=σ22=σ2,则上式中的A=0,我们得到一个解:此即为图像分割的最佳阈值T如果先验概率也相等,那么得到的解中的第二项等于零,最佳分割阈值为图像中两个灰度均值的平均数,即如果背景与目标的灰度范围有部分重叠,仅取一个固定的阈值会产生较大的误差,为此,可以采用双阈值方法。221T迭代阈值选取方法利用程序自动搜寻出比较合适的阈值。此阈值选取方法首先选取图像灰度范围的中值作为初始值T,把原始图像中全部像素分成前景、背景两大类,然后分别对其进行积分并将结果取平均以获取一新的阈值,并按此阈值将图像分成前景、背景。如此反复迭代下去,当阈值不再发生变化,即迭代已经收敛于某个稳定的阈值时,此刻的阈值即作为最终的结果并用于图像的分割。数学描述110011121LTkkLTkkTkkTkkiiiiihkhhkhT这类算法的时间和空间复杂性比较大,但抗噪声能力强,对一些用全局阈值不易分割的图像有较好的分割效果,如对二值化文档图像采用该分割具有较好的性能。下面介绍分水岭阈值算法。基本概念分水岭概念是以对图像进行三维可视化处理为基础的。其中两个是坐标,另一个是灰度级。对于这样一种“地形学”的解释,需考虑三点:(a)属于