摘要:图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤,也是一种基本的计算机视觉技术。对图像分割的研究一直是图像工程中的重点和热点。本文对近年来图像分割方法的研究现状与新进展进行了归纳总结。首先,简单介绍了图像分割的传统方法,包括基于区域的、基于边缘的和两者结合的图像分割方法。然后,对现在较新的三种图像分割方法进行了详细的论述。最后,对图像分割方法的发展趋势进行了展望。关键词:图像分割模糊聚类Gabor小波图割方法1.引言在计算机视觉理论中,图像分割、特征提取与目标识别构成了由低层到高层的三大任务。目标识别与特征提取都以图像分割作为基础,图像分割结果的好坏将直接影响到后续的特征提取与目标识别[1]。图像分割是将图像中有意义的特征或区域提取出来的过程。这些特征可以是图像的原始特征,如像素的灰度值、物体轮廓、颜色、反射特征和纹理等,也可以是空间频谱等,如直方图特征。图像分割的目的是把图像划分成若干互不相交的区域,使各区域具有一致性,而相邻区域间的属性特征有明显的差别。图像分割的应用非常广泛,几乎出现在有关图像处理的所有领域并涉及各种类型。图像分割作为前沿学科充满了挑战,吸引了众多学者从事这一领域研究。2.传统的图像分割方法传统的图像分割方法包括基于区域的,基于边缘的和两者结合的图像分割方法。基于区域的分割方法是以直接寻找区域为基础的分割技术,具体算法有区域生长和区域分离与合并算法。基于区域提取方法有两种基本形式:一种是区域生长,从单个像素出发,逐步合并以形成所需要的分割区域;另一种是从全局出发,逐步切割至所需的分割区域。在实际中使用的通常是这两种基本形式的结合。该类算法对某些复杂物体定义的复杂场景的分割或者对某些自然景物的分割等类似先验知识不足的图像分割,效果较理想。基于边缘检测的分割方法试图通过检测不同区域的边缘来解决问题,通常不同的区域之间的边缘上灰度值的变化往往比较大,这是边缘检测方法得以实现的主要假设之一。它的基本思想是先检测图像中的边缘点,再按一定策略连接成轮廓,从而构成分割区域。其难点在于边缘检测时抗噪性和检测精度的矛盾,若提高检测精度则噪声产生的伪边缘会导致不合理的轮廓;若提高抗噪性则会产生轮廓漏检和位置偏差。边缘检测能够获得灰度值的局部变化强度,而区域分割能够检测特征的相似性与均匀性。边缘与区域相结合分割的主要思想是结合二者的优点,通过边缘点的限制,避免区域的过分割;同时,通过区域分割补充漏检的边缘,使轮廓更加完整[2]。3.基于粗糙集与差分免疫模糊聚类的图像分割算法马文萍等提出基于粗糙集与差分免疫模糊聚类算法的图像分割算法[3]。该算法在差分免疫克隆聚类算法的基础上,通过引入粗糙集模糊聚类,将差分免疫克隆聚类算法中的硬聚类变成模糊聚类,从而获得更丰富的聚类信息。具体来说,由于粗糙集的优势是处理不确定的数据,因此,加入粗糙集模糊聚类后更有利于算法解决不确定性问题。通过对比实验,验证了该算法在聚类性能稳定性方面的优越性,结果还同时证明了该算法具有更高的分割正确率和更好的分割结果。3.1粗糙集模糊聚类算法思想粗糙集理论能够处理不精确数据,因此,将模糊聚类方法与粗糙集理论相结合的聚类分析方法逐渐成为一个重要的研究方向,并且获得了广泛的应用。1982年,Lingras等人提出了一个粗糙C均值(roughC-means,简称RCM)聚类算法[4],通过一个类中心、一个上近似(upperapproximation)和下近似(lowerapproximation)对来描述一个类。其中,上近似和下近似用两个不同加权参数来计算新的聚类中心。在文献[4]中,模糊集和粗糙集理论的结合,为处理不确定性问题提供了一个重要的方向。模糊集和粗糙集在某些方面的互补性为解决与数据相关的不确定性问题提供了数学框架。近年来,Mitra等人[5]将粗糙集和模糊集结合,并提出了一种新的C均值聚类算法,其中,一个类由一个模糊的下近似区域和边缘区域构成。下近似区域中的每一个对象都有一个与之对应的模糊隶属值,即权重。对于相应的聚类中心和类,其下近似区域内的每一个对象应该具有相似的影响作用,并且其权重应该与其他聚类中心和类无关。这样,根据下近似区域的模糊概念得出,该区域内对象的权重会减小。事实上,这会使得聚类中心与期望的位置有一定偏差。此外,该算法对噪声和异常值敏感。之后,Maji等人[6]提出了一个一般化的模糊C均值算法(rough-fuzzyPCM,简称RFPCM),在C均值算法中增加了模糊集中的模糊隶属度和粗糙集中的上下近似两个概念。其中,模糊隶属度包括概率性隶属度和可能性隶属度,其应用能够有效地处理相互重合的类;粗糙集能够处理类中知识的不确定性和不完整性。因此,RFPCM可以有效地避免FCM对噪声敏感的弊端,同时弥补PCM对重合类无法确定的不足。这里,我们详细阐述RFPCM的算法框架。首先,令njxxxX,,,,1表示n个目标的集,civvvV,,,,1表示c个聚类中心的集合,i表示第i个聚类区域;其次,令iA和iA表示i的上下近似,iiiAAB表示i的边界区域。通过优化下面的函数,该算法将X分为c类:iiiiiiRFPBAifBBAifABAifBAJ,,,,,,11111,ciAxciAxmijiijmijmijijijxbaA11212211,ciBxciBxmijiijmijmijijijxB11212211。这里,1m和2m是模糊度,通常取2。为下近似的相对重要性,常量和分别定义了概率性隶属度ij和可能性隶属度ij的相对重要性。对于比列参数,可通过以下公式来计算:njmijnjijmijix11222采用梯度流方法求解上述方程,从而得到概率性隶属度ij、可能性隶属度ij以及聚类中心的更新公式。通过不断地迭代,最终得到目标函数的最优解。需要指出的是:对于一个像素jx,其总的隶属度函数ijijiju。我们在其隶属度cjijjxxxX,,,,1中选取最大的值mju和第二大的值nju,取二者之差,如果该差值大于预设的阈值,则该素既属于mA也属于mA。然而,梯度流方法在迭代寻找最优解的同时,极容易陷入局部最优,使得聚类结果不稳定。故采用了一种典型的进化算法——差分免疫克隆算法,通过全局搜索来优化上述问题。3.2差分免疫克隆算法与粗糙集模糊聚类现实世界中的诸多问题都可以归结为一个优化问题。要解决一个优化问题,首先要明确其目标函数,然后对问题进行建模,再采用某种优化算法来优化该目标函数。例如,聚类问题就可以归结为一个优化问题,设计一个聚类评价准则作为目标函数,采用优化算法的目的就是通过不断优化该目标函数,使聚类结果达到最优。为了有效地解决这些优化问题,人们已经提出了各种有效的优化算法,免疫克隆选择算法及差分进化算法就是其中两种比较优秀的算法。图像分割是计算机视觉和模式识别中关键技术之一。图像分割的结果就是将图像分成若干个部分,每部分代表图像中不一样的特征,并把同一部分像素标记为同一个值。因为图像中的每一个点都对应着一个像素点,一个像素点就是一个数据,数据的划分即图像的分割,因此,图像分割在本质上就是一个对数据的聚类问题。免疫克隆选择算法与差分进化算法在解决优化问题时具有不同的特性:免疫克隆选择算法本质上固有并行性和搜索变化的随机性,不易陷入局部极值;差分进化算法则具有较好的全局收敛性和鲁棒性,非常适合求解各种数值最优化问题。基于这两种不同的算法,马文萍等人提出了一种差分免疫克隆选择算法(differentialimmunecloneclusteringalgorithm,简称DICCA)[7]。差分免疫克隆算法主要是基于差分进化及免疫克隆,通过克隆繁殖、差分变异、交叉及克隆选择操作来进化种群,在进化过程中加入局部搜索机制来提高算法的收敛性。具体过程是:首先,通过基于类中心的编码方式随机生成初始种群1,评价种群(即计算每个抗体的适应度),选择最优的5个抗体作为种群2;其次,对种群1执行差分变异、差分交叉操作生成变异交叉后的抗体,对种群2执行克隆繁殖、均匀变异、克隆选择操作后形成抗体子种群;最后,用子种群取代种群1中最差的5个个体,作为下一代进化的新抗体种群。模糊聚类和硬聚类相比较,能够获得更丰富的聚类信息,而粗糙集聚类算法善于处理不精确的数据,因此,我们将前面已讨论过的进化算法与粗糙集模糊聚类理论相结合,在DICCA聚类算法中引入粗糙集模糊聚类的思想,并将其应用于图形分割领域中,以达到目标识别和分析的目的。3.3粗糙集与差分免疫模糊聚类算法描述将粗糙集与差分免疫模糊聚类算法(RDIFC)运用到图像分割时,首先读入图像,再对图像进行特征提取和分水岭初分割操作,接下来对数据归一化,判断是否满足终止条件,如果不满足则更新隶属度函数,进而更新聚类中心,获得新的种群,新的种群通过差分免疫克隆算法进化。该算法的流程如图1(a)所示,差分免疫克隆算法的流程如图1(b)所示。首先,对初始种群1评价,在种群1的个体中选出最优的5个个体作为种群2,对种群1进行差分变异操作、交叉操作与差分选择操作更新种群1,对种群2进行克隆繁殖操作、均匀变异操作和克隆选择操作更新种群2,用种群2中的个体取代种群1中的最差的d个个体,最终用替代后的种群作为下一代进化的种群。如此迭代,直到满足终止条件时,输出最终的聚类结果。下面将详述具体步骤。图1差分免疫克隆进化算法流程图4.基于Gabor变换的GrabCut纹理图像分割杨章静等提出基于Gabor变换的GrabCut纹理图像分割[8]。多数自然图像都包含纹理信息,它相对颜色特征而言具有描述方向性与尺度差异的特性。因此,可以利用半交互式的GrabCut的图像分割方式对图像前景区域与背景区域进行有效的分割,通过建立前景和背景所对应的高斯混合模型(GMM),结合最大流最小割的图像分割方式实现全局优化,并利用前景和背景的KL测度,自适应地终止分割过程。实验对比分析表明,所提出的方法对于合成纹理图像与自然纹理图像具有较好的整体分割效果及较高的分割准确率。4.1Gabor小波理论为了计算得到一幅离散二维图像的多尺度多方向的纹理特征,需要将图像I变换到频域空间表示。假设yxG,是一个二维可微的平滑函数,对于Gabor函数,其定义如下式所示:2222222221exp21221exp21,yxyxyxyxyxixyxyxGxix2sin2cos,其中:x、y分别是沿x方向和y方向对应Gabor函数的缩放系数,它们用来控制滤波器脉冲响应的宽度。将yxG,作为Gabor小波变换的母波函数,通过适当旋转与缩放,得到一组自相似、方向与尺度差异的滤波器组,并通过对图像空间进行缩放与旋转变化得到多尺度多方向的Gabor滤波器组。为了获得一个包含多方向多尺度的滤波器组,可以对Gabor函数进行变换,将其转换到频谱空间。由于各个尺度各个方向的滤波器组之间并非正交关系,造成滤波后的图像存在大量的冗余信息,为了克服该缺陷,在频率空间对相关参数进行转化计算。对上式中的二维Gabor小波进行如下变换:222221exp,uWuvuG其中:xu21,y21。通过多尺度多方向的频率滤波器对二维离散图像进行处理后,可以得到多尺度多方向的纹理特征。假设用110,,,,NfffvuF表示vu,点的Gabor纹理特征,SMN。其中:M是方