8.1基本概念8.2颜色特征描述8.3形状特征描述8.4纹理特征的描述第8章图像特征提取与分析FeatureExtractionandAnalysis8.1基本概念要让计算机具有理解图像内容的能力,首要的问题就是将人类视觉系统对图像内容的感知属性描述为计算机能够理解的表示,并让计算机能根据图像内容的表示进一步进行推理。这一处理过程实际上就是对图像中感兴趣的目标进行检测和测量,以获得它们的客观信息,从而建立对图像的描述,这种对图像的描述就是所谓的图像特征。图像特征图像特征是指图像场的原始特性或属性,其中有些是视觉直接感受到的自然特征,如区域亮度、边缘轮廓、颜色、纹理,有些需要通过变换或测量才能得到,如频谱、直方图等。常用的图像特征有颜色特征、纹理特征、形状特征、灰度特征。特征提取目的图像特征提取与分析的目的是为了让计算机具有认识或识别图像的能力,计算机实现图像识别必须根据一定的图像特征作为推理的基础。特征提取则是使用计算机提取图像信息,让计算机具有认识或识别图像的能力。从图像的整体和局部的角度将图像特征划分为全局特征和局部特征两大类。全局特征是指图像的整体属性,常见的全局特征包括:颜色特征、纹理特征和形状特征、灰度直方图等。局部特征则是从图像局部区域中抽取的特征,包括边缘、角点、线等。图像特征分类特征选择是从众多特征中找出最有效的特征。它解决选用什么特征来描述目标如何精确地测量这些特征特征选择特征选择原则从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的,这个过程就叫特征选择。选取的特征应具有如下特点:可区别性可靠性独立性好数量少对尺寸、变换、旋转等变换尽可能的不敏感8.2颜色特征的描述颜色特征是一种全局特征,描述了图像所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像的像素都有贡献。颜色特征和图像的大小、方向无关,而且对图像的背景颜色不敏感,因此颜色特征被广泛应用于图像识别。常用的颜色特征提取方法包括颜色直方图、颜色相关图、颜色矩等。颜色直方图(ColorHistogram)是在许多图像识别系统中被广泛采用的颜色特征。它所描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物体。计算颜色直方图需要将颜色空间划分成若干个小的颜色区间(每个小区间称为直方图的一个bin),这个过程称为颜色量化。然后,通过计算颜色落在每个小区间内的像素数量可以得到颜色直方图。1、颜色直方图颜色直方图设一幅图像包含M个像素,图像的颜色空间被量化成N个不同颜色。颜色直方图H定义为:pi=hihi为第i种颜色在整幅图像中具有的像素数。归一化为:pi=hi/M颜色直方图可以是基于不同的颜色空间和坐标系。最常用的颜色空间是RGB颜色空间,此外基于HSI空间、Luv空间和Lab空间的颜色直方图。colortransform0.m优点:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些不需要考虑物体空间位置的图像。缺点:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。颜色直方图特点:颜色集是对颜色直方图的一种近似。将颜色空间量化成若干个等级(称为bin)。一个M维的颜色集,用BM表示,是二值空间中的一个M维矢量,它对应着对第m种颜色的选择,即第m种颜色出现时,对应该维分量为1,否则,为0。2、颜色集具体应用时,用色彩分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达成一个二进制的颜色索引集。2、颜色集例如:颜色空间划分为8种颜色。则颜色集是8维的矢量。8维颜色空间量化后的图像颜色集c=[10010001]使用颜色集表示图像的颜色信息时,通常采用HSI颜色空间。颜色集表示方法的实现步骤如下:1)将RGB颜色空间转化到视觉均衡的颜色空间,如HSI颜色空间。3)采用量化器QM对颜色空间进行量化,使得视觉上明显不同的颜色对应着不同的颜色级,并将颜色级映射成索引值m。颜色集表示方法8.2.2颜色矩(ColorMoments)颜色矩是一种图像的颜色特征,可以用来描述图像的颜色分布信息。由于颜色分布信息主要集中在低阶矩中,因此,仅采用颜色的一阶矩(mean)、二阶矩(Variance)和三阶矩(Skewness)就足以表达图像的颜色分布。颜色矩通常直接在RGB空间计算。设P(j,i)为图像的第j个像素的第i个颜色分量值,一阶矩为:一阶矩(mean)NjjiiPN11即表示待测区域的颜色均值。二阶矩(Variance)表示待测区域的颜色方差,即不均匀性。2/121))(1(NjiijiPN三阶矩(Skewness)三阶矩反映颜色的不对称性。如果图象颜色完全对称,其值应为零。3131))(1(NjiijiPNs8.2.4颜色聚合向量(colorcoherencevector)针对颜色直方图和颜色矩无法表达图像色彩的空间位置的缺点,提出了图像的颜色聚合向量。它是颜色直方图的一种演变,它包含了颜色分布的空间信息。基本思想是将属于直方图每一个bin的像素分为两部分:如果该bin内的某些像素所占据的连续区域的面积大于给定的阈值,则该区域内的像素作为聚合像素,否则作为非聚合像素。假设i与i分别代表直方图的第i个bin中聚合像素和非聚合像素的数量,图像的颜色聚合向量可以表达为(1,1),(2,2),…,(N,N)颜色聚合向量定义:8.3形状特征描述8.3.1几个基本概念8.3.2区域内部空间域分析8.3.3区域内部变换分析8.3.4区域边界的形状特征描述8.3.1几个基本概念1、邻域与邻接对于任意像素(i,j),(s,t)是一对适当的整数,则把像素的集合{(i+s,j+t)}叫做像素(i,j)的邻域.直观上看,这是像素(i,j)附近的像素形成的区域.最经常采用的是4-邻域和8-邻域4-邻域8-邻域OO*OOOOOO*OOOO邻域与邻接互为4-邻域的两像素叫4-邻接。互为8-邻域的两像素叫8-邻接。pqpq(a)(b)连接(连通)成分00000000011100111000110001100000000001010010110000000000例00000001110010011100000000000000111001001100000000(a)(b)下面图中有几个连通成分?计算一幅二值图像中所有连接分量[L,N]=bwlabel(f,conn)L为输出矩阵,N为图像中连接成分总数,conn用于指定连接方式,为4或8。00000000021100211000110001100000000002020040430000000000输出矩阵Lconn=?N=400000000021100211000110001100000000002020020220000000000输出矩阵Lconn=?N=22、距离在图像处理中,往往需要计算两个像素点之间的距离。所以对于给定图像中三点,当函数D(A,B)满足(8-14)式的条件时,把D(A,B)叫做A和B的距离。(8-14)常用的几种距离:设二维矢量A(x1,y1)和B(x2,y2),计算距离欧氏距离de=[(x1-x2)2+(y1-y2)2]1/2街区距离,也称为4-邻域距离d4=|x1-x2|+|y1-y2|棋盘距离,也称为8-邻域距离d8=max{|x1-x2|,|y1-y2|}D8距离二维空间等距离线形成的几何图形pqD4距离二维空间等距离线形成的几何图形pq区域内部空间域分析是不经过变换而直接在图像的空间域,对区域内提取形状特征。1、欧拉数(拓扑描述子)拓扑特征是对图像中区域结构形状的总体描述。拓扑特征的特点是不受“橡皮被单”式畸变的影响,当图形由于拉伸、压缩、扭曲、旋转、平移(不能撕裂和折叠)等而变形时,拓扑特征不变。图像的欧拉数是图像的拓扑特性之—,它表明了图像的连通性。8.3.2区域内部空间域分析欧拉数定义设图像的连通成份数为C,孔数为H,欧拉数E定义为:E=C-H区域的拓扑性质对区域的全局描述是很有用的,欧拉数是区域一个较好的描述子。(a)(b)下图(a)的图形有一个连接成分和一个孔,而下图(b)有一个连接成分和两个孔。欧拉数为-1欧拉数为0E=C-H在文字识别中,欧拉数常常作为描述文字形状的一个特征例2、凹凸性凹凸性是区域的基本特征之一,区域凹凸性可通过以下方法进行判别:区域内任意两像素间的连线穿过区域外的像素,则此区域为凹形。相反,连接图形内任意两个像素的线段,如果不通过这个图形以外的像素,则这个图形称为是凸的。3、区域的测量区域的大小及形状表示方法主要包括以下几种:(1)面积S:图像中的区域面积S可以用同一标记的区域内像素的个数总和来表示。按上述表示法区域R的面积S=41。区域面积可以通过扫描图像,累加同一标记像素得到,或者是直接在加标记处理时计数得到。(2)周长L:区域周长L是用区域中相邻边缘点间距离之和来表示。采用不同的距离公式,关于周长L的计算有很多方法。常用的有两种:欧式距离,在区域的边界像素中,设某像素与其水平或垂直方向上相邻边缘像素间的距离为1,与倾斜方向上相邻边缘像素间的距离为。周长就是这些像素间距离的总和。这种方法计算的周长与实际周长相符,因而计算精度比较高。8邻域距离,将边界的像素个数总和作为周长。也就是说,只要累加边缘点数即可得到周长,比较方便,但是,它与实际周长间有差异。根据这两种计算周长的方式,以区域的面积和周长图为例,区域的周长分别是和22。(3)圆形度R0:圆形度R0用来描述景物形状接近圆形的程度,它是测量区域形状常用的量。其计算公式为:R0=4S/L2式中为S区域面积;L为区域周长。R0值的范围为0R01.R0值的大小反映了被测量边界的复杂程度,越复杂的形状取值越小。R0值越大,则区域越接近圆形。R0=/4R0=1(4)形状复杂性e(又称为形状因子):形状复杂性常用离散指数表示,其计算公式为:e=L2/S该式描述了区域单位面积的周长大小,e值越大,表明单位面积的周长大,即为复杂形状;反之,则为简单形状。e值最小的区域为圆形。e=12.6e=16.0e=20.88.3.3区域内部变换分析p和q可取所有的非负整数值。1、矩描述具有两个变元的有界函数f(x,y)的p+q阶矩定义为大小为M×N的数字图像f(i,j)的矩为由于p和q可取所有的非负整数值,它们产生一个矩的无限集。而且,这个集合完全可以确定函数f(x,y)本身。换句话说,集合{mpq}对于函数是唯一的,也只有f(x,y)才具有该特定的矩集。(1)0阶矩各阶矩的物理解释0阶矩m00是图像灰度f(i,j)的总和。二值图像的m00则表示目标的面积。(2)一阶矩--区域形心位置如果用m00来归一化1阶矩m10及m01,则得到一个物体的矩心坐标:(2)中心矩中心矩是以矩心作为原点进行计算:中心矩能反映区域中的灰度相对于灰度中心是如何分布的度量。利用中心矩可以提取区域的一些基本形状特征。例如20和02分别表示围绕通过灰度中心的垂直和水平轴线的惯性矩。假如2002,则可能所计算的区域为一个水平方向延伸的区域。当30=0时,区域关于轴对称。同样,当03=0时,区域关于对称。三阶以下的中心矩:把中心矩再用零阶中心矩来规格化,叫做规格化中心矩,记作rpqpq002qpr为了使矩描述子与大小、平移、旋转无关,可以用二阶和三阶规格化中心矩导出七个不变矩组Φ。不变矩描述分割出的区域时,具有对平移、旋转和尺寸大小变化都不变的性质。(3)不变矩利用二阶和三阶规格中心矩导出的7个不变矩如下:phi=invmoments(f)计算不变矩的matlab函数:不变矩对平移、旋转和尺寸大小都不变的性质invmoments0.m2、投影对于区域为n×n的二值图像和抑制背景的图像f(i,j),它在i轴上的投影为:nijifipnj,,2,1),(