形状特征形状特征•1、形状特征的描述•2、边缘检测•3、上下文形状描述符(shapecontext)1.形状描述特征•二维图像中,形状通常被认为是一条封闭的轮廓曲线所包围的区域。•通常情况下,对形状的描述有两种方法:一种是基于轮廓的,一种是基于区域的。•前者只利用形状的外部边缘,而后者利用形状的全部区域。1.1基于轮廓的描述1.1.1基于空间域的描述1、链码2、周长3、斜率、曲率和角点4、基于多边形的特征参数1.1.2基于变换域的描述1、傅里叶描述子2、小波轮廓描述符1链码区域外部形状是指构成区域边界的像素集合。链码描述通过边界的搜索等算法的处理,所获得的输出最直接的方式是各边界点像素的坐标,也可以用一组被称为链码的代码来表示,这种链码组合的表示既利于有关形状特征的计算,也利于节省存储空间。用于描述曲线的方向链码法是由Freeman提出的,该方法采用曲线起始点的坐标和斜率(方向)来表示曲线。对于离散的数字图像而言,区域的边界轮廓可理解为相邻边界像素之间的单元连线逐段相连而成。对于图像某像素的8-邻域,把该像素和其8-邻域的各像素连线方向按八链码原理图所示进行编码,用0,1,2,3,4,5,6,7表示8个方向,这种代码称为方向码。八链码原理图八链码例子其中偶数码为水平或垂直方向的链码,码长为1;奇数码为对角线方向的链码,码长为。八链码例子图为一条封闭曲线,若以s为起始点,按逆时针的方向编码,所构成的链码为556570700122333,若按顺时针方向编码,则得到链码与逆时针方向的编码不同。边界链码具有行进的方向性,在具体使用时必须加以注意。2周长区域周长L是用区域中相邻边缘点间距离之和来表示。采用不同的距离公式,周长L的计算不同。常用的有两种:一种计算方法是采用欧式距离,在区域的边界像素中,设某像素与其水平或垂直方向上相邻边缘像素间的距离为1,与倾斜方向上相邻边缘像素间的距离为。周长就是这些像素间距离的总和。这种方法计算的周长与实际周长相符,因而计算精度比较高。另一种计算方法是采用8邻域距离,将边界的像素个数总和作为周长。也就是说,只要累加边缘点数即可得到周长,比较方便,但是,它与实际周长间有差异。2周长根据这两种计算周长的方式,以区域的面积和周长图为例,区域的周长分别是和22。3斜率、曲率和角点•斜率(slope)能表示轮廓上各点的指向,曲率(curvature)是斜率的改变率,它描述了轮廓上各点沿轮廓方向变化的情况。在1个给定的轮廓点,曲率的符号描述了轮廓在该点的凹凸性。如果曲率大于零,则曲线凹向朝着该点法线的正向。如果曲率小于零,则曲线凹向是朝着该点法线的负方向。曲率的局部极值点称为角点。4基于多边形的特征参数•多边形的特征参数主要有顶点数、凹点数、内角分布等。•(a)多边形的顶点数、凹点数和凸点数多边形的顶点数表明了多边形的复杂程度,而且凹点增加,多边形变得复杂。多边形的凹凸点比例反映了物体边界的齿状情况。•(b)多边形的内角直方图多边形的内角可以用余弦公式计算。多边形的内角分布反映了多边形的许多性质。例如,分布在(0°,180°)度中的内角对应凸顶点,分布在(180°,360°)中的内角对应凹顶点,分布在180°左右的内角对应平滑线或弧线等。4基于多边形的特征参数•(c)内角方差多边形的内角方差反映了形状的规则程度,如等边多边形、矩形、圆的内角方差为0。内角方差的计算公式如下:•是内角均值,N是多边形的顶点数。4基于多边形的特征参数•(d)最小外接凸多边形、最大内接凸多边形、凹凸度最小外接凸多边形指连接部分凸点形成的包含原图的凸多边形,最大内接凸多边形指连接部分凸点和凹点形成的包含在原图中的最大凸多边形。下图示出一个凹边形的最小外接凸多边形和最大内接凸多边形的例子。4基于多边形的特征参数•凹凸度(concavo-convex)是反映物体形状凹凸程度的一个重要度量定义如下:•其中,S0是多边形的面积,Sc是最小外接凸多边形的面积,Sr是最大内接凸多边形的面积。显然,凸形的凸度、凹凸度为1,而星形的凹度较大,凹凸度较小。利用凹凸度,可以识别物体的姿态,如飞禽类的飞、栖,走兽类的卧、站、奔跑等。基于空间域描述轮廓的方法给出的结果太概括,对轮廓特性的描绘比较抽象.事实上仅由几何参数往往不能完全确定物体轮廓.而基于变换域描述轮廓的方法能够以一定精度描述轮廓特性,并可以进行相似度的定量比较.接下来将分别对傅里叶描述符合小波轮廓描述符进行介绍,5傅里叶描述子•傅立叶描述子(FourierDescriptor,简称FD)常用来表示单封闭曲线的形状特征,其基本思想是将目标轮廓曲线建模成一维序列,对该序列进行一维的傅立叶变换,从而获得一系列的傅立叶系数,用这些系数对该目标轮廓进行描述。傅立叶描述子方法有一系列优点,如:计算原理简单,描述清晰,具有由粗及精的特性等[10]。计算原理简单可以使得特征提取更加稳定,因为在计算的过程中,无须设置大量控制参数就可以获得结果,计算的一致性好。傅立叶描述子具有明确的物理或几何意义,它比某些特征描述子(如Hu不变矩)更具直观性。此外,由于任何一个序列经傅立叶变换后,其能量主要集中于少数几个低频傅立叶系数上,因此采用极少的傅立叶系数就可以描绘该序列特征。同时,随着傅立叶系数的增多,该序列的细节特征得以更好地描述。因此,傅立叶描述子对目标轮廓有非常好的由粗及精的描述能力。一个傅立叶描述子的构建包括两步:首先,定义一种好的表示(representation)方法对轮廓曲线进行描述;然后,采用傅立叶理论对该曲线进行变换[6]。不同的曲线表示方法有不同的特性,一个好的表示方法应该使最终获得的傅立叶描述子具有尺度、旋转、平移不变性及起始点的无关性。5傅里叶描述子•对轮廓的离散傅里叶变换表达可以作为定量描述轮廓形状的基础。将轮廓所在的XY平面与一个复平面UV重合,其中实部U轴与X轴重合,虚部V轴与Y轴重合。这样就可用复数u+jv的形式来表示给定轮廓上的每个点(x,y)而将XY平面中的曲线段转化为复平面上的1个序列,见下图。5傅里叶描述子•考虑1个由N点组成的封闭边界,从任1点开始绕边界1周就得到1个复数序列:•s(k)的离散傅里叶变换是•S(w)可称为边界的傅里叶描述,它的傅里叶反变换是:•如果我们只利用S(w)的前M个系数,这样可得到s(k)的1个近似:5傅里叶描述子•傅立叶描述子序列{C(u)}反映了原曲线的形状特征,同时,由于傅立叶变换具有能量集中性,因此,少量的傅立叶描述子就可以重构出原曲线。下图给出1个由N=64个点组成的正方形轮廓以及取不同的M值重建这个边界得到的一些结果。5傅里叶描述子这说明,少量的傅立叶系数就可以很好地描述轮廓特征。由于傅立叶变换将序列的主要能量集中在了低频系数上,因此,傅立叶描述子的低频系数反映了轮廓曲线的整体形状,而轮廓的细节反映在了高频系数上。第1个傅立叶描述子(即直流量)为所有轮廓曲线上的点的x坐标和y坐标的均值(以复数形式表示),它即为轮廓的质心,给出了轮廓的位置信息。第2个傅立叶描述子给出了最能拟合所有轮廓点的圆的半径。=YBoYyOmAfhzLOMMWajudOIhKOsfMStECmTjBW492ztUmlq8Z7n1mFjDAUuuNiTG_cGzzdGV4sYm50lWgjPjuh_ChXvJbHdwPubsQUtUyLle&qq-pf-to=pcqq.c2c6小波轮廓描述符小波函数族可如下定义对给定的(轮廓)函数c(t),其小波变换系数为而由小波变换系数重建c(t)的公式可写成:其中m0。与截断系数时所需精度有关.6小波轮廓描述符如果设尺度函数将上式右边第一项用的线性组合来代替,则可将上式写为根据小渡变换的特点,上式右边第一项可以看作c(t)在2-m0尺度下的模糊草图,第二项则是对c(t)的细节补充.如果将称为尺度系数,称为小波系数,则所有系数组成与轮廓,c(t)对应的小渡轮廓描述符.6小波轮廓描述符•小波轮廓描述符的基本性质(1)唯一性.小波变换是一一对应的映射,所以一个给定的轮廓对应一组唯一的描述符.反过来,一组描述符对应唯一的一个轮廓.(2)可比较性.对两个轮廓的描述矢量S1和S2,可以借助它们之间的内积d2=S1,S2来定义它们之间的距离以判别相应轮廓的相似程度,即可在数学上对轮廓的相似程度进行定量比较.6小波轮廓描述符小波轮廓描述符:小波轮廓描述符的特点是受轮廓的局部畸变影响较小以及用较少的系数可实现较高的轮廓描述精度。相比傅立叶描述符有更好的精度和稳定性,比较适合用来描述轮廓的基本特征并用来进行基于轮廓的图像查询。1.2.基于区域的描述1、长轴和短轴2、区域面积3、矩形度4、圆形度5、不变矩1.2.1长轴和短轴•边界的直径是边界上相隔最远的2点之间的距离,即这2点之间的直连线段长度。有时这条直线也称为边界的主轴或长轴(与此垂直且最长的与边界的2个交点间的线段也叫边界的短轴)。1.2.2区域面积•区域面积是区域的一个基本特征,它描述了区域的大小。对于数字图像而言,区域的面积定义为区域中的像素点数。这个特征受尺寸、扭曲和缩放的影响,但是它具有旋转不变性。1.2.3矩形度•矩形度定义为物体的面积A0与物体的最小外接矩形(MER)的面积AR之比,即R=A0/AR。矩形度反映了物体在最小外界矩形中的填充程度,矩形的矩形度为1,圆的矩形度为pi/4,三角形的矩形度为0.5。对于其它形状,矩形度的取值范围为(0,1)。利用矩形度可以区分矩形、圆形和不规则形状。1.2.4圆形度•圆形度反映了物体接近圆形的程度,也称作区域的紧凑性(Compactness),定义为4π倍的区域面积A与周长P的平方之比(有的文献定义为周长的平方与4π倍的区域面积之比),即:•在相同面积的情况下,具有光滑边界的形状边界较短,圆形度较大,表明形状较密集。随着边界凹凸变化程度的增加,周长P相应增加,圆形度随之减小。圆的圆形度C=1,正方形的圆形度C=pi/4。1.2.5不变矩矩为一种线性特征,可用来对区域进行描述。对于二维连续函数f(x,y),其(i+j)阶矩定义为由单值性定理(Uniqueness)[7-9]可知:若f(x,y)为分段连续函数且在x-y平面内仅有有限非0值部分,则存在各阶矩,并且矩构成的序列,{}ijM由f(x,y)唯一确定;反之,序列,{}ijM也唯一确定f(x,y)。图像函数为满足上述条件的函数,因此存在各阶矩。定义离散形式的图像(i+j)阶矩为:可求得如下0阶和1阶矩:1.2.5不变矩它们分别代表了图像中的目标的总质量,绕x轴的1阶矩,绕y轴的1阶矩。由0阶和1阶矩我们可求得图像目标的质心:定义图像的中心矩为:则0-3阶中心矩可按如下公式计算:1.2.5不变矩1.2.5不变矩定义归一化中心矩为:下面定义的7个不变矩具有平移、尺度、旋转不变性,称为Hu矩。[8]HuM.K.Visualpatternrecognitionbymomentinvariants.IRETrans.Info.Theory.1962,8:179-187.此文献证明了不变矩具有平移、尺度、旋转不变性2.边缘检测•边缘存在于目标与背景、目标与目标、区域与区域之间,是图像最基本的特征之一为人们描述或识别目标以及解释图像提供了一个重要的特征参数。•它蕴含了图像丰富的内在信息(如方向、阶越性质与形状等);•纹理特征的重要信息源和形状特征的基础;•图像分割、图像分类、图像配准和模式识别所依赖的重要特征。•如果能成功地检测出图像的边缘,图像分析、图像识别就会方便得多,精确度也会得到提高。•滤波:边缘检测算法主要是基于图像强度的一阶和二阶导数,但导数的计算对噪声很敏感,因此必须使用滤波器来改善与噪声有关的边缘检测器的性能。•大多数滤波器在降低噪声的同时也导致了边缘强度的损失,因此,增强边缘和降低噪声之间需要折中。•增强:增强边缘的基础是确定图像各点邻域强度的变化值。增强算法可以将邻域(或局部)强度值有显著变化的点突显出来。边缘增强