图像:凡是纪录在纸上的,拍摄在照片上的,显示在屏幕上的所有具有视觉效果的画面都可以称为图像。数字图像:在计算机中的二维阵列(网格)I(i,j):二维组象素最小单位值列行::::Iji一个数(Intensity)一个向量(R,G,B)两个基本属性:①几何属性:坐标②物理属性:灰度、亮度I→颜色、透射度、深度。(R(x,y),G(x,y)B(x,y))视觉系统中的一个重要问题是从图像中识别代表物体的区域(或子图像),这种对人来说是件非常容易的事,对计算机来说却是令人吃惊的困难.为了将物体区域同图像其它区域分离出来,需要首先对图像进行分割.把图像划分成区域的过程称为分割,即把图像划分成区域,使得每一个区域对应一个候选的物体.阈值几何特性投影游程长度编码欧拉数轮廓表示目的:提取感兴趣的对象,为进一步的理解和识别做准备。定义:已知一幅图象象素集I和一个一致性谓词P(·),求图象I表示成n个区域Ri集合的一种划分。IRini1一致性谓词和图象划分具有如下特性,即任何区域满足如下谓词P(Ri)=True任何两个相邻区域不能合并成单一区域,必满足谓词P(RiURj)=False一致性渭词P(·)定义了在区域Ri上的所有点与区域模型的相似程度假定二值图像大小为,其中物体像素值为1,背景像素值为0.以B[i,j]来代表二值化后的目标,目标点置1,背景为0,代表第i行第j列的值尺寸和位置方向密集度和体态比尺寸:一幅二值图像的面积(或零阶矩)以物体的矩心来表示AjiiByAjijBxnimjnimj10101010],[],[一阶矩某些形状的方向不唯一,为了定义唯一的方向,假定物体是长形的,其长轴方向被定义为物体的方向。一般,二维屏面上的最小二阶矩轴为长轴。图像中物体的二阶矩轴定义为:物体上的全部点到该线的距离平方和最小。],[)(],[))((],[)(10102101010102jiByycjiByyxxbjiBxxanimjijnimjijijnimjijcab2tan可求得方向区域的密集度2pACp和A分别为图像的周长和面积圆是最密集的图形。体态比定义为区域的最小外接矩形的长与宽之比。正方形和圆的体态比等于1,细长型的物体体态比大于1给定一条直线,用垂直该直线的一簇等间距直线将一幅二值图象分割成若干条,每条内象素值为1的象素数量为该条二值图象在给定直线上的投影(Projection)值.当给定直线为水平或垂直直线时.计算二值图象每一列或每一行上象素值为1的象素数量,就得到了二值图象的水平和垂直投影。一幅二值图象及其水平和垂直投影图d=i-j+m-1对角线投影共对应n+m-1个条,其中投影位置如下游程长度编码(run-lengthencoding)是另一种二值图象的简洁表示方法,它是用图象象素值连续为1的个数(象素1的长度)来描述图象.这种编码已被用于图象传输.图像的某些性质,如物体区域面积,也可以从游程长度编码直接计算出来.游程长度编码:使用1的起始位置和1的游程长度,仅仅使用游程长度,如果第1个编码值为0,则表示游程长度编码是从0象素的长度开始1的游程(2,2)(6,3)(13,6)(20,1)(4,6)(11,10)(1,5)(11,1)(17,4)1和0的游程长度:0,1,2,2,3,4,6,1,10,3,6,1,105,5,1,5,41021012,nimkkiirAmi是第i行游程个数在许多应用中,亏格数(Genus)或欧拉数被作为识别物体的特征.亏格数定义为连通成分数减去洞数.近邻矩形象素网格的4邻点和8邻点示意图象素[i,j]位于中心一个象素被认为与它的4邻点是4连通(4—connected)关系,与它的8邻点是8连通关系.从象素[i0,j0]到象素[in,jn]的路径(path)是指一个象素序列([i0,j0],[i1,j1]…[in,jn])其中象素[ik,jk]和象素[ik+1,jk+1]互为邻点,如果邻点关系是4连通的,则路径是4路径;如果是8连通的,则称为8路径.4路径8路径图象中值为1的全部象素的集合称为前景(foreground),用S表尔已知象素p,q属于S,如果存在一条从p到q的路径,且路径上的全部象素都包含在S中,则称p与q是连通的.注意,连通性(connectivity)是等价关系.对属于S的任意三个象素p,q,r1象素p与p本身连通(自反性).2如果p与q连通,则q与p连通(互换性)3如果p与q连通且q与r连通,则p与r连通(传递性).一个象素集合,如果集合内的每一个象素与集合内其它象素连通,则称该集合为一个连通成分(connectedcomponent).(S的补集)中包含图象边界点的所有连通成份的集合称为背景;S的补集中所有其它元称为洞.首先看左图中有几个洞和几个物体.如果从前景和背景来考虑4连通,有四个大小为1个象素的物体和一个洞.如果考虑8连通,那么有一个物体而没有洞.为了避免这种情况,对物体和背景应使用不同的连通。前景使用8连通,背景使用4连通E=1-1=0E=1-2=-1E=2-0=21.网格特征2.投影直方图3.傅立叶描述子4.不变矩每个网格中黑像素个数的比例构成图像的网格特征将目标的轮廓曲线建模成一维序列,对该序列进行一维的傅立叶变换,从而获得一系列的傅立叶系数,用这些系数队目标轮廓进行描述.首先把X-Y平面上的轮廓曲线的有序点集转换到复平面上,形成一维序列:zi=xi+jyi,i=1,2,3…NN为轮廓像素数,对zi取离散傅立叶变换:将得到的傅立叶系数归一化后,可作为轮廓的描述符:由于傅立叶描述子低频部分决定于图像的整体轮廓,高频部分仅仅体现图像的细节,所以高频部分对基于轮廓识别意义不大。因此,用对应的低频分量的傅立叶描述子描述动作轮廓特征,不仅能够完成描述任务而且可以大大压缩数据。。。。。。。。。。。。。。。。颜色模型与颜色感知贾云得第十章