机器视觉2

a612804
0 ℃
2020-09-14

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

图像：凡是纪录在纸上的，拍摄在照片上的，显示在屏幕上的所有具有视觉效果的画面都可以称为图像。数字图像：在计算机中的二维阵列（网格）I(i,j)：二维组象素最小单位值列行::::Iji一个数（Intensity）一个向量（R,G,B）两个基本属性：①几何属性：坐标②物理属性：灰度、亮度I→颜色、透射度、深度。（R(x,y),G(x,y)B(x,y)）视觉系统中的一个重要问题是从图像中识别代表物体的区域（或子图像），这种对人来说是件非常容易的事，对计算机来说却是令人吃惊的困难．为了将物体区域同图像其它区域分离出来，需要首先对图像进行分割．把图像划分成区域的过程称为分割，即把图像划分成区域，使得每一个区域对应一个候选的物体．阈值几何特性投影游程长度编码欧拉数轮廓表示目的：提取感兴趣的对象，为进一步的理解和识别做准备。定义：已知一幅图象象素集I和一个一致性谓词P(·)，求图象I表示成n个区域Ri集合的一种划分。IRini1一致性谓词和图象划分具有如下特性，即任何区域满足如下谓词P(Ri)=True任何两个相邻区域不能合并成单一区域，必满足谓词P(RiURj)=False一致性渭词P(·)定义了在区域Ri上的所有点与区域模型的相似程度假定二值图像大小为，其中物体像素值为1，背景像素值为0．以B[i,j]来代表二值化后的目标,目标点置1，背景为0,代表第i行第j列的值尺寸和位置方向密集度和体态比尺寸：一幅二值图像的面积（或零阶矩）以物体的矩心来表示AjiiByAjijBxnimjnimj10101010],[],[一阶矩某些形状的方向不唯一，为了定义唯一的方向，假定物体是长形的，其长轴方向被定义为物体的方向。一般，二维屏面上的最小二阶矩轴为长轴。图像中物体的二阶矩轴定义为：物体上的全部点到该线的距离平方和最小。],[)(],[))((],[)(10102101010102jiByycjiByyxxbjiBxxanimjijnimjijijnimjijcab2tan可求得方向区域的密集度2pACp和A分别为图像的周长和面积圆是最密集的图形。体态比定义为区域的最小外接矩形的长与宽之比。正方形和圆的体态比等于1，细长型的物体体态比大于1给定一条直线，用垂直该直线的一簇等间距直线将一幅二值图象分割成若干条，每条内象素值为1的象素数量为该条二值图象在给定直线上的投影（Projection）值．当给定直线为水平或垂直直线时．计算二值图象每一列或每一行上象素值为1的象素数量，就得到了二值图象的水平和垂直投影。一幅二值图象及其水平和垂直投影图d=i-j+m-1对角线投影共对应n+m-1个条，其中投影位置如下游程长度编码(run-lengthencoding)是另一种二值图象的简洁表示方法，它是用图象象素值连续为1的个数(象素1的长度)来描述图象．这种编码已被用于图象传输．图像的某些性质，如物体区域面积，也可以从游程长度编码直接计算出来．游程长度编码：使用1的起始位置和1的游程长度，仅仅使用游程长度，如果第1个编码值为0，则表示游程长度编码是从0象素的长度开始1的游程(2,2)(6,3)(13,6)(20,1)(4,6)(11,10)(1,5)(11,1)(17,4)1和0的游程长度：0,1,2,2,3,4,6,1,10,3,6,1,105,5,1,5,41021012,nimkkiirAmi是第i行游程个数在许多应用中，亏格数(Genus)或欧拉数被作为识别物体的特征．亏格数定义为连通成分数减去洞数．近邻矩形象素网格的4邻点和8邻点示意图象素[i,j]位于中心一个象素被认为与它的4邻点是4连通(4—connected)关系，与它的8邻点是8连通关系.从象素[i0,j0]到象素[in,jn]的路径(path)是指一个象素序列([i0,j0],[i1,j1]…[in,jn])其中象素[ik,jk]和象素[ik+1,jk+1]互为邻点，如果邻点关系是4连通的，则路径是4路径；如果是8连通的，则称为8路径．4路径8路径图象中值为1的全部象素的集合称为前景(foreground)，用S表尔已知象素p,q属于S，如果存在一条从p到q的路径，且路径上的全部象素都包含在S中，则称p与q是连通的．注意，连通性(connectivity)是等价关系．对属于S的任意三个象素p,q,r1象素p与p本身连通(自反性)．2如果p与q连通，则q与p连通(互换性)3如果p与q连通且q与r连通,则p与r连通(传递性)．一个象素集合，如果集合内的每一个象素与集合内其它象素连通，则称该集合为一个连通成分(connectedcomponent)．(S的补集)中包含图象边界点的所有连通成份的集合称为背景；S的补集中所有其它元称为洞．首先看左图中有几个洞和几个物体．如果从前景和背景来考虑4连通，有四个大小为1个象素的物体和一个洞．如果考虑8连通，那么有一个物体而没有洞．为了避免这种情况，对物体和背景应使用不同的连通。前景使用8连通，背景使用4连通E=1-1=0E=1-2=-1E=2-0=21.网格特征2.投影直方图3.傅立叶描述子4.不变矩每个网格中黑像素个数的比例构成图像的网格特征将目标的轮廓曲线建模成一维序列,对该序列进行一维的傅立叶变换,从而获得一系列的傅立叶系数,用这些系数队目标轮廓进行描述.首先把X-Y平面上的轮廓曲线的有序点集转换到复平面上，形成一维序列：zi=xi+jyi,i=1,2,3…NN为轮廓像素数，对zi取离散傅立叶变换：将得到的傅立叶系数归一化后，可作为轮廓的描述符：由于傅立叶描述子低频部分决定于图像的整体轮廓，高频部分仅仅体现图像的细节，所以高频部分对基于轮廓识别意义不大。因此，用对应的低频分量的傅立叶描述子描述动作轮廓特征，不仅能够完成描述任务而且可以大大压缩数据。。。。。。。。。。。。。。。。颜色模型与颜色感知贾云得第十章