模式识别案例水果的识别•四部分:–数码图片的获取,–图像的彩色边缘检测、图像的分割,–图象的颜色特征和形状特征提取–图像的分类识别。•选择研究的目标物–香蕉,西红柿,梨和青椒四种果蔬。•功能:–使机器具有一定的视觉功能,能够认识“记忆”中的水果。–例如:当接受到命令是香蕉时,就可以自动地将香蕉拿出来。2水果原始图像颜色空间的转换•为了正确使用颜色,需要建立颜色空间。颜色空间是对彩色的一种描述方法,它有很多种类型,–如:RGB,CMY,YIQ,YUV,HSL等。•RGB是使用较普遍的颜色空间,由于显示器采用此模型,因此,算法的执行速度较快。•HSL–是由色调(H),饱和度(S)和亮度(L)三个颜色分量组成的一类颜色空间,–是面向用户的一种复合主观感觉的颜色空间,通常用于选择颜色,更接近人对颜色的感知。3•图(a),图(b),图(c)分别表示彩色水果图像的R,G,B分量,•将三图组合起来都可得到原始图像。4图(a)图(b)图(c)•图(d),图(e),图(f)分别为其H,S,V分量。将三图组合起来都可得到原始图像。•图中H和S分量图看起来与V分量图很不相同,这说明H,S,V三分量间的差别比R,G,B间的大。5图(d)图(e)图(f)彩色边缘和彩色边缘检测•边缘是图像的一个基本特征,携带了图像中的大量信息,边缘检测不仅能得到关于边界的有用的结构信息,而且还能极大地减少要处理的数据,很多图像处理和识别算法都以边缘检测为重要基础。6•边缘按其颜色特征可分为灰度边缘和彩色边缘。–灰度图像可由图像亮度函数来描述,灰度边缘可以定义为图像亮度函数的具有边缘特征的不连续点的集合,它描述了灰度函数的局部突变。–彩色图像可由图像色彩函数来描述,彩色边缘可以定义为图像色彩函数的具有边缘特征的不连续点的集合,它描述了色彩函数的局部突变。7•长期以来人们主要致力于灰度边缘的研究并取得了很好的效果。但彩色边缘能比灰度图像提供更多的信息。有研究表明,彩色图像中,大约有90%的边缘与灰度图像中的边缘相同,也就是说,有10%的边缘在灰度图像中是检测不到的。因此,彩色边缘的检测受到越来越多的重视。8彩色边缘检测的方法•输出融合法–分别对红,绿,蓝三个颜色通道(或其他颜色空间分量)执行边缘检测,–最后的输出是这三幅边缘图像的合成9阈值RGB边缘__R边缘__G边缘__B边缘图像彩色边缘检测的方法•多维梯度法–将三个梯度结合成一个,只需检测一次边缘,从而缩短了整个彩色边缘检测的过程10R多维梯度计算GB边缘图像阈值彩色边缘检测的方法•以上两种彩色边缘检测算法中常用的梯度算子有–罗伯特交叉(Robertcross)算子,蒲瑞维特(Prewitt)和索贝尔(Sobel)算子。–其中,索贝尔算子是效果较好的一种,并且可以直接应用于彩色图像的各个颜色通道。11边缘提取•使用索贝尔算子得到的边缘图像12取反后的边缘图像4.数学形态学处理•上图的二值边缘图像描述了色彩函数的局部突变,从图中看出,边缘不很连续和光滑,并且在高细节区存在琐细边缘,难以形成一个大区域,这两点恰是限制边缘检测在图像分割中应用的两大难点。•数学形态学是一种应用于图像处理和模式识别领域的新的方法。基本思想:–利用“探针”收集图像的信息。当探针在图像中不断移动时,便可考察图像各个部分间的相互关系,从而了解图像各部分的结构特征。–作为探针的结构元素,可直接携带知识(形态,大小,以及灰度和色度信息)来探测所研究图像的结构特点13•14%轮廓变模糊形态学处理步骤–第一步:构造结构元素(%即形状等)–第二步:利用构造的结构元素对图像进行膨胀操作–第三步:区域填充–第四步:连通区域标记–第五步:选择对象•与原始图像相比,我们看到在边缘图像中存在一些细小的间隙,根据数学形态学原理,如果构造结构元素对图像进行膨胀操作,这些小间隙就会消失。因此,我们在水平和竖直两个方向分别构造结构元素:–(%水平方向)se0=(1111111111)–(%垂直方向)se90=(11111111111)15膨胀处理•膨胀处理后16区域填充•膨胀运算后,图像的边缘得到了很好的描述•然而,在目标物的内部,仍然存在一些空洞,可通过区域填充消除空洞17区域填充后标记连通区域•为了能够更加清楚的观察分割结果,我们对上图中的连通区域进行标记,并且用不同的颜色显示•从图中可以看出,共得到四部分分割区域,并分别用红色,黄色,深蓝色和蓝绿色表示出来18对象提取•在二值图像中,对象是指值为1且连接在一起的像素的集合。•根据上图中不同目标物的不同坐标,提取出特定的连通区域,选择特定的对象19分别显示出只含有一个对象的二值图像5特征提取•5.1形状特征•5.2颜色特征205.1形状特征•图像经过边缘提取和图像分割等操作,就会得到边缘和区域,也就是获得了目标的形状。•任何物体的形状特征均可由其几何属性(如长度、面积、距离、凹凸等),统计属性(如投影)和拓扑属性(如连通、欧拉数)来进行描述。•可以用来表示形状的特征包括几何特征和矩特征。–可供选择的几何特征有:周长、面积、偏心率、欧拉数、角点、横轴长度和纵轴长度。–矩特征有质心、方向、主轴关于方向的矩、不变矩和特征矩等。–本例识别目标物较少,因此不必选择过多特征,我们只选择了面积,横轴长两个特征,并用图像分析得到的特征值建立了一个小型的特征库215.2颜色特征•由于颜色特征具有旋转不变性和尺度不变性,因而,在图象识别技术,颜色是使用最广泛的特征之一。•而颜色特征的提取是利用颜色特征进行图象识别的关键之一。•目前,大部分系统都采用颜色比例分布作为颜色基本特征,这就是图象领域中的直方图法。22(a)(b)(c)(d)图(a)~(d)分别为香蕉,青椒,梨和西红柿的直方图横轴为色调Hue,纵轴为H(p)。相似度量•颜色特征提取后,如何用数值来有效的表示图像在颜色上的相似程度,这便是相似度量问题•相似度量也是直接影响识别效果的重要环节,在模式识别技术中,特征的相似度量均采用距离法,即特征的相似程度用特征向量的空间距离来表示236识别结果•经过彩色边缘检测,图像分割和特征提取,对分割后的图像进行模式匹配,并制作出用户界面,最终实现图像的分类和识别。•当按下界面上的控制按钮时,计算机会自动识别出相应的水果。–例如:按下按钮“梨”时,界面上就会显示出梨。按下按钮“关闭”,界面关闭。24最终效果图•25(a)原始图像(b)梨弹孔识别车牌识别文字干扰其他字符干扰车牌污染车牌被污染部分被挡车牌字符下边被遮挡运动失真车牌字符因运动失真