1第八章遥感图像自动识别分类2内容提纲•基础知识•特征变换和特征选择•监督分类•非监督分类•监督分类和非监督分类的结合•分类后处理和误差分析•非光谱信息分类•自动分类新方法3概述•遥感图像的计算机分类,是模式识别技术在遥感技术领域中的具体运用•目视判读是直接利用人类的自然识别智能•计算机分类是利用计算机技术来人工模拟人类的识别功能•采用决策理论(或统计)方法•从被识别的模式(即对象)中,提取一组反映模式属性的量测值,称之为特征•把模式特征定义在一个特征空间中,进而利用决策的原理对特征空间进行划分,以区分不同特征的模式,达到分类的目的•光谱特征和纹理特征458.1基础知识•模式与模式识别•光谱特征空间•地物在特征空间中的聚类统计特性68.1.1模式与模式识别•“模式”是指某种具有空间或几何特征的东西,它的含义是某种事物的标准形式。•一个模式识别系统对被识别的模式作一系列的测量,然后将测量结果与“模式字典”中一组“典型的”测量值相比较。若和字典中某一“词目”的比较结果是吻合或比较吻合,则我们就可以得出所需要的分类结果。这一过程称为模式识别。•这一组测量值就是一种模式。7图8-1模式识别系统的模型8模式与模式识别数据获取模式分割模式识别姚明ROCKETS119模式识别的应用车牌识别10模式识别的应用信函分拣11模式识别的应用遥感影像分类128.1.2光谱特征空间•不同的地物在同一波段图像上表现的亮度一般互不相同•不同的地物在多个波段图像上亮度的呈现规律也不相同•同名地物点在不同波段图像中亮度的观测量将构成一个多维随机向量X,称为光谱特征向量如TM图像上任一个点TM=[TM1,TM2,TM3,TM4,TM5,TM6,TM7]TnxxxX][21=13地物与光谱特征空间的关系14地物在特征空间中的聚类情况由于随机性因素(如大气条件,背景,地物朝向,传感器本身的“噪声”等)影响,同类地物的各取样点在光谱特征空间中的特征点将不可能只表现为同一点,而是形成一个相对聚集的点集群,而不同类地物的点集群在特征空间内一般是相互分离的。特征点集群在特征空间中的分布15168.1.3地物在特征空间中的聚类统计特性•地物在特征空间的聚类通常是用特征点(或其相应的随机矢量)分布的概率密度函数来表示178.2特征变换和特征选择•目的:减少参加分类的特征图像的数目,从原始信息中抽取能更好进行分类的特征图像。•特征变换——将原有的m量值集合通过某种变换,然后产生n个(n≤m)新的特征。•特征选择——从原有的m个测量值集合中,按某一准则选择出n个特征。188.2.1特征变换•概念:将原始图像通过一定的数字变换生成一组新的特征图像,这一组新图像信息集中在少数几个特征图像上。•目的:数据量有所减少,去相关,有助于分类。•常用的特征变换:主分量变换、哈达玛变换、穗帽变换、比值变换、生物量指标变换。19redScatterPlotrevealsrelationshipbetweeninformationintwobandshere:correlationcoefficient=0.137redNIR20PrincipalComponentsAnalysiscorrelationbetweenallbandsTMdatacorrelationcoefficients:1.0000.9270.8740.0690.5930.4260.7360.9271.0000.9540.1720.6910.4460.8000.8740.9541.0000.1370.7400.4330.8120.0690.1720.1371.0000.369-0.0840.1190.5930.6910.7400.3691.0000.5340.8910.4260.4460.433-0.0840.5341.0000.6710.7360.8000.8120.1190.8910.6711.000211.主分量变换•主分量变换也称为KL变换,是一种线性变换,是就均方误差最小来说的最佳正交变换•KL变换能够把原来多个波段中的有用信息集中到数目尽可能少的特征图像组中去,达到数据压缩的目的。•KL变换还能够使新的特征图像间互不相关,使新的特征图像包含的信息内容不重叠,增加类别的可分性。22主分量变换计算步骤(1)计算均值向量M和协方差矩阵C;(2)计算矩阵C的特征值和特征向量;(3)将特征值按由大到小的次序排序;(4)选择前几个特征值对应的几个特征向量构造变换矩阵φn;(5)根据Y=φnX进行变换,得到的新特征影像就是变换的结果,X为多光谱图像的一个光谱特征矢量。23MSS主分量变换前后的信息量分布24TM主分量变换前后的信息量分布25主分量变换PC-1PC-7262.哈达玛变换•哈达玛变换是利用哈达玛矩阵作为变换矩阵实施的遥感多光谱域变换。•哈达玛矩阵的变换核为27哈达玛变换•哈达玛矩阵的维数N总是2的倍数•每个高阶哈达玛矩阵都由其低一阶的哈达玛矩阵按如下形式组成•哈达玛变换定义为:−=+mmmmmHHHHH1XHIH⋅=),2,1(2==mNm28哈达玛变换的几何意义•由哈达玛变换核可知,哈达玛变换实际是将坐标轴旋转了45℃的正交变换29哈达玛变换的几何意义•以四波段的陆地卫星图像的哈达玛为换为例,取二阶哈达玛变换矩阵[]0312ThIhhhh=−−−−−−=1111111111111111Hh0=(x4+x5)+(x6+x7)h1=(x4+x5)-(x6+x7)h2=(x4-x5)-(x6-x7)h3=(x4-x5)+(x6-x7)−=++7654101111XXhh−=−−7654231111XXhh30哈达玛变换的几何意义图8-4二维哈达玛变换31哈达玛变换的几何意义•特征图像h0把水同土壤与植被的混合体区分开来•特征图像h1把植被同水和土壤的混合体区分开来•特征图像h3和特征图像h2主要表现为噪声图像,通常在特征选择过程中可舍去,达到数据压缩的目的。323.穗帽变换•又称K-T变换,由Kauth-Thomas提出,是一种线性特征变换。•MSS图像信息随时间变化的空间分布形态是呈规律性形状的,像一个顶部有缨子的毡帽。•特点1:在MSS图像中,土壤在特征空间(光谱空间)的集群,随亮度的变化趋势沿从坐标原点出发的同一根辐射线方向上出现。•特点2:若把土壤和植被的混合集群投影到MSS-5和MSS-6波段图像所组成的特征子空间中,形成一个近似的帽状三角形。33穗帽变换Y=A·X34穗帽变换Y=A·XY=(ISBIGVIYIN)TX=(x4x5x6x7)ISB——土壤亮度轴的像元亮度值IGV——植物绿色指标轴的像元亮度值IY——黄色轴IN——噪声轴xi——地物在MSS四个波段上的亮度值•SB分量和GV分量一般情况下等价于主分量变换中的第一主分量PC1和第二主分量PC2•SB分量集中了大部分土壤信息,所以对土壤的分类是有效的•GV分量对植被的分类是有效的354.生物量指标变换•Ibio——生物量变换后的亮度值。•x7,x5为MSS-7和MSS-5图像的像元亮度值。•经变换后,植物、土壤和水都分离开来,因此可独立地对绿色植物量进行统计。36生物量指标变换)148(5757−+−=xxxxIbio12HHbioIII=−+=−=575757211111xxxxxxIIHH378.2.2特征选择•选择一组最佳的特征影像进行分类•定量选择方法–距离测度–散布矩阵测度类内散布矩阵类间散布矩阵总体散布矩阵00{()()}TmiiwbSEMMMMSS=−−=+类别均值间的标准化距离38•前面所述内容主要为分类前的预处理。预处理工作结束后,就将参与分类的数据准备,接下来的工作就是从这些数据提供的信息中让计算机“找”出所需识别的类别,其方式有两种:一种就是监督分类法;另一种称为非监督分类法。398.3监督分类•监督分类:是基于我们对遥感图像上样本区内地物的类属已知,于是可以利用这些样本类别的特征作为依据来识别非样本数据的类别。•监督分类的思想:首先根据已知的样本类别和类别的先验知识,确定判别函数和相应的判别准则,其中利用一定数量的已知类别函数中求解待定参数的过程称之为学习或训练,然后将未知类别的样本的观测值代入判别函数,再依据判别准则对该样本的所属类别作出判定。40监督分类•判别函数和判别规则•分类过程418.3.1判别函数和判别规则•各个类别的判别区域确定后,某个特征矢量属于哪个类别可以用一些函数来表示和鉴别,这些函数就称为判别函数。•当计算完某个矢量在不同类别判决函数中的值后,我们要确定该矢量属于某类必须给出一个判断的依据。如若所得函数值最大则该矢量属于最大值对应的类别。这种判断的依据,我们称之为判别规则。42判别函数•判别当且仅当g2(x)g1(x),g2(x)g3(x),x∈ω2对于更多的类别,当且仅当gi(x)gj(x),x∈ωi,其中j=1,2,3,…,m,j≠i,m为类别数43概率判别函数和贝叶斯判别规则•可以把某特征矢量(X)落入某类集群的条件概率当成分类判别函数(概率判别函数),X落入某集群的条件概率最大的类为X的类别,这种判决规则就是贝叶斯判别规则。贝叶斯判别规则是以错分概率或风险最小为准则的判别规则。•假设,同类地物在特征空间服从正态分布,则类别的概率密度函数为:44概率判别函数和贝叶斯判别规则•根据贝叶斯公式可得:•式中:(/)()(/)()iiiPXPPXPXωωω⋅=()(/)(/)iiiiiiiPPXXPXXωωωωωωω−−−类出现的概率,即先验概率;在类中出现的条件概率,也称类的似然概率;属于的后验概率。()(/)()iiidXPXPωω=⋅判别函数为()ln(/)ln()iiidXPXPωω=+(8-21)(8-22)(8-23)45概率判别函数和贝叶斯判别规则46最大似然法分类的错分概率•错分概率是类别判别分界两侧做出不正确判别的概率之和。贝叶斯判别边界使这个数错误为最小,因为这个判别边界无论向左还是向右移都将包括不是1类便是2类的一个更大的面积,从而增加总的错分概率。由此可见,贝叶斯判别规则是错分概率最小的最优准则。•根据概率判别函数和贝叶斯判别规则来进行的分类通常称为最大似然分类法。47距离判别函数和判别规则•基本思想:计算未知矢量X到有关类别集群之间的距离,哪类距离它最近,该未知矢量就属于哪类。•距离判别规则:最小距离判别的原则。若对于所有的比较类j=1,2,…,m;j≠i,有di(X)dj(X),则X属于类,其中di(X)为X到第i类集群间的距离。•基于距离判决函数和判决规则,在实践中以此为原理的分类方法称为最小距离分类法。•距离判别函数:−马氏距离−欧氏距离−计程距离iω48距离判别函数和判别规则•马氏距离假定则其几何意义是X到wi类重心Mi之间的加权距离,其权系数为多维方差或协方差。•欧氏距离•计程距离))||||ijijPwPw==∑∑((,1()()iTMiiidXMXM−=−−∑ijσ2()()||||iTEiiidXMXMXM=−−=−1||imTjijjdXM==−∑49错分概率及判别边界50盒式分类法•基本思想:首先通过训练样区的数据找出每个类别在特征空间的位置和形状,然后以一个包括该集群的“盒子”作为该集群的判别函数。判决规则为若未知矢量X落入该“盒子”,则X分为此类,否则再与其它盒子比较。图8-9盒式分类法518.3.2分类过程(1)确定感兴趣的类别数(2)特征变换和特征选择变换之后的特征影像和原始影像共同进行特征选择,以选出既能满足分类需要,又尽可能少参与分类的特征影像,加快分类速度,提高分类精度。(3)选择训练样区训练样区指的是图像上那些已知其类别属性,可以用来统计类别参数的区域。(4)确定判决函数和判决规则(5)根据判别函数和判别规则对非训练样区的图像区