第九章遥感图像分类遥感图像的计算机分类,就是利用计算机技术来模拟人类的识别功能,对地球表面及其环境在遥感图像上的信息进行属性的自动判别和分类,达到提取所需地物信息的目的。§9—1基础知识1、模式与模式识别所谓“模式”是指某种具有空间或几何特征的东西。对被识别的模式作一系列的测量,然后将测量结果与“模式字典”中一组“典型的”测量值相比较,得出所需要的分类结果。这一过程称为模式识别.xn分类器(或称判决器),可以根据一定的分类规则,把某一测量矢量X划入某一组预先规定的类别之中去。自然模式接收器(传感器)分类器(判决器)x2x1结果….模式识别系统的模型2、光谱特征空间及地物在特征空间中聚类的统计特性光谱特征空间:以各波段图像的亮度分布为坐标轴组成的空间.同类地物在特征空间形成一个相对聚集的点集群;不同类地物的点集群在特征空间内一般是相互分离的.地物与光谱特征空间的关系水B5B7特征点集群在特征空间中的分布大致可分为如下三种情况:理想情况——不同类别的点的集群至少在一个特征子空间中的投影是完全可以相互区分开的。BiBj植被一般情况——无论在总的特征空间中,还是在任一子空间中,不同类别的集群之间总是存在重叠现象。这时重叠部分的特征点所对应的地物,在分类时总会出现不同程度的分类误差,这是遥感图像中最常见的情况。水典型情况——不同类别地物的集群,在任一子空间中都有相互重叠的现象存在,但在总的特征空间中可以完全区分的。这时可采用特征变换使之变成理想情况进行分类。水§9-2特征变换及特征选择一、特征变换1、主分量变换2、穗帽变换3、哈达玛变换哈达玛变换定义为:IH=H·X1、K-L变换(Karhunen-Loeve)(主分量变换)K-L变换:它是对某一多光谱图像X.利用K-L变换矩阵A进行线性组合,而产生一组新的多光谱图像Y.Y=AX特点:变换后的主分量空间与变换前的多光谱空间坐标系相比旋转了一个角度。新坐标系的坐标轴一定指向数据量较大的方向。该变换的几何意义是把原始特征空间的特征轴旋转到平行于混合集群结构轴的方向上去。达到数据压缩、提高信噪比、提取相关信息、降维处理和提取原图像特征信息的目的。主分量变换计算步骤如下:(1)计算多光谱图像的均值向量M和协方差矩阵C。(2)计算矩阵C的特征值λr和特征向量φr,(r=1,2,………,M),M为多光谱图像的波段数。(3)将特征值λr按由大到小的次序排列,即λ1λ2……λm.(4)选择前几个特征值对应的几个特征向量构造变换矩阵φn.(5)根据Y=φnX进行变换,得到的新特征影像就是变换的结果,X为多光谱图像的一个光谱特征矢量。第一分量方差分布最广,集中最多信息,第二分量次之。2、K-T变换是kauth-Thomas变换的简称,也称穗帽变换.是一种坐标空间发生旋转的线性变换,旋转后的坐标轴指向与地面景物有密切关系的方向主要针对TM图像数据和MSS数据.Y=A·XY=(ISBIGVIYIN)TX=(X4X5X6X7)其中:ISB——土壤亮度轴的像元亮度值IGV——植物绿色指标轴的像元亮度值IY——黄色轴IN——噪声轴Xi——地物在MSS四个波段上的亮度值穗帽变换的变换矩阵根据经验确定。Kauth和Thomas研究出的矩阵A具有如下形式:0.4330.6320.5860.264-0.290-0.5670.6000.491-0.8240.533-0.0500.1850.2230.012-0.5430.809土壤亮度变化轴ISB为穗帽的底边,帽上面各部分反映了植物生长变化状况,植物株冠的绿色发展到顶点(最旺盛时在帽顶)以后逐渐枯黄,枯黄过程是从帽顶沿着一些称为帽穗的路径回归到土壤底线(因此有穗帽之称)。哈达玛矩阵为一个对称的正交矩阵,其变换核为H’由哈达玛变换核可知,哈达玛变换实际是将坐标轴旋转了45℃的正交变换3、哈达吗变换哈达玛矩阵的维数N总是2的倍数,即N=2m(m=1,2……)其中m称为矩阵的阶,每个高阶哈达玛矩阵都由其低一阶的哈达玛矩阵按如下取二阶哈达玛变换矩阵以MSS4,5,6,7四波段的陆地卫星图像的哈达玛为换为例:IH=H·XIH=(h0h3h1h2)Th0=(x4+x5)+(x6+x7)h1=(x4+x5)-(x6+x7)h2=(x4-x5)-(x6-x7)h3=(x4-x5)+(x6-x7)有:h011x4+5h11-1x6+7h211x4-5h31-1x6-7==将它们投影到以X4+5X6+7和X4-5X6-7形成的二个二维空间上特征图像h0集中了大量的土壤信息,并且对于把水同土壤与植被的混合体区分开来是有效的。而h1则有利于提取植被信息,即有利于把植被同水和土壤的混合体区分开来。而h2类似于h1。但是由于(X4-5)和(X6-7)的数值对各类都很小(1.0%),所以h3和h2主要表现为噪声图像,通常在特征选择过程中可把其舍去,以达到数据压缩的目的。4、比值变换和生物量指标变换比值变换图像用作分类有许多优点,它可以增强土壤,植被,水之间的辐射差别,压抑地形坡度和方向引起的辐射量变化。该变换的几何意义是地物集群沿辐射方向在IH1=1的直线上的投影从图中可以看出植物与土壤在7波段上有混淆;植物与水在5波段上有混淆。经变换后,植物与土壤和水都分离开来,因此可独立地对绿色植物量进行统计,因而得名。二特征选择在遥感图像自动分类过程中,不仅使用原始遥感图像进行分类,还使用如上节所述多种特征变换之后的影像。我们总希望能用最少的影像数据最好地进行分类。这样就需在这些特征影像中,选择一组最佳的特征影像进行分类,这就称为特征选择。特征选择的问题与所希望区分的类别及影像本身的特征有关比如当希望研究植被类别,生长情况等,那么选择生物量指标变换影像及穗帽变换中GV(绿色植物指标轴)分量影像就比较有利;研究土壤类别问题时,使用穗帽变换中的SB(土壤亮度轴)分量比较有利;区分两类类似的地物(如玉米和大豆),则选取用适宜时间的影像进行分类;又如对山地植被分类选用比值变换后影像能消去地形影响。特征选择的定量方法1、距离测度:如果所选择的一组特征能使感兴趣类别的类内距离最小,而与其它类别的类间距离最大,那么根据距离测度;用这组特征设计的分类器分类效果最好。实际可使用标准化距离,类别均值间的标准化距离公式为:类别间标准化距离越大的特征影像可分性越好2、散布矩阵测度除了距离测度之外,实际应用中还经常采用一种散布矩阵的方式来度量类别的可分性,它是用矩阵形式来表示模式类别在特征空间中的散布情况。§9-3监督分类监督分类法是选择有代表性的试验区来训练计算机,再按一定的统计判别规则对未知地区进行自动分类的方法。自动识别分类监督分类法非监督分类法分类目的:将图象中所有像元自动地进行土地覆盖专题分类原始遥感图像对应的专题图像分类的依据是什么?监督分类的思想1)确定每个类别的样区2)学习或训练3)确定判别函数和相应的判别准则4)计算未知类别的样本观测值函数值5)按规则进行像元的所属判别分类过程原始影像数据的准备图像变换及特征选择分类器的设计初始类别参数的确定逐个像素的分类判别形成分类编码图像输出专题图一判决函数和判决规则判决函数:当各个类别的判别区域确定后,用来表示和鉴别某个特征矢量属于哪个类别的函数。这些函数不是集群在特征空间形状的数学描述,而是描述某一未知矢量属于某个类别的情况,如属于某个类别的条件概率。一般,不同的类别都有各自不同的判决函数。判别规则:当计算完某个矢量在不同类别判决函数中的值后,我们要确定该矢量属于某类必须给出一个判断的依据。如若所得函数值最大则该矢量属于最大值对应的类别。这种判断的依据,我们称之为判别规则。判断特征矢量属于某类的依据。概率判别函数:把某特征矢量(X)落入某类集群的条件概率当成分类判决函数(概率判决函数)贝叶斯判别规则:把X落入某集群wi的条件概率P(wi/X)最大的类为X的类别贝叶斯判别规则以错分概率或风险最小为准则的判别规则。1、概率判决函数和贝叶斯判决规则根据贝叶斯公式可得:P(wi)——wi类出现的概率,也称先验概率。P(wi/X)——在wi类中出现X的条件概率,也称wi类的似然概率。P(X/wi)——X属于wi的后验概率。由于P(X)对各个类别都是一个常数,故可略去所以,判决函数可用下式表示:)()/()(iiiPXPXd)()()/()/(XPPXPXPiii为了计算方便,将上式可以用取对数方式来处理。即同类地物在特征空间服从正态分布,则类别的概率密度函数:)(ln||ln212ln2)()(21)(1iiiiTiiPnMXMXXd)(ln)/(ln)(iiiPXPXd)()(21exp)2()/(12/2/1MXMXXPTn去掉与i值无关的项对分类结果没有影响,因此上式可简化为:相应的贝叶斯判决规则为:若对于所有可能的j=1,2,···,m;j≠i有,则X属于类。根据概率判决函数和贝叶斯判决规则来进行的分类通常称为最大似然分类法。)(ln||ln21)()(21)(1iiiiTiiPMXMXXd贝叶斯判决规则是以错分概率最小的最优准则•判别边界•当使用概率判别函数进行分类时,不可避免地会出现错分现象。2、距离判决函数和判决规则基本思想是设法计算未知矢量X到有关类别集群之间的距离,哪类距离它最近,该未知矢量就属于那类。距离判决函数不象概率判决函数那样偏重于集群分布的统计性质,而是偏重于几何位置。距离判别规则是按最小距离判别的原则马氏(Mahalanobis)距离欧氏(Euclidean)距离计程(Taxi)距离基于距离判别函数和判别规则,在实践中以此为原理的分类方法称为最小距离分类法。1)马氏距离)()(1iiTiMiMXMXd马氏距离几何意义:X到类重心之间的加权距离,其权系数为协方差。判别函数:在各类别先验概率和集群体积|∑|都相同情况下的概率判别函数则有•在马氏距离的基础上,作下列限制–将协方差矩阵限制为对角的–沿每一特征轴的方差均相等2)()(iiTiEiMXMXMXd欧氏距离是马氏距离用于分类集群的形状都相同情况下的特例。2)欧氏距离则有•X到集群中心在多维空间中距离的绝对值之总和来表示mjijTiMXd1||3)计程(Taxi)距离3、其它的判决函数和判决规则盒式分类法基本思想:首先通过训练样区的数据找出每个类别在特征空间的位置和形状,然后以一个包括该集群的“盒子”作为该集群的判别函数。判决规则为若未知矢量X落入该“盒子”,则X分为此类,否则再与其它盒子比较。例如对于A类的盒子,其边界(最小值和最大值)分别是X1=a、X1=b;X2=c、X2=d。这种分类法在盒子重叠区域有错分现象。错分与比较盒子的先后次序有关。二分类过程确定判决函数和判决规则以后,下一步的工作是计算每一类别对应的判决函数中的各个参数,如使用最大似然法进行分类,必须知道判别函数中的均值向量和协方差矩阵。而这些参数的计算是通过使用“训练样区”的数据来获取的。监督法分类意味着对类别已有一定的先验知识,根据这些先验知识,就可以有目的地选择若干个“训练样区”。这些“训练样区”的类别是已知的。利用“训练样区”的数据去“训练”判决函数就建立了每个类别的分类器然后按照分类器对未知区域进行分类。分类的结果不仅使不同的类别区分开了而且类别的属性也知道了。监督分类的主要步骤如下:(1)确定感兴趣的类别数。首先确定要对哪些地物进行分类,这样就可以建立这些地物的先验知识。(2)特征变换和特征选择根据感兴趣地物的特征进行有针对性的特征变换,这部分内容在前面特征选择和特征变换一节有比较详细的介绍。变换之后的特征影像和原始影像共同进行特征选择,以选出既能满足分类需要,又尽可能少参与分类的特征影像,加快分类速度,提高分类精度。(3)选择训练样区训练样区的选择要注意准确性、代表性和统计性三个问题。准确性就是要确保选择的样区与实际地物的一致性代表性一方面指所选择区为某一地物的代表,另一