1第七章高光谱遥感图像分类2基本概念模式(pattern):在多波段图像中,每个像元都具有一组对应取值,称为像元模式特征(feature):在多波段图像中,每个波段都可看作一个变量,成为特征变量一个像元可以看成由n个特征组成的n维空间的一个点,同类地物的像元形成n维空间的一个点群,差异明显的不同地物会构成n为空间的若干个点群图像分类就是要分析特征空间这些点群的特点,如点群位置、分布空间、分布规律,从而确定点群的界限,最终完成分类任务3相似性:可以表现为不同的形式和量度距离值(DistanceValue):像素或像素组信号特征向量之间距离值的大小来衡量概率值(ProbabilityValue):像素信号特征向量与某一像素组的似然性的大小为相似性的量度光谱角值(SpectralAngleValue):像素或像素组之间光谱角的大小为相似性量度4分类方法分类执行方式:监督分类、非监督分类分类模型或分类器:统计分类、模糊分类、邻域分类、神经网络分类参数分类和非参数分类:假定类的概率分布函数并估计其分布参数硬分类和软分类:像元属于一个类或多个类56监督分类(Supervisedclassification)通过选择代表各类别的已知样本(训练区)的像元光谱特征,事先取得各类别的参数,确定判别函数,从而进行分类。在监督分类中,先定义信息类,然后检验它们的光谱可分性7监督分类训练区已知地表覆盖类型的代表样区用于描述主要特征类型的其精度直接影响分类检验区用于评价分类精度的训练样区8样区选择示例训练样区与检验区的选择:相互独立、不能重叠9样区选择示例10监督算法介绍1、平行管道分类算法2、最小距离分类算法3、最大似然分类算法111、平行管道监督分类原理对图像中每个像素的光谱响应曲线进行相似性比较,如果落到某一类平行管道阈值范围内,则划分到该类别;如果落到多个类中,则将这个像元划分到最后匹配的类别;落不到任何管道中,则标识为未分类像元每类的初始参数要在分类过程中逐步建立。其分类判决过程如下:12Parallelepipedclassifier02550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest02550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest1213分类判决过程:142、最小距离监督分类假定初拟分类c个类别,分别是,,…,,则最小距离分类的步骤是:12c(1)取c个类别的训练区域,第i个类别训练区域的样本个数为计算每个类别的均值(或):iNimiiTyiiyNm1具体地,若样本y有K个波段组成,则均值是K维向量,每个分量是训练区域相应波段的像素均值(2)扫描图像,对每个像元y,分别计算y到每个类中心的距离若KkikkiimymyD122)(||||jcjiDD],1[miniy15Minimumdistanceclassifier02550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest02550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest1216分类常用距离与有关统计量1.绝对值距离n1jijkjkiMxxd式中:di(xk)为距离;j为波段序号;总波段数为n,i为类别号;Xkj为k象元在j波段的灰度值;Mij为均值。这个距离也叫出租汽车距离或城市块距离。在二维空间中可以看出,这种距离是计算两点之间的直角边距离,相当于城市中出租汽车沿城市街道拐直角前进而不能走两点连接的最短距离,它的名称也由此而来172n1jijkjkiMxxd2.欧几里德距离欧几里德距离就是两点之间的直线距离。这是我们用的最多因而也是最为熟悉的一种距离。与我们习惯用的距离一致。欧氏距离的表达式为:欧氏距离中各特征参数也是等权的。以上两种距离都称为明可夫斯基(Minkowski)距离(以下简称明氏距离),使用明氏距离应该注意以下问题:明氏距离与特征参数的量纲有关。具有不同量纲的特征参数的明氏距离常常是无意义的明氏距离没有考虑特征参数间的相关性183.马哈拉若比斯距离ik1iTikkiMxMxxdTkNk2k1kxxxx,,,T,,,iNi2i1iMMMMimNm2m12N22211N1211式中,为第i类别的协方差矩阵,其协方差为:i11iinkilklijkjjlnnMxMxi194.相似系数YXYX)(cosniiniiniiiyxyx121211)(cos即其中,α是两个矢量间夹角20最小距离监督分类注意:最小距离监督分类方法可以从以下几方面扩展:①上述的距离可以是绝对距离(cityblock)或其他距离。②分类判决可以考虑使用门限阈值,即,若=min则yj[1,c],否则,y属于拒绝类。阈值的选择与各特征波段的标准偏差有关,可以事先求出各类组的训练样本的标准偏差或标准偏差的均值,并根据专业知识和经验考虑门限阈值的设置。③类判决中可以考虑k—近邻法,直观来说,取未知样本y的k个近邻,看这k个近邻中多数属于哪一类,就把y归于哪一类。更进一步,还可考虑距离加权的k近邻法,即计算未知样本与k个近邻训练样本的距离,并将距离的倒数作为权赋与k个近邻样本,将权大的近邻的归属作为未知样本的归属。(3)对图像上的每个象素而言,比较它到每个类中心的距离,距离哪个区域的中心值最近,就将该象素归为那个区域;最后获得分类后的图像。iDiDTDTD213、最大似然监督分类最大似然法是经典的分类方法,已在宽波段遥感图像分类中普遍采用。它主要根据相似的光谱性质和属于某类的概率最大的假设来指定每个像元的类别。MLC法最大优点是能快速指定被分类像元到若干类之中的一类中去。从概率统计分析,要想判别某位置的向量属于哪一个类别,判别函数要从条件概率来决定,代表第i个类别,表示在模式X出现的条件下,为类的概率等于多少。这里不考虑地面上的地物类别在一个像元内混合的情况,认为一个像元应该只属于一个特定的类别。由于这个特定的类别是未知的,我们只有想法找到属于每一类的可能性,然后比较它们的大小,哪一种类别出现的概率大,就把这个位置的像元归哪类,即:如果成立,则miXwPi,,3,2,1iwPXiwXwPXwPjiiwX22最大似然监督分类由于概率是建立在统计意义上的,因而当使用概率判别函数实行分类判别时,不可避免地会出现错分漏分的现象,我们希望以错分概率或风险最小为准则建立所需要的判别规则。根据概率理论中的Bayes公式)()()|()|(XPPXPXPiii式中:为先验概率,也就是在被分类的图像中类别出现的概率。为似然概率,它表示在这一类中出现像元X的概率。只要有一个已知的训练区域,用这些已知类别的像元做统计就可以求出平均值及方差、协方差等特征参数,从而可以求出总体的先验概率。在不知道的情况下,也可以认为所有的为相同。为后验概率。表示不管什么类别出现的概率:iwPiwiwXPiwiwPXwPiXP23miiiwPwXP1XP与类别无关,是对各类来说一个公共因子,在比较大小时不起作用,因此作判别时可将去掉。应用最大可能性判别规则,再加上贝叶斯(Bayes)的使平均损失最小的原则,都表明XPiiiwPwXPXg是一组理想的判别函数。判别规则为若在最大似然法的实际计算中,常采用经过对数变换的形式jjiiwXPwPwXPwPiwX则iiiiiMxSMxSwPxg1T21ln21ln24是每一类()在图像中的概率,在事先不知道是多少的情况下,可以认为所有的都相同,即为类别数,为第i类的协方差矩阵,为该类的均值向量,这些数据来源于由训练组所产生的分类统计文件。对于任何一个像元值x,其在那一类中最大,就属于哪一类。最大似然法分类的基本前提是认为每一类的概率密度分布都是正态分布(即高斯分布)。最大似然法分类的分类精度一般比前几种方法要高,但分类过程更复杂,计算时间较长。iwPiwiwPiwPmwPi1miSiMxgi25MaximumlikelihoodclassifierBandxBandySamples26Maximumlikelihoodclassifier(cont.)02550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest1202550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest27非监督分类(Unsupervisedclassification)根据事先指定的某一准则,让计算机自动进行判别归类,无需人为干预,分类后需确定地面类别。在非监督分类中,先确定光谱可分的类别(光谱类)然后定义它们的信息类28一、非监督分类算法非监督分类,是指人们事先对分类过程不施加任何的先验知识,仅凭据遥感影像地物的光谱特征的分布规律,随其自然地进行盲目的分类。其分类的结果,只是对不同类别达到了区分,并不确定类别的属性,其属性是通过事后对各类的光谱响应曲线进行分析,以及与实地调查相比较后确定的。29主要过程如下:(1)确定初始类别参数,即确定最初类别数和类别中心(集群中心);(2)计算每一个像元所对应的特征矢量与各集群中心的距离;(3)选与中心距离最短的类别作为这一矢量的所属类别;(4)计算新的类别均值向量;(5)比较新的类别均值与原中心位置上的变化。若位置发生了改变,则以新的类别均值作为聚类中心,再从第2步开始重复,进行反复迭代操作。(6)如果聚类中心不再变化,计算停止。30初始类别参数的选定初始类别参数是指:基准类别集群中心(数学期望)以及集群分布的协方差矩阵。因为无论采用何种判别函数,都要预先确定其初始类别的参量。以下为几种常用的方法:311、像素光谱特征的比较法首先,在遥感图像中定义一个抽样集,它可以是整幅图像的所有像素,但通常是按一定间隔抽样的像素;然后选定抽样集中任一像素作为第一个类别;给定一个光谱相似性比较阈值;依次把抽样集中每个像素的光谱特征与已建起的初始类别作比较,若相似,则作为该类集群中的一个成员,若不与任何一个相似,则以该像素建立一个新的初始类别。当以上聚类过程完成后,每个已经建立起来的初始类别都包含了一定成员,依据此可统计其集群中心(数学期望)和协方差矩阵32该方法是在整幅遥感影像的总体直方图的基础上进行类别中心的选定的。设总体直方图的均值和方差分别为:TnmmmM,,21Tn],,,[22221NjijiNjiijixNmmxN11221)(11式中,i为波段号;j为像素点号;为像素i在第j波段的亮度值;n为波段数;N为像素总数。ijx2、总体直方图均匀选心法33]1)1/()1(2[QqmZiiqi;+;iiiiiimZmZ3131;+;iiiiiimZmZ4231用作图法不难证明,该法所选定的初始类别中心通过整体集群中心的一条直线均匀散布的,并基本上包括在整体集群的范围之内现假设我们需要Q个初始类别,每个初始类别集群中心可按下式确定:例如,Q=4时初始类别参数的选定343、最大最小距离选心法该法的选心原则是使各初始类别之间,尽可能地保持远距离,为做到这一点,首先在整幅