1第七章高光谱遥感图像分类本章主要介绍高光谱遥感数据的分类算法和实验。27.1遥感图像分类数据信息利用计算机通过对高光谱遥感图像中的各类地物的光谱信息和空间信息进行分析、选择特征,并用一定的手段将特征空间互分为互不重叠的子空间,然后将图像中的各个像元划分到各个子空间去。3构造分类器分类器如下图所示是把未知模式识别为已知模式的工具,要实现这一功能,它由以下四个部分组成:分类特征,分类判据,分类准则,分类算法。41)遥感图像的分类特征分类特征即将各类模式区分开来的特征,常用的高光谱图像的分类特征就是光谱特征,主要分为:光谱反射率、波形、光谱数学变换特征、光谱吸收指数、导数光谱波形等。除此之外,还有几何特征,多时相特征(融合),数字变换特征(NDVI),高程信息等。它们都可以作为分类的依据加入到分类模型当中。52)分类判据相似性作为分类判据的度量:可以表现为不同的形式:距离值(DistanceValue):像素或像素组信号特征向量之间距离值的大小来衡量。假如样本均线性可分--欧式距离假如样本正态分布--马氏距离,假如样本线性不可分--似然度概率值(ProbabilityValue):像素信号特征向量与某一像素组的似然性的大小为相似性的量度光谱角值(SpectralAngleValue):像素或像素组之间光谱角的大小为相似性量度。光谱波形特征--光谱相似度或光谱夹角63)分类准则最常用的分类准则是:最小二乘法(平方误差最小)和费歇尔准则(假设样本基于正态分布)是广泛采用的分类准则,除此之外,还有,基于最小误差准则(分类的错误概率最小),最小风险准则(损失的条件数学期望最小),聂曼-皮尔逊准则,基于熵函数可分性准则等74)算法选择分类模型或分类器:统计分类、模糊分类、邻域分类、神经网络分类参数分类和非参数分类:假定类的概率分布函数并估计其分布参数硬分类和软分类:像元属于一个类或多个类8监督分类:利用某些已知类别训练样本让分类识别系统进行学习,待其掌握了各个类别的特征以后,按照分类的决策规则进行分类。例如:最小距离法,最大似然法,平行管道法以及神经网络、支持向量机等新方法。训练区已知地表覆盖类型的代表样区用于描述主要特征类型的其精度直接影响分类检验区用于评价分类精度的训练样区5)分类执行的方式9样区选择示例训练样区与检验区的选择:相互独立、不能重叠10非监督分类:是在没有先验类别(训练场地)作为样本的条件下,即事先不知道类别特征,主要根据像元间相似度的大小进行归类合并(即相似度的像元归为一类)的方法,例如K均值,isodata算法等。其分类的结果,只是对不同类别达到了区分,并不确定类别的属性,其属性是通过事后对各类的光谱响应曲线进行分析,以及与实地调查相比较后确定的。11聚类分析非监督分类主要采用聚类分析方法,把一组像素按照相似性归成若干类别。例如:K均值算法基本思想是:通过迭代,移动各个基准类别的中心,直至得到最好的聚类结果为止。该算法能使得聚类域中所有样本到聚类中心的距离平方和最小。12监督分类与非监督分类方法比较训练样本的选择是监督分类的关键,必须充分考虑地物光谱特征,且样本数目要能满足分类的要求,有时这些还不易做到,这是监督分类不足之处。非监督分类不需要更多的先验知识,它根据地物的光谱统计特性进行分类。因此,非监督分类方法简单,但是,分类效果不如监督分类效果好。13高光谱遥感图像分类的主要特点在于:1)光谱分辨率高,波段众多,且可以挑选特定的波段来突出特征,进行分类。2)数量冗余程度增加,波段相关性高。3)hughs现象的存在,样本数目要求高,且随着波段增加分类精度反而下降。我们主要介绍三种方式进行有效的高光谱遥感图像分类:1)降维+传统分类算法2)智能化的新分类算法3)光谱匹配分类7.2高光谱遥感图像分类思路141)降维+传统分类原始高光谱图像:山东青岛OMIS128个波段15重点在于光谱维特征的提取,即通过映射和变换的方法(如主成分分析PCA,最小噪声分离变换MNF,小波变换等),把原始模式空间的高维数据变成特征空间的低维数据。然后对特征更集中的低维数据进行传统分类处理。分类方法:特征提取+传统分类算法16(1)Minimumdistanceclassifier02550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest02550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest12分类器:选择最小距离和最大似然法进行比较17(2)Maximumlikelihoodclassifier02550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest1202550255TMBand3TMBand4concretehighbuildingsgrassslopewaterbaresoilsforest18具体步骤:选取海水,建筑物和植被3个不同类别的样本,样本个数各为300个。样本要具有代表性就是样本的亮度要反映该类地物的亮度特征,当同一地物区域分布不连续时,我们要尽量使样本来自不同的区域。如:在对海水取样时,既要选择来来自右上角的深水区的样本,又要选择来自河道以及水田中的浅水区的样本。从亮度特征角度而言,对于同一类地物具有不同亮度特征情况,都要选取(同物异谱)。原始图像选择前3个波段后,采用以下两种传统分类算法进行分类:19分类结果比较图最大似然法分类结果最小距离法分类结果可以分为三个类别:海水植被及农作物建筑物及桥梁20区域A:在浅水区,最大似然法分类图像中出现了原始分类图像中没有的像点。这些像点是水中的暗礁和草,RGB图像上用肉眼无法识别到这些细节。21区域B:通过目视解译,可以分辫出这个区域是由田埂分开的一块又一块的稻田,这些稻田中全是海水。最小距离法分类时却忽略了这些由植被覆盖的田埂,将其全部分成了海水。甚至将右上角处的海水类分成了植被类。22区域C:可以看到左图中有很多被错分的像点,如山脉中的部分植被和建筑被类分成了海水类。而右图中几乎没有被错分的像点;23247.3神经网络对高光谱影像分类目前的多种先进而新颖的技术手段层出不穷,人工智能,模糊理论,决策树,神经网络等都被应用于遥感图像的理解和分析当中。人工神经网络技术,黑匣子,能被用于多源数据的综合分析被广泛用于遥感图像分类。251神经系统基本构成神经网络是在生物功能启示下建立的信息处理系统,摸仿了人脑的结构特征和信息处理机制,表现出了许多与人脑相同的特征。26简单的神经元网络是对生物神经元的简化和模拟,其模型如下图:njijjiixwS1)(iiSfy272拓扑结构网络的拓扑结构是NN的重要特征,从连接方式上可以包括:前馈型网络和反馈型动态网络两大类。输出层隐藏层输入层o1o2om…x1x2xn………………连接的拓扑表示:ANiwijANj28层次划分信号只被允许从较低层流向较高层。层号确定层的高低:层号较小者,层次较低,层号较大者,层次较高。输入层:被记作第0层。该层负责接收来自网络外部的信息输出层隐藏层输入层o1o2om…x1x2xn………………29第j层:第j-1层的直接后继层(j0),它直接接受第j-1层的输出。输出层:它是网络的最后一层,具有该网络的最大层号,负责输出网络的计算结果。隐藏层:除输入层和输出层以外的其它各层叫隐藏层。隐藏层不直接接受外界的信号,也不直接向外界发送信号输出层隐藏层输入层o1o2om…x1x2xn………………303学习与联接模式学习规则:外部环境对系统的输出结果给出评价,学习系统通过强化受奖的动作来改善自身性能。误差纠错学习(delta)Hebb学习竞争学习学习方式:监督学习(Supervisedlearning)非监督学习(Unsupervisedlearning)31联接模式用正号(“+”,可省略)表示传送来的信号起刺激作用,它用于增加神经元的活跃度;用负号(“-”)表示传送来的信号起抑制作用,它用于降低神经元的活跃度。324BP(BackPropagation)神经网络1.BP网络在1986年提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。2.BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。3.BP网络的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。4.BP神经网络模型拓扑结构包括输入层(input)、隐层(hidelayer)和输出层(outputlayer)。33BP网络的拓扑结构x1o1输出层隐藏层输入层x2o2omxn…………WV34训练过程概述样本:(输入向量,理想输出向量)权初始化:(-1,1)1、向前传播阶段:(1)从样本集中取一个样本(Xp,Yp),将Xp输入网络;神经元的网络输入:neti=x1w1i+x2w2i+…+xnwni(2)计算相应的实际输出O:netenetfo11)(1(0,0.5)net(0,0)o352、向后传播阶段——误差传播阶段:(1)计算实际输出O与相应的理想输出Y的差;(2)网络关于第p个样本的误差测度:mjpjpjpoyE1221(3)网络关于整个样本集的误差测度:ppEE(4)按极小化误差的方式调整权矩阵。即:对W不断做调整,直到∑Eε。36BP神经网络模型的输入层的神经元个数为波段数,输入值为各个像元的灰度值。输出层的神经元个数为地物端元的个数,输出值为像元在各个典型地物所属的类别。隐含层神经元的个数经过多次的实验确定,同时也可以采用有经验公式计算:式中,M为分类数;N为特征向量维数,即影像波段数。)()1)(2/(2NMNNMMN具体应用于遥感影像分类37正向传播:对权值赋予-1~1之间的随机值,然后从网络的输入节点输入样本数据,计算样本信息在正向传播过程中,前一层的神经元数据对本层每个神经元的加权,并利用Sigmoid函数运算输出。反向传播:接着求出误差进行反向的迭代,调整权值,权值训练完成后,求出满足一定误差条件的权矩阵。测试:将影像上的每个像素的波段值作为输入向量,通过计算可得到输出向量,对应于该像素在各个预先指定的各个分类类型的概率值,将最大的概率值赋值为1,其余的赋值为0,即得出分类图。具体过程:38实验1实验分析39该影像区域选择的是武汉城区,通过实际调查后,预期将该影像分为,水体,植被,城市,云四个类类别。经过实际调查后得到的每个类别的样本数列在表中。40监督人工神经网络分类器的比较植被(f)Self-organizingmap(b)K均值(c)ISODATA(a)MODIS影像(d)最大似然法(e)神经网络分类41方法精度K均值ISODATAMLC神经网络总精度78.65%72.43%76.98%83.64%Kappa系数0.73590.69040.72560.7912定量结果比较42实验2该区域在常州市夏桥,为混合农业区域。采用的是国产PHI(推扫式光谱成像仪)遥感影像(340×390像素),波段数为80波段,该区域是一个混合的农业区域,其成像波段范围为0.417-0.854μm。43通过实际调查后,预期将该影像分为七类,具体为:水体,谷物1,谷物2,道路1,道路2,土壤,蔬菜。44(e)模糊算法(b)K均值(c)ISODATA(a)PHI影像(d)最大似然法实验:常州夏桥PHI高光谱影像水体谷物1谷物2道路1道路2土壤蔬菜(e)神经网络分类45分类方法的比较实验结果表明UAIC对高光谱遥感影像也有很好的分类效果,是一种具有高分类精度的高光谱遥感影像分类方法。分类精度比较方法精度K均值ISODATA模糊算