2图像分类的实现指导1、遥感图像计算机分类的理论依据:遥感图像中的同类地物在相同的条件下(纹理、地形等),应具有相同或相似的光谱信息特征和空间信息特征,从而表现出同类地物的某种内在的相似性,即同类地物像元的特征向量将集群在同一特征空间区域;而不同的地物其光谱信息特征或空间信息特征将不同,集群在不同的特征空间区域。2、传统的分类方法:在遥感图像分类中,按照是否有已知训练样本的分类依据,分类方法又分为两大类:监督分类与非监督分类。遥感图像的监督分类是在已知类别的训练场地上提取各类别训练样本,通过选择特征变量、确定判别函数或判别式(判别规则),进而把图像中的各个像元点划归到各个给定类的分类。遥感图像的非监督分类是在没有先验知识(训练场地)的情况下,根据图像本身的统计特征及自然点群的分布情况来划分地物类别的分类处理,事后再对已分出的各类的地物属性进行确认,也称作“边学习边分类法”。两者的最大区别在于,监督分类首先给定类别,而非监督分类则由图像数据本身的统计特征来决定。3、影响遥感影像分类精度的因素:遥感图像计算机自动分类在遥感数字图像处理技术中占有非常重要的地位,由于计算机分类的精度和可靠性除了与分类方法本身的优劣有关外,还取决于一些其它的因素:训练场地和训练样本的选择问题地形因素的影响混合像元问题特征变量的选择问题空间信息在分类中的应用问题图像分类的后期处理问题4、ENVI软件提供的监督分类的分类器图像分类的关键问题之一是选择适当的分类规则(或分类器),通过分类器把图像数据划分为尽可能符合实际情况的不同类别。根据分类的复杂度、精度需求等选择一种分类器。在主菜单-Classification-Supervised-分类器类型(如表1),此外还包括应用于高光谱数据的波谱角(SpectralAngleMapperClassification)、光谱信息散度(SpectralInformationDivergenceClassification)和二进制编码(BinaryEncodingClassification)分类方法。表1六种监督分类器说明分类器说明平行六面体根据训练样本的亮度值形成一个n维的平(Parallelpiped)行六面体数据空间,其他像元的光谱值如果落在平行六面体任何一个训练样本所对应的区域,就被划分其对应的类别中。平行六面体的尺度是由标准差阈值所确定的,而该标准差阈值则是根据所选类的均值求出。最小距离(MinimumDistance)利用训练样本数据计算出每一类的均值向量和标准差向量,然后以均值向量作为该类在特征空间中的中心位置,计算输入图像中每个像元到各类中心的距离,到哪一类中心的距离最小,该像元就归入到哪一类。马氏距离(MahalanobisDistance)计算输入图像到各训练样本的马氏距离(一种有效的计算两个未知样本集的相似度的方法),最终统计马氏距离最小的,即为此类别。最大似然(LikelihoodClassification)假设每一个波段的每一类统计都呈正态分布,计算给定像元属于某一训练样本的似然度,像元最终被归并到似然度最大的一类当中。神经网络(NeuralNetClassification)指用计算机模拟人脑的结构,用许多小的处理单元模拟生物的神经元,用算法实现人脑的识别、记忆、思考过程应用于图像分类。支持向量机(SupportVectorMachineClassification)支持向量机分类(SVM)是一种建立在统计学习理论(StatisticalLearningTheory或SLT)基础上的机器学习方法。SVM可以自动寻找那些对分类有较大区分能力的支持向量,由此构造出分类器,可以将类与类之间的间隔最大化,因而有较好的推广性和较高的分类准确率。选择不同的分类器器需要设置的参数不一样。5、监督分类的一般步骤监督分类一般分为以下几步:选择训练样本、评价训练样本、进行监督分类、精度评价和分类后处理等五步。5.1选择训练样本5.1.1训练样本选择原则(1)选取的训练样本要有代表性:应选择光谱特征比较均一的区域(避免混合像元)(2)选取训练样本的数目:要能满足建立分类用判别函数的要求,对于光谱特征变化较大的地物,训练样本的数目要更多一些,以反映其变化范围。(3)选取训练样本要考虑空间变化的影响:要考虑到每一种地物类型随空间变化发生光谱特征变化的可能性,选择训练场地应当能够反映这种变化。在遥感图像中,地形因素不仅会造成几何畸变,而且还会影响其亮度值。如同类地物由于所处山坡位置的不同,其阴坡和阳坡的光谱特性就有很大的差异,即同物异谱;如不同的地物由于地形的影响而具有相同的光谱特性,即同谱异物。可以利用图像增强的多波段图像的比值处理来减弱地形的影响,但其比值图像并不能彻底消除地形的影响,而且当地形起伏太大时比值处理受到限制。解决这类由于地形因素造成的“同物异谱”和“同谱异物”现象的一种有效的方法是采用“同类多组法”来选取训练样本,即同类地物根据光谱特征的不同,可以选取一组以上训练样本,并规定类与组的明确概念。在对图像进行分类时,应首先进行分组,然后再根据所属的类别进行合并。5.1.2训练样本选择的依据(1)外业调查(2)高分影像(3)已有的分类成果图5.1.3训练样本的选择5.1.3.1调查本实验区的地物类型(作业:绘制不同地物类型的光谱曲线)5.1.3.2定义训练样本(1)打开ROI工具(说明:ENVI软件基本上都有多种方式可以实现同一目的,但我们仅列出其中的一种,比如打开ROI工具共有4种方式,这个说明的目的是让大家不要局限于我讲的方式)。鼠标右键单击主图像窗口(ENVI软件有三个图像窗口,分别是主图像窗口,滚动窗口和放大窗口),选中ROI工具,然后打开定义ROI的窗口(2)定义ROI(介绍两种方式)(a)根据波段阈值定义ROI(想定义某个范围内的像元作为ROI,即可用这种方式)(b)在图像上选择ROI后面的具体操作课堂讲授5.2评价训练样本5.2.1定性评价:N维可视化方法将样本显示在N维特征空间的散点图中:ROITool-File-ExportROIston-DVisulizer,建议显示在主成分特征空间。5.2.2定量评价:根据ROI可分离性(ComputeROISeparability)工具计算任意类别间的统计距离来衡量训练样本(ROI)的可分离性。选择Options→ComputeROISeparability进行训练样本可分离性计算,可分性度量有两种:Jeffries-Matusita-JM距离,TransformedDivergence-离散度在SelectInputFileforSeparability窗口中选择计算训练可分离性的图像文件计算可分离性根据可分离性值的大小,从小到大列出感兴趣区组合。这两个参数值为0~2.0,大于1.9说明样本之间可分离性好,属于合格样本;小于1.8,需要重选择样本;小于1,考虑将两类样本合成一类样本。5.3选择分类器进行监督分类5.3.1最大似然分类(1)在主菜单中,选择Classification-Supervised-LikelihoodClassification,在文件输入对话框中选择待分类影像。单击OK按钮打开LikelihoodClassification参数设置面板DataScaleFactor:输入一个数据比例系数。这个比例系数是一个比值系数,用于将整型反射率或辐射率数据转化为浮点型数据。例如:如果反射率数据在范围0-10000之间,则设定的比例系数就为10000。对于没有定标的整型数据,也就是原始DN值,将比例系数设为2n-1,n为数据的比特数,例如:对于8-bit数据,设定的比例系数为255,对于10-bit数据,设定的比例系数为1023,对于11-bit数据,设定的比例系数为2047。单击OK按钮执行分类。5.3.2最小距离分类(1)在主菜单中,选择Classification-Supervised-MinimumDistance,在文件输入对话框中选择待分类影像,单击OK按钮打开MinimumDistance参数设置面板(2)SelectClassesfromRegions:单击SelectAllItems按钮,选择全部的训练样本。(3)SetMaxstdevfromMean:设置标准差阈值,有三种类型:None:不设置标准差阈值;SingleValue:为所有类别设置一个标准差阈值;MultipleValues:分别为每一个类别设置一个标准差阈值。选择None。(4)SetMaxDistanceError:设置最大距离误差,以DN值方式输入一个值,距离大于该值的像元不被分入该类(如果不满足所有类别的最大距离误差,它们就不会被归为未分类类(unclassified))。也有三种类型,这里选择None。(5)单击Preview,可以在右边窗口中预览分类结果,单击ChangeView可以改变预览区域。(6)选择分类结果的输出路径及文件名。(7)设置OutRuleImages为No,不输出规则图像。(8)单击OK按钮执行分类。5.3.3马氏距离分类(1)在主菜单中,选择Classification-Supervised-MahalanobisDistance,在文件输入对话框中选择待分类影像。单击OK按钮打开MahalanobisDistance参数设置面板(2)SelectClassesfromRegions:单击SelectAllItems按钮,选择全部的训练样本。(3)SetMaxDistanceError:设置最大距离误差,以DN值方式输入一个值,距离大于该值的像元不被分入该类(如果不满足所有类别的最大距离误差,它们就不会被归为未分类类(unclassified))。也有三种类型,这里选择None。(4)单击Preview,可以在右边窗口中预览分类结果,单击ChangeView可以改变预览区域。(5)选择分类结果的输出路径及文件名。(6)设置OutRuleImages为No,不输出规则图像。(7)单击OK按钮执行分类。5.4分类精度评价(混淆矩阵)执行监督分类后,需要对分类结果进行评价,ENVI提供了了分类结果叠加,混淆矩阵(confusionMatrices)和ROC曲线(ROCCurves)仅介绍混淆矩阵,其它方法参与ENVI使用说明使用confusionmatrices工具可以把分类结果的精度显示在一个混淆矩阵里(用于比较分类结果和地表真实信息)。使用地表真实感兴趣区域计算混淆矩阵(1)生成用于精度验证的ROI使用地表真实感兴趣区之前,需要准备反映地表真实地物信息的ROI文件。可以在高分辨率图像上,通过目视解译获取各个分类的地表真实感兴趣区,也可以通过野外实地调查,根据调查数据生成地表真实感兴趣区。说明:用于监督分类的训练样本和用于精度验证的训练样本一定不能是相同的训练样本。建立混淆矩阵1°选择Classification→PostClassification→ConfusionMatrix→UsingGroundTruth/Image或/ROIs;2°在ClassificationInputFile中选择分类后的图像3°在MatchClassesParameters选择相匹配的类型在SelectGroundTruthROI中选择地面真实的感兴趣区,在SelectClassificationImage中选择与真实的感兴趣相匹配的分类。点击AddCombination按钮将真实的感兴趣区与分类结构相匹配。如果地面真实感兴趣区中的类别与分类图像中的类别名称相同,它们将自动匹配。4°在ConfusionMatrixParameters中设置混淆矩阵参数选择像素(pixels)和百分比(percent)5°点击OK执行显示混淆矩阵中的记录以及相关的统计(可以输出为txt文件)在输出的混淆矩阵报表中包含了:总体分类精度、Kappa系数、错分误差、漏分误差、制图精度以及用户精度。Overa