影像的分类可分为监督与非监督分类。监督分类器根据其原理有基于传统统计分析的、基于神经网络的、基于模式识别的等。本专题以ENVI的监督与非监督分类的实际操作为例,介绍这两种分类方法。有以下内容组成:非监督分类监督分类分类后处理非监督分类非监督分类:也称为聚类分析或点群分类。在多光谱图像中搜寻、定义其自然相似光谱集群的过程。它不必对影像地物获取先验知识,仅依靠影像上不同类地物光谱(或纹理)信息进行特征提取,再统计特征的差别来达到分类的目的,最后对已分出的各个类别的实际属性进行确认。目前比较常见也较为成熟的是ISODATA、K-Mean和链状方法等。遥感影像的非监督分类一般包括以下6个步骤:图1非监督分类操作流程1、影像分析大体上判断主要地物的类别数量。一般监督分类设置分类数目比最终分类数量要多2-3倍为宜,这样有助于提高分类精度。本案例的数据源为ENVI自带的Landsattm5数据Can_tmr.img,类别分为:林地、草地/灌木、耕地、裸地、沙地、其他六类。确定在非监督分类中的类别数为15。2、分类器选择目前非监督分类器比较常用的是ISODATA、K-Mean和链状方法。ENVI包括了ISODATA和K-Mean方法。ISODATA(IterativeSelf-OrgnizingDataAnalysizeTechnique)重复自组织数据分析技术,计算数据空间中均匀分布的类均值,然后用最小距离技术将剩余像元进行迭代聚合,每次迭代都重新计算均值,且根据所得的新均值,对像元进行再分类。K-Means使用了聚类分析方法,随机地查找聚类簇的聚类相似度相近,即中心位置,是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的,然后迭代地重新配置他们,完成分类过程。3、影像分类打开ENVI,选择主菜单-Classification-Unsupervised-IsoData或者K-Means。这里选择IsoData,在选择文件时候,可以设置空间或者光谱裁剪区。这里选择软件自带的Can_tmr.img,按默认设置,之后跳出参数设置,如图2。这里主要设置类别数目(NumberofClasses)为5-15、迭代次数(MaximumIteration)为10。其他选项按照默认设置,输出文件。图2ISODATA非监督分类参数设置图3ISODATA分类结果4、类别定义/类别合并1)类别定义在display中显示原始影像,在display-overlay-classification,选择ISODATA分类结果,如图4所示,在InteractiveClassTool面板中,可以选择各个分类结果的显示。图4影像与分类结果的叠加InteractiveClassTool面板中,选择Option-Editclasscolors/names。通过目视或者其他方式识别分类结果,填写相应的类型名称和颜色。InteractiveClassTool面板中,选择Option-Editclasscolors/names。通过目视或者其他方式识别分类结果,填写相应的类型名称和颜色。图5类别定义如图6所示为最终的结果。图6类别定义结果在类别定义时候,可以利用Mode:PolygonAddtoClass、Edit-Mode:PolygonDeletefromClass或者Setdeleteclassvalue把很明显的错误分类结果并入或者删除。2)类别合并选择主菜单-Classification-PostClassification-CombineClasses。把同一类的类别合并成一类,如图7所示。在点击ok后,需要选择输出文件和RemoveEmptyClass选择YES,可以得到结果。图7类别的合并5、分类后处理分类后处理包括的很多的过程,都是些可选项,包括更改类别颜色、分类统计分析、小斑点处理(类后处理)、栅矢转换等操作。1)更改类别颜色可以在InteractiveClassTool面板中,选择Option-Editclasscolors/names更改,也可以在Display-Tools-ColorMapping-ClassColorMapping。如下图8所示,直接可以在对应的类别中修改颜色。也可以根据一个显示的RGB影像来自动分配类别颜色,打开主菜单-Classification-PostClassification-AssignClassColors。图8类别颜色的更改图9类别颜色更改后的效果图10自动颜色更改的效果图2)分类统计分析主菜单-Classification-PostClassification-ClassStatistics。如图11所示,包括基本统计:类别的像元数、最大最小值、平均值等,直方图,协方差等信息。图11分类结果统计3)小斑点处理(类后处理)运用遥感影像分类结果中,不可避免地会产生一些面积很小的图斑。无论从专题制图的角度,还是从实际应用的角度,都有必要对这些小图斑进行剔除和重新分类,目前常用的方法有Majority/Minority分析、聚类(clump)和过滤(Sieve)和。这些工具都可以在主菜单-Classification-PostClassification中找到。Majority/Minority分析和聚类(clump)是将周围的“小斑点”合并到大类当中,过滤(Sieve)是将不符合的“小斑点”直接剔除。如下图12为Majority分析的结果。图12类后处理结果图4)栅矢转换打开主菜单-Classification-PostClassification-ClassificationtoVector,可以将分类后得到的结果转化为矢量格式,或者主菜单-Vector-RastertoVector,在选择输出参数时候,可以选择特定的类别,也可以把类别单独输出为矢量文件或者一个矢量文件。图13栅矢转换面板6、结果验证对分类结果进行评价,确定分类的精度和可靠性。有两种方式用于精度验证:一是混淆矩阵,二是ROC曲线,比较常用的为混淆矩阵,ROC曲线可以用图形的方式表达分类精度,比较形象。真实参考源可以使用两种方式:一是标准的分类图,二是选择的感兴趣区(验证样本区)。两种方式的选择都可以通过主菜单-Classification-PostClassification-ConfusionMatrix或者ROCCurves来选择。真实的感兴趣区参考源的选择可以是在高分辨率影像上选择,也可以是野外实地调查获取,原则是获取的类别参考源的真实性。由于没有更高分辨率的数据源,本例中就把原分类的TM影像当作是高分辨率影像,在上面进行目视解译得到真实参考源。直接利用ROI工具,在TM图上均匀的选择6类真实参考源,如图13所示。选择主菜单-Classification-PostClassification-ConfusionMatrix-UsingGroundTruthROIs。将分类结果和ROI输入,软件会根据区域自动匹配,如不正确可以手动更改。点击ok后选择报表的表示方法(像素和百分比),就可以得到精度报表。图14真实感兴趣区参考源选取图15验证操作面板图16分类精度评价混淆矩阵这里说明一下混淆矩阵中的几项评价指标,如下:总体分类精度等于被正确分类的像元总和除以总像元数。被正确分类的像元数目沿着混淆矩阵的对角线分布,总像元数等于所有真实参考源的像元总数,如本次精度分类精度表中的OverallAccuracy=(1849/2346)78.8150%。Kappa系数它是通过把所有真实参考的像元总数(N)乘以混淆矩阵对角线(XKK)的和,再减去某一类中真实参考像元数与该类中被分类像元总数之积之后,再除以像元总数的平方减去某一类中真实参考像元总数与该类中被分类像元总数之积对所有类别求和的结果。错分误差指被分为用户感兴趣的类,而实际属于另一类的像元,它显示在混淆矩阵里面。本例中,林地有419个真实参考像元,其中正确分类265,12个是其他类别错分为林地(混淆矩阵中林地一行其他类的总和),那么其错分误差为12/419=2.9%。漏分误差指本身属于地表真实分类,当没有被分类器分到相应类别中的像元数。如在本例中的耕地类,有真实参考像元465个,其中462个正确分类,其余3个被错分为其余类(混淆矩阵中耕地类中一列里其他类的总和),漏分误差为3/465=0.6%制图精度是指分类器将整个影像的像元正确分为A类的像元数(对角线值)与A类真实参考总数(混淆矩阵中A类列的总和)的比率。如本例中林地有419个真实参考像元,其中265个正确分类,因此林地的制图精度是265/419=63.25%。用户精度是指正确分到A类的像元总数(对角线值)与分类器将整个影像的像元分为A类的像元总数(混淆矩阵中A类行的总和)比率。如本例中林地有265个正确分类,总共划分为林地的有277,所以林地的用户精度是265/277=95.67%。监督分类监督分类监督分类:又称训练分类法,用被确认类别的样本像元去识别其他未知类别像元的过程。它就是在分类之前通过目视判读和野外调查,对遥感图像上某些样区中影像地物的类别属性有了先验知识,对每一种类别选取一定数量的训练样本,计算机计算每种训练样区的统计或其他信息,同时用这些种子类别对判决函数进行训练,使其符合于对各种子类别分类的要求,随后用训练好的判决函数去对其他待分数据进行分类。使每个像元和训练样本作比较,按不同的规则将其划分到和其最相似的样本类,以此完成对整个图像的分类。遥感影像的监督分类一般包括以下6个步骤,如图17所示:图17监督分类步骤1、类别定义/特征判别根据分类目的、影像数据自身的特征和分类区收集的信息确定分类系统;对影像进行特征判断,评价图像质量,决定是否需要进行影像增强等预处理。这个过程主要是一个目视查看的过程,为后面样本的选择打下基础。本例是以ENVI自带Landsattm5数据Can_tmr.img为数据源,类别分为:林地、草地/灌木、耕地、裸地、沙地、其他六类。2、样本选择为了建立分类函数,需要对每一类别选取一定数目的样本,在ENVI中是通过感兴趣区(ROIs)来确定,也可以将矢量文件转化为ROIs文件来获得,或者利用终端像元收集器(EndmemberCollection)获得。本例中使用ROIs方法,打开分类图像,在Display-Overlay-RegionofInterest,默认ROIs为多边形,按照默认设置在影像上定义训练样本。如图18所示,设置好颜色和类别名称(支持中文名称)。在ROIs面板中,选择Option-ComputeROISeparability,计算样本的可分离性。如图19所示,表示各个样本类型之间的可分离性,用Jeffries-Matusita,TransformedDivergence参数表示,这两个参数的值在0~2.0之间,大于1.9说明样本之间可分离性好,属于合格样本;小于1.8,需要重新选择样本;小于1,考虑将两类样本合成一类样本。图18训练样本的选择图19样本可分离性计算报表3、分类器选择根据分类的复杂度、精度需求等确定哪一种分类器。目前监督分类可分为基于传统统计分析学的,包括平行六面体、最小距离、马氏距离、最大似然,基于神经网络的,基于模式识别,包括支持向量机、模糊分类等,针对高光谱有波谱角(SAM),光谱信息散度,二进制编码。下面是几种分类器的简单描述。平行六面体根据训练样本的亮度值形成一个n维的平行六面体数据空间,其他像元的光谱值如果落在平行六面体任何一个训练样本所对应的区域,就被划分其对应的类别中。最小距离利用训练样本数据计算出每一类的均值向量和标准差向量,然后以均值向量作为该类在特征空间中的中心位置,计算输入图像中每个像元到各类中心的距离,到哪一类中心的距离最小,该像元就归入到哪一类。马氏距离计算输入图像到各训练样本的协方差距离(一种有效的计算两个未知样本