1第五章遥感数字图像计算机分类一、遥感数字图像计算机分类的一般原理二、遥感分类的常用判别函数三、遥感数字图像的分类方法四、遥感数字图像的分类后处理五、光谱特征分类中的辅助处理技术六、遥感图像计算机分类新方法2一、遥感数字图像计算机分类的一般原理遥感图像解译3一、遥感数字图像计算机分类的一般原理遥感图像解译遥感图像数据专题图像专题地图专业应用解译方法计算机分类目视解译光谱规律地学规律解译者的经验解译标志(亮度、色调、位置、时间、纹理、结构等)景物类型属性识别、分类提取信息、识别地物4图像分类的目的将图像中每个像元根据其不同波段的光谱亮度、空间结构特征或其他信息,按照某种规则或算法划分为不同的类别。遥感图像分类利用计算机技术来模拟人类的识别功能,对地球表面及其环境在遥感图像上的信息进行属性的自动判别和分类,达到提取所需地物信息的目的。5计算机分类是通过模式识别理论,利用计算机将遥感图象自动分成若干地物类别的方法。如土地覆盖/土地利用分类、森林类型分类、植被类型分类、岩性分类、……数据→信息(遥感数据---地物信息)主要数据类型:1、原始光谱数据;2、光谱变换后数据;3、非遥感数据6理论依据在理想条件下,图像中同类地物在相同的条件下应具有相同或相似的光谱信息特征和空间信息特征,从而表现出同类地物的某种内在相似性,即同类地物像元的特征向量将集群在同一特征空间区域,而不同地区的光谱信息特征或空间信息特征应不同,因而将集群在不同的特征空间区域。7遥感图像分类的实质图象分类过程的总目标是,将图象中所有像元自动地进行土地覆盖类型或土地覆盖专题的分类。8影响遥感图像分类精度的因素大气状况的影响:吸收、散射。下垫面的影响:下垫面的覆盖类型和起伏状态对分类具有一定的影响。其他因素的影响:云朵覆盖;不同时相的光照条件不同,同一地物的电磁辐射能量不同;地物边界的多样性。9统计模式识别的概念和基本问题模式(pattern):在多波段图象中,每个象元都具有一组对应取值,称为象元模式,即一个像元对应多个值(地理信息的多维性)。特征(feature):在多波段图象中,每个波段都可看作一个变量,称为特征变量。特征变量构成特征空间。波段:光谱波段其它派生波段(纹理、上下文关系、波段比等)辅助数据(ancillarydata)(非遥感数据,如DEM、土壤类型)特征提取(featureextraction):通过变换找出最能反映地物类别差异的特征变量用于分类的过程10模式识别是人们沿着仿生学的道路,用计算机系统作为工具来模拟人类的感知和识别智能,它是人工智能的一个分支。xn分类器(或称判决器),可以根据一定的分类规则,把某一测量矢量X划入某一组预先规定的类别之中去。自然模式接收器(传感器)分类器(判决器)x2x1结果….模式识别系统的模型11遥感图像目视判读与计算机分类的比较相同点:目的一致;不同点:目视判读——直接利用人类的自然识别智能;计算机分类——利用计算机模拟人类的识别能力。遥感图像的计算机分类它是对地球表面及其环境在遥感图像上的信息进行属性的识别和分类,从而达到识别图像信息所相应的实际地物,提取所需地物信息。12遥感图像的模式特征及其分类方法光谱特征纹理特征↓↓基于光谱特征的统计识别方法基于纹理特征的统计识别方法(主要)(次要、补充)13统计模式识别的基本含义(1)把识别对象的特征的每一个观测量视为从属于一定分布规律的随机变量;(2)在多维观测的情况下,把识别对象特征的各维观测值的总体视为一个随机矢量,每一个随机矢量在一个多维特征空间中都有一个特征点与之相对应;(3)所有特征点的全体在特征空间中将形成一系列的分布群体,每个分布群体中的特征点被认为具有相似特征,并可以划为同一类别;(4)找到各个分布群体的边界线(面)或确定任意特征点落入每个分布群体中的条件概率,并以此依据来确定特征点(或相应的识别对象)的分类。14光谱特征向量与特征点集群基于统计模式识别的分类方法监督分类与非监督分类分类处理与增强处理的异同共同点:增强和提取遥感图像中目标物的信息不同点:增强处理→增强视觉效果→提高图像的可解译性(定性)图像分类→地物类别的区分(定量信息)15光谱特征向量与特征点集群TnxxxX,,,21——图像波段总数——地物图像点在第波段图像中的亮度值光谱特征向量光谱特征变量:由于受外界各种因素的影响,使得同类地物的成像亮度值总是带有随机误差,导致图像亮度值(即光谱特征)的观测值为一个随机变量(x)。光谱特征向量:同名地物点在不同波段图像中亮度的观测量构成一个多维的随机向量(X),称为光谱特征向量。即16光谱特征向量与特征点集群光谱特征空间为度量地物的光谱特征,建立的以各波段图像的亮度分布为子空间的多维空间。17光谱特征向量与特征点集群特征点集群每个地物点依其在各个波段所具有的光谱值可以在一个多维空间中找到一个相应的特征点,但由于随机性所致,同类地物的各取样点在光谱特征空间中的特征点将不可能表现为一个点,而是表现为一个相对聚集的点集群,不同类地物点集群在特征空间中一般相互分离,这些点集群称为特征点集群。18特征点集群在空间中的分布情况•最理想情况不同类别集群至少在一个特征子空间(某一波段图像)中的投影(即亮度范围)是完全可以相互区分开的——可以用简单的图像密度分割实现。BiBj植被19•典型情况不同类别地物的集群,在任一个子空间都有重叠现象存在,但在总的特征空间中却是可以完全分开的。即单波段的图像不能实现图像的分类,只有利用多波段图像在多维空间中才能实现精确分类。水20•一般情况不论是在总的特征空间还是任一子空间,不同类别的集群之间总有重叠现象,这时重叠部分的特征点所相应的地物,在分类时会出现不同程度的分类误差,这是遥感图像分类中最常见的现象。水21地物与光谱特征空间的关系22计算机分类的基本原理•基本原理不同的地物具有不同的光谱特征,同类地物具有相同或相似的光谱特征→将图像中的每个像元或区域划归为若干类别是的一种,即通过光谱特征分析→选择特征参数→将特征空间划分为不重叠的子空间→将影像像元划分到各个子空间→实现分类图象分类:基于数字图象中反映的同类地物的光谱相似性和异类地物的光谱差异性。依据是遥感图像像素的相似度。距离相关系数23计算机分类的基本原理•基本思想同类地物的光谱特征比较接近,在特征空间中的点聚集在该类的中心附近;多类目标聚集多个点族。•分类算法的核心判别函数判别准则•方法判别函数:找到一个函数使fAB(X)=0判别准则:fAB(X)0,X为A类;fAB(X)0,X为B类类别界面24计算机分类处理的一般过程图像变换及特征选择分类器的设计初始变量参数的确定每个像素的分类判决分类编码图像、结果检验分类结果输出原始图像数据的预处理准备阶段分类判决输出几何校正、辐射校正量化、采样、增强等特征选择(FeatureSelection)特征提取(FeatureExtraction)精度评价可靠性评价25二、遥感分类的常用判别函数距离判别函数欧氏距离:N,波段数;dij第个i像元与第j个像元在N维空间中的距离;xik为第个k波段上第i个像元的灰度值。21()NikjkkijxxdN相当于高维空间内向量所表示的点到点之间的距离。由于特征向量的各分量的量纲不一致,通常需要先对各分量进行标准化,使其与单位无关,比如对亮度值和NDVI两个单位不同的指标使用欧式距离可能使结果失效。优点:简单,应用广泛(如果也算一个优点的话)缺点:没有考虑分量之间的相关性,体现单一特征的多个分量会干扰结果。26绝对距离:q/1N1kqjkikij]|xx|[d明可夫斯基距离(Minkowski):欧氏距离和绝对距离可统一表示为:明可夫斯基距离存在的主要问题•明氏距离与特征参数的量纲有关(解决办法:标准化处理)•明氏距离没有考虑特征参数间的相关性1||Nijikjkkdxx27为了更一步理解这些距离的差别,我们做下面一个实验:选取一个点作为中心点,用上述的三个距离公式分别计算周围的每一个点到这个中心点的距离,将距离相同的点用同一种颜色表示,那么得到下面的三个图:图1.欧氏距离图2.曼哈顿距离图3.闵可夫斯基距离(p=10)从三个图中可以看出,三个不同的距离公式,对中心的逼近方式也不一样:欧式距离是以同心圆的方式向中心靠近;曼哈顿距离是以倾斜45度角的正方形的方式向中心靠近;闵可夫斯基距离(p=10)则是以四个角度光滑的四边形的方式向中心靠近。28分类实验:在维数为2维的平面空间中(只有横轴方向x和纵轴方向y两维空间),有一块128×128的区域,在这个区域中有已知的A(110,18),B(30,18),C(110,88),D(90,58),E(25,123)五个点,以这五个点为5个类别的中心,将这个128×128的区域里面的所有的点,用上面的三个不同的距离计算方法,对它们进行最小距离分类,结果如图图4.欧氏距离分类图5.曼哈顿距离分类图6.闵可夫斯基距离(p=10)分类从三个图中可以看出来,不同距离算法,类别中心对周围点的作用域是不相同的。29马氏距离(Mahalanobis)1)度量两个服从同一分布并且其协方差矩阵为C的随机变量X与Y的差异程度2)度量X与某一类的均值向量的差异程度,判别样本的归属。此时,Y为类均值向量.优点:1)独立于分量量纲2)排除了样本之间的相关性影响。缺点:不同的特征不能差别对待,可能夸大弱特征。30相似系数(余弦距离)表示当前像元的向量与类向量之间的光谱夹角。像元i到类k的距离公式为:相似系数为1,表明两个向量重合,但并不代表两个向量之间的欧氏距离为0。特点:将地面光谱作为已知类,比较图像光谱与地面光谱的相似性,相似系数具有更好的效果。dik为像元i到类k的距离,p为波段数,xij为像元i在j波段的值,Mkj为类k在j波段的中心。31最大似然法判别函数(Bayes准则)基本思想(1)地物类数据在特征空间中构成特征点集群;(2)每类地物每一特征均为正态分布,多个特征构成多维正态分布;(3)按正态分布规律用最大似然判别规则进行判决,得取分类结果。32Bayes准则及判别函数X属于wi类的概率,又称后验概率,即像元X出现在wi的最大概率33假设有两类,如图。概率判别函数的判别边界为d1(X)和d2(X),当使用概率判别函数进行分类时,不可避免会出现错分现象,分类错误的总概率由后验概率函数重叠部分下的面积给出。错分概率是类别判别分界两侧做出不正确判别的概率之和。Bayes判别边界使这个数最小,因为这个判别边界无论向左还是向右都将包括不是1类便是2类的一个更大面积,从而增加总的错分概率。故:Bayes判别规则是错分概率最小的最优准则。34最大似然法和最小距离法分类错分比较假设有两类w1和w2,其后验概率分布如图。最小距离按欧氏距离或计程距离计算(因马氏距离不仅与均值向量有关,还与协方差矩阵有关,更复杂)。结论:最大似然法的错分概率小于最小距离法总的错分概率。对马氏距离而言,判别边界有可能不是两上均值向量的中点,其判别边界与集群的分布形状大小有关。35三、遥感数字图像的分类方法分类执行方式:监督分类、非监督分类分类模型或分类器:统计分类、模糊分类、邻域分类、神经网络分类等。36监督分类(supervisedclassification)通过选择代表各类别的已知样本(训练区)的象元光谱特征,事先取得个类别的参数,确定判别函数,从而进行分类。在监督分类中,先定义信息类,然后检验它们的光谱可分性。37监督分类(supervisedclassification)训练区的作用•已知覆盖类型的代表样区•用于描述主要特征类型的光谱属性•其精度直接影响分类结果38训练区的选择要求•训练场地所包含的样本在种类上要与待分区域的类别一致。•训练样本应在各类目标地物面积较大的中心选取,这样才有代表性。•如果采用最大似然法,分类要求各变量正态分布,因此训练样本应