第15章ArcGIS地统计分析地统计分析方法是空间统计学的一个重要分支,被广泛应用于许多领域。ArcGIS地统计分析功能是借助于ArcGIS地统计分析模块(ArcGISGeostatisticalAnalyst)来实现的。ArcGIS地统计分析模块使得复杂的地统计方法可以在软件中轻易实现。本章主要通过对地统计分析的概念介绍,逐步引导读者在ARCGIS中,如何应用地统计分析解决实际问题。15.1ArcGIS地统计分析概述很长时间以来,地统计分析一直没能很好的和GIS分析模型紧密地结合在一起,而ArcGIS地统计分析模块则在地统计学与GIS之间架起了一座桥梁。15.1.1ArcGIS地统计分析模块介绍ArcGIS地统计分析模块(ArcGISGeostatisticalAnalyst)是一个完整的工具包,它带有为默认模型设计的稳定性参数。这样可以帮助初学者快速的掌握地统计分析。15.1.2地统计分析基础简介地统计(Geostatistics)又称地质统计,也可以称为空间统计分析,其是统计学的一个分支。地统计于20世纪50年代初开始形成,60年代在法国著名统计学家G.Matheron的大量理论研究工作基础上,形成一门新的统计学分支。地统计学是以区域化变量理论(theoryofregionalizedvariable)为基础,以变异函数(variogram)为基本工具来研究分布于空间,并呈现出一定的随机性和结构性的自然现象的科学。15.2探索性数据分析工具探索性数据分析可以让用户更清楚地了解所用的探索性数据,包括数据的属性、分布以及空间数据的变异性和相关性,并以此来分析数据的变化趋势,从而利用已知的数据来推测拟合未知的数据。探索性数据分析也可以让用户更深入地认识研究对象,从而对与其数据相关的问题做出更好的分析与决策。探索性数据分析需要借助于ArcGIS的探索性数据分析工具。15.2.1添加探索性数据分析工具通常,ArcGIS的探索性数据分析模块并没有打开,在默认界面上没有探索性数据分析工具,需要手动添加。添加方法如下。(1)开启地统计分析扩展模块:单击ArcMAP界面上“工具”︱“扩展”命令,弹出“扩展”对话框,确保GeostatisticalAnalyst的复选框被选中。(2)添加GeostatisticalAnalyst工具条。选择ArcMAP界面上的“视图”菜单︱“工具条”命令,确保GeostatisticalAnalyst工具条被选中。之后,在ArcMAP工具栏将出现GeostatisticalAnalyst工具条。15.2.2Histogram(直方图)Histogram(直方图)指对采样数据按一定的分级方案进行分级,统计采样点落入各个级别中的个数或占总采样数的百分比,并通过条带图或柱状图表现出来。直方图可以直观的反映采样数据分布特征与规律。15.2.3正态QQPlot分布图)和普通QQPlot分布图QQPlot分布图是可以将现有数据的分布与标准正态分布对比,从而来分析和评价现有数据。其是利用分布的分位数而作出的图形,如果数据图形越接近一条直线,则它越接近于服从正态分布。1.NormalQQPlot分布图(正态QQPlot分布图)2.GeneralQQPlot分布图(普通QQPlot分布图)15.2.4TrendAnalysis(趋势分析)趋势分析可以利用样点数据生成以数据某一属性值为高度的三维透视图,从而帮助用户从不同视角分析采样数据集的全局趋势。样点的位置由X、Y和Z3个值来决定。X、Y确定样点平面坐标,Z值则是样点数据的某一属性值。三维透视图中的每个黑线就代表了样点的位置和高度,位置就是样点X、Y平面坐标,高度即样点数据的某一属性值的大小。15.2.5VoronoiMap(Voronoi地图)Voronoi地图是由样点以及样点周围的一系列多边形所组成。多边形生成的要求就是多边形内任何位置距这一样点的距离都,比该多边形到其他样点的距离要近。Voronoi多边形生成之后,相邻的点就被定义为其Voronoi多边形,与选择样点的Voronoi多边形具有公共边的其他样点。15.2.6Semivariogram/CovarianceCloud(半变异/协方差函数云)半变异/协方差函数云表示的是数据集中所有样点对的理论半变异值和协方差,并把它们用两点间距离的函数来表示,用此函数作图来表示。15.2.7CrosscovarianceCloud(正交协方差函数云)正交协方差函数云表示的是两个数据集中所有样点对的理论正交协方差,并把它们用两点间距离的函数来表示。15.3探索性数据分析对于一组模式未知的数据,可以有很多方法来处理,当数据偏离严格假定所描述的理想模型,古典统计技术可能不适用。探索性数据分析技术——新开发的稳健、高效的数据分析方法,可以让用户更全面地了自己使用的数据。可以借助其来查看数据是否服从正态分布,是否存在某种趋势效应、各向异性等。探索性数据分析主要利用ArcGIS提供的工具和插值方法,可以确定统计数据属性,探测数据分布、全局和局部异常值、寻求全局的变化趋势、研究空间自相关和理解多种数据集之间相关性。15.3.1检验数据分布在地统计分析中,克里格方法建立在一定的假设基础上,其在一定程度上要求所有数据值具有相同的变异性。另外,普通克里格法、简单克里格法和泛克里格法等都假设数据服从正态分布。如果数据不服从正态分布,需要进行一定的数据变换,从而使其服从正态分布。因此,在进行地统计分析前,检验数据分布特征,了解和认识数据具有非常重要的意义。数据的检验可以通过直方图和正态QQPlot分布图完成。1.通过直方图检验数据分布2.通过QQplot图检验数据分布15.3.2寻找数据离群值在一组平行测定数据中,有时会出现个别值与其他值相差较远,这种值叫离群值。数据离群值分为全局离群值和局部离群值两大类。全局离群值是指对于数据集中所有点来讲,具有很高或很低的值的观测样点。局部离群值对于整个数据集来讲,观测样点的值处于正常范围,但与其相邻测量点比较,它又偏高或偏低。1.利用直方图查找离群值2.利用半变异/协方差函数云识别离群值3.利用Voronoi图查找局部离群值15.3.3全局趋势分析全局趋势分析可以通过TrendAnalysis(趋势分析)工具来实现。地物的空间趋势反映了空间物体在空间区域上变化的主体特征。趋势面分析主要依靠空间样点数据,通过数学的方法来拟合一个空间曲面,从而大致反映其空间分布的变化情况。值得注意的是一个表面主要是由确定的全局趋势和随机的变异误差来共同确定的。而趋势面分析则会忽略这种局部的变异,只揭示其空间物体变化的总体规律。15.3.4空间自相关及方向变异地理空间自相关是指时间序列相邻数值间的相关关系。大部分的地理现象都具有空间相关特性,即距离越近的两事物越相似。地理研究对象普遍存在的变量间的关系中,确定性的是函数关系,非确定性的是相关关系。如果存在空间自相关,那么该变量本身存在某种数学模型。半变异/协方差函数云图就是这种关系的定量化表示。15.3.5多数据集协变分析世界上的事务不会孤立存在,它们都是处于广泛联系之中的,并相互制约和相互影响。变分析主要通过分析多因素(数据集)关联特征,在地统计空间分析中可以有效利用这种相关特征增强建模效果,如协同克里格插值分析。15.4空间确定性插值对采样数据进行分析,并对采样区地理特征认识之后,便要选择合适的空间内插方法来创建表面。插值方法按其实现的数学原理可以分为两类,一类是确定性插值方法;另一类是地统计插值,也就是克里格插值。确定性插值方法以研究区域内部的相似性(如反距离加权插值法)、或者以平滑度为基础(如径向基函数插值法)由已知样点来创建表面。确定性插值方法又可以分为两种,即全局性插值方法和局部性插值方法。全局性插值方法以整个研究区的样点数据集为基础来计算预测值,局部性插值方法则使用一个大研究区域内较小的空间区域内的已知样点来计算预测值。15.4.1反距离加权插值反距离加权插值法的基本原理在于,一般来讲物体离得近,它们的性质就越相似。反之,离得越远则相似性越小。反距离加权插值法以插值点,与样本点间的距离为权重进行加权平均,离插值点越近的样本点赋予的权重越大。15.4.2全局多项式插值全局性插值方法以整个研究区的样点数据集为基础,用一个数学多项式来模拟计算预测值。其可以视为用一个多项式平面或曲面来全区域的拟合。此方法拟合的表面很少能与已知样点完全重合,所以全局插值法是非精确的插值法。利用全局性插值法生成的表面容易受极高和极低样点值的影响,尤其在研究区边沿地带,因此用于模拟的有关属性在研究区域内最好是变化平缓的。全局多项式插值法适用的情况如下。当一个研究区域的表面变化缓慢,即这个表面上的样点值由一个区域向另一个区域的变化平缓时,可以采用全局多项式插值法利用该研究区域内的样点对该研究区进行表面插值。检验长期变化的、全局性趋势的影响时,一般采用全局多项式插值法,在这种情况下,应用的方法通常被称为趋势面分析。15.4.3局部多项式插值局部多项式插值采用多个多项式,每个多项式都处在特定重叠的邻近区域内。通过使用搜索邻近区域对话框可以定义搜索的邻近区域。局部多项式插值法不是一个精确的插值方法,但它能得到一个平滑的表面。建立平滑表面和确定变量的小范围的变异可以使用局部多项式插值法,特别是数据集中含有短程变异时,局部多项式插值法生成的表面就能描述这种短程变异。15.4.4径向基函数插值径向基函数插值法适用于对大量点数据进行插值计算,同时要求获得平滑表面的情况。将径向基函数应用于表面变化平缓的表面,如表面上平缓的点高程插值,能得到令人满意的结果。而在一段较短的水平距离内,表面值发生较大的变化,或无法确定采样点数据的准确性,或采样点数据具有很大的不确定性时,径向基函数插值的方法并不适用。15.5地统计插值地统计插值,也就是克里格插值。克里格方法(Kriging)又称空间局部插值法,是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法,是地统计学的主要内容之一。15.5.1克里格插值基础克里格方法与反距离权插值方法类似的是,两者都通过对已知样本点赋权重来求得未知样点的值。不同的是,在赋权重时,反距离权插值方法只考虑已知样本点与未知样点的距离远近,而克里格方法不仅考虑距离,而且通过变异函数和结构分析,考虑了已知样本点的空间分布及与未知样点的空间方位关系。15.5.2普通克里格插值普通克里格(OrdinaryKriging)是区域化变量的线性估计,它假设数据变化成正态分布,认为区域化变量Z的期望值是未知的。插值过程类似于加权滑动平均,权重值的确定来自于空间数据分析。1、创建预测图(PredictionMap)2、创建分位数图(QuantileMap)3、创建概率图(ProbabilityMap)4、创建标准误差预测图(PredictionStandardErrorMap)15.5.3简单克里格插值简单克里格是区域化变量的线性估计,它假设数据变化成正态分布,认为区域化变量Z的期望值为已知的某一常数。ArcGIS中普通克里格插值包括4部分功能,即创建预测图(PredictionMap)、创建分位数图(QuantileMap)、创建概率图(ProbabilityMap)和创建标准误差预测图(PredictionStandardErrorMap)。1、创建预测图(PredictionMap)2、创建分位数图(QuantileMap)3、创建概率图(ProbabilityMap)4、创建标准误差预测图(PredictionStandardErrorMap)15.5.4泛克里格插值泛克里格假设数据中存在主导趋势,且该趋势可以用一个确定的函数或多项式来拟合。在进行泛克里格分析时,首先分析数据中存在的变化趋势,获得拟合模型;其次,对残差数据(即原始数据减去趋势数据)进行克里格分析;最后,将趋势面分析和残差分析的克里格结果加和,得到最终结果。由此可见,克里格方法明显优于趋势面分析,