第十章 地统计分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十章地统计分析主要内容•10.1地统计基础•10.2探索性数据分析•10.3空间确定性插值•10.4地统计插值•10.5地统计图层管理•10.6练习:GDP区域分布图的生成与对比10.1地统计基础•10.1.1基本原理•10.1.2克里格插值•10.1.3ArcGIS地统计分析10.1.1基本原理•地统计(Geostatistics)又称地质统计,它是以区域化变量为基础,借助变异函数,研究既具有随机性又具有结构性,或空间相关性和依赖性的自然现象的一门科学。凡是与空间数据的结构性和随机性,或空间相关性和依赖性,或空间格局与变异有关的研究,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性时,皆可应用地统计学的理论与方法。地统计分析理论基础包括:•前提假设•区域化变量•变异分析•空间估值前提假设:•前提假设•与经典统计学相同的是,地统计学也是在大量样本的基础上,通过分析样本间的规律,探索其分布规律,并进行预测。平稳性均值平稳,即假设均值是不变的并且与位置无关。二阶平稳,是假设具有相同的距离和方向的任意两点的协方差是相同的,协方差只与这两点的值相关而与它们的位置无关。正态分布在获得数据后首先应对数据进行分析,若不符合正态分布的假设,应对数据进行变换,转为符合正态分布的形式,并尽量选取可逆的变换形式。区域化变量•当一个变量呈现一定的空间分布时,称之为区域化变量,它反映了区域内的某种特征或现象。区域化变量具有两个显著特征:即随机性和结构性。首先,区域化变量是一个随机变量,它具有局部的、随机的、异常的特征;其次,区域化变量具有一定的结构特点,除此之外,区域化变量还具有空间局限性、不同程度的连续性和不同程度的各向异性等特征。变异分析1.协方差函数协方差又称半方差,表示两随机变量之间的差异。在概率论中,随机变量X与Y的协方差定义为:其中,Z(x)为区域化随机变量,并满足二阶平稳假设,即随机变量Z(x)的空间分布规律不因位移而改变;h为两样本点空间分隔距离;为Z(x)在空间点处的样本值;是Z(x)在处距离偏离h的样本值[i=1,2,…,N(h)];N(h)是分隔距离为h时的样本点对总数。)]Y())(X([(),(EYEXEYXCov借鉴上式,地统计学中的协方差函数可表示为:)(1)]()()][()([)(1)(hNiiiiihxZhxZxZxZhNhC)(ixZ)(ixZ)(hxZi)(hxZi变异分析2.半变异函数半变异函数又称半变差函数、半变异矩,是地统计分析的特有函数。区域化变量Z(x)在点x和x+h处的值Z(x)与Z(x+h)差的方差的一半称为区域化变量Z(x)的半变异函数,记为r(h),2r(h)称为变异函数。根据定义有:)]()([21),(hxZxZVarhxr22)]}([)]([{21)]()([21),(hxZExZEhxZxZEhxr区域化变量Z(x)满足二阶平稳假设,因此对于任意的h有:)]([)]([xZEhxZE因此,半变异函数可改写为:2)]()([21),(hxZxZEhxr变异分析半变异值的变化随着距离的加大而增加,协方差随着距离的加大而减小。这主要是由于半变异函数和协方差函数都是事物空间相关系数的表现,当两事物彼此距离较小时,它们应该是相似的,因此协方差值较大,而半变异值较小;反之,协方差值较小,而半变异值较大。c(h)图10.2协方差函数图r(h)图10.1半变异函数图偏基台值(PartialSill)块金(Nugget)基台值(Sill)变程(Range)距离(h)距离(h)偏基台值(PartialSill)块金(Nugget)变程(Range)基台值(PartialSill))3.变异分析变异分析4.上图参数含义:块金值(Nugget):理论上,当采样点间的距离为0时,半变异函数值应为0,但由于存在测量误差和空间变异,使得两采样点非常接近时,它们的半变异函数值不为0,即存在块金值。•变程(Range):当半变异函数的取值由初始的块金值达到基台值时,采样点的间隔距离称为变程。变程表示了在某种观测尺度下,空间相关性的作用范围,其大小受观测尺度的限定。在变程范围内,样点间的距离越小,其相似性,即空间相关性越大。当hR时,区域化变量Z(x)的空间相关性不存在,即当某点与已知点的距离大于变程时,该点数据不能用于内插或外推。偏基台值(PartialSill):基台值与块金值的差值。•基台值(Sill):当采样点间的距离h增大时,半变异函数r(h)从初始的块金值达到一个相对稳定的常数时,该常数值称为基台值。当半变异函数值超过基台值时,即函数值不随采样点间隔距离而改变时,空间相关性不存在。空间估值:空间估值过程,一般为:首先是获取原始数据,检查、分析数据,然后选择合适的模型进行表面预测,最后检验模型是否合理或几种模型进行对比。(如图所示)数据显示数据检查模型拟合模型诊断模型比较13245图10.3空间估值流程图克里格插值克里格插值(Kriging)又称空间局部插值法,是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法,是地统计学的主要内容之一。插值方法插值方法按其实现的数学原理可以分为两类:一是确定性插值方法,另一类是地统计插值,也就是克里格插值。(如右图)空间插值确定性插值全局性插值:全局多项式插值局部性插值径向基插值地统计插值反距离权插值局部多项式插值普通克里格插值概率克里格插值简单克里格插值泛克里格插值析取克里格插值协同克里格插值图10.4空间插值分类体系(数学原理)插值方法空间插值方法根据是否能保证创建的表面经过所有的采样点,又可以分为精确性插值和非精确性插值。(如右图)空间插值精确性插值非精确性插值反距离权插值全局多项式插值局部多项式插值克里格插值径向基插值普通克里格插值概率克里格插值简单克里格插值泛克里格插值析取克里格插值协同克里格插值图10.5空间插值分类体系(表面是否经过所有的采样点)ArcGIS地统计分析探索性数据分析(ExploreData)地统计分析向导(GeostatisticalWizard)生成数据子集(CreateSubsets)探索性数据分析(ExploreData)•数据分析工具可以让用户更全面地了解所使用的数据,以便于选取合适的参数及方法。如数据是否服从正态分布,是否存在某种趋势等.地统计分析向导(GeostatisticalWizard)地统计分析模块提供了一系列利用已知样点进行内插生成研究对象表面图的内插技术。地统计分析向导通过完善的图形用户界面,引导用户逐步了解数据、选择内插模型、评估内插精度,完成表面预测(模拟)和误差建模。生成数据子集(CreateSubsets)•就是将原始数据分割成两部分,一部分用来空间结构建模及生成表面,另一部分用来比较和验证预测的质量。图10.6生成数据子集操作步骤10.2探索性数据分析10.2.1数据分析工具10.2.2检验数据分布10.2.3寻找数据离群值10.2.4全局趋势分析10.2.5空间自相关及方向变异10.2.6多数据集协变分析数据分析工具刷光(Brushing)与链接(Linking)直方图Voronoi地图QQPlot分布图趋势分析方差变异分析刷光(Brushing)与链接(Linking)刷光指在ArcMap数据视图或某个ESDA工具中选取对象,被选择的对象高亮度显示。链接指在ArcMap数据视图或某个ESDA视图中的进行选取对象操作,则在所有视图中被选取对象均会执行刷光操作。直方图直方图指对采样数据按一定的分级方案(等间隔分级、标准差分,等等)进行分级,统计采样点落入各个级别中的个数或占总采样数的百分比,并通过条带图或柱状图表现出来。图10.7直方图示例Voronoi地图Voronoi地图是由在样点周围形成的一系列多边形组成的。某一样点的Voronoi多边形按下述方法生成:多边形内任何位置距这一样点的距离都比该多边形到其它样点的距离要将要近。图10.8Voronoi地图示例QQPlot分布图QQ图提供了另外一种度量数据正态分布的方法,利用QQ图,可以将现有数据的分布与标准正态分布对比,如果数据越接近一条直线,则越接近于服从正态分布。QQ图可分为以下两种:1.正态QQPlot(NormalQQPlot)分布图2.普通QQPlot(GeneralQQPlot)分布图正态QQPlot分布图图10.9正态QQPlot图普通QQPlot分布图图10.10普通QQPlot图趋势分析空间趋势反映了空间物体在空间区域上变化的主体特征,它主要揭示了空间物体的总体规律,而忽略局部的变异。趋势面分析是根据空间抽样数据,拟合一个数学曲面,用该数学曲面来反映空间分布的变化情况。图10.11趋势分析操作对话框方差变异分析1.半变异/协方差函数云半变异/协方差函数云表示的是数据集中所有样点对的理论半变异值和协方差,并把它们用两点间距离的函数来表示,用此函数作图来表示。图10.12协方差变异分析操作对话框方差变异分析2.正交协方差函数云正交协方差函数云表示的是两个数据集中所有样点对的理论正交协方差,并把它们用两点间距离的函数来表示。图10.13正交方差变异分析操作对话框检验数据分布•在地统计分析中,克里格方法是建立在平稳假设的基础上,这种假设在一定程度上要求所有数据值具有相同的变异性。另外,一些克里格插值都假设数据服从正态分布。如果数据不服从正态分布,需要进行一定的数据变换,从而使其服从正态分布。因此,检验数据分布特征,了解和认识数据具有非常重要的意义。寻找数据离群值数据离群值分为全局离群值和局部离群值两大类。全局离群值是指对于数据集中所有点来讲,具有很高或很低的值的观测样点。局部离群值值对于整个数据集来讲,观测样点的值处于正常范围,但与其相邻测量点比较,它又偏高或偏低。用直方图查找离群值离群值在直方图上表现为孤立存在或被一群显著不同的值包围,直方图上最右边被选中的一个柱状条即是该数据的离群值,相应地,数据点层面上对应的样点也被刷光。但需注意的是,在直方图中孤立存在或被一群显著不同的值包围的样点不一定是离群值。图10.14离群值的直方图查找和图面显示用半变异/协方差函数云识别离群值如果数据集中有一个异常高值的离群值,则与这个离群值形成的样点对,无论距离远近,在半变异/协方差函数云图中都具有很高的值。如下图所示,这些点可大致分为上下两层,对于上层的点,无论位于横坐标的左端或右端(即无论距离远近)都具有较高的值。刷光上层的一些点,右图是对应刷光的样点对。可以看到,这些高值都是由同一个离群值的样点对引起的,因此,需要对该点进行剔除或改正。图10.15离群值的半变异/协方差函数云查找和图面显示用Voronoi图查找局部离群值用聚类和熵的方法生成的Voronoi图可用来帮助识别可能的离群值。熵值是量度相邻单元相异性的指标。通常,距离近的事物比距离远的事物具有更大的相似性。因此,局部离群值可以通过高熵值的区域识别出来。同样的原理,聚类方法也可将那些与它们周围单元不相同的单元识别出来。图10.16离群值的Voronoi图查找全局趋势分析空间趋势反映了空间物体在空间区域上变化的主体特征,它主要揭示了空间物体的总体规律,而忽略局部的变异。趋势面分析是根据空间抽样数据,拟合一个数学曲面,用该数学曲面来反映空间分布的变化情况。全局趋势分析对比分析可以发现,左图显示采样数据在东西方向和南北方向具有微弱的U型趋势;右图显示采样数据在东南-西北方向具有明显的U型趋势,而在南北方向基本不具有任何趋势。图10.17全局趋势分析对比图全局趋势分析趋势分析过程中,透视面的选择应尽可能采样数据在透视面上的投影点分布比较集中,通过投影点拟合的趋势方程才具有代表性,才能有效反映采样数据集全局趋势。左图反映的趋势显然要比右图要更为准确。图10.18不同透视面选择的全局趋势分析对比图空间自相关及方向变异左图所示,jsJDP2中GDP采样值在空间基本不具有空间相关性,虽然

1 / 79
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功