空间统计应用汇总空间分布的关键特征识别具有统计显著性的空间聚类和空间异常值评估聚集或离散的整体模式根据属性相似性对要素进行分组空间关系建模地统计在科学和工程领域中的应用采矿行业:量化矿物资源和评估项目的可行性环境科学:评估污染级别以判断是否对环境和人身健康构成威胁,以及能否保证修复。土壤科学:绘制土壤营养水平(氮、磷、钾等)和其他指标(例如导电率),以便研究它们与作物产量的关系和规定田间每个位置的精确化肥用量。气象:温度、雨量和相关的变量(例如酸雨)的预测公共健康领域:预测环境污染程度及其与癌症发病率的关系。地统计分析用于研究区域中已测量的采样点为同一区域内其他未测量位置创建准确预测。探索性空间数据分析工具用于评估数据的统计属性,比如空间数据变异性、空间数据相关性和全局趋势。探索性空间数据分析采用探索性空间数据分析工具来研究喀尔巴阡山中监测站处获取的臭氧测量值的属性表面预测和误差建模白俄罗斯放射铯土壤污染级别的预测图地统计工具可生成各种类型的地图图层,包括预测图、分位图、概率图、预测标准误差图。阈值制图概率图来预测值超过临界阈值的位置。暗橙色和红色显示的位置表示概率大于62.5%,此处放射性铯污染超过森林浆果中最大允许级别(临界阈值)。模型验证和诊断预测伊利诺斯州农场的有机物将输入数据拆分成两个子集。用数据的第一个子集开发预测的模型。然后使用“验证”工具,比较预测值和其余位置的已知值。协同克里金法的表面预测探索臭氧(主变量)和二氧化氮(二级变量)之间的空间相关性。在绘制臭氧地图时,协同克里金法可使用二氧化氮数据改进预测。第七章空间数据的统计分析方法空间数据的统计分析着重于空间物体和现象的非空间特性的统计分析,研究如何以数学统计模型来描述和模拟空间现象和过程。空间数据统计分析的目的描述事物在空间上的分布特征(随机的、聚集的或规则的)。分析数据的空间自相关性,空间自相关性对空间格局的影响,如何利用这种关系构建模型。空间数据统计分析的流程原始数据检查、分析数据选择合适的模型检验模型或模型比较探索数据暗含的特点和规律,比如是否为正态分布、有没有趋势效应、各向异性等进行表面预测。包括半变异模型的选择和预测模型的选择。最后检验模型是否合理或几种模型进行对比。分析结果一基本统计量二探索性空间数据分析三地统计分析四克里金插值方法五应用案例主要内容一基本统计量基本统计量集中趋势离散程度分布特征平均数中位数众数分位数极差离差平均离差离差平方和方差标准差变异系数偏度峰度总和比率比例种类描述数据特征的统计量其他统计量从离散样本点连续表面插值方法的选择模型参数的设置不同的插值方法模型参数设置•有多少样本点参与到计算中来?•每个样本点的权重是相同的吗?•选择什么函数来模拟表面?•……了解数据开始探索性空间数据分析ExploreSpatialDataAnalysis一基本统计量二探索性空间数据分析三地统计分析四克里金插值方法五应用案例主要内容二探索性空间数据分析对样本数据性质的研究,没有先验的理论假设,通过对数据全面深入分析来了解其在空间分布、空间结构以及空间相互影响方面的特征。ExploratorySpatialDataAnalysis—ESDA(一)基本分析工具(二)检验数据分布(三)寻找数据离群值(四)全局趋势分析(五)空间自相关分析二探索性数据分析(一)基本分析工具直方图:检查数据集的分布和汇总统计数据。正态QQ图和常规QQ图:分别评估数据集是否是正态分布以及研究两个数据集是否具有相似的分布。Voronoi图:直观地检查数据集的空间可变性和稳定性。趋势分析:查看并检查数据集的空间趋势。半变异函数/协方差云:评估数据集的空间依赖性(半变异函数和协方差)。交叉协方差云:评估两个数据集间的空间依赖性(协方差)。探索性数据分析:直方图直方图:对采样数据按一定的分级方案(等间隔分级、标准差分等)进行分级,统计采样点落入各个级别中的个数或占总采样数的百分比,并通过条带图或柱状图表现出来。直方图的一些基本统计量,可以对数据有个初步的了解。直方图可以直观的反映采样数据分布特征、总体规律,可以用来检验数据分布和寻找数据离群值。将数据分为若干区间,统计每个区间内的要素个数给出一组统计量检验数据是否符合正态分布以及发现离群值直方图频率分布汇总统计数据用条形图表示,显示了观察值位于特定区间或组之内的频率。通过描述统计数据位置、离散度和形状的统计量来概括数据作为一种快速检查手段,如果平均值和中值近似相同,则初步证明数据可能呈正态分布。该臭氧数据直方图表示数据为单峰(一个高峰)并且向右偏移。分布图的右侧尾部表示存在的采样点相对较少但臭氧浓度值较高。该数据不接近于正态分布。探索性数据分析:直方图变换直方图对数变换评估具有n个值的单变量样本数据是否服从正态分布正态QQ图如何构建正态QQ图?④在累积值之间使用线性内插技术,构建一个与其具有相同累积分布的理论正态分布图,求对应的正态分布值;标准正态分布(平均值为0标准方差为1的高斯分布⑤以横轴为理论正态分布值,竖轴为采样点值,绘制样本数据相对于其标准正态分布值的散点图。探索性数据分析:QQplot图正态QQPlot分布图(NormalQuantile-quantilePlot)①对采样值进行排序;②计算出每个排序后的数据的累积值(i-0.5)/n;③绘制累积值分布图;普通QQ图普通QQ图评估两个数据集的分布的相似程度。使用QQ图检查数据分布正态QQ图上的点可指示数据集的单变量分布的正态性。如果数据是正态分布的,点将落在45度参考线上。如果数据不是正态分布的,点将会偏离参考线。如果在数据中存在趋势,则该趋势就是可以通过数学公式表示非随机(确定性)组成部分。如:通过平面表示一个平缓的山坡。山谷可以使用二阶多项式通过创建U形来表示出来。将局部变化添加到表面。使用其中某个平滑函数为趋势建模,从数据中移除趋势,通过为残差(移除趋势后的剩余部分)建模继续进行分析。为残差建模时,将分析表面中的局部变化。通过“趋势分析”工具可以识别输入数据集中存在的/不存在的趋势,并且可以识别出最佳拟合此趋势的多项式阶数。识别数据中的全局趋势探索性数据分析:趋势分析趋势分析“趋势分析”工具提供数据的三维透视图。采样点的位置绘制在x,y平面上。在每个采样点的上方,值由z维中的杆的高度给定。“趋势分析”工具将散点图投影到x,z平面和y,z平面上。可以将其视为通过三维数据形成的横向视图。多项式即会根据投影平面上的散点图进行拟合。附加要素是您可以旋转数据来隔离方向趋势。趋势很明显,呈倒置的U形。这表明可使用二阶多项式对数据进行拟合。趋势的影响力从区域的中心到各个边界逐渐减弱(即,最大值出现在区域的中心,最小值出现在边的附近)。平面n个离散点,把平面分成n个区,每个区包括一个点,该点所在的区是到该点距离最近的点的集合。Voronoi图的定义:探索性数据分析:Voronoi图创建Voronoi多边形,以使多边形内的各个位置距该多边形内的采样点的距离小于距任何其他采样点的距离。创建这些多边形后,采样点的相邻点将被定义为与该所选采样点共享多边形一条边的任何其他采样点。亮绿色的采样点被一个面包围,这个面以红色高亮显示。与其他任何采样点(以深蓝色小圆点表示)相比,红色面内的每个位置更接近亮绿色采样点。蓝色的面都与红色的面共享一条边,因此,蓝色面内的采样点是亮绿色采样点的相邻点。检查局部变化Voronoi地图是由围绕采样点的位置形成的一系列多边形所构成的地图。通过采用红色和蓝色多边形中采样点的”值”来计算局部值。然后将此局部值指定给红色多边形。将针对所有多边形及其相邻点重复此过程,并以色带的形式显示计算结果,以区分具有高局部值和低局部值的区域。检查局部变化Voronoi地图是由围绕采样点的位置形成的一系列多边形所构成的地图。探索性数据分析--半变异函数/协方差云半变异函数和协方差函数将邻近事物比远处事物更相似这一假设加以量化。半变异函数和协方差都将统计相关性的强度作为距离函数来测量。对半变异函数和协方差函数建模的过程就是半变异函数或协方差曲线与经验数据拟合。目标是达到最佳拟合,并将对现象的认知纳入模型,使模型便可用于预测。半变异函数定义为γ(si,sj)=½var(Z(si)-Z(sj)),其中var是方差。如果两个位置si和sj,在d(si,sj)的距离测量上彼此相近,那么会希望这两个位置相似,以便缩小两个位置的差值Z(si)-Z(sj)的大小。当si和sj距离逐渐增大时,它们变得越来越不相似,它们的值Z(si)-Z(sj)的差异也会增大。半变异函数典型半变异函数的解析图标识的是差异协方差函数定义为C(si,sj)=cov(Z(si),Z(sj)),其中cov是协方差。当两个位置si和sj彼此相近时,希望这两个位置相似,而它们的协方差(相关性)会变大。当si和sj距离逐渐增大时,它们变得越来越不相似,并且它们的协方差会变为零。协方差函数典型协方差函数的解析图标识的是相关性在半变异函数和协方差函数关系:γ(si,sj)=sill-C(si,sj),Sill为基台,使用两种函数中的任一种来执行预测,一般采用半变异函数。半变异函数和协方差函数之间的关系典型半变异函数的解析图典型协方差函数的解析图了解半变异函数:变程、基台和块金半变异函数显示测量采样点的空间自相关。基台变程块金偏基台块金:测量误差或小于采样间隔距离处的空间变化源变程:半变异函数的模型首次呈现水平状态的距离基台:半变异函数模型在变程处所获得的值(y轴上的值)半变异函数/协方差云每一个点代表一个点对空间距离越近,相关性越大发现离群值以及是否存在各向异性在半变异函数图中,相互之间最接近的位置应该具有较小的半变异函数值。随着位置对之间的距离增加,半变异函数值也应该增加。但当到达某个距离时云会变平,这表示相互间的距离大于此距离的点对的值不再相关。观察半变异函数图,如果出现某些非常接近的数据位置(在x轴上接近零)却具有高于预期的半变异函数值(在y轴上的高值),则应该调查这些位置对,看一下是否存在不准确的数据。具有典型半变异函数值的位置对,其点对之间的距离大致相同。其中的大多数连线与海岸线大致平行,可以看到数据受到方向因素的影响。(二)检验数据分布在地统计分析中,克里金方法是建立在平稳假设的基础上,并假设数据服从正态分布。如果数据不服从正态分布,需要进行一定的数据变换,从而使其服从正态分布。因此,检验数据分布特征,了解和认识数据具有非常重要的意义。(三)查找全局异常值和局部异常值全局异常值是相对数据集中的所有值具有非常高值或非常低值的已测量采样点。局部异常值是一个已测量采样点,具有整个数据集正常范围内的值,但查看周围点时,其值显得异常高或异常低。识别异常值的原因有两个:•如果异常值是现象中的真实异常情况,那么这可能是研究和理解现象的最重要的点。•如果异常值是由数据输入过程中的错误导致的,那么在创建表面之前应该进行校正或移除。通过直方图工具查找异常值通过半变异函数/协方差云识别异常值如果数据集中存在具有异常高值的全局异常值,则无论什么距离所有点和异常值的配对在半变异函数云中也将具有高值。彼此靠近的成对位置具有高半变异函数值,当把这些点擦除后,可以看出所有这些点都和单个位置配对。此位置可能是局部异常值。局部异常值通过Voronoi制图查找局部异常值通过采用红色和蓝色多边形中采样点的”值”来计算局部值。然后将此局部值指定给红色多边形。将针对所有多边形及其相邻点重复此过程,并以色带的形式显示计算结果,以区分具有高局部值和低局部值的区域。Voronoi地图是由围绕采样点的位置形成的一系列多边形所构成的地图。(四)全局趋势分析空间趋势反映了空间物体在空间区域上变化的主体特征,它主要揭示了空间物体的总体规律,而忽略局部的变异。趋势面分析是根据空间抽样数据,拟合一个数学曲面,用该数学曲面来反映空间分布的变化情况