空间统计分析

叶海晨星
0 ℃
2021-03-29

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

地图分析与应用MapAnalysisandApplications李飞雪南京大学地理信息科学系2023323033032032303322033233033203023330232033230数据概括相同，空间模式不同3数据分析的缺点以经典统计理论为基础标准正态分布缺失位置信息4空间数据很少符合正态分布位置信息非常重要依赖（Dependence）是一种规律（rule）空间相互作用、空间外部性、空间溢出等空间尺度非常重要5•空间依赖性（SpatialDependence）),,,(21Niyyyfy变量Y在第i个空间单元上的观测值由该空间系统中其他空间单元上的观测值通过函数f表达，i∈S，S是所有空间单元的集合。6•空间依赖性的产生原因空间相互作用测量误差7•空间异质性（SpatialHeterogeneity）),,(iiiiixfyi代表空间观测单元，fi表示因变量yi与自变量xi、参数向量i和误差项i之间具体的函数关系。8（A）（B）（C）（D）（E）I=-1.000I=-0.393I=0.000I=+0.857I=+0.393空间模式的量化9专题三空间统计分析空间统计分析，即空间数据（spatialdata）的统计分析，是现代计量地理学中一个快速发展的方向和领域。空间统计分析，其核心是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关，通过空间位置建立数据间的统计关系。空间统计分析地球表面上的事物或现象之间存在着某种联系，并以相似或差异的方式表现出来。Tobler（1970）“地理学第一定律”描述了这样性质：“所有的事物或现象在空间上都是有联系的，但相距近的事物或现象之间的联系一般较相距远的事物或现象间的联系要紧密”。在空间统计学中，相似事物或现象在空间上集聚（集中）的性质称之为空间自相关（Spatialautocorrelation）。空间上的相关性或关联性（Spatialassociatiaon）是自然界存在秩序与格局的原因之一（Goodchild1986）。地理学第一定律在地理学中，每一个空间位置上的事物（现象）都具有区别于其他位置上的事物（现象）的特点，这种差异性被称为空间异质性（Spatialheterogeneity）（Anselin1988）。与地理学第一定律所描述的空间依赖性相对应，Goodchild（2003）将空间异质性总结为“地理学第二定律”。Goodchild在2003年的UCGIS年会上做了一场题为“地理信息科学基本定律（TheFundamentalLawsofGIScience）”的报告。在该报告中，Goodchild将“空间异质性”概括为地理学第二定律（theSecondLawofGeography）。地理学第一定律13基本分析方法/分析指标空间权重矩阵空间权重矩阵是对空间邻接关系的定义，是空间统计分析运算的基础之一。全局空间自相关局部空间自相关1415空间权重矩阵（spatialweightmatrix）对空间邻居（spatialneighborhood）或邻接关系的描述，通常定义一个二元对称空间权重矩阵W，来表达n个位置的空间区域的邻近关系。目前对于空间权重指标的构建，主要基于两类特征：连通性（Continuity）和距离（Distance）。此外，还可以通过面积、可达度等方式对空间权重指标进行构建。空间权重矩阵16空间权重矩阵（spatialweightmatrix）基于连通性特征的空间权重指标，又可以称为空间邻接指标。三种基本的空间邻接定义方式：考虑横纵方向邻接关系的“卒”型、考虑对角线方向邻接关系的“象”型以及综合考虑上述方向的“后”型。空间邻接影响不仅仅局限于两个单元的相邻，一个空间单元还可通过相邻单元对外围非相邻单元产生影响，对于这类影响可以通过设定空间二阶乃至高阶邻接指标进行表达。17空间权重矩阵（spatialweightmatrix）基于距离特征的空间权重指标，又可以称为空间距离指标。空间距离指标选择空间对象间的距离（如反距离、反距离平方值、距离负指数等）定义权重矩阵。如Cliff和Ord曾提出的Cliff-Ord空间权重指标，即是将距离作为指标定义的一部分。，i=1,2,…,n；j=1,2,…,n其中，dij为空间对象间的距离，βij为空间对象共享边界的长度，a、b为两类距离的权重调整系数。bijaijijdw][][18空间权重矩阵（spatialweightmatrix）空间数据集中不同实体单元间存在不同程度的空间关系，在实际使用中，一般通过矩阵形式给出空间逐点的空间权重指标，称为空间权重矩阵。111212122212.....................nnnnnnW是一个nn的正定矩阵，矩阵的每一行指定了一个空间单元的“邻居集合”。一般地，面状观测值用连通性指标：若面状单元i和j相邻，则wij=1；否则，wij=0。点状观测值用距离指标：若点i和j之间的距离在阈值d以内，则wij=1；否则，wij＝0。通常约定，一个空间单元与其自身不属于邻居关系，即矩阵中主对角线上元素值为0。19在实际应用中，一般根据以下两种规则定义邻居：公共边界如果第i和第j个空间单元具有公共边界，则认为它们是邻居，空间权重矩阵中的元素为1；否则，不是邻居，元素为0。距离如果第i和第j个空间单元之间的距离位于给定的临界距离d之内，则认为它们是邻居，空间权重矩阵中的元素为1；否则，不是邻居，元素为0。Cliff-Ord广义空间权重矩阵ijijijdbw其中dij是i和j之间的距离，bij是i和j之间的公共边界占i周长的比例。2021空间自相关度量的意义发现空间分布模式如何度量？全局空间自相关统计指数(a)空间集聚(空间相似)(b)空间间隔(空间相异)(c)空间随机22主要描述整个研究区域上空间对象之间的关联程度，以表明空间对象之间是否存在显著的空间分布模式。（CliffandOrd，1981）全局空间自相关分析主要采用全局空间自相关统计量（如Moran’sI、Geary’sC、GeneralG）进行度量。全局空间自相关（globalspatialautocorrelation）23niininjjiijxxxxxxwSnI210)())((Moran’sI统计量是一种应用非常广泛的空间自相关统计量，它的具体形式如下（CliffandOrd，1981）：Moran’sI其中，xi表示第i个空间位置上的观测值，，wij是空间权重矩阵W（n×n）的元素，表示了空间单元之间的拓扑关系，S0是空间权重矩阵W的所有元素之和。反映的是空间邻接或空间邻近的区域单元属性值的相似程度。niixnx11全局空间自相关统计指数24用矩阵形式表示如下：XXWXXSnI''0其中，X是xi与其均值的离差向量（n×1），W是（n×n）的空间权重矩阵，S0含义同上。25+4.55+5.54+2.24-5.15+9.02+3.10-4.39-2.09+0.46-3.06xyz124.55135.54212.2422-5.15239.02313.132-4.3933-2.09420.4643-3.06TabulatedlatticedataAdjacencymatrix,WI=0.0317.Ifthisvalueiscloseto0thereisverylittlespatialautocorrelation,whichiswhatwehavefoundinthisexample26对观测值在空间上不存在空间自相关（或独立、随机分布）这一原假设进行检验时，一般根据标准化以后的Moran’sI值或z值，即：)()(IVARIEIZIMoran’sI的检验在统计推断的过程中，通常需要对变量x的分布做出假设。一般分两种情况：一是假设变量x服从正态分布；二是在分布未知的情况下，用随机化方法得到x的近似分布。通过在正态或随机两种分布假设下得到I的期望值和方差来分别进行假设检验。27在正态分布假设下，Moran’sI的期望值和方差分别为：)()1(3)()1(1)(222020212IEnSSnSSnIVARnIEnnnninjijwS021)(21jininjijwwSniiiwwS22)(式中njijiww1njjiiww1和分别是空间权重矩阵W的第i行和第i列元素之和28)()3)(2)(1()62)(()3)33(()()1(1)(22020212220212IEnnnSSnSSnnbSnSSnnnIVARnIERRR2242))(()(niiniixxxxnb在随机分布假设下，Moran’sI的期望值和方差分别表示为：式中其他符号同上。29通常将Moran’sI解释为一个相关系数，取值范围从-1到+1。0I1表示正的空间自相关，I=0表示不存在空间自相关，-1I0表示负的空间自相关。当Moran’sI显著为正时，存在显著的正相关，相似的观测值(高值或低值)趋于空间集聚。当Moran’sI为显著的负值时，存在显著的负相关，相似的观测值趋于分散分布。当Moran’sI接近期望值（-1/（n-1），随着样本数量的增大，该值趋于0）时，表明不存在空间自相关，观测值在空间上随机排列，满足经典统计分析所要求的独立、随机分布假设。30随机检验（Permutationtest）在不存在空间自相关的假设下，观测值x1,…,xn可被认为是观测值被随机分配到n个空间位置上的一次随机过程。当观测值为n时，可能的空间组合次数为n!，这n!次随机排列构成观测值在原假设条件下的分布。根据这一分布，可以得到统计量的期望值和方差。蒙特卡罗检验（MonteCarlotest）当n比较大时，这些观测值的随机排列的组合数非常大。通常情况下是利用k个随机数生成方法来构建一个经验的原始分布。当k=99时，可以满足5%显著性水平下的检验；当k=999次，可以满足1%显著性水平的检验。k值越大，经验分布越接近原假设下的分布状态。可以根据这种经验分布来检验一个观测值的出现是否为“小概率事件”，从而判断是拒绝还是接受原假设。31Geary’sCniininjjiijxxxxwSnC121120)()(21Geary’sC也是一种较常用的空间自相关统计量，其结果解释类似于Moran’sI（CliffandOrd1981）。其形式为：对该统计量的统计推断也是根据相应的标准化Z值。32在正态分布假设下，Geary’sC的期望值和方差分别为：)4)1)(2(()1(21)(1202120SnSSSnCVar(C)ENN在随机分布假设下，Geary’sC的期望值和方差分别表示如下：]})1(3[])2(63[)1(41])1(33[)1{()3)(2(1)(1)(22220222222120bnnSbnnnnSnbnnnSnSnnnCVarCERR式中符号同Moran’sI的期望和方差公式。33Geary’sC总是正值，取值范围一般为0到2之间，且服从渐近正态分布。当Geary’sC小于1时，表明存在正的空间自相关。当Geary’sC大于1时，表明存在负的空间自相关。当Geary’sC值为1时，表明不存在空间自相关，即观测值在空间上随机排列。34GeneralG统计量Moran’sI和GearyC统计量均可以用来表明属性值之间的相似程度以及在空间上的分布模式，但它们并不能区分是高值的空间集聚（高值簇或热点（hotspots））还是低值的空间集聚（低值簇或冷点（coldspots）），有可能掩盖不同的空间集聚类型。Getis-OrdGeneralG统计量则可以识别这两种不同情形的空间集聚（GetisandOr