NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•面状数据通过各个面积单元上变量的数值描述地理现象的分布特征,变量的值描述是这个空间单元的总体特征,与面积单元内的空间位置无关。•空间点模式主要从点的位置信息研究空间分布模式,而面状数据的空间模式研究的是面积单元的空间关系作用下的变量值的空间模式。第五章面状数据空间模式分析方法NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY5.1空间接近性与空间权重矩阵5.2面状数据中趋势分析5.3空间自相关的概念5.4名义变量的空间自相关测度—连接计数法5.5空间自相关变量—Moran’sI和Geary’sC5.6广义G统计量5.7局部空间自相关统计量NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY5.1空间接近性与空间权重矩阵•“空间接近性”就是面积单元之间的“距离”关系,“空间接近性”描述了不同“距离”关系下的空间相互作用,而接近性程度一般使用空间权重矩阵描述。•空间权重矩阵给出了一个面积单元受邻近空间单元影响的可量化测度。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY5.1.1空间接近性•基于“距离”的空间接近性测度就是使用面积单元之间的距离定义接近性。如何测度任意两个面积单元之间的距离,有两种方法:(1)按照面积单元之间是否有邻接关系的邻接法(2)基于面积单元中心之间距离重心距离法NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY(1)边界邻接法(2)重心距离法NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY中心单元格为X,在“车行走方式”下的接近性相当于具有共享边界的情况,X有4个近邻,分别为BDGE。在“王后行走方式”下,周围8个面积单元都是X的近邻,这相当于按照距离的接近性定义,假设网格的边长为L,则中心之间的距离≤sqrt(2)L的网格单元定义为X的近邻。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.二元邻接矩阵共享边界的面积单元定义为近邻。两个单元共享边界,则权重矩阵的元素Wij=1,否则Wij=0,即根据重心距离也可得到类似于上式的权重定义:5.1.2空间权重矩阵NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY上述权重矩阵称为二元邻接矩阵,因为根据式(5.1)或式(5.2)定义的n个面积单元之间的接近性矩阵W是由0,1构成的。图5.3所示的面积单元之间的二元邻接矩阵NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY二元邻接矩阵C有很多重要的性质:①对角线元素Cij=0②矩阵具有对称性(Cij=Cji)③矩阵的行元素之和表示该空间单元直接邻居的数量,Ci.=Cij。∑NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY考虑任意一个面积单元的3阶最近邻,则得到接近性矩阵W如式(5.4)表示,这是一个非对称关系的接近性矩阵。矩阵各行求和的值,表示该行对应的面积单元的3阶近邻的数量。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY2.行标准化权重矩阵在二元邻接矩阵中,若面积单元是近邻则权重为1。已知二元矩阵1表示相对应的行和列上的面积单元是相邻的,因此对于每一行,行和记为Ci.,表示该面积单元的近邻的总数。用矩阵元素的值Cij除以Ci.就得到每一个近邻面积单元的权重Wij=Cij/Ci.NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY5.1.3重心距离与权重矩阵考虑到距离的远近对于变量值的贡献,接近性测度可定义为式(5.6)的形式,表示随着重心之间距离的增加,第j个面积单元对于第i个面积单元的影响呈指数下降。式中,γ是幂指数。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY两个多边形之间的距离定义存在多种方法。最为常用的是用两个多边形的重心间的距离表示多边形的距离。重心指的是多边形的几何中心。但确定多边形几何中心的方法有多种。一般而言,多边形的不规则性对几何中心的位置有重要的影响,计算的重心经常会出现在不合意的位置上。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY5.2面状数据中趋势分析空间数据的一阶效应反映了研究区域上变量的空间趋势,通常用变量的均值描述这种空间变化。一阶效应使用的方法主要是利用空间权重矩阵进行空间滑动平均估计。若面积单元数据是基于规则格网的,一般使用中位数光滑的方法,此外核密度估计方法也是研究面状数据一阶效应的常用方法。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY5.2.1空间滑动平均空间滑动平均是利用近邻面积单元的值计算均值的一种方法,称之为空间滑动平均。设区域R中有m个面积单元,对应于第j个面积单元的变量Y的值为yj,面积单元i邻近的面积单元的数量为n个,则均值平滑的公式为最简单的情况是假设近邻面积单元对i的贡献是相同的,即则有式子的作用是对变量进行空间滤波,或用于空间插值NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY5.2.2中位数光滑若面积单元是规则的格网,则常用的方法是用中位数光滑来估计趋势。趋势估计中使用中位数替代均值是因为均值对于离群值比较敏感,当数据中存在离群值时,中位数比均值更加稳健。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY一个变量的空间分布可看作是多种因素影响下的空间过程的一个实现,在这个空间过程中包含了全局趋势、局部效应和随机误差。于是对于规则格网表示的变量的空间分布情况,变量的值yij可表示成式(5.10)所示的分解:式中,μ是总的趋势;μi和μj分别表示的是行和列的效应,相当于局部效应;εij是随机误差。于是总的均值为NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY为了计算规则格网中变量的空间趋势,中位数光滑算法的一般过程如下:(1)将每一行的中位数记录在这一行的边上,并在每行中减去中位数。(2)计算行中位数的中位数,将其作为总的效应,从每一行中位数中减去总效应。(3)将每一列的中位数记录在这一列的下面,并在每一列中减去中位数。(4)计算列中位数的中位数,将其和总效应相加,从每一列中位数的总效应中减去这一数值。(5)重复步骤(1)~(4),直到行或列的中位数不再变化。经过上述步骤计算即可产生的每一个网格的值μij,作为均值的估计,提供了数据的全局趋势:NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY使用图5.5的数据说明中位数光滑方法的应用。图5.5是一个3X3的规则网格,对其进行的中位数光滑计算过程如下:(1)将每一行的中位数记录在这一行的边上,即记录于s+1列中,并在每一行中减去s+1列对应的中位数,添加r+1行,行元素充0,如图5.6。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY(2)计算行中位数的中位数,结果为5,将其作为总的效应,从每一行中位数中减去总效应,结果见s+1列(图5.7)NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY(3)将每一列的中位数记录在这一列的下面,并在每一列中减去中位数(图5.8)。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY(4)计算列中位数的中位数,将其和总效应相加,从每一列中位数的总效应中减去这一数值,到此步为止,行和列的中位数不再变化(图5.9)。于是表示在本例中所有单元格的均值都为5,而剩余的随机残差是各个网格中的数值减去该网格的均值。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY5.2.3核密度估计方法在点模式的研究中,核密度估计方法(简称核估计)被用于探索点密度的变化,也常用于描述连续数据的一阶趋势的变化,也同样可用于描述面状数据的一阶趋势。首先需要计算各个面积单元的重心Si,假设用对面积单元S(重心表示)周围的单元Si的变量值估计S的值,S和Si之间的距离用向量表示为d=S-Si,则面积单元S的估计为NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY式中,是面积单元s的估计;是核函数;是宽带,可解释为对s产生影响的距离。式(5.13)适用于面积单元中的变量是连续数值的情况。如果变量的值是计数值,面积单元内的观测是计数值,则不适用,需要改写核估计公式为式(5.14)表示单位面积内总的计数值。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY面积单元核估计的一个重要应用是从一种面积单元变换到另一种面积单元时的空间插值。由于核估计计算上比较繁琐,在面积单元转换的实际应用中常采用其他近似的方法来获得新的面积单元的数值估计。这些方法主要有:最近邻重心赋值法,重心对多边形赋值法,以及面积权重法。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.最近邻重心赋值法原则是用变换后的面积单元的重心计算其变换前的最近邻的面积单元的重心,用最近邻的重心对应的面积单元的值对变换后的面积单元赋值。2.重心对多边形赋值法这一方法将变换前的面积单元的重心和变换后的面积单元进行多边形叠加,根据重心落入的多边形对新的面积单元赋值。3.面积权重法根据一组面积单元和另外一组面积单元的叠加,用前一组面积单元落入的面积权重平均对另一组面积单元进行插值,获得新的面积单元中变量的估计。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY5.3空间自相关的概念5.3.1空间自相关空间自相关是空间地理数据的重要性质,空间上近邻的面积单元中地理变量的相似性特征将导致二阶效应。在面状数据的背景上,二阶效应又称为空间自相关。空间自相关是研究空间模式时间变化的有用工具。它能够提供理解空间模式从过去到现在、从现在到未来变化的知识,并且通过空间模式时间变化的研究能够揭示导致空间模式变化的驱动因子。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY空间自相关是根据位置相似性和属性相似性的匹配情况来测度的。图5.11是3种典型的空间自相关模式。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY5.3.2空间随机性为了研究面积单元的空间自相关,首先建立空间随机性的概念。Hanning则从完全独立性的角度提出了更为严格的定义,对于连续空间变量Y,若式(5.15)成立,则是空间独立的:式中,n为研究区域中面积单元的数量。若变量是类型数据,则空间独立性定义改写为式中,a,b是变量的两个可能的类型,i≠j。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGYHanning还描述了3类空间随机过程,其中前两种过程的因变量服从式(5.15)和式(5.16):(1)赋值到n个位置上的连续变量{Xj}来自于正态分布N(0,σ2)。(2)赋值到n个位置上的离散变量的值来自于n次硬币的投掷。(3)坐标为(i,j)的位置上的变量的值Yi