空间自相关分析在地学中的应用2007年科技成果交流刘永生汇报内容空间自相关概念应用实例结论“任何事物间都存在着关系,但距离越近关系越大”——Tobler’sFirstLaw(TFL)(Tobler1970)。地理学第一定律时间上和空间上的相关性是自然界存在秩序、格局和多样性的根本原因之一(Goodchild,1996)在对地学数据的处理研究中,必须面对的一个很重要的问题就是数据之间广泛存在空间自相关。由于空间信息的自相关特性,经典的线性回归模型在此无能为力。在空间分析中,空间自相关分析是一个非常重要的领域。计算空间自相关的方法有很多种。用的最广的主要有:Moran’sI、Geary’C、Getis、Joincount等等,但这些方法作用不是很相同。一般来说,这些方法从功用上来说大致可以分为两大类:一为全域型,另一为区域型。全域型方法是探索整个空间上属性数据的分布模式以及空间结构情况,而局域型空间分析方法可以进一步探索属性数据在空间上的聚集行为、聚集位置等空间信息。在许多研究中,Moran’I和Getis是最被经常使用的方法。空间统计参数(TheGeneralCross-ProductStatistic)ijijijWC(Hubertetal.1981;UptonandFingleton,1985)空间权重(Wij)构造方式(1040,lag=1km)(1040,lag=1.5km)(1040,lag=2km)(1040,lag=3km)1211()()()()nnijijijinnnijiijiiWxxxxnIdWxx如果某些位置的观测值在距离(d)的范围内倾向于相似,那么MoranI是正相关的,如果不相似则为负相关。如果观测值在空间上完全独立并呈随机分布的话,MoranI的值接近为0。(Moran,P.A.P,1950)()()()()IdEIZdVarIMoranI标准化的公式:当需要进一步考虑是否存在观测值的局部空间集聚,哪个区域单元对于全局空间自相关的贡献更大,以及空间自相关的全局评估在多大程度上掩盖了局部不稳定性时,就必须应用局部空间自相关分析(LISA)(Anselin,1995)。iiijjjIzwz其中,iizxx,(观测值的偏差)。以Rook方式为例:abcdefghi963852741abcdefghia010100000b101010000c010001000d100010100e010101010f001010001g000100010h000010101i000001010MoranI=0.5统计意义?在开源自由统计软件R2.5.1环境下进行编程处理。R是一种为统计计算和图形显示而设计的语言及环境,它提供了一系列统计和图形显示工具。空间自相关利用软件包spdep-0.4-6进行计算。library(foreign)library(maptools)library(SparseM)library(tripack)library(spdep)library(combinat)vect=c(1,2,3,4,5,6,7,8,9)#网格中9个值rook3x3=cell2nb(3,3)#生成3*3的网格WIJ=nb2mat(rook3x3,style=B)#生成网格权重N=9#LOOP=10000I=numeric(LOOP)#MI=numeric(LOOP)for(loin1:LOOP){#combn函数是在vect中产生的9!个排列中每循环一次就在总的排列中选择一个样本,这样#循环LOOP次就产生LOOP个vect的排列vector=combn(vect,9,sample)WCIJ=matrix(NA,N,N)for(iin1:N){for(jin1:N){if(WIJ[i,j]==0)WCIJ[i,j]=0elseWCIJ[i,j]=WIJ[i,j]*(vector[i]-mean(vector))*(vector[j]-mean(vector))}}sumWCIJ=0for(iin1:N){for(jin1:N){sumWCIJ=sumWCIJ+WCIJ[i,j]}}sumV=0for(iin1:N){sumV=sumV+(vector[i]-mean(vector))^2}sumW=0for(iin1:N){for(jin1:N){sumW=sumW+WIJ[i,j]}}I[lo]=(N/sumW)*(sumWCIJ/sumV)#比较通过一步一步算得I值与用spdep里的moran函数计算的值,结果一样。#listW=nb2listw(rook3x3,style=B)#conf=summary(listW)#MI[lo]=moran(vector,listW,conf$n,conf$S0)$I}win.metafile(filename=MoranI.wmf,width=5.96,height=4.08)#par(pin=c(4.5,2.5),mar=c(4.3,4.1,0.3,0.3))plot(density(I),main=Moran'I概率密度图)dev.off()-1.0-0.50.00.50.00.51.01.5Moran'I概率密度曲线N=10000Bandwidth=0.0353Density0-1.962.5%1.962.5%显著性检验1211()()()()nnijijijinnnijiijiiWxxxxnIdWxx110011001100110011001001100110011001100111001100110011001100100110011001100110011100110011001100110010011001100110011001110011001100110011001001100110011001100111001100110011001100100110011001100110012468101214-1.0-0.8-0.6-0.4-0.20.00.2距离moran'I2468101214-10-505距离Z(I)1111110010010010010011111100100100100100111111001001001001001111110010010010010011111100100100100100111111001001001001001111110010010010010011111100100100100100111111001001001001001111110010010010010024681012140.00.20.40.60.8距离moran'I2468101214051015202530距离Z(I)11111111111111111111111001001110010011111001001110010011111111111111111111111110010011100100111110010011100100111111111111111111111124681012140.00.10.20.30.4距离moran'I2468101214-20246距离Z(I)11111111111111111111111111111111111111111111100100111111111001001111111111111111111111111111111111111111111124681012140.00.10.20.30.4距离moran'I2468101214-20246距离Z(I)空间最大变异距离研究应用实例刘永生,李瑞敏.不同方法下土壤重金属元素空间最大变异距离研究.岩矿测试,2007,26(4)实例一:重金属元素的半变异函数图重金属元素理论模型块金值基台值变程/km块金系数拟合度As指数模型0.0800.28015.1880.2850.896Cd指数模型0.0720.1267.7140.5690.763Cr指数模型0.0500.13137.3740.3790.820Cu指数模型0.0860.18213.0210.4710.894Hg指数模型0.2200.90724.7600.2420.910Pb指数模型0.0230.24726.6790.0930.973Ni指数模型0.0520.15523.6420.3370.876Zn指数模型0.0390.08317.4240.4650.871土壤重金属元素半变异函数参数重金属元素的空间自相关变化图(Moran’sI)重金属元素的空间自相关标准化图(1km间隔)重金属AsCdCrCuHgPbNiZn地质统计法15.27.737.413.024.826.723.617.4空间分析法158241216262413不同途径求得的重金属空间变程(km)(1)从两种途径得到的空间变程来看,空间自相关分析法得到的空间变程最为稳定,也最为直观,而地质统计法得到的空间变程随着拟合模型的不同其结果变化较大,两种方法可以互相比较。(2)地质统计学是通过对模型的拟合来得到重金属元素的空间最大变程,其优点是若模型选择得好,拟合效果就比较好,得到的最大变程也就越准确,但由于空间数据的复杂性,往往很难找到能够拟合的非常好的模型,有时常用的经验模型都拟合得很差,而导致最后结果不准确。(3)全域型空间自相关分析法是通过空间单元间的邻接关系来分析空间数据的特征,它不但能得到空间属性数据的正相关尺度,还能得到负相关尺度,但由于其计算方法复杂,得到的属性数据空间变程的精度依赖于计算的空间距离,计算的空间距离越短,数据越多,计算时间也就越长。在元素空间分布模式方面的探索实例二:1040个点空间自相关性强的点分布(Al2O3)图(297,1公里尺度)(浙江上虞数据)P值0.05空间自相关性强的点分布(Al2O3)图(67,1公里尺度)(浙江上虞数据)P值0.05空间自相关性强的点分布(Al2O3)图(379,2公里尺度)(浙江上虞数据)P值0.05空间自相关性强的点分布(Al2O3)图(260,2公里尺度)(浙江上虞数据)P值0.05AlBCaCeMgONNa2OOrgCSSeSiO2K2OLa674094751175152934412611922541966180As、Cd、Cr、Cu、F、Fe2O3、Hg、Mn、Mo、Ni、P、Pb、Y、Zn为什么?1公里尺度P值0.05其他应用领域:崩塌、滑坡空间分布特征?(遥感方法解译的)地面沉降?地下水降落漏斗?初步结论(1)在地学研究中,涉及空间位置与空间属性时可考虑用空间统计技术。(3)空间自相关分析在地学信息的空间最大变程获取上较地质统计学快捷和准确。(4)在地质指标监测的空间布设上,空间自相关技术是值得考虑的手段。(2)空间自相关技术可以用于探寻地学信息在空间上的分布结构特征。谢谢大家,请批评指正!