空间统计分析实验报告一、空间点格局的识别1、平均最邻近分析平均最邻近距离指点间最邻近距离均值。该分析方法通过比较计算最邻近点对的平均距离与随机分布模式中最邻近点对的平均距离,来判断其空间格局,分析结果如图1所示。图1平均最邻近分析结果图最邻近比率小于1,聚集分布,Z值为-7.007176,P值为0,即这种情况是随机分布的概率为0计算结果共有5个参数,平均观测距离,预期平均距离,最邻近比率,Z得分,P值。P值就是概率值,它表示观测到的空间模式是由某随机过程创建而成的概率,P值越小,也就是观测到的空间模式是随机空间模式的可能性越小,也就是我们越可以拒绝开始的零假设。最邻近比率值表示要素是否有聚集分布的趋势,对于趋势如何,要根据Z值和P值来判断。本实验中的最邻近比率小于1,聚集分布,Z值为-7.007176,P值为0,即这种情况是随机分布的概率为0,该结果说明云南省详细居民点的分布是聚集分布的,不存在随机分布。2、多距离空间聚类分析基于Ripley'sK函数的多距离空间聚类分析工具是另外一种分析事件点数据的空间模式的方法。该方法不同于此工具集中其他方法(空间自相关和热点分析)的特征是可汇总一定距离范围内的空间相关性(要素聚类或要素扩散)。本实验中第一次将距离段数设为10,距离增量设为1,第二次将距离段数设为5,距离增量同样为1,得到如图2和图3所示的结果。从图中可以看出,小于3千米的距离内,观测值大于预测值,居民点聚集,大于3千米,观测值小于预测值,居民点离散。且聚集具有统计意义上的聚集,离散并未具有统计意义上的显著性。图2K函数聚类分析结果1图3K函数聚类分析结果23、密度制图前面的最邻近分析和K函数聚类分析只能得到从数值上的出空间分布的状态,但并不能直观看到分布集聚或分散的位置、形状和大小。密度制图根据输入点要素的数值及其分布来计算整个区域的密度分布状况,并产生一个连续的栅格图形,利用密度制图可以通过密度显示点的聚集情况。图4核密度制图结果小于3千米,居民点聚集,且聚集具有统计意义上的聚集,大于3千米,居民点离散,离散并未具有统计意义上的显著性在核密度分析中,落入搜索区内的点具有不同的权重,靠近网格搜索中心的点会被赋予较大的权重,随着与其网格中心距离的加大,权重降低。图4中的值为详细居民点之间的距离的密度,从图中可以看出居民点密集的地方核密度分析的值越大,居民点越密集,如上图中用红色椭圆圈出来的区域,该地区位于滇东南,居民点比较密集,可能与该地区的地形、气候等因素有关。二、中心位置测度分析本实验中的测度分析包括云南省居民点的中心要素、平均中心和中位数中心,结果如图5所示。中心要素表示居民点中处在最中心的居民点,平均中心计算的是所有居民点质心的平均中心,中位数中心计算的是可使所有居民点的欧式距离达到最小的点。平均中心和中位数中心的计算以GDP为权重,所以计算出来的平均中心和中位数中心为云南省的经济中心,而中位数中心在计算的时候受异常值的影响较小,所以计算经济中心时一般以中位数中心为准,如图5中以GDP为权重计算出的中位数中心位于昆明市,与昆明市是云南省的经济中心相一致。图5中心位置测度分析结果中心要素平均中心中位数中心三、离散度的测度分析图6离散度测度分析结果离散度测度分析的结果如图6所示,本实验中的离散度分析采用的是标准距离和标准差椭圆。标准距离创建的是一个包含以平均中心点为中心的圆面,半径为标准距离值,表示要素集中分布的范围;标准差椭圆创建的椭圆的中心同样为平均中心,有两个不同的标准距离,表示要素集中分布的趋势。本实验中的离散度分析以GDP为权重来进行分析,结果如图6所示。图中的数据显示云南省居民点主要集中分布在中部和东部地区,是一个以安宁市为中心,半径为198千米的圆,说明云南省经济较发达的区域集中在以安宁市为中心的,半径为198千米的圆内,集中分布的趋势为东北西南走向。四、空间自相关和事物属性的空间分布格局某类事物的出现(例如犯罪、某类用地、某居住空间等)是否造成了周边同类或异类事物或现象的出现,即空间是否自相关;找到某类事物或现象异常聚集的空间位置(例如低收入阶层聚集),以利于分析聚集的原因。空间自相关是指分布于不同空间位置的地理事物,热门的某一属性存在同价相关性,通常距离越近的两值之间的相关性越大,具体可分为空间正相关和负相关,常用Moran指数来表示。本实验通过分析来判断是否存在高收入和高收入聚集,低收入和低收入聚集,或者高低收入相邻分布。一般情况下,适度的集聚可以更有效地满足不同阶层人的需求,但过度的高高收入和低低收入聚集会加剧居住空间分异,阶层对立,也容易引发各类环境问题及社会矛盾,同时集聚也关乎社会资源的分配。1、全局自相关统计图7全局自相关统计报表对于GlobalMoran'sI统计量,零假设声明,所分析的属性在研究区域内的要素之间是随机分布的;换句话说,用于促进观察值模式的空间过程是随机的。本实验中的z值为2.671575,大于0,表示云南省经济状况存在着空间自存在空间自相关聚集分布相关,存在着聚集分布的趋势,即经济发达的地区周围的区域还是经济发达,经济落后区域周的区域还是经济落后,但是光靠Moran指数还无从判断是高高聚集还是低低聚集,可进一步采用高低聚类分析来判断是高高收入聚集还是低低收入聚集。2、高、低聚类(Getis-OrdGeneralG)由于Moran'sI指数不能判断空间数据是否显示高聚集还是低聚集,该分析也是用z值来检验空间自相关的统计显著性,但不同的是,z值得分为正值是意味着高高集聚,为负值意味着低低集聚。图7高、低聚类报表高值聚集最后得到的结果z值为4.519258,大于0,说明云南省的经济情况分布不均衡,存在着高高聚集的状态,正常情况下应该高低值都有,过于不均衡的聚集会导致社会矛盾的出现,本实验中出现这个现象的原因可能是因为数据的问题,但也不能排除这种高值聚集现象的出现。应该看高值出现的区域具体是在哪里,根据该地区的情况来分析高值出现的原因。五、空间模式分析—局部空间自相关1、聚类和异常值分析聚类和异常值分析,用于发现局域空间是否存在空间自相关,他计算每一个空间单元与邻近单元就某一属性的相关程度。HH为高高聚集,HL为高低聚集,LL为低低聚集。从下图中可以看出,在昆明和玉溪出现了几个高高聚集的点,其他的点均为无效的点,说明在云南省存在着一定的居民收入分布不均的情况,高收入主要集中在昆明市、安宁市和玉溪市。昆明地区不用说是云南省的政治经济文化中心,其产业的发展是全省较好的,所以出现了高值;玉溪市距昆明较近,交通发达,其烟草行业带动了该地区的经济发展,使得该地区的居民收入增加。图8聚类和异常值分析结果图2、热点分析热点分析是可以较准确地探测出局域空间自相关的有效方法,它能较准确地探测出聚集区域,而聚类和异常值分析(AnselinLocalMoranI)对聚集范围的识别偏差较大,能大致他侧出聚集区域的中心,但探测出的范围小于实际范围。在上述聚类和异常值分析的实验中,实验结果表明昆明市市区和安宁市以及玉溪市存在着高高聚集的,但是热点分析做出来的实验结果表明高高聚集这个状态的范围更广,存在于昆明市大大部分地区、玉溪市的少数地区以及楚雄市的武定县,而不是只有之前的三个地方。p值小,z得分越大,高值聚集;z得分越小,低值聚集。在下图中,热点分析值表示的市z得分下图表明,在云南省不存在者低低聚集的情况,这和实际有一定的区别,肯可能与实验的数据有关。除了在昆明和玉溪地区存在着高高聚集外,在曲靖市也存在着高高聚集,但是其聚集的显著情况低于昆明和玉溪地区。图9热点分析结果图