NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY空间数据分析方法毕硕本南京信息工程大学遥感学院NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.1空间分析的概念与研究进展1.2空间分析的研究内容1.3空间分析与地理信息科学第一章绪论NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.1空间分析的概念与研究进展NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.1.1空间分析的概念•Unwin(2003)著作《GeographicInformationAnalysis》进行了分析总结:•不同领域的文献中至少存在4种相互联系的空间分析概念,分别是:①空间数据操作(spatialdatamanipulation)②空间数据分析(spatialdataanalysis)③空间统计分析(spatialstatisticalanalysis)④空间建模(spatialmodeling)NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•空间数据操作:通常被称为空间分析。一般包括缓冲区分析、包含分析、相交分析、叠加分析、距离面积路径计算,以及基于空间关系的空间查询等简单的数据分析功能。•空间数据分析:指对空间数据的描述性和探索性分析技术和方法,是所有空间分析过程中的一个重要步骤,特别是对于规模庞大的数据集,通过将数据图形化或地图化的探索性分析技术,研究数据中潜在的模式、异常等,为后续的分析做准备。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•空间统计分析:用统计的方法描述和解释空间数据的性质,以及数据对于统计模型是否典型或是否如所期望。•空间建模:主要包括构建模型、预测空间过程及结果。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY在地理研究及相关研究中,基本上都包括了空间分析这四个方面:数据在GIS环境中存储并可视化;描述和探索性的数据分析技术提出问题并建议相应的分析理论或模型;在此基础上通过空间统计方法建立统计模型;在理论指导下对特定的问题进行空间建模分析和预测。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY综上所述,空间分析是能够揭示出比数据本身更多的信息和知识的一组分析技术或方法。地理学家用空间分析技术或方法研究地理对象或现象的分布模式、动态演化过程和空间相互作用规律,发展和检验地理模型,增进对地理信息的理解,创新地理知识。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.1.2空间分析研究的进展1.20世纪60年代的计量革命和目前仍然在发展的计量地理学方法是空间分析的重要内容。地理学的计量革命改变了地理学以记述和描述地理现象为主要研究手段的传统,促进了地理学定量分析技术的发展。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY2、1970~1980年,在这一时期围绕地理现象的空间本质或地理数据的空间性质,建立起了地理学的空间分析方法或体系。①Tobler于1969年提出了描述地理现象空间作用关系的“地理学第一定律”。使得地理现象的空间相关性和异质性特征在研究中得到重视。②Clifford在1973年出版的专著中揭示了空间自相关的概念,使研究者能够从统计上评估数据的空间依赖性程度③统计学家Ripley于1981年对空间点分布模式进行了卓有成效的研究和总结,提出了测度空间点模式的K函数方法等。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY④OpenShaw等对空间数据中的可塑面积单元问题进行了深入的探讨。⑤Anslin等提出描述局部相关性的测度方法和统计量LISA,成为研究某些现象分布模式的局部热点区域的重要方法。⑥随着对地理数据空间特殊性的重视和地理空间统计模型的提出,以描述全局特征为主的传统统计分析方法逐渐向以描述局部特征为主的统计分析方法转变。在这一时期考虑空间相关性的空间回归模型或空间自回归模型被提出并在计量经济学中得到重要的应用,导致了空间计量经济学的出现。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY这些对地理现象或地理数据空间特征的研究以及地理空间统计方法和模型的提出成为现代空间数据分析的转折点,也奠定了现代空间数据分析的理论基础。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY3、进入90年代后,空间分析的发展和GIS的发展密切结合在一起,是以GIS为计算环境的空间分析大发展的时期。推动因素包括以下四个方面:A.GIS数据革命极大地促进了空间分析在众多领域的应用。B.地理学家面临的数据环境发生了巨大的改变,大量的空间分析基于海量空间数据环境,迫切需要新一代的以数据为驱动的地理探索和建模工具,使得分析处理过程中数据丰富环境下的多维复杂性不能被忽略。C.高性能计算机的出现,为需要复杂的空间数据处理和地理知识表示的空间分析活动提供了可行的环境。D.神经网络、遗传算法等可应用的实用智能计算工具提供了空间分析的新范例。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.2空间分析的研究内容NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.2.1空间数据模型与地理世界的表示•空间数据主要描述地理实体或现象空间位置。•在表达离散和连续现象时分为两类主要的空间数据。•一种是实体型的世界观,空间现象被描述为0维的点对象,1维的线对象或2维的面对象。•后者通常根据对离散实体采样空间位置获得。•空间分析的目的在于观测单元的空间排列,但还可以考虑其属性信息。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.2.2探索性空间数据分析与可视化空间数据分析方法分为:—探索性数据分析方法;—数据可视化方法;—空间统计方法;—空间建模方法等。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.2.3空间数据的性质•空间数据性质:空间相关性、空间异质性,以及由尺度变化等引起的相关效应等。•空间效应分为:大尺度的趋势和局部效应。前者称为“一阶”效应,它描述的是某个参数均值的总体变化性;后者称为“二阶”效应,是由空间依赖性所产生,表达的是空间上近邻位置上的数值相互趋同的倾向,可通过其对于均值的偏差计算估计。•平稳过程:即假定当邻近的观测可能依赖时,它们独立于观测位置。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•各向同性:在平稳过程中,如果在不同位置上观测数据之间的协方差仅仅依赖于距离而与方向无关。•影响空间数据分析主要因素:A.地理尺度B.方向效应•面积单元问题:很多数据分析不得不依赖于根据某一特定空间聚集水平来概括数据信息,如果使用的是相同层次的聚集,根据这种分析做出的推断只在此层次上正确,被称为面积单元问题。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.2.4空间数据分析的点模式方法•空间数据类型:点数据、线数据、面数据、空间连续数据。•空间点模式:根据事件的空间坐标的分析技术,事件也可能包含属性信息。•数据的点模式:基于所有点事件的完全地图,或者是样本点分布模式。•空间点模式研究的重点:在于探测点事件的分布是随机的,或是聚集,或是均匀分布的模式。•聚类分析:根据点对之间或区域之间的关系进行分析。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•GIS空间点模式最常用的表示方法是点状地图、密度图等方式。•样方计数法:先将区域划分为面积相等的子区域样方,然后根据每一个样方中的事件数量计算概括统计量,这些技术给出的是空间基本过程的密度变化。缺点:将信息聚集到面状数据中,引起信息的损失。•核密度估计:使用原始的点位置产生光滑的密度图。点模式的二阶性质是基于点之间距离测度的研究方法。•最近邻距离估计有两种技术,即随机选择的事件及其最近邻之间的距离,或随机选择空间上的位置与最近邻的事件之间的距离。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•空间点模式的分析方法:离散指数法、Clark-Evans检验法、K-函数法等。•一个随机空间过程产生的点模式,应当遵守同质过程。这意味着研究区域中的每一个事件是以等概率发生在区域的任意位置上,并且其发生独立于空间任意位置和其他的事件。因此完全随机过程式不存在“一阶”或“二阶”效应。•模型的G方法,构造了基于距离的统计量,可用于评价点模式和面模式的空间自相关问题,还可用于检验用全局方法不能检验的空间依赖的局部热点区域。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.2.5面数据的空间分析方法与空间回归模型•在面数据的分析中,首先需要研究的是它的表达方法,一般通过设色地图进行可视化。•对于面数据的空间分析,需要研究面数据的许多性质,例如,多边形的几何性质和相互之间的接近性的测度方法,空间自相关性的测度方法等。•对于面数据同样需要研究其“一阶”效应和“二阶”效应。描述“一阶”效应的方法有空间滑动平均核估计方法等。“二阶效应”主要由Moran’I和Geary’C两个指标反映。•在面数据空间相关性分析的基础上,可深入分析空间背景上变量之间的回归关系,一般通过两种途径建模:一种是空间回归模型,另一种是地理加权回归模型。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.2.6空间连续数据的分析技术•空间连续数据经常被称为地统计数据。•空间连续数据以及面状数据的分析中,重点是使用属性信息来描述空间模式。•其数据通常是对空间上固定点的采样数据。•分析的主要目标是使用样本采样点上收集的数据描述属性值的空间变化。空间变化可被模拟为一阶和二阶的空间过程。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•空间连续数据“一阶”效应的分析方法,描述的是要素分布的全局趋势,主要有空间滑动平均、镶嵌方法、核估计方法和趋势面分析。•空间滑动平均方法:在给定的近邻样采样点之间内插数值。例如倒数距离加权法,通过引入距离加权机制来说明采样点之间的距离的变化对于插值点数值的贡献。•Delauney三角形:又被称为不规则三角网(TIN)。根据Delauney三角形可以得到Voronoi多边形。可用于构造等高线地图或数值地形模型(DTM)。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY•“一阶”方法缺点:忽略了局部性和空间相关性等因素,在很多应用中会带来偏差,而且其偏差难以估计。•“二阶”效应的分析方法的典型是克立格方法或地统计方法。•方差图描述的是一个协方差随着样本距离的变化而变化的函数。•相关图是相关性随着样本点距离的变化而变化的函数。•半方差图是采样点之间距离和方向变化时的方差的图形表达。NANJINGUNIVERSITYOFINFORMATIONSICENCE&TECHNOLOGY1.2.7地图代数与栅格数据建模技术•地理世界存在两种表达的方法:连续的和离散的。以连续的世界观为基础发展起来的是基于栅格模型的GIS,而在离散的世界观上发