第5章GIS空间分析方法5.1基于栅格数据的GIS空间分析5.1.1栅格叠加分析5.1.2栅格缓冲分析5.1.3栅格邻域分析5.1.4栅格窗口分析5.1.5栅格地形分析5.2基于矢量数据的GIS分析5.2.1矢量地理查询5.2.2矢量缓冲分析5.2.3矢量叠置分析5.2.4矢量网络分析5.2.5矢量地形分析5.2.6矢量邻域分析5.1基于栅格数据的GIS空间分析在栅格数据模型中,使用的是一种规则格网来覆盖这个空间,该格网的每个像元值对应于该单元格位置上空间现象的特征。图5.1栅格数据点、邻域、区域的概念图示5.1.1栅格叠加分析栅格数据的叠加分析主要是逐点运算和区域运算。5.1.1.1逐点运算1.逐点运算的原理是以网格为单位,即逐个网格地进行栅格数据分析,逐点运算输出的网格值为同点输入网格值的函数。2.逐点运算可分为三种:(1)数据的重新分类(Reclassification)(2)数值计算(Computation)(3)逐点叠置分析(Location-SpecificoverlayAnalysis)。(1)重新分类•重新分类运算是以一个栅格图层为输入,并根据一定的分类规则或逻辑运算规则,将每个网格值重新分类,输出的图层是一个新的栅格图层,即表示每个网格重新分类后的新值。•重新分类运算主要应用包括以下几种:数据分离数据简化数据分等图5.2重新分类运算图示(2)数值计算•数值计算以一个栅格图层为输入,对输入的每个网格值作一定的数学运算,以一幅新的栅格图层输出运算的结果。•GIS中用于栅格数据逐点数值计算的常用数学运算见表5.1。例子:图5.3数值计算示意图(3)逐点叠置分析•传统的地图叠置分析方法是先将参与分析的地图分别复制到透明片上,然后将这些透明片一层层叠置在透光桌上,通过目视分析各现象之间的联系或空间对应关系,再根据各现象属性之间的不同组合进行分类,勾绘出反映各现象组合特性分类的区域范围,最后,才制作一幅新的地图。可以基于GIS模拟上述手工地图叠置分析,并将这一过程自动化。•GIS叠置分析是地理数据综合分析的一种地图分析方法,即将若干同一地区、不同专题的地图在统一的地表定位参照系统下叠置在一起,分析或模拟多种地表现象在空间上的相互联系,或进行某些现象的区域统计分析,主要的操作有“并”、“交”、“或”等。•在栅格GIS中,逐点叠置分析是对两个或两个以上的输入栅格图层中同一位置(行、列)上的两个或两个以上的网格值进行逻辑、规则、算术或统计分析运算,以一个新的栅格图层直接输出运算的结果,或根据运算的结果对网格进行分类,以新的栅格图层输出分类的结果。GIS中常用叠置分析的逻辑、规则、算术和统计分析运算见表5.2。(a)(b)图5.4逻辑叠置分析(c)图5.5属性叠置分析图5.6规则叠置分析图5.7叠加分析中的组合运算图5.8福州土地利用类型动态变化图示注意:在逐点叠置分析中有两个需要特别注意的问题。(1)若参与叠置分析的栅格图层的网格精度不一致,应当将它们统一到其中最差的网格精度。比如,两个用于叠置分析的栅格图层,一个网格精度为10m(即网格边长为10m),另一个为40m,在将它们叠置在一起之前,应对网格精度为10m的图层进行转换,如通过使用空间聚集运算将网格合并(稍后介绍),使其网格精度降至40m。(2)在对栅格图层进行某一叠置分析运算时,需要理解每个参与叠置分析的栅格图层中网格值的数据类型,避免产生无意义的结果。例如,一个栅格图层以整数为代码表示土地利用类型(如1表示森林,2表示草地),另一个栅格图层以浮点数表示年均降雨量,对这两个栅格图层进行算术叠置分析是没意义的。5.1.1.2区域运算•一个区域可以是一组相邻接的网格,也可以是由若干相互不相连但具有相同属性值的网格组成。•区域运算则是根据输入网格值的类别将全区划分为一系列区域,计算每个区域的几何特征,或根据包含在每个区域内的网格值计算输出网格值。•在栅格图层中,一个区域由具有相同特性或属性值的网格组成。•例如,全中国水稻种植区不连续地分布在全国各地,但它们可定义为同一个区域。•区域运算是以区域为单位分析和操作栅格数据,主要有三组:区域单元识别、分区叠置分析和几何量测。1.区域单元识别•该运算将同值的相邻接的网格组合成区域单元(相当于矢量模型中的一个多边形),并赋予每个区域单元一个唯一的识别码。•例子(图5.9)。一个包含有三种森林类型的栅格图层经区域单元识别运算后,划分出五个区域单元,并赋予每一个区域单元不同的标识码。尽管松树林和栎树林分布于多处,但它们互不相连,因此,分别以不同的区域单元输出。这一运算主要用于涉及到要求对每一个区域单元进行逐一分析的GIS应用。11-松树林12-榕树13-桉树图5.9区域单元识别运算图示1125551125552125552223552223343333341125551125552125552223552223343333342.分区叠加分析(1)概念:分区叠加运算是以一个输入栅格图层中定义的区域为单位,对另一个输入栅格图层表示的地理数据作某种数学或统计计算,表达各区域内某种地理实体分布的数量特征。(2)分区与逐点比较:–逐点叠加分析是对多个输入栅格图层中相同位置上的网格值进行逻辑、规则、算术和统计运算,以建立多种地理实体在空间上的相互联系,或根据多种要素分析、模拟某一现象的过程。–分区叠加分析则主要是根据表示在一个输入栅格图层上的区域边界,对位于每一区域范围内的另一输入栅格图层中的网格值逐个区域地进行运算,用于分区或分类统计。–分区叠加分析与逐点叠加分析在概念上以及在分析应用的目的上是不一样的。•例子:例如,将一个表示某省县级行政区划的栅格图层与一个表示该省土地利用分布的栅格图层叠置起来,可以分析每个县区范围内主要的土地利用类型,以及各类土地利用所占的面积和比例。又如,在市场分析中,常将一个表示区级行政界线的栅格图层与表示人口数据的栅格图层叠置起来,统计每个区人口的大小、家庭的平均收入、年龄结构和教育程度等。•表5.1中列出的统计分析运算都可运用于分区叠置分析。•图5.10给出了一个分区叠置分析的例子,图5.10分区叠加分析图5.11以土地利用类型为区域单元,统计各类型受淹面积3.几何量测•区域运算中的几何量测主要是区域面积、周长、宽度和形状特征的计算。•在一幅栅格图层上,一个区域的面积是位于该区域范围边界内所有网格面积的总和,可由位于区域内网格的总数乘以一个网格的面积计算获得。一个区域的周长等于形成该区域边界的外围网格边的总数乘以一个网格的边长。•例子(如图5.12所示)。图5.12区域面积和周长的计算5.1.2栅格缓冲分析•栅格数据的缓冲分析原理主要基于邻域运算。它以一个栅格图层为输入,根据每个网格周围某一邻域内所有网格值计算输出网格值,并产生一个新的图层,即邻域运算输出的每一个网格值为该网格邻域内所有输入网格值的函数。•在运用邻域运算计算每个网格的新值时,首先要定义一个邻域。一个待计算的网格称为焦点网格(FocalCell),其邻域所包含的网格称为邻域网格(NeighbouringCell)。一个网格的邻域(Neighbourhood)是根据一定的形状和大小定义的,它可以是一定大小的以该网格为中心的正方形,也可以是以该网格为圆心的圆(Circle)、圆锥(Wedge)或圆环(Ring)。最常用的邻域则由围绕焦点网格最邻近的四个网格或八个网格组成。•如图5.13所示。图5.134网格邻域(a)和8网格邻域(b)图一个焦点网格及其邻域组成的区域称为一个窗口(Window)。邻域是指“具有统一属性的实体区域或者焦点集中在整个地区的较小部分实体空间”。邻域运算包括三组:空间聚焦、过滤、坡度和坡向计算。邻域分析就是在特定的实体空间中发现其属性的一致性。领域包括直接邻域和扩展邻域。1.空间聚焦(1)栅格数据的空间聚集运算实际上是一个地图综合的过程,运算时用较大的网格对栅格数据重新采样(Resampling),以减少网格数量、降低栅格数据的空间精度。空间聚集运算不是对栅格数据进行压缩,而是以较大的网格表示同一地区。该运算采用一定大小的矩形窗口或邻域计算,窗口一般与输出网格等大,窗口越大,综合程度就越高,有关地理实体的细节也就丢失得越多。(2)输出网格值的计算主要有三种方法:①中心网格值法(Central_CellMethod),以位于窗口为中心的输入网格值为输出网格值;②平均值法(AveragingMethod),计算窗口内所有输入网格值的平均值,以此作为输出网格值;③中数法(MedianMethod),以窗口内所有输入网格值的中数(Median)为输出网格值,如图5.14显示了空间聚集运算的三种方法(将6×6的栅格图层转换成2×2的栅格图层)。图5.14空间聚集运算法图示•栅格数据的空间聚集是环境研究中地理数据分析的一个重要过程。一般,环境研究中的地理数据是以适合于局部地区分析的较大比例尺采集的,通常需将它们综合、简化,转换成较小比例尺的数据,以适合于区域性和全球性分析的需要。2.过滤(1)过滤运算(Filtering)–运用一个移动窗口(MovingWindow),以每个输入网格为焦点网格,逐网格地对以移动窗口定义的邻域中所有网格值进行特定的运算,计算每个网格的新值。–如图5.15所示,典型的移动窗口为3×3或5×5矩形。(2)领域统计分析–过滤运算是将统计分析方法运用于移动窗口中的焦点和邻域网格值,计算出焦点网格的输出值。因此,过滤运算又称为邻域统计分析(NeighbourhoodStatisticsAnalysis)。–图5.16给出了示例,这些例子使用3×3矩形移动窗口,图中只显示了绘有晕线的网格输出值。图5.15邻域运算中移动窗口的概念图5.16栅格数据的过滤运算例子3.坡度和坡向(1)坡度•邻域运算还常用于根据栅格高程数据或基于栅格数据结构的数字高程模型计算坡度和坡向。数字高程模型(DigitalElevationModel,简称DEM),不仅包含高程属性,还包含其它的地表形态属性,如坡度、坡向等。•DEM通常用于地表规则网格单元构成的高程矩阵表示,广义的DEM还包括等高线、三角网等所有表达地面高程的数字表示。•DEM生成方法可以利用规则格网模型(是最主要的形式,如GRID)、等高线模型、不规则三角网模型(TIN)、层次模型(如金字塔(Pyramids))等,它们各有优缺点。规则格网模型•优点:–规则格网的高程矩阵,可以很容易地用计算机进行处理,特别是栅格数据结构的地理信息系统;–还可以很容易地计算等高线、坡度坡向、山坡阴影和自动提取流域地形;–为DEM最广泛使用的格式•缺点:–不能准确表示地形的结构和细部格网;–数据量过大,给数据管理带来了不方便;–通常要进行压缩存储等高线模型•优点:–直观–便于理解•缺点:–只表示离散的数据,不能表示连续的数值或面状色彩填充地物特征;–不便于坡度计算、地貌晕渲等不规则三角网模型(TIN)•优点:–减少规则格网方法带来的数据冗余–在计算(如坡度)效率方面有优于纯粹基于等高线的方法–利用复杂地形的表达•缺点:–在地形平坦的地方,存在大量的数据冗余;–在不改变格网大小的情况下,难以表达复杂地形的突变现象;–某些计算,如通视问题,过分强调网格的轴方向层次模型•优点:–数据简单–顺序查询•缺点:–因层次的数据导致数据冗余;–自动搜索的效率低,例如搜索一个点可能先在最粗的层次上搜索,再在更细的层次上搜索,直到找到该点数据高程模型:栅格数据DEM的表示方法将区域划分成网格,记录每个网格的高程,是线模型到高程矩阵的转换。•优点:–计算机处理以栅格为基础的矩阵很方便,使高程矩阵成为最常见的DEM;•缺点:–在平坦地区出现大量数据冗余;若不改变格网大小,就不能适应不同的地形条件;在视线计算中过分依赖格网轴线。(2)坡向•在GIS中,DEM是建立数字地形模型(DTM)的基础数据,其它的地形要素可由DEM直接或间接导出,这种数据,称为“派生数据”,如坡度、坡向等。•坡度是地表单元陡缓的程度,由地表单