第五章空间数据分析空间数据分析,也称空间分析,是分析空间数据的技术的通称空间数据的空间特征分析:从空间对象的形态、位置、关系等角度去分析空间数据,从中获取空间信息和规律属性特征分析:着重研究空间对象的属性特征点线面一、空间对象的特征值一、几何形态点-线-面-体4类空间对象各自具有不同的几何形态,可以用评价指标来衡量:点:坐标,高程(或其他要素值)线:长度,方向,曲率面:面积,形状,边界长度,朝向体:体积,坡度,坡向,剖面1.长度矢量数据:点对坐标(x,y)或(x,y,z)的序列在不考虑比例尺的情况下,线长度的计算公式为:栅格数据:线状地物的长度就是累加地物骨架线通过的格网数目,骨架线采用8方向连接,当连接方向为对角线方向时,还要乘以。2.曲率曲率:就是针对曲线上某个点的切线方向角对弧长的转动率,通过微分来定义,表明曲线偏离直线的程度。数学上表明曲线在某一点的弯曲程度的数值。曲率越大,表示曲线的弯曲程度越大。曲率的倒数就是曲率半径。3.面积矢量数据:面状地物是以其轮毂边界弧段构成的多边形表示的,对于没有空洞的简单多边形,设面状物体的轮廓边界由一个点的序列P1(x1,y1),P2(x2,y2),…,Pn(xn,yn)表示,其面积为:SS1S2有环岛的面状地物面积计算面积4.形状目标物的外观是多变的,很难找到一个准确的量对其进行描述。基本考虑:空间完整性、多边形形状特征。当把城市作为单个面状目标看待时,可以直接使用面状目标的形状系数,如形状率、圆形率、紧凑度等,这些指标计算较简单,但只反映一个抽象的形状;当把城市作为面状目标的集合看待时,可以使用放射状指数、标准面积指数等形状系数,这些指标计算较复杂,但反映了城市内部的具体联系。在多数指标中,都以圆形作为城市的标准形状。形状比=A/L2其中,A为区域面积,L为区域最长轴的长度。该指标能反映城市的带状特征,城市的带状特征越明显则形状比越小。显然,如果城市为狭长带状分布,其长轴两端的联系是不便捷的。1)形状比(FORMRATIO)伸延率=L/L’式中,L为区域最长轴长度,L’为区域最短轴长度。该指标反映城市的带状延伸程度,带状延伸越明显则延伸率越大,反映城市的离散程度越大。2)伸延率(ELONGATIONRATIO)紧凑度有三个不同的计算公式。公式1:紧凑度=其中,A为面积,P为周长。该指标反映城市的紧凑程度,其中圆形区域被认为最紧凑,紧凑度为1。其它形状的区域,其离散程度越大则紧凑度越低。PA/23)紧凑度(COMPACTNESSRATIO)PAU2圆U=1U1膨胀型U1紧缩型其中,A为区域面积,A’为该区域最小外接圆面积。该指标同样认为圆形区域最紧凑,其紧凑度为1。在计算中采用最小外接圆面积作为衡量城市形状的标准。公式2:紧凑度指数=A/A’其中,L为最长轴长度,A为区域面积。该指标也认为圆形为标准形状,但它只考虑最长轴长度,只能概略地反映城市形状。公式3:紧凑度=1.273A/L2放射状指数有两个不同的计算公式,较常使用的计算公式为:放射状指数=式中,di是城市中心到第i地段或小区中心的距离,n为地段或小区数量。这一指标不单纯是从抽象的形状入手,而是综合了城市内部各小区的位置特征。通过距离(可以结合时间、阻力等线路因素)反映城市中心与区内各部分之间的具体联系。niniiindd11|)/100()/100(|4)放射状指数(RADIALSHAPEINDEX)式中:S为标准面积指数;A为区域面积;As为与区域面积相等的等边三角形面积。标准面积指数能反映城市形状的破碎程度。城市形状越破碎,则其与等边三角形的交集越小而并集越大,所以其比值越小。不过,通常认为圆才是真正的紧凑形状,而并不是等边三角形。ssAAAAS5)标准面积指数5.坡度和坡向坡度:水平面与局部地表之间夹角的正切值,包含斜度(高度变化的最大值比率,常称为坡度)和坡向(变化比率最大值的方向)影响到地区的稳定度及水流速度;坡度的缓急可以从等高线的疏密程度判知;(1)等高线较疏的地区,地势较平坦;(2)等高线较密集的地区,则地势较陡峭;(3)当许多等高线密集在一起时,则表示该地为悬崖峭壁。坡度的表示方法有百分比法、度数法、密位法和分数法四种,其中以百分比法和度数法较为常用。(1)百分比法表示坡度最为常用的方法,即两点的高程差与其水平距离的百分比,其计算公式如下:坡度=(高程差/水平距离)x100%(2)度数法用度数来表示坡度,利用反三角函数计算而得,其公式如下:tanα(坡度)=高程差/水平距离所以α(坡度)=tan-1(高程差/水平距离)6.剖面积地形剖面图,可以以线带面概括研究区域的地势、地质和水文特征等。二、空间分布1.空间分布类型空间分布反映的是同类空间事物的群体定位信息,特定分布区域中的分布对象是单一性质的。空间对象按空间实体的几何形态划分为点、线、面,不同的空间分布对象具有不同的空间分布特征,并且具有各自相应的空间分布参数,下面分别对点、线、面的不同空间分布及其描述参数进行讨论。分布区域点线面离散连续离散连续离散连续线江河里的船只,公路上的汽车,路旁分布的加油站街道两旁的林荫树河流上的防护堤坝,城市街道的林荫道、公汽路线面城镇的分布,火山的分布降水河网,交通网,地图上的边界线污染的扩散大气运动湖泊的分布,居民区中楼房的分布人口普查区域,行政区划2.分布密度指单位分布区域内的分布对象的数量,是两个比率尺度数据的比值。举例:1.某地区汽车加油站的密度=加油站数/总公里路程2.某地区森林覆盖率=森林面积/地区总面积3.某省人口密度=人口数/该省总面积4.某地区交通网密度=交通网总长度/区域总面积5.城市商业网点密度=商业网点数/城区总面积6.某河流沿岸防护堤建筑比率=防护堤总长度/河岸总长度3.质心质心可概略表示分布总体的位置,是目标保持均匀分布的平衡点,可通过对目标坐标值加权平均求得。计算公式:设pi(i=1,2,……,n)的权重分别为W(Pi),则:其中:xi,yi为i个离散点的坐标n为目标个数4.点模式点模式的空间分布是一种比较常见的状态,如不同区域内的人口、房屋、城市分布,油田区的油井分布等。通常,点模式的描述参数有分布密度、分布中心、分布轴线、离散度等。均匀分布随机分布聚集分布三种点模式点群类型指标均一点模式是根据均一的子区域之间的关系定义的,这种子区域称为较大区域的样方。如果每个均一的样方包含相同数量的点对象,则整个研究区分布具有均一性,这种检验分布性的标准型方法称为样方分析,即假设每个子区域存在的对象数量大致相等,那么可以计算所有数据点个数与子区域个数的比值,得到每个子区域内平均对象的个数,只要它具备均一分布的特征,这个数值就是期望分布值。用简单的x2数学检验法对这些数据进行估计,其公式表示为Q——每个样方中实际观测到的点数;E——每个样方中期望的分布值。1)样方的统计量X2最近邻分析是一种分析点位置关系的点模式分析法,通常分为顺序法和区域法两种方法。无论是哪种方法,它分析过程的中心思想都是先测出每点与其最近点间的距离,然后将量测值与所测距离的均值进行比较。这种统计方法仅涉及计算每对最近点间距离的平均值,平均最近邻距离提供了空间分布中点之间距离的量度或点之间的距离指数。由于点对象之间距离太近会发生冲突,因此,最近邻分析在动物个体与种群的活动习性研究中具有很高的利用价值,如猴子是一种群居动物,不同群组的猴子都有自己的活动范围,它们的空间绝不允许其他猴群的侵犯;老虎、狮子这些个体活动的猛兽,也都拥有自己的生活区域,它们在这一定的范围内猎食、休息,而不会去侵犯其他同类的活动范围,也绝不允许被别人干扰。2)最近邻指数R5.网络测度指标对于任何一个网络图,都存在着三种共同的基础指标:①连线(边或弧)数目m;②结点(顶点)数目n;③网络中亚图的数目p。由它们可以产生如下几个更为一般性的测度指标:β指数回路数kα指数γ指数◣指数——实际回路数与网络内可能存在的最大回路数之间的比率。◣网络内可能存在的最大回路数目为连线的最大可能数目减去最低限度连接的连线数目,即所以,指数为指数也可以用百分率表示1)指数指数的变化范围,一般介于[0,1]区间,=0意味着网络中不存在回路;=1,说明网络中已达到最大限度的回路数目。对于非平面网络,其指数为◣β指数——线点率,是网络内每一个节点的平均连线数目。◣β=0,表示无网络存在;网络的复杂性增加,则β值也增大。◣没有孤立点存在的网络,连线数目为n-p,则β指数为如果地理网络不包含次级亚图,即P=1,则其最低限度连接的指数值为。2)β指数◣γ指数——网络内连线的实际数目与连线可能存在的最大数目之间的比率,对于平面网络,其计算公式为:◣γ指数是测度网络连通性的一种指标,其数值变化范围为[0,1]。◣γ=0,表示网络内无连线,只有孤立点存在;γ=1,则表示网络内每一个节点都存在与其它所有节点相连的连线。γ指数也可以用百分比表示3)γ指数二、空间关系分析邻近度分析网络分析叠置分析1.邻近度分析邻近度(Proximity)描述了地理空间中两个地物距离相近的程度度,其确定是空间分析的一个重要手段。交通沿线或河流沿线的地物有其独特的重要性,公共设施的服务半径,大型水库建设引起的搬迁,铁路、公路以及航运河道对其所穿过区域经济的发展的重要性等,军是一个邻近度问题。缓冲区分析是解决邻近度问题的空间分析工具之一。1)距离2)缓冲区分析缓冲区是指为了识别某一地理实体或空间物体对其周围地物的影响度而在其周围建立的具有一定宽度的带状区域。缓冲区分析则是对一组或一类地物按缓冲的距离条件,建立缓冲区多边形,然后将这一图层与需要进行缓冲区分析的图层进行叠置分析,得到所需结果的一种空间分析方法。缓冲区分析适用于点、线或面对象,如点状的居民点、线状的河流和面状的作物区等。邻域半径R即缓冲距离(宽度),是缓冲区分析的主要数量指标,可以是常数或变量。空间对象还可以生成多个缓冲带。(a)不同宽度缓冲区干流支流(b)环状缓冲区(a)单点形成的缓冲区(b)点群形成的缓冲区(c)分级点形成的缓冲区点形成的缓冲区形式①点要素的缓冲区矢量数据缓冲区的建立方法②线要素的缓冲区线形成的缓冲区形式(a)单线形成的缓冲区(b)多线形成的缓冲区(c)分级线形成的缓冲区③面要素的缓冲区面形成的缓冲区形式(a)单一面形成的缓冲区(b)多个面形成的缓冲区(c)分级面形成的缓冲区栅格数据的缓冲区分析通常称为推移或扩散(Spread),推移或扩散实际上是模拟主体对邻近对象的作用过程,物体在主体的作用下沿着一定的阻力表面移动或扩散,距离主体越远所受到的作用力越弱。栅格数据缓冲区的建立方法缓冲区实现有两种基本算法:矢量方法和栅格方法。矢量方法使用较广,产生时间较长,相对比较成熟,具体的几何算法是中心线扩张法,又称加宽线法或图形加粗法,通过以中心轴线为核心做平行曲线,生成缓冲区边线,再对生成边线求交、合并,最终生成缓冲区边界。栅格方法以数学形态学扩张算法为代表,采用由实体栅格和八方向位移L得到的n方向栅格像元与原图作布尔运算来完成,由于栅格数据量很大,特别是上述算法运算量级很大,当L较大时实施有一定困难,且距离精度也尚待提高。2.网络分析网络分析是通过研究网络的状态以及模拟和分析资源在网络上的流动和分配情况,对网络结构及其资源等的优化问题进行研究的一种空间分析方法。网络分析的理论基础是图论和运筹学。在地理信息系统中,网络分析功能依据图论和运筹学原理,在计算机系统软硬件的支持下,将与网络有关的实际问题抽象化、模型化、可操作化,根据网络元素的拓扑关系(线性实体之间、线性实体与结点之间、结点与结点之间的连结、连通关系),通过考察网络元素的空间、属性数据,对网络的性能特征进行多方面的分析计算,从而为制定系统的优化途径和方案提供科学决策的依据,最终达到使系统运行最优的目标。网络模型在城市之间建立通讯网络,使其中任意两个城市之间都有直接或间接的通讯联系,假设已知每两个城市之间通讯线路的成本,要求找出一个成本最低