1间数据分析1.空间分析:(spatialanalysis,SA)是基于地理对性的位置和形态特征的空间数据分析技术,其目的在于提取和传输空间信息,是地理信息系统的主要特征,同时也是评价一个地理信息系统功能的主要指标之一,是各类综合性地学分析模型的基础,为人们建立复杂的空间应用模型提供了基本方法.2.空间分析研究对象:空间目标。空间目标基本特征:空间位置、分布、形态、空间关系(度量、方位、拓扑)等。3.空间分析根本目标:建立有效地空间数据模型来表达地理实体的时空特性,发展面向应用的时空分析模拟方法,以数字化方式动态的、全局的描述的地理实体和地理现象的空间分布关系,从而反映地理实体的内在规律和变化趋势。GIS空间分析实际是一种对GIS海量地球空间数据的增值操作。4.ArcGIS9中主要的三种数据组织方式:shapefile,coverage和geodatabase。Shapefile由存储空间数据的dBase表和存储属性数据和存储空间数据与属性数据关系的.shx文件组成。Coverage的空间数据存储在INFO表中,目标合并了二进制文件和INFO表,成为Coverage要素类。5.Geodatabase是面向对象的数据模型,能够表示要素的自然行为和要素之间的关系。6.GIS空间分析的基本原理与方法:根据空间对象的不同特征可以运用不同的空间分析方法,其核心是根据描述空间对象的空间数据分析其位置、属性、运动变化规律以及周围其他对象的相关制约,相互影响关系。方法主要有矢量数据的空间分析,栅格数据的空间分析,空间数据的量算与空间内插,三维空间分析,空间统计分析。7.栅格数据在数据处理与分析中通常使用线性代数的二维数字矩阵分析法作为数据分析的数学基础。栅格数据的处理方法有:栅格数据的聚类、聚合分析,复合分析,追踪分析,窗口分析。8.栅格数据的聚类与聚合分析区别:聚类是根据设定的聚类条件对原有的数据系统进行有选择的信息提取儿建立的新的栅格数据系统的方法;聚合分析是根据空间分辨率和分类表进行数据类型的合并或转换以实现空间地域的兼并。e.g.:从遥感图像信息中提取某一地物的方法是栅格数据的聚类,而由数字高程模型转换为数字高程分级模型便是空间数据的聚合。9.ArcGIS9的空间分析功能主要包括:空间分析模块、3D分析模块、地统计分析模块、网络分析模块、跟踪分析模块等。10.GIS的四种模型:要素模型(矢量类型),场模型(栅格类型),时态模型,网络模型。11.矢量数据的空间分析方法:空间关系查询;叠置分析;缓冲区分析;泰森多边形分析;网络分析。212.空间关系查询中要素间的关系有:相邻关系(proximity);包容关系(containment);叠加关系(overlap)。空间关系查询涉及到的:目标层—从其中查询满足条件的要素。选择层—比较此图层中要素与目标层中的关系。选择层是从目标层中得来的。13.空间关系连接(spatialjoin)有:根据图层间的关系连接属性表;根据空间位置连接图层属性表。14.叠置分析:是将代表不同主题的各个数据层面进行叠置产生一个新的数据层面,叠置的结果综合了原来来年各个或多个层面要素所具有的属性,不仅生成了新的空间关系,还将输入的多个数据层的属性联系起来产生了新的属性关系。叠置分析前提条件:要素层面必须基于相同坐标系统、同一地带,还必须查验叠加层面之间的基准面是否相同。15.根据操作要素的不同,叠置分析可以分为:点与多边形叠加;线与多边形叠加;多边形与多边形叠加。16.根据操作形式的不同,叠置分析可以分为:图层擦除(erase);识别叠加(identity);交集操作(intersect);均匀差值(symmetricaldifference);图层合并(union);修正更新(update)。17.从数学的空间运算角度来说,图层擦除:A-A∩B(即X∈A且X?B,A为输入图层,B为擦除层)。识别叠加:Aor(A∩B)。交集操作:X∈A∩B(A、B分别是进行交集的图层)。均匀差值:X∈(A∪B—A∩B)。图层合并:X∈A∪B。修正更新:Bor(A∪B)。18.缓冲区分析基本思想:给定一个空间对象或几何,确定它们的邻域,邻域的大小由邻域半径R决定。19.缓冲区的建立方法:角平分线法,凸角圆弧法。缓冲区的建立包括:点状要素的缓冲区,线状要素的缓冲区,面状要素的缓冲区(面状要素缓冲区建立的四种方式:1.insideandoutside内外缓冲区之和2.onlyoutside只有外缓冲区3.onlyinside只有内缓冲区4.insideandincludeoutside外缓冲区和原有图形之和)。20.泰森多边形:也称为Voronoi图或者Dirichlet图。泰森多边形可用于定性分析、统计分析、临近分析等,是某些空间分析一个有用的工具。泰森多边形的特性:每个泰森多边形内仅含有一个离散点数据;泰森多边形内的点到相应离散点的距离最近;位于泰森多边形边上的点到其两边的离散点的距离相等。可用于现有设施的负荷状况分析、设施选址等问题的分析。21.狄洛尼三角网:DelaunayTriangulation(D-TIN),是将泰森多边形中各一直点相连形成的一个三角形网,该三角网是泰森多边形的对偶图,是模拟自然面或人工构成面的理想方法。狄洛尼三角网特性:1其Delaunay三角网是唯一的;2三角网的外边界构成了点集P的凸多边形外壳;3没有任何点在三角形的外接圆内部;4如果将三角网中的每个三角形最小角进行升序排列,则Delaunay三角网的排列得到的数值最大,即Delaunay三角网是“最接近于规则化”的三角网(等边三角形)。22.狄洛尼三角网构建方法:三角网生长法。首先找出离散点集中相距最短的两点,连线成为D-TIN的初始基线,然后在这附近找第三点,一般取第三点到前两点的距离平方和最小3的参考点作为候选点,以这三点作一外接圆,判断是否有落入该外接圆的点,一直找到没有其他参考点落入外接圆内,该三角形就是Delaunay三角形,然后以该三角形的任意一条边作为基边,用同样的方法形成其他三角形,一直到所有参考点都参与构造了Delaunay三角网为止。23.用Delaunay三角网构建泰森多边形方法:1构建离散平面点集的D-TIN;2求取各三角形的外接圆心;3对每个离散点,按顺时针或逆时针方向连接与其关联的三角形的外接圆心,得到该离散点的泰森多边形;4将各离散点的泰森多边形形成集合,得到平面点集的泰森多边形。24.构成网络的基本要素:链(link);结点(node)(包括:障碍-barrier,拐点-turn,中心-center,站点-stop)。以上网络要素分别有各自的特殊属性项,归纳为:阻力值(impedance),资源需求(demand),资源容量(capacity)三种。25.网络分析应用:路径分析;连通分析;定位-配置分析;地址匹配。26.路径分析的核心是对最佳路径和最短路径的求解。最佳路径的求解时在指定的网络中两节点间找一条阻碍强度最小的路径,最佳路径的产生基于网线和结点转角的阻碍强度。另一种路径分析功能是求解最佳游历方案,分为:结点最佳游历方案求解(推销员问题);弧段最佳游历方案求解(邮递员问题)。27.最短路径分析核心算法:Dijkstra算法。28.连通分析两类问题:1连通分量求解;2最少费用连通方案的求解。29.连通图:在一个图中。任意两个结点之间都存在一条路。30.最小生成树:若一个连通图中不存在任何回路,称为树,生成树是极小连通子图(权数最小)称为最小生成树。应用:类似在n个城市间建立通信线路的连通分析问题。构造最小生成树的依据:1在网中选择n-1条边连接网的n个顶点;2尽可能选取权值为最小的边。算法:Kruskal,克罗斯科尔算法(避圈法)。31.定位-配置分析(举例分析):1定位问题:已知需求点分布,确定哪里布设供给点。如消防站点分布、学校选址、垃圾收集站点分布;2配置问题:已知供给点分布,确定供给点服务于哪些需求点。如确定一消防站负责哪些区域的消防工作;3同时确定供给点和需求点。算法:Teitz-Bart算法(泰茨-巴特算法)。32.e.g:选址问题就选择5个城市中一个作为中心邮局地时选择标准有中心点法和中位点法。中心点法是中心局到其它城市最短距离的最大值最小;中位点法是中心局到其它城市距离总和最小。33.地址匹配:是基于空间定位技术,是地理编码的核心技术,提供了一种把描述成地址的地理位置信息转换成可以被用于GIS的地理坐标的方式。434.利用地址匹配技术可以在地理空间参考范围中确定数据资源的位置,建立空间信息与非空间信息之间的联系,实现各种地址空间范围内的信息整合。它的过程中涉及两种数据:一种是只包含地理实体位置信息没有相关地图定位信息的地址数据(如街道地址、邮政编码、行政区划等),另一种是已经包含了相关地图定位信息的地理参考数据,这些数据集合或者数据库在地址匹配过程中起到空间参考作用。35.栅格数据的空间分析方法:距离制图、密度制图、表面分析、统计分析、重分类、栅格计算。36.距离制图中基本概念:1源:距离分析中的目标或目的地;2成本:到达目标、目的地的花费,成本数据的制作一般是基于重分类功能完成的;3成本距离加权数据:也程成本累计数据,几率每个栅格到距离最近、成本最低的源的最少累加成本;4距离方向数据:表示了从每一个单元出发,沿着最低累计成本路径到达最近源的路线方向;5分配数据:记录每一个单元点隶属的最近源信息,单元值就是其最近源的值;6距离制图函数:主要包括成本加权函数(cost-weighteddistance),成本方向加权数据(cost-weighteddirection),成本分配加权函数(cost-weightedallocation),直线距离函数(straight-linedistance),直线方向函数(straight-linedirection),直线分配函数(straight-lineallocation),最小成本路径函数(shortestpath),分配函数(allocation)。其中:1、2为原始数据,3—6为结果数据。37.密度制图:基于点数据生成的,以每个待计算网格点为中心,进行圆形区域的搜索,今儿来计算每个格网点的密度值。本质上讲,密度制图是一个通过离散采样点进行表面内插的过程,根据内插原理不同,分为核函数密度制图(Kernal)和简单密度制图(Simple)。38.简单密度制图:以样本为圆心,考搜索半径产生圆,组成圆的栅格总面积为分母,样本点的属性值为分子,两折相除得到密度值,搜索圆内每个栅格单元的密度值相同。39.核函数密度制图:以样本点为圆心,考搜索半径产生圆,圆心处的栅格单元密度值最高,离开圆心越远,密度越低,逐步递减,到边界处密度值为0。圆心处密度值大小由搜索半径决定。40.表面分析:主要通过栅格差值生成栅格表面产生新的数据集。如等值线、坡度、坡向、山体阴影等派生数据。41.统计分析包括:单元统计(n对1);领域统计(1对1);分类区统计(2对1)。42.单元统计常用于同一地区多时相数据的统计,通过单元统计分析得出所需数据。例如:同一地区不同年份的人口分析,同一地区不同年份土地利用类型等。单元统计输入数据集必须来源于同一个地理区域,并且采用相同的坐标系统。43.领域统计:是以待计算栅格为中心,向其周围扩展一定范围,基于这些扩展栅格数据进行函数运算,从而得到此栅格的值。即在单元对应的领域范围指定的单元上进行统计分析,然后将结果值输出到该单元位置。ArcGIS中提供四种领域分析窗口:Rectangle(矩形);Annulus(环形);Circle(圆形);Wedge(楔形)。544.分类区统计:即以一个数据集的分类区为基础,对另一个数据集进行述职统计分析,包括计算述职范围、最大值、最小值、标准差等。利用分类区统计可以计算具有某一相同属性的数据所包含的另一属性数据的统计信息。e.g:计算每个污染区的平均人口密度;计算同一高程处植被类型的种类;计算同一种植被类