南京工业大学研究生学位论文开题报告学号:622081601006研究生姓名:朱丹导师:董有福研究方向:地理信息系统理论与应用论文题目:基于DEM的地形空间自相关研究学院:测绘学院入学时间:2012年9月10日开题时间:2014年11月30日2014年11月30日填报说明一、开题报告中必须采用计算机输入和打印。二、开题报告为A4大小,于左侧装订成册。三、开题报告要求摘要开题报告的内容应包括:1、课题的研究意义、国内外现状;2、与本课题有关的工作积累和已有的研究工作成绩;3、指出课题难点和拟解决的关键问题;拟采取的研究方法、技术线路、试验方案及其可行性。4、计划进度和预期成果;四、开题报告一式二份,研究生和学院各存档一份。一、立论依据1、课题来源随着地理信息系统、空间数据基础设施的发展和建设,数字高程模型成为地理信息系统数据库中最为重要的空间信息资料,以及进行地形分析的核心数据,是目前最重要的地球信息三维基础产品,是国家基础空间数据的重要组成部分,在经济、国防和科技上具有广泛的不可替代的作用。数字高程模型(DigitalElevationModel,简称DEM)。它是用一组有序数值阵列形式表示地面高程的一种实体地面模型,是零阶单纯的单项数字地貌模型,是数字地形模型(DigitalTerrainModel,简称DTM)的一个分支,主要研究地面起伏,其它各种地形特征属性如坡度、坡向及曲率等地貌因子均可在DEM的基础上派生。由于传统的地理信息系统的数据结构都是二维的,高程是地理空间中的第三维坐标,数字高程模型的建立是一个必要的补充。数字高程模型已作为一个独立的产品而存在,并且成为地理信息系统的核心数据及地学分析的基础数据。DEM是3S(GIS,GPS,RS)技术应用成果的主要产品之一。高精度的DEM不仅可以非常直观的展示一个地区的地形、地貌:三维显示(景区、校园、市民广场)、3D建筑、景观设计与城市规划等,而且也为各种地形特征的定量分析提供了基本数据:流水线分析、可视性分析、坡度坡向计算、估计侵蚀和径流、交通路线规划、土方量计算等,此外还可以用于不同类型专题图的自动绘制:立体等高线图、晕渲图、纵横断面图、三维立体透视图、数字城市和虚拟现实等。建立DEM的方法有多种。从数据源及采集方式讲有:(1)以地面实测记录为数据源,例如用GPS、全站仪、野外实地测量等获取;(2)根据航空或航天遥感影像,通过摄影测量途径获取,如立体测图仪或立体坐标仪观测、解析测图、数字摄影测量等;(3)从现有地形图上采集,如格网读点法、数字化仪手扶跟踪、扫描仪半自动采集然后通过内插生成DEM等方法。数据源决定采集方式,数据点的采集密度和采点的选择决定DEM的精度。DEM数据质量的优劣直接影响到地理信息系统各种分析结果的准确性和正确性,进而影响到地理信息系统和测绘信息工程的成败。误差减少、提高精度对制作好的数字高程模型显得尤为重要,但同时高精度的DEM又导致海量数据的存储。2、选题依据和背景情况空间自相关(SpatialAutocorrelation)是指某一变量在同一个分布区内的观测数据之间潜在的相互依赖性。Tobler(1970)曾指出“地理学第一定律:任何东西与别的东西之间都是相关的,但近处的东西比远处的东西相关性更强”。在统计上,透过相关分析可以检测两个统计量的变化是否存在相关性,例如:稻米的产量,往往与其所处的土壤肥沃程度相关。若将其分析的统计量视为不同观察对象的同一属性变量,则称之为自相关。因此,所谓的空间自相关就是研究空间中,某一空间单元与其周围单元间的某种特征值,透过统计方法,进行空间自相关性程度的计算,以分析这些空间单元在空间上分布现象的特性。空间自相关分析的目的是确定某一变量是否在空间上相关,其相关程度如何。空间自相关统计量是用于度量地理数据的一个基本性质:某位置上的数据与其他位置上的数据间的相互依赖程度。通常把这种依赖叫做空间依赖(SpatialDependence)。地理数据由于受空间相互作用和空间扩散的影响,彼此之间可能不再相互独立,而是相关的。例如,把空间上互相分离的许多市场看作一个集合,如市场间的距离近到可以进行商品交换与流动,则商品的价格与供应在空间上可能是相关的,而不再相互独立。实际上,市场间距离越近,商品价格就越接近、越相关。空间自相关作为空间分析的热点之一,越来越受到重视。空间自相关系数常用来定量地描述事物在空间上的依赖关系。具体地说,空间自相关系数是用来度量物理变量在空间上的分布特征及其对周围的影响程度。如果某一变量的值随着测定距离的缩小而变得更相似,这一变量呈现空间正相关;若所测值随距离的缩小而更为不同,则称之为空间负相关;若所测值不表现出任何空间依赖关系,那么这一变量表现出空间不相关性或空间随机性。计算空间自相关的方法有许多种,一般来说,方法在功用上可大致分为两大类:全局型和局域型。全局型方法是探索整个空间上属性数据的分布模式以及空间结构情况,判断此分布在空间是否有聚集特性存在,但其并不能确切地指出聚集在哪些地区。而局域型分析方法可以进一步探索属性数据在空间上的聚集行为、聚集位置等空间信息。局域型之所以能够推算出聚集地的范围,主要有两种:一是藉由统计显著性检定的方法,检定聚集空间单元相对于整体研究范围而言,其空间自相关是否够显著,显著性大的地方,即是该现象空间聚集的地区;另外,则是度量空间单元对整个研究范围空间自相关的影响程度,影响程度大的往往是区域内的特例,也就表示这些特例点往往是空间现象的聚集点。3、研究目的DEM的生产与应用就是地形数据的采集、处理、传输和表达的过程。在对地学数据的处理研究中,涉及一个重要的问题,即数据之间存在广泛的空间自相关性。由于空间信息的自相关特性,经典的线性回归模型很难描述和表达。因此,在空间数据分析中,以空间自相关分析为切入点,研究DEM栅格单元高程变异的规律性,对于深化DEM地形信息基本理论的认识,提高DEM应用效率与可靠性,都具有非常重要的理论意义和实践价值。本文描述的DEM地形空间自相关就是计算某一栅格单元的高程值与其相邻栅格高程值的趋近程度。对于DEM数据而言,大部分栅格单元高程值呈现出有序变化即空间自相关程度较高,而少量栅格单元(如脊线点和沟谷点)高程值表现为突变特征即空间自相关程度较低。首先通过对空间自相关指标的研究,选用合适指标,从地形曲面参数分析各指标的差异;其次从窗口大小、数据读取方向、不同地貌类型等方面对DEM空间自相关影响因素做相关分析;在求算DEM栅格单元空间自相关指数的基础上,选取一定数量的地貌特征点进行DEM地形简化。地形简化是目前解决DEM存在海量数据与计算机有限存储能力之间矛盾的有效方法,它是在保证地形整体特征精度要求的前提下最大限度的减少用于描绘地形的数据。二、文献综述国内外研究现状、发展动态空间自相关是一个有助于定义空间分析的概念。它的核心是利用空间统计和空间计量经济学进行研究。空间自相关性使用全局和局部两种指标来度量。最初,Moran在空间自相关所做的贡献被后人总结为Moran’sI指数,是适用范围最为广泛的用于测量和测试空间自相关的指标[1]。随着研究的继续深入和挖掘,相继产生Geary’sc用于计算空间自相关全局差异,GetisandOrd’sG全局空间自相关乘法模型等全局性的指标模型[2]。二十世纪九十年代,空间自相关的理念由全局延伸至局部,GetisandOrd在全局G系数的基础上发展了局部统计指标Gi,用于分析局部聚类[3]。Anselin提出了局部Moran’sI指数和局部Geary’sc指数统称为LISA[4],被用于识别热点或者类似于统计上显著的聚类中心。当考虑到这些指标计算结果依据数据而定时,即全局空间自相关统计程度将影响局部空间自相关的计算效果,OrdandGetis’O指数应运而生,用于分析影响因素[5]。国内学者也有空间自相关指标适用性的研究。张松林通过大量的模拟计算,比较局部Moran指数和局部G系数发现两者探测空间聚集的能力有显著的差异,局部G系数能较准确地探测出聚集区域;局部Moran指数能大致探测出聚集区域的中心,但对聚集范围的识别偏差较大,探测出的范围小于实际范围[6]。另外对比全局Moran指数和全局G系数发现:G系数检测出高值聚集的正确率远大于检测出低值聚集的正确率,尽管G系数具有区分高值和低值聚集的优势,但是判断一个区域是否存在空间聚集,尤其是估计聚集区域位于区域的边缘时,采用Moran指数统计的结果更为可靠,要区分是高值聚集还是低值聚集,可通过属性值的相对大小直接判断[7]。陈彦光利用线性代数知识对基于Moran统计量的空间自相关过程的数学表示进行规范化整理,基于变换中的不变性思想给出Moran指数的理论解释,对空间权重矩阵的数理性质、建设方法和应用范围提出新的见解。发展了Moran指数的三种计算方法:三步求值法、矩阵标度法和回归分析法,将空间权重矩阵划分为四种基本类型:局域关联型、准局域关联型、准长程关联型和长程关联型,总结了基于Moran指数的空间自相关分析理论和方法[8]。空间自相关分析方法在国外的应用较多且较成熟,尤其在生态、地理、大气、海洋等领域[9-12]。在生态学领域,空间自相关分析一般作为数据分析的基础手段之一,常用于获取相应要素的距离特征;在地理学领域,该方法一般用于研究要素的空间分布格局或模式,并可基于不同时期空间自相关分析结果的比较,宏观了解要素或对象的地理分布状态或变化;在大气和海洋领域,该方法多用于要素空间集聚和变化趋势的研究,作为探索大气或海洋环境中要素集聚规律、空间关联模式随时间变化分析的基础。国内的空间自相关研究起步较晚,主要集中医学、环境、土地利用、经济、人口[13-18]等领域。陈江平采用空间自相关方法对甲型H1N1流感疫情的时空分布进行了分析,得出甲流传播的集聚性由弱到强变化,疫情大致经历了三个阶段:早期的随机分布、中期的扩散以及后期的集中控制,并且聚集重心并未随着时间发生转移[19]。周天墨在分析国内外空间自相关应用现状的基础上提出,国内环境污染领域空间自相关分析的应用研究应重视权重矩阵改进、时间滞后系数补充、数据源扩展、可视化表达多样化,并引入其他学科或领域的研究方法[20]。张朝生利用空间自相关与分形方法研究长江水系沉积物重金属含量空间分布特征,两种指标均能反映研究区域沉积物重金属含量的空间结构性特征:结构性好的元素空间自相关指标大,分维数低;反之,结构性差的元素空间自相关指标小,分维数高[21]。谢花林建立了混合回归-空间自相关回归模型,即空间滞后模型,对于存在空间自相关性的数据来说有着统计上的合理性,克服了经典线性回归模型无法表现数据的空间自相关特征这一缺点[22]。刘涛将城市规模的空间集聚与分散和中心城市影响区域划分两者结合,提出自下而上考察中心城市影响力的新视角,通过空间自相关分析,从区域和地方两个尺度综合考察了中心城市的影响力和城市规模的空间聚散特征[23]。也有一些学者将此运用于DEM地形数据。刘学军在顾及DEM误差自相关的前提下,对DEM坡度计算模型进行分析表明,DEM误差自相关性的存在,不仅能够改善地形分析的精度,也能改善DEM自身精度[24]。王耀革采用空间自相关分析方法,从空间角度对DEM误差的空间分布特征进行了研究。实验得出利用双线性曲面表示地形表面时产生的DEM误差,全局空间自相关不显著,而在局部区域具有很高的空间正相关性[25]。卢华兴从DEM插值入手,从理论上推导了插值条件下格网DEM邻域窗口内坡度噪声误差的空间自相关模型以及坡度精度模型,并选取不同的差值方法和坡度差分算法,试验分析出坡度精度受DEM噪声误差的空间自相关性影响较大,并与DEM插值方法和坡度计算模型中的差分算法有关[26]。汤国安首先提出DEM地形描述误差的提取方法,通过误差地图以及量化研究方法,揭示DEM误差的空间分布规律,即DEM地形描述误差具有很强的空间自相关性,自相关值随着地形复杂度与DEM分辨率的改变而有规律地变化[27]。针对DEM地形简化的精度问题,