第2章DEM数据组织与管理主要内容概述DEM数据模型DEM数据结构DEM数据库管理2.0概述空间对象建立过程DEM建立的一般过程•数字高程模型是地形曲面的数字化表达,也就是说,DEM是在计算机存储介质上科学、真实地描述、表达和模拟地形曲面实体,因此它的建立实际上是一种地形数据的建模过程。•DEM的建立首先要对地形曲面进行抽象、总结和提炼,形成高度概括的地形曲面数据模型,然后在此数据模型基础上,将观测数据按照一定的结构组织在一起,形成对数据模型的表述,最后借助计算机实现数据管理和地形重建。•按一定结构组织在一起的地形数据,一般通过数据库进行管理和调度(当然小范围的数据也可采用文件形式进行管理)。空间数据库数据库功能:与数据结构有关空间索引机制遵循一般空间数据库原则DEM数据库设计基本原则2.1DEM数据模型空间数据模型属于概念层次的空间对象语义描述。三种抽象类型•对象模型•网络模型•场模型镶嵌数据模型基本思想在二维区域上的网络划分来覆盖整个研究区域网络特征参数分辨率、方位、形状、位置类型规则镶嵌数据模型和不规则镶嵌数据模型应用范围连续变化空间对象模拟;三维离散数据空间建模;•镶嵌数据模型(Tessellationmodel)源于这样的思想:空间对象可用相互连接在一起的网络来覆盖和逼近,或者说用在二维区域上的网络划分来覆盖整个研究区域。•镶嵌数据模型特别适合于对三维离散空间数据的表达,以及对具有连续变化的空间对象的模拟。网络的特征参数包括网格尺寸、形状、方位等,对同一地理现象可以由若干不同的尺度、不同的聚分性网络来覆盖。•镶嵌数据模型按照网格形状可分为规则镶嵌数据模型和不规则镶嵌数据模型,镶嵌模型的典型应用是地形曲面模拟,即数字高程模型,其中基于正方形网络的镶嵌数据模型为栅格DEM,而基于不规则镶嵌数据模型为不规则三角网DEM。镶嵌数据模型镶嵌数据模型规则镶嵌数据模型概念:就是用规则的小面块集合来逼近不规则分布的地形曲面。在二维空间中可以有多种可能的规则格网划分方法,如图。基于正方形的规则镶嵌数据模型是应用最为广泛的数据模型,同时也是目前数字高程模型的主要结构之一。镶嵌数据模型规则镶嵌数据模型构造规则镶嵌模型的方法:用数学手段将研究区域进行网格划分,把连续的地理空间离散为互不覆盖的网格,然后对网格单元附加相应的属性信息(即高程值)。例如对规则格网的DEM而言,一般通过曲面拟合方法求得栅格单元的高程值。镶嵌数据模型规则镶嵌数据模型评价优点:(1)其数据结构为通常的二维矩阵结构,每个网格单元表示二维空间的一个位置,不管是沿水平方向还是垂直方向,均能方便地利用简单的数学公式访问任何位置的格网单元;(2)处理这种结构的算法比较多而且成熟,大多数计算机程序语言都有矩阵处理功能。(3)以矩阵形式存储和组织数据还具有隐式坐标,即格网单元的平面坐标隐含在矩阵的行列号之中,从而不需要进行坐标数字化。缺点:是不管地形变化复杂还是简单,均采用相同的结构,导致数据冗余而给数据管理带来不便。镶嵌数据模型规则格网数据模型的两个理解格网栅格的观点:格网单元的数值即其中所有点的值,对应实地单元区域内高程为均一高程。点栅格观点:格网单元的数值是格网中心点的数值,其它任意点高程通过内插方式确定适用于什么地形?镶嵌数据模型不规则镶嵌数据模型概念:是指用来进行镶嵌的小面块具有不规则的形状和边界,如图。镶嵌数据模型不规则镶嵌数据模型构造方法:在DEM中,基于三角形的不规则镶嵌模型又称为不规则三角网(TriangulatedIrregularNetwork,简称TIN),是DEM的又一主要表达形式。区域内任意点的取值:三角形顶点-取顶点值三角形边上-通过两端点内插三角形内-平面内插函数TIN模型是三维空间上的分段线性模型,整个区域内连续但不可微。镶嵌数据模型不规则镶嵌数据模型评价特点:不规则三角网数字高程模型由连续的三角面组成,三角形的形状、大小取决于不规则分布的点的位置和密度。地形变化越简单,采样点就越少,则单元格就越大;反之地形变化比较复杂,数据点分布比较密集,格网单元就越小。•与规则格网的区别:TIN模型不需要维护模型的结构规则性,不但能灵活地随地形的复杂程度而改变格网单元大小,避免平坦地形的数据冗余,而且又能按地形特征点线如山脊点、山谷线、地形变化线等表示地形特征。镶嵌数据模型基于F-DEM数据模型构建的梯田DEM特征嵌入式数据模型(Featurepreserved-DEM,F-DEM)是矢量栅格混合数据模型中的一种,即将特征要素(points、linesandareas,PLA)嵌入到规则或不规则镶嵌数据模型中。2.2DEM数据结构2.2.1规则格网DEM数据结构(1)简单矩阵结构规则格网DEM的数据在水平方向和垂直方向的间隔相等,格网点的平面坐标隐含在行列号中,故适宜用矩阵形式进行存储,即按行(或列)逐一记录每一个格网单元的高程值。同时为了实现行列号和平面位置坐标之间的转换,还需要记录格网西南角的坐标值、格网间距等。规则格网DEM的数据文件一般包含数据头和数据体。数据头:定义DEM西南角起点坐标、坐标类型、格网间距、行列数、最低高程以及高程放大系数等内容。数据体:按行或列分布记录的高程数字阵列。Arcview的文本文件格式(2)行程编码结构DEM行程编码的基本思路是:对于一幅DEM,常常在行(或列)方向上相邻的若干点具有相同的高程值,因而从第一列开始,在格网单元数值发生变化时依次记录该值以及重复的个数,应用时可利用重复个数恢复DEM矩阵。行程编码方案实际上是一种栅格数据的压缩方案,能够有效的减少DEM数据存储量,特别是对平坦地区。行程?行程长度编码课堂小练习0744444477774777444487780840877808800800887888880000888800000888请对本页栅格数据进行行程编码(3)块状编码结构块状编码方案是行程编码方案从一维扩展到二维的情况,它采用方形区域作为记录单元,每个记录单元包括相邻的若干栅格。该数据结构是由记录单元的初始位置(行、列号)、格网单元高程值和方形区域半径(正方形区域的边长,采用格网间距倍数表示)所组成的单元组,即(行号,列号,格网高程值,区域半径),整个DEM数据文件由该单元组组成,根据初始位置和区域半径可恢复高程矩阵。(4)四叉树结构四叉树数据结构是一种对栅格数据的压缩编码方法。常规四叉树:基本思想是将一幅栅格数据层或图像等分为四个部分,逐块检查其格网属性值(或灰度);如果某个子区的所有格网值都具有相同的值,则这个子区就不再继续分割,否则还要把这个子区分割为四个子区;这样依次分割,直到每个子块都只含有相同的属性值或灰度为止。实际上,在地理信息系统中不采用常规四叉树,而是采用线性四叉树。2.2.2TIN结构不规则三角网DEM直接利用原始采样点进行地形表面的重建,由连续的相互联接的三角面组成,三角面的形状和大小取决于不规则分布的观测点的密度和位置。AEDCB165432TIN模型基本结构元素拓扑关系TIN文件组成AEDCB165432三角形节点A1,5,6B4,5,6C3,4,6D2,3,6E1,2,6三角形/节点关系表坐标表节点坐标1X1,Y1,Z12X2,Y2,Z23X3,Y3,Z34X4,Y4,,Z45X5,Y5,Z56X6,Y6,Z6TIN模型基本链表结构拓扑关系隐含TIN的数据结构类型TIN的面结构•TIN的面结构在基本链表结构基础上增加了用来描述三角形之间拓扑关系的数据,也就是说TIN的面结构一般由三个表组成,即坐标表、三角形顶点表以及邻接三角形表。•特点:由于存储了三角形之间的邻接关系,TIN内插、检索、等高线提取、显示及局部结构分析都比较方便。•不足:存储量较大,而且在TIN的编辑中要随时维护这种关系。TIN的点结构•TIN的点结构由坐标文件和三角形顶点的邻接指针链组成。•三角形顶点的邻接点是指共用该顶点的所有三角形其余两顶点的不重复顶点的集合,可按顺时针或逆时针方向顺序组成。•每个顶点的邻接点顺次存储在一个链表中。•特点:存储量小,编辑方便。•不足:但三角形及其邻接关系需实时再生成,计算量比较大。14345521ee1e226e3e43e5e7e6e89e10TIN的点面结构•在点结构基础上,增加组成三角形三顶点的数表。•特点:结构存储量与面结构的大致相当,编辑、显示比较方便。•不足;由于三角形之间的关系是隐式的,检索与内插效率不太高。14345521ee1e226e3e43e5e7e6e89e10TIN的边结构•TIN的边结构是从组成整个TIN模型的所有三角形中,抽取其不重复边集所组成。•特点:存储量比较小,非常适合等高线的提取•不足:编辑、内插以及检索不太方便。14345521ee1e226e3e43e5e7e6e89e10TIN的边面结构•边面结构重点在于刻画三角形边和三角形面之间的拓扑关系,一般由边表和邻接三角形表组成。在边表中,定义该边的起点、终点和左右相邻三角形,而邻接三角形表中则记录三角形之间的拓扑关系。•特点:为上述所有结构中存储量最大的,虽然在检索、等高线提取等方面比较方便。•不足:不利于动态更新和维护。14345521ee1e226e3e43e5e7e6e89e10不同TIN结构对比方便,随时可用数据维护不方便数据维护不方便较方便,专用算法生成较方便,生成工作量较大显式隐式隐式隐式显式264248224160370面结构点结构点面结构边结构边面结构拓扑关系存储量结构143e1e226e3e43e5e6e821e95e74e105应用三角形结构注意点一味追求存储量而忽视对拓扑信息的显式表达,这样会导致应用时的信息量不足而影响执行效率,如当要用拓扑关系时需临时生成等;大量地存储显式关系而导致存储空间过大,不利于大范围的模型建立。不规则三角网DEM的优点是:•能充分利用地貌的特征点和特征线,较好地表示复杂地形;•可根据不同的地形,选取合适的采样点数;•进行地形分析和绘制立体图也很方便。其缺点是:由于数据结构复杂,因而不便于规范化管理,难以与矢量和栅格数据进行联合分析。规则格网DEM不规则三角网TIN优点优点简单的数据存储结构;与遥感影像数据的相合性;良好的表面分析功能;较少的点可获取较高的精度;可变分辨率;良好的拓扑结构缺点缺点计算效率较低;数据冗余;格网结构规则;表面分析能力较差;构建比较费时;算法设计比较复杂;规则格网DEM和TIN的对比2.2.3格网与不规则三角网结构混合结构•由于规则格网DEM和不规则三角网各有优缺点,在实际应用中,在大范围内一般采用规则格网附加地形特征数据,如地形特征点、山脊线、山谷线、断裂线等,构成全局高效、局部完美的DEM,规则格网DEM被分割而形成一个局部的不规则三角网。格网与不规则三角网结构混合结构•由于特征线作为矢量数据具有比规则格网复杂得多的拓扑结构和属性内容,一般还是采用混合的数据结构分别进行处理。•当然也可以设计一个一体化的数据结构同时组织这些不同类型的数据,比如将所有矢量都栅格化。另外,考虑到混合结构将导致数据管理复杂化并降低数据检索的效率,根据研究区域的大小和软件性能,应用时常常将其实时地完全转换为TIN的数据结构。2.3DEM数据库管理2.3.1DEM数据库内容DEM已成为GIS的核心数据库和地学分析的基础数据。DEM数据与遥感影像数据、矢量特征数据、多媒体数据等数据进行融合和信息的复合处理,DEM从单一的文件结构向复杂的信息系统发展已成为一种必然的趋势。DEM数据库属空间数据库,DEM数据库的设计内容如图。在一个关系数据库里最普通的对象是关系表,其他对象如索引、视图、序列、同义字和数据字典等都用来进行查询和数据存取。•表是基本的存储结构,是一个由若干行和列的数据元素组成的二维矩阵。•表的每一行包含了描述一个实体的所有信息,而其中的一列则表示这个实体的一个属性。•当使用关系型数据库时,高效的空间索引至关重要。•SDE:DEM数据的分解存储。DEM数据库结构实质上是DEM的数据结构。对于TIN而言,一般是把三角