空间数据库第一章绪论1、数据库是长期存储在计算机内的、有组织的、可共享的数据集合;空间数据库是描述与特定空间位置有关的真实世界对象的数据集合。2、空间数据是对空间事物的描述,用来描述空间实体的位置、形状、大小及其分布特征等多方面的信息;空间数据包括文字、数字、图形、影像、声音等主要类型。3、GIS中数据的来源:地图数据、影像数据、地形数据、属性数据;空间数据特征:时空特征、多维特征、多尺度性、海量数据特征。4、空间数据库的作用:空间数据处理与更新、海量数据存储与管理、空间分析与决策、空间信息交换与共享。5、空间数据库系统是一个存储空间和非空间数据的数据库系统,在它的数据模型和查询语言中能提供空间数据类型,可以进行空间动态索引,并提供空间查询和空间分析的功能。6、空间数据库特征:综合抽象特征、非结构化特征、分类编码特征、复杂性与多样性。7、空间数据库与传统数据库的差异:(1)信息描述差异(在空间数据库中,数据比较复杂。不仅有一般地理要素的属性数据,还有大量的空间数据;空间数据库是一个复杂的系统,要用数据来描述各种地理要素,尤其是要素的空间分布,其数据量大,空间数据库中的数据具有丰富的隐含信息);(2)数据管理差异(传统数据库的管理是不连续的、相关性较小的数字和字符,而空间数据是连续的,具有很强的相关性;传统数据库管理的实体较少,并且实体类型之间只有简单的空间关系,而空间数据库实体类型繁多,实体类型之间存在着复杂的空间关系,并且能够产生新的关系;传统数据库只针对简单对象,无法有效地支持复杂对象,而空间数据库由于不同空间目标的坐标串长度不定,具有变长记录,并且数据项有可能很大、很复杂;传统数据库无法支持以复杂对象为主体的GIS领域,地理空间数据必须具有对地理对象进行模拟和推导的功能);(3)数据操作差异(从数据操作的角度,地理空间数据管理中需要进行大量的空间数据操作和查询,而传统数据库系统只操纵和查询文字和数字信息,难以适应空间操作);(4)数据更新差异(数据更新周期不同;数据更新的角色不同;访问的数据量不同;数据更新的策略不同);(5)服务应用差异(空间数据库的服务和应用范围相当广泛;空间数据库是一个共享或分享式的数据库;传统的关系数据库中存储和处理的大都是关系数据)。第二章空间现象抽象表达1、空间认知是对现实世界的空间属性包括位置、大小、距离、方向、形状、模式、运动和物体内部关系的认识,是通过获取、处理、存储、传递和翻译空间信息,来获取空间知识的过程。2、空间类型具有五种形式:物理空间、感觉运动空间、感知空间、认知空间、符号空间。3、空间认知模式:空间特征感知、空间对象认知、空间格局认知。4、模型是对现实世界中的实体和现象的抽象或简化,是对实体或现象中最重要的构成及其相互关系的表达,能反映事物的固有特征及其相互关系或运动变化规律。GIS概念数据模型是考虑用户需求的共性,用统一的语言描述、综合、集成的用户视图。5、GIS空间数据模型由概念数据模型、逻辑数据模型、物理数据模型三个不同层次组成。6、空间实体是存在于自然世界中地理实体,与地理空间位置或特征相关联,在空间数据中不可再分的最小单元现象层称为空间实体。基本的空间实体有点、线、面、体四种类型。7、矢量数据结构是利用欧几里得学的中心点、线、面及其组合体来表示地空间分布的一种数据组织方式。矢量数据结构主要有Spaghetti(面条)结构和拓扑矢量数据结构。Spaghetti(面条)结构的特点:(1)数据按点、线或多边形为单元进行组织,易于实现以多边形为单元的运作,数据编排直观,数字化后无需进行大量的编辑整理,即可方便地显示;(2)每个多边形都以闭合线段存储,多边形的公共边界被数字化两次和存储两次,线性数据库中被多次记录,造成数据冗余;(3)点、线和多边形有各自的坐标数据,每个多边形自成体系,但缺少有关拓扑关系的信息;(4)多边形公共边界线的两次输入,记录常不一致,容易造成数据结构的破坏,引起严重的匹配误差;(5)不能解决“洞”和“岛”之类的多边形镶嵌问题,岛只作为一个单个图形,没有与外界多边形的联系,难以表达多边形包含关系。8、拓扑矢量数据结构是指根据拓扑几何学原理进行空间数据组织的方式。最基本的拓扑关系是:关联、邻接、包含。拓扑矢量数据结构的特点:(1)一个多边形和另一个多边形之间没有空间坐标的重复,这样就消除了重复线;(2)拓扑信息与空间坐标分别存储,有利于进行近邻、包含和相连等查询操作;(3)拓扑表现必须在一开始就创建,这要花费一定的时间和空间;(4)一些简单的操作比如图形显示比较慢,因为图形显示需要的是空间坐标而非拓扑结构。9、栅格数据结构就是将地理空间连续分布的区域进行离散化,用二维规则栅格覆盖整个连续区域,地理实体表面被分割为互相邻接、规则排列的栅格地块,每个地块与栅格数据中的一个像元对应。栅格数据来源:目读法、手扶数字跟踪化、扫描数字化、分类影像输入。栅格数据的取值方法:中心归属法、面积占优法、长度占优法、重要性法。第三章空间数据模型1、空间关系是指空间目标之间在一定区域上构成的与空间特性有关的联系,这种联系可分为拓扑关系、度量关系、顺序关系。拓扑关系指拓扑变换下的拓扑变量;度量关系是用某种度量空间中的度量描述的目标间的关系;方位关系用来描述目标在整体和局部之间的某种顺序关系。2、采用相离、相等、相接、相交、包含于、包含、叠加、覆盖、被覆盖、进入、穿越和被穿越共12种基本空间关系表达3D空间中的点—点、点—线、点—面、点—体、线—线、线—面、线—体、面—面、面—体、体—体10类有理论价值和实际意义的空间拓扑关系。3、面向对象的数据模型是将面向对象的概念模型转换为面向对象数据库模式的方法和工具的总和。面向对象数据模型涉及四个抽象概念:分类、概括、聚集、联合,以及继承和传播两个语义模型工具。对象间的关系概括为分类关系、组合关系、关联关系。继承与传播的区别:(1)继承服务于概括,传播作用于联合和聚集;(2)继承是从上层到下层,应用与类,而传播是自下而上,直接作用于对象;(3)继承包括属性和操作,而传播一般仅涉及属性;(4)继承是一种信息隐含机制,而传播是一种强制性工具。5、不规则三角网(TIN)是一种空间数据结构,也称不规则三角形面模型。它由不规则分布的数据点连成的三角网组成,是一种基于三角形的空间镶嵌模型,三角形的大小取决与不规则分布的观测点或称结点的密度和位置。TIN生成的算法:逐点插入法、分治算法和三角形生长法。6、将现有空间构模方法分为:基于面模型、基于体模型和基于混合模型的三大类构模体系,根据模型所具有的主要特征大致又分为:三维矢量模型、混合或集成数据模型和面向实体的数据模型。7、八叉树数据结构是将所有要表示的三维空间V按X、Y、Z三个方向从中间进行分割,把V分割成八个立方体,然后根据每个立方体所含的目标来决定是否对各立方体继续进行八等分的划分。8、四面体网格(TEN)是将目标空间用紧密排列但不重叠的不规则四面体形成的格网来表示,其实质是2DTIN结构在3D空间上的扩展。第四章空间数据组织与管理1、空间数据库系统不仅包括空间数据库本身,还包括相应的计算机硬件系统、操作系统、计算机网络结构、数据库管理系统、空间数据管理系统、地理空间数据库和空间数据库管理人员等组成的一个运行系统。2、数据库的管理方式:文件管理、文件与数据库混合管理、全关系型数据库管理、面向对象数据库管理、对象—关系数据库管理。3、空间数据引擎是用来解决如何在关系数据库中存储空间数据,实现正真的数据库方式管理空间数据,建立空间数据服务器的方法。空间数据库引擎的作用:(1)与空间数据库联合,为任何支持的用户提供空间数据服务;(2)提供开放的数据访问,通过TCP/IP横跨任何同构或异构网络,支持分布式的GIS系统;(3)SDE对外提供了空间几何对象模型,用户可以在此模型基础之上建立空间几何对象,并对这些几何对象进行操作;(4)快速的数据提取和分析,SDE提供快速的空间数据提取和分析功能,可进行基于拓扑的查询、缓冲区分析、叠加分析、合并和切分等;(5)SDE提供了连接DBMS数据库的接口,其他的一切涉及与DBMS数据库进行交互的操作都是在此基础上完成;(6)与空间数据库联合可以管理海量空间信息,SDE在用户与物理数据的远程存储之间构建了一个抽象层,允许用户在逻辑层面上与数据库交互,而实际的物理存储则交由数据库来管理;(7)无缝的数据管理,实现空间数据与属性数据统一存储;(8)并发访问,SDE与空间数据库相结合,提供空间数据的并发响应机制。4、空间数据库引擎ArcSDE的功能主要有:(1)高性能的DBMS通道。ArcSDE是多种DBMS的通道,是一个能够在多种DBMS平台上提供高级的、高性能的GIS数据管理接口。(2)开放的DBMS支持。ArcSDE允许在多种DBMS中管理地理信息数据。(3)多用户。ArcSDE为用户提供大型的空间数据库支持,并支持多用户编辑。(4)GIS工作流和长事务处理。GIS中的数据管理工作流,依赖长事务处理和版本管理,ArcSDE为DBMS提供了这种技术。(5)丰富的地理数据模型。ArcSDE保证了存贮于DBMS中的矢量和栅格几何数据的高度完整性。(6)连续、可伸缩的数据库。ArcSDE可以支持海量的空间数据库和任意数量的用户。直至DBMS的上限。(7)灵活的配置。ArcSDE通道可以让用户在客户端应用程序内部或跨网络、跨计算机的对应应用服务器进行多种多层结构的配置方案,ArcSDE支持Windows、Unix、Linux等多种操作系统。5、空间数据与属性数据连接的四种方式:图形数据与专题属性数据分别管理、对通过DBMS扩展以增加空间数据库的管理能力、图形数据与属性数据具有统一的结构、图形数据与属性数据自成体系。6、空间数据组织(P107):纵向分层组织、横向分块组织。第五章空间数据索引技术1、空间索引是指在存储空间数据时依据空间对象的位置和形状或空间对象之间的某种空间关系,按一定顺序排列的一种数据结构,其中包含空间对象的概要信息,如对象的标识、外接矩形及指向空间对象实体的指针。目前存在的空间数据索引技术超过50种。可概括为树结构、线性映射和多维空间区域变换三种类型,从应用范围上可分为静态索引和动态索引。典型的空间索引技术包括R树索引、四叉树索引、网格索引等。2、R树索引(P131)、R+树索引(P137)、四叉树索引(P145)、PR四叉树(P147)。四叉树索引的几种方法:点四叉树索引、MX四叉树索引、PR四叉树索引、GIF四叉树索引。第六章空间数据查询、访问1、关系数据库结构化查询语言(SQL)的优点:非过程化语言、统一的语言、所有关系数据库的公共语言。SQL语句是由命令、从句、运算符和合计函数所构成的,功能包括查询、操纵、定义和控制四个方面,是一个综合的、通用的、功能极强的关系数据库语言。2、扩展关系模型主要从以下几个方面进行扩展:(1)突破关系模型中关系必须是第一范式的限制,允许定义层次关系和嵌套关系;(2)增加抽象数据类型如图形数据类型点、线、面、栅格、图像等和用户自定义数据类型;(3)增加空间谓词,例如,表示空间关系的谓词,包含、相交等,表示空间操作的谓词,叠加、缓冲区等;(4)增加适合于空间数据索引的方法,如R树。四叉树等。3、OpenGIS是基于空间的对象的模型的,对SQL进行了扩展,它提供了:(1)针对所有几何类型的基本操作;(2)描述空间对象间拓扑关系的函数;(3)空间分析的一般操作。4、SQL3/SQL99(P166)定义了三种空间对象类型:ST_MultiPoint、ST_MultiCurve、ST_MultiPolygon。5、空间选择查询也称范围查询,即在地图上划出一个区域,查询该区域内的所有空间数据。主要的空间查询包括点查询、区域查询和最近邻查询三种空间选择查询。6、查询路径优化:查询优化器、语法分析、逻辑转换、基于代价的优化。7、空间查询的处理步骤:过滤、求精。过滤筛选过程的对象近似技术,空间查询精炼步骤中的相关技术,平面扫描技术、