第四章地理信息系统空间数据库第1节空间数据库概述第2节传统的数据模型第3节语义和面向对象数据模型第4节空间数据库逻辑模型设计和物理设计第5节GIS空间时态数据库主要内容第一节空间数据库概述1.数据库的相关概念①数据库:是指长期储存在计算机内有结构的、大量的、可共享的数据集合。②数据库管理系统:是位于用户与操作系统之间的一层数据管理软件;他的功能包括:数据定义,数据操作,数据库的运行管理,数据库的建立和维护。③数据库系统:指在计算机系统中引入数据库后的系统,它由数据库、数据库管理系统及其开发工具、应用系统、数据库管理员和用户构成。④数据库系统管理员:负责数据库的建立、使用和维护的专门人员。一、空间数据库的概念第一节空间数据库概述2.空间数据库的相关概念空间数据库:是地理信息系统在计算机物理存储介质存储的与应用相关的地理空间数据的总合,以一系列特定结构的文件形式组织后存储在介质上。空间数据库(系统)组成:空间数据库:是地理信息系统在计算机物理存储介质存储的与应用相关的地理空间数据的总合,一般是以一系列特定结构的文件形式组织后存储在介质上。空间数据库管理系统:是指能够对物理介质上存储的地理空间数据进行语义和逻辑上的定义,提供必需的空间数据查询检索和存取功能,以及能够对空间数据进行有效的维护和更新的一套软件。数据库应用系统:应用模块。第一节空间数据库概述常规数据库管理系统扩展:直接对常规数据库管理系统进行扩展,加入一定数量的空间数据存储与管理功能。例如:Oracle空间数据库引擎(SDE:SpatialDatabaseEngine):在常规数据库管理系统上加一层空间数据库引擎,实现空间数据的存储与管理。例如:ESRI的SDE3、空间数据库管理系统的实现方法空间数据库管理系统是建立在常规数据库管理系统的基础上,实现对空间数据的管理功能。第一节空间数据库概述转换现实世界人类的认识、抽象机器世界DBMS支持的数据模型现实世界中客观实体的抽象过程信息世界的概念模型1.空间数据库的设计过程这一过程一般需要两步①人类对客体的认识、抽象,建立概念模型。②将概念模型转换为计算机能够接受的形式,即数据模型。就是将地理空间客体按一定的组织形式,在数据库系统中加以表达的过程。二、空间数据库的设计第一节空间数据库概述地理空间是一个三维空间,有四个基本实体点实体线实体面实体体实体地理空间的认知①地理空间实体(客体)第一节空间数据库概述②地理空间实体间的联系空间联系属性联系时间联系空间位置,空间分布,空间形态、空间相关等空间信息反映了空间分析所能揭示的信息,彼此互有联系通过实体变化过程来反映。实体间的属性主要体现为属性多级分类体系中的从属关系、聚类关系和相关关系第一节空间数据库概述能够对空间数据进行统一管理帮助用户查询、检索、增加删除和修改数据保障空间数据的独立性、完整性、和安全性2.空间数据库的数据模型设计数据模型建立的目的揭示空间实体的本质特征,并对其进行抽象化,使之转化为计算机能够接受和处理的数据形式。第一节空间数据库概述实际上是现实世界到机器世界的一个中间层。概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象,是设计人员的有力工具。(1)概念模型概念结构设计过程用户需求需求分析抽象信息结构概念模型概念结构能够真实、处分的反映现实世界易于理解用户与设计人员易于更改需求改变模型改变易于转换关系、网状、层次特点E-R图第一节空间数据库概述(1)实体(Entity):客观存在并可相互区别的事物(2)属性(Attribute):实体所具有的某一特性(3)码(Key):唯一标识实体的属性集(4)域(Domain):属性的取值范围(5)实体型(EntityType):具有相同属性的实体必然有共同的特征和性质(6)实体集(EntitySet):同型实体的集合(7)联系(Relationship):不同实体集之间的联系信息世界中的基本概念第一节空间数据库概述①一对一联系(1:1)②一对多联系(1:n)。③多对多联系(m:n)注意:E-R图仅仅是对现实世界描述的一种工具,仅能建立概念模型(信息模型),不能在计算机上直接实现。两个实体之间的联系可分为以下三类第一节空间数据库概述层次模型网状模型关系模型面向对象模型(2)数据模型常用数据模型种类第一节空间数据库概述设计原则:①尽量减少空间数据存储冗余;②提供稳定的空间数据结构,在用户的需要改变时,数据结构能够做出相应的变化;③满足用户对空间数据及时访问的需求,高效提供用户所需的空间数据查询结果;④在空间元素间维持复杂的联系,反映空间数据的复杂性;⑤支持多种决策需要,具有较强的应用适应性。3.空间数据库设计的原则、步骤和技术方法第一节空间数据库概述第一步需求分析第二步概念设计第三步逻辑设计第四步物理设计第五步数据库的实施和维护设计步骤第一节空间数据库概述明白即将开发的GIS所支持的各种功能;了解系统要求的数据内容和行为;了解数据之间的关系和优先次序,这些信息有利于制定数据库的开发实施计划。了解数据库和GIS的整体要求和蓝图。现状调查调查内容的组织的分析第一步用户需求分析GIS数据库开发应该主要了解下面的内容用户需求分析方法:第一节空间数据库概述用户需求分析过程现状调查:通过实际调查了解用户的现状及要求调查内容的组织的分析:对调查的结果进行整理、分析和组织,并提交报告及图件。包括:现有机构的组织结构图软件、硬件资源表专业人员清单部门功能清单数据来源清单第一节空间数据库概述把用户的需求加以解释,用概念模型表达出来,具体任务包括:1)数据库的宏观定义指对数据库比例尺、地图投影和坐标系统的定义。2)数据库的特征设计对于各种地理特征有关的属性数据中以什么几何形式表达进行设计。3)数据库表格及其关系的设计表达对与地理特征有关的属性数据在数据库中表达方式的设计。第二步概念化设计第一节空间数据库概述4)数据库总体设计的评定根据数据库的应用目的和数据内容及使用方式来评价前面三步的设计结果。5)数据库概念模型的起草将GIS数据库的概念设计起草成正式的文件,作为后面详细设计时参考。第一节空间数据库概述第三步逻辑设计逻辑设计应该选择最适于描述与表达相应概念结构的数据模型,然后选择最合适的空间数据库管理系统。设计逻辑结构时一般要分三步进行:①将概念结构转换为一般的关系、网状、层次模型②将转化来的关系、网状、层次模型向特定空间数据库系统支持下的数据模型转换。③对数据模型进行优化。第一节空间数据库概述数据库的物理设计特点设计人员必须充分了解所用DBMS的内部特征,特别是存储结构和存取方法;充分了解应用环境,特别是应用的处理频率和响应时间要求;充分了解外存设备的特性。第四步物理设计数据库最终是要存储在物理设备上的。为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构(存储结构与存取方法)的过程,就是数据库的物理设计。第一节空间数据库概述根据逻辑设计和物理设计的结果,在计算机上建立实际的空间数据库系统,装入空间数据,并调试和运行。建立实际的空间数据库结构装入试验性的空间数据对应用程序进行测试,以确认其功能和性能是否满足设计要求装入实际的空间数据,即数据库加载,建立起实际运行的数据库。数据库试运行1、数据库的实现三、空间数据库的实施和维护第一节空间数据库概述2、相关的其它设计在数据库试运行期间,应进一步完善数据库的功能和性能。(1)空间数据库再组织:调整或者改变空间数据库的概念、逻辑和物理结构的。(2)安全性考虑:规定相应的数据库使用权限,保证数据库的安全运行。主要方法是授权。(3)故障恢复处理:数据库恢复就是把数据库从错误状态恢复到某一已知的正确状态(亦称为一致状态或完整状态)的功能。(4)事务控制:事务控制的目的就是保证多用户环境下的数据库的完整性和一致性。第一节空间数据库概述(1)维护空间数据库的安全性和完整性:需要及时调整授权和密码,转储及恢复数据库(2)监测并改善数据库性能:分析评估存储空间和响应时间。(3)增加新功能:按用户的需要及时扩充功能,满足用户的新需要。(4)修改错误:包括程序和数据。3、空间数据库的运行与维护第二节传统的数据模型一、层次数据模型有且只有一个结点没有双亲结点,这个结点称为根结点根以外的其它结点有且只有一个双亲结点同一双亲的子女结点称为兄弟结点,没有子女结点的结点称为叶结点。层次模型是数据库系统中最早出现的数据模型,层次数据库系统采用层次模型作为数据的组织方式,用树形结构来表示各类实体以及实体间的联系。如行政机构,家族关系等。(1)层次模型的数据结构特点第二节传统的数据模型R1R3R2R4R5兄弟结点兄弟结点根结点叶结点叶结点一个层次模型的示例叶结点在右图的例子中,R1根结点,R2和R3为兄弟结点,是R1的子女结点;R4和R5为兄弟结点,是R2的子女结点;R3,R4,R4,是叶结点。第二节传统的数据模型Coverage记录polygons记录arcs记录nodes记录coordinates记录多边形层次数据结构第二节传统的数据模型(2)层次模型的数据存储层次数据库中不仅要存储数据本身,还要存储数据之间的层次关系,应将两者的存储结合在一起。数据存储方法包括:邻接法(树遍历法)和通用选择法第二节传统的数据模型A1B1B4B6C3C7C14C2C5C9C4C6C8A1C14B1C3C5C7B4C2C9B6C4C6C8...邻接法层次数据库及其实例邻接法(树遍历法)按照层次树前序穿越的顺序,把所有记录值依次邻接存放,即通过物理空间的位置相邻来体现(或隐含)层次顺序。数据检索首先搜索双亲结点,然后搜索其子女结点。第二节传统的数据模型通用选择法通用选择法不依赖于客体在树状结构中的顺序,而是根据所确定的选择条件,在结构中选择某特定的客体。DRAWcoordinatesWHEREarcs=‘arc1’例如:从数据库中提取弧段arc1的坐标并显示第二节传统的数据模型二、网络数据模型在现实世界中客体的联系更多的是非层次关系的,用层次模型表示非树形结构是很不直接的,网络模型可以克服这一弊病。在数据库中,把满足以下两个条件的基本层次联系集合称为网状模型:允许一个以上的结点无双亲:一个结点可以有多于一个的双亲。网状模型可以更直接地去描述现实世界,而层次模型实际上是网状模型的一个特例第二节传统的数据模型网状模型示例L1L5L3L4L1L2L1L2R1R2R3R1R2R3R5R4R1R2L2网状模型的例子(a)(b)(c)右图(a)中,R3有两个双亲记录R1和R2把R1和R2之间的联系命名为L1,把R2与R3的联系命名为L2第二节传统的数据模型网状模型的数据结构网状数据库的存储结构中关键是如何实现记录之间的联系。常用的方法是链接法,包括单向链接、双向链接、向首链接等,此外还有其它实现方法,如引元阵列法、二进制阵列法、索引法等依据具体系统不同而不同。网状数据库实例第二节传统的数据模型三、关系数据模型1、关系模型的基本概念(1)关系关系是一个二维表,表的每行对应一个元组,表的每列对应一个域。元组域表的每行对应一个元组域是一组具有相同数据类型的值的集合属性:每列起一个名字,如XTIC第二节传统的数据模型基本关系通常可称为基本表或基表,它是实际存储数据的逻辑表示。查询表是查询结果对应的表视图表是由基本表或其它视图表导出的表,是虚表,不对应实际存储的数据。(2)关系的类型第二节传统的数据模型关系中某一属性组,若它的值能唯一地标识一个元组,则称该属性组为候选关键字。关键字(3)关键字主关键字:若一个关系有多个候选码,则选定其中一个为主关键字。主属性:主关键字的诸属性称为主属性。非码属性:不包含在任何候选关键字中的属性称为非码属性。第二节传统的数据模型一个关系需要描述的方面:①关系是元组的集合,因此关系模式必须指出这个元组集合的结构,即它由哪些属性构成,属性来自哪个域,以及属性与域的映象关系。②一个关系通常是由赋予它的元组语义来确定的。元组语义实质上是