合肥工业大学资源与环境工程学院Email:njuzhp@sina.comQQ:526091899主要内容第1节空间数据库概述第2节空间数据库概念模型设计第3节空间数据库逻辑模型设计第4节空间数据库的物理设计本章重点:•空间数据库概念、构造的原理、模型和方法第5节空间数据查询第9节空间时态数据库第6节空间数据库索引第7节空间元数据第8节空间数据库引擎数据库是一个信息系统的基本且重要的组成部分,是以一定的组织方式存储在一起的相互关联的数据集合。数据库系统的构成①数据库存储系统:按照一定的结构组织在一起的相关数据的集合②数据库管理系统:数据库建立、使用和管理的软件系统③数据库应用系统:对数据库访问和操作的应用软件,满足用户要求•作用:数据存储与管理辅助用户的空间分析与决策•要求:高效•关键:数据模型第一节空间数据库概述一、空间数据库的概念•空间数据文件存储管理:空间数据以操作系统的文件形式保存在计算机中。特点:一个GIS软件可以同时直接使用多个空间数据文件,一个空间数据文件也可同时为多个GIS软件共享;但空间数据存储在不同的文件里造成数据是面向应用的,多个文件之间彼此孤立,不能反映数据间的联系,易造成数据的冗余和不一致性等问题。•空间数据库存储管理空间数据库主要是为GIS提供空间数据的存储和管理方法。空间数据的存储和管理通常有两种方式:空间数据库系统也是由三部分构成,所不同的是研究对象为空间数据。空间数据库系统的构成①空间数据库:是地理信息系统在计算机物理存储介质上存储的与应用相关的地理空间数据的总和,一般是以一系列特定结构的文件的形式组织在存储介质之上的。②空间数据库管理系统:指能够对物理介质上存储的地理空间数据进行语义和逻辑上的定义,提供必需的空间数据查询和存取功能,以及能够对空间数据进行有效的维护和更新的一套软件系统。③空间数据库应用系统:地理信息系统的应用软件部分,如GIS的空间分析模型和应用模型等。空间数据库的特点:•数据量特别大;•不仅有地理要素的属性数据(与一般数据库中的数据性质相似),还有大量的空间数据,即描述地理要素空间分布位置的数据,并且这两种数据之间具有不可分割的联系;•数据应用广泛,例如地理研究、环境保护、土地利用与规划、资源开发、生态环境、市政管理、道路建设等。•初级管理模式•混合管理模式•扩展式管理模式•集成式管理模式空间数据管理实现方式的发展•初级管理模式基于文件的管理方法,其空间分析功能和属性处理功能分别直接调用空间数据文件和属性数据文件进行处理。代表:ArcInfo的Coverage文件管理模式。•混合管理模式其空间分析功能调用空间数据库管理模块对空间数据文件进行处理,属性数据使用属性数据库进行管理。代表:ArcInfo、ArcView的shape文件和MapInfo的.TAB文件等管理模式•扩展式管理模式在常规数据库管理系统之上添加一层空间数据库引擎,以获得常规数据库管理系统功能之外的空间数据存储和管理能力。代表:ArcInfo的Geodatabase(SDE)。•集成式管理模式直接对常规数据库管理系统进行功能扩展,加入一定数量的空间数据存储和管理功能。代表:OracleSpatialCartridge(对象—关系数据库)。空间数据库的设计,其实质是将地理空间实体以一定的组织形式在数据库系统中加以表达的过程,也就是GIS中的空间实体建立数据模型的过程。空间数据库设计--空间数据的模型化(一)设计过程和步骤二、空间数据库的设计需求分析概念设计逻辑设计物理设计数据库数据库的概念模型数据库的逻辑模型数据库的存储模型现实世界概念世界计算机世界(二)空间数据库设计的原则和技术方法设计原则•较少的冗余量•稳定和灵活的数据结构•高效的访问和查询•能反映空间数据间的复杂性•较强的应用适应性设计技术数据设计者使用的设计工具,其中包括各种算法、文本化方法、用户组织的图形表示法、各种转化规则、数据库定义的方法及编程技术。设计技术分为两类:数据分析技术和技术设计技术,两类技术所处理的是两类不同的问题。(一)空间数据库的实现建立空间数据结构装入试验数据进行测试装入实际数据调试运行(二)空间数据库的运行与维护维护空间数据库的安全性和完整性测试并改善数据库性能增加新的功能修改错误三、空间数据库的实现和维护第二节空间数据库概念模型设计概念模型设计阶段要产生反映GIS需求的数据库概念模型。概念模型是对错综复杂的现实世界的认识与抽象,是关于实体及实体间联系的抽象概念集。普遍采用的概念模型是:语义数据模型面向对象数据模型语义模型的模型结构是由若干种抽象所组成,用这些抽象来描述空间实体的基本语义特征,再根据语义模型结构规则把这些抽象有机地组织起来形成模型。最常用的语义模型之一是实体—联系模型(E-R模型),可以通过E-R图的图示方法进行设计。E-R模型由三部分组成:实体:实体是对客观存在的起独立作用的客体的一种抽象。在E-R图中用矩形符号表示,实体名标注于矩形符号内。联系:联系是客体间有意义的相互作用或对应关系,分为1:1、1:N、M:N三种类型。用菱形符号表示,实体和联系之间用线段连接并注明连接类型。属性:属性是对实体和联系特征的描述。用椭圆表示,椭圆中标注属性名称,属性同实体和联系之间也用线段连接。一、语义数据模型边线走向街道路面质量所属路段所属街道组成长度等m1模型E-R优点:接近人的思想,易于理解,同时,与计算机的具体实现无关,是一种很好的概念设计模型,但不能在数据库中直接实现。采用E-R模型进行数据库概念设计的三个步骤:•设计局部E-R模型:完成局部结构范围的确定,定义属性、实体和联系,以及属性的分配。•设计全局E-R模型:将所有局部的E-R图综合成单一的全局的E-R图。•全局E-R模型的优化:达到三个目的(实体类型个数尽可能少,实体类型所含的属性尽可能少,实体类型间联系无冗余)具体有以下优化方式:①通过实体类型的合并来实现②冗余属性的消除③冗余联系的消除(一)基本概念对象:是对客观世界实体的抽象描述,由数据和对数据的操作组合而成,具有封装性、继承性、多态性等。如:一个城市、一条河流•具有一个唯一的标识,•具有一组描述特征的属性,以表明其在某一时刻的状态—静态属性—数据,通过域来描述,•具有一组表示行为的操作方法,用以改变对象的状态。--作用、功能—函数、方法。将方法与数据放于一对象中,以使对数据的操作只可通过该对象本身的方法来进行。即将对象的状态及其操作集成化,使之不受外界影响,具有封装性。二、面向对象的数据模型消息:是对象之间通信的手段,用来指示接收消息的对象的操作。分为:•公有消息:可由其他对象向它发送的消息。•私有消息:由它自己向自身发送的消息。类和实例:•类:是对多个相似对象共同特性的描述。共享同一属性和方法集的所有对象的集合构成类。•实例:是由一特定类描述的具体对象。类和实例之间是抽象和具体的关系,实例是某类的一个具体对象,类是多个实例的抽象综合。(二)继承及类之间的层次关系继承:是一种现实世界中对象之间独特的关系,它使得某类对象可以得到另一类对象的特征和能力。如饭店子类从建筑物类继承地址、建筑日期等属性。•继承性具有双重作用:一是减少代码冗余;二是通过协调性来减少相互之间的接口和界面。•继承从对象类的数量上看可分为分单继承(子类仅有一个直接的父类)和多继承(允许多于一个直接父类)两种。类的层次结构:是引入类的继承关系而产生的,被继承的类称为超类(基类),继承其他类的类称为子类(派生类)(三)功能重载和多态性面向对象系统中消息传递的实现是以重载和多态为支撑概念的,也可以说,重载和多态概念是消息传递模式的自然体现。功能重载:实际上意味着特定的函数不仅以名称来区分,而且用它所带的参数来区别。多态:是指同一个消息可以根据发送消息对象的不同采用多种不同的行为方式。(四)概括和聚集概括:概括是把一组具有相同持征和操作的对象归纳在一个更一般的超类中。聚集:聚集反映了嵌套对象的概念,嵌套对象是由一些其他对象组成的,它是用来描述更高层次对象的一种形式。即把几个不同性质类的对象组合成一个更高级的复合对象的过程。运用面向对象的概念和方法就可以建立起GIS中空间数据库的对象数据模型。如OpenGIS协会推荐的空间对象数据模型:(五)空间数据库对象模型ORM即对象角色建模(ObjectRoleModeling),是运用面向对象的原理进行数据库概念建模的软件工程方法。它提供了概念性的、易于理解的模型化数据的技术。该方法使用用户和设计人员都能够理解的直观符号和自然语言事实来说明应用领域的对象。该方法还提供了一组全面的约束来表达业务规则。ORM图是用图形符号的形式表现对象角色建模的结果。它用对象类型和谓词来表达一个事实。(六)ORM图对象类型:表示实际对象或概念的类型,必须以大写字母开头的英文名词的形式出现,必须具有唯一的定义,且在模型范围内只能被定义一次。对象类型有两类:•实体对象类型:是由实际事物组成的对象类型。在图中用实线椭圆表示。•值对象类型:是由数字或字符串组成的数字类型,一般用于说明实体对象类型。在图中用虚线椭圆表示。谓词:是描述由对象类型扮演的角色的事实的一部分。每一谓词都分为若干角色,在ORM图中,表示为一个或多个角色框的序列。约束:是一种规则,用来规定数据的关系,唯一性约束用双向箭头表示,强制性约束用圆点表示。ORM图可以表达子类型的关系。Spatial_ObjPolygonPolygon_ID具有/属于第三节空间数据库逻辑模型设计数据库逻辑设计的任务是把数据库概念设计阶段产生的概念数据库模式变换为逻辑数据库模式,即适应于某种特定数据库管理系统所支持的逻辑模型。传统的数据模型层次模型网状模型关系模型一、层次模型概念:层次模型是以记录类型为结点的有向树或森林,能很好地表达1:N的关系。主要特点:①除根结点外,任何结点都有且只有一个“父亲”;②“父”结点表示的实体与“子”结点表示的实体是一对多的关系。adcfeb1243ⅠⅡ5M12233441abcd343554cefⅠⅡM层次模型反映了实体之间的层次关系,简单、直观,易于理解,并在一定程度上支持数据的重构。层次模型用于GIS地理数据库的局限性①很难描述复杂的地理实体之间的联系,描述多对多的关系时导致②对任何对象的查询都必须从层次结构的根结点开始,低层次对象的查询效率很低,③数据独立性较差,数据更新涉及许多指针,插入和删除操作比较复杂,④层次命令具有过程式性质,要求用户了解数据的物理结构,并在⑤基本不具备演绎功能和操作代数基础。二、网状模型概念:网状模型将数据组织成有向图结构(系结构),图中的结点代表数据记录,连线描述不同结点数据间的联系。特点:①可以有一个以上的结点没有“父”结点;②至少有一个结点有多于一个“父”结点;③结点之间可以有多种联系;④可以存在回路。adcfeb1243ⅠⅡ5Mabcd12345efⅠⅡM网状模型反映地理世界中常见的多对多关系,支持数据重构,具有一定的数据独立和数据共享特性,且运行效率较高。网状模型用于GIS地理数据库的局限性①由于网状结构的复杂性,增加了用户查询的定位困难,要求用户熟悉数据的逻辑结构,②网状数据操作命令具有过程式性质,存在与层次模型相同的问题;③④基本不具备演绎功能和操作代数基础。三、关系模型关系数据模型是把数据的逻辑结构归结为满足一定条件的二维表格,每个二维表格称为一个关系。关系模型以记录组或数据表的形式组织数据,便于利用各种地理实体与属性之间的关系进行存储和变换,不分层也无指针,是建立空间数据和属性数据之间关系的一种非常有效的数据组织方法。(一)关系数据模型的基本概念关系:是一个二维表,表的每行对应一个元组,表的每列对应一个域。由于域可以相同,为了加以区分,为每列起一个名字,称为属性。关键字:关系中的某一属性组,若它的值唯一地标识了一个元组,则称该属性组为候选关键字。若一个关系中有多个候选关键字,则选定一个为主关键字,该关键字