查询1、从查询处理的角度来看,空间数据库与关系数据库之间区别:答:至少有三个主要区别:①、与关系数据库不同,空间数据库没有固定的运算符集合可以充当查询计算的基本构件②、空间数据库要处理非常大量的复杂对象,这些对象具有空间范围,不能自然的排列成一维数组。③、检测空间谓语要用到计算量极大的算法,所以不能再假定I/O代价在CPU的处理代价中只能主导地位2、空间查询的基本构件:点查询:给定一个查询点P,找出所有包含它的空间对象O;范围或区域查询:给定一个查询多边形P,找出所有与之相交的空间对象O;空间链接:两个表R和S基于一个空间谓语θ进行连接时,该连接成为空间连接。最近邻居:空间聚集,即给定一个对象O,找出所有距离O最近的对象P3、空间查询处理的“过滤-精炼模式”是什么,其目的?(对象操作的两步查询处理)目的:用两步算法高效地处理复杂的数据类型过滤:寻找Q最终结果的超集S;精炼:利用GIS处理S来找到精确的Q的答案过滤-精炼策略的作用?两个步骤的内容是什么?提示:ppt:EfficientalgorithmstoanswerspatialqueriesCommonStrategy-filterandrefine(过滤-精炼)FilterStep:QueryRegionoverlapswithMBRsofB,CandD过滤:查询区域与B、C、D的最小外接矩形有重叠部分,保留B、C、D,其他的舍弃RefineStep:QueryRegionoverlapswithBandC精炼:查询区域与B、C有重叠,舍弃D4、空间查询处理中,一般是采用什么(MBR))来替代不同类型的空间实体(如线、面)?这样做有何好处?答:Minimumorthogonalboundingrectangle(MOBRorMBR)最小外接矩形;能够加快查询速度5、对于点查询、区域查询、空间连接查询操作,各自有哪些处理算法(策略)?它们与什么因素有关?答:点查询:数据未排列且没有索引:穷举法,扫描整个文件并判断每条记录是否满足谓语;建立空间索引:在索引中使用find操作;需要查找的磁盘扇区等于索引的深度;空间填充曲线散列:运用折半法寻找点;检验大约logB(n),的磁盘扇区;区域查询:数据未排列且没有索引:穷举法,扫描整个文件并判断每条记录是否满足谓语;建立空间索引:在索引中使用范围查询操作;空间填充曲线散列:验证Z值满足范围查询要求;使用折半查询找到最低的Z值;扫描前面的数据文件直至满足查询要求的最大的Z值空间连接:嵌套循环,检验所有可能的空间谓语对;基于空间分块,只检验普通空间区域的对象对;树匹配:从每张表中找出分层的的对象组22.举例说明单遍扫描查询和多遍扫描查询的概念。答:单边扫描查询中,被查询的表(关系)中的一条记录(元组)最多只被访问一次;例如“列出武大周围5km内的书店的名字”。多遍扫描查询是被查询的表(关系)中的一条记录(元组)至少被访问一次,例如“找出其代表的选取范围大于200公顷并且在这区拥有公司的女议员的名字”1、举例说明什么是空间数据、非空间数据?如何理解空间查询(spatialqueries)和非空间查询的区别(Non-spatialqueries)?答:河流的泛洪区,卫星影像数据、气象气候数据等都可以是空间数据,书店名称店员人数,去年的销售量,电话号码等是非空间数据,空间查询是对空间数据的查询或命令,非空间查询是对非空间数据的查询或命令。7、什么是查询优化器?查询优化器所承担的主要任务是什么?答:查询优化器是数据库软件中的一个模块,它用于产生不同计算计划并确定适当的执行策略。主要任务:逻辑转换、动态规划。8、对查询树进行逻辑转换的目的和一般方法是什么?答:方法:将非空间的选择和投影操作下推;目的:减少连接操作所涉及的关系大小,从而减少计算代价。拓扑关系1、什么是拓扑关系,举例说明拓扑与非拓扑特性、拓扑与非拓扑操作。答:是指满足拓扑几何学原理的各空间数据间的相互关系。即用结点、弧段和多边形所表示的实体之间的邻接关联和包含等关系。拓扑特性:弹性变形后临近物体之间的拓扑关系没有发生改变;非拓扑特性:弹性变形后临近物体之间的拓扑关系发生了改变3、说明九交模型表达拓扑关系的原理。答:在一个平面上。两个对象A、B之间的二元拓扑关系主要基于以下的相交情况,即分别是A和B的内部、边界、外部。值六部分可以构成九交模型。考虑取值有空(0)和非空(1),可以确定有29=512种二元拓扑关系。对于R²嵌在中的二维区域,有八个关系是可实现的,并且它们彼此互斥且完全覆盖。:相离、相接、交叠、相等、包含、在内部、覆盖、被覆盖。拓扑是在要素之间构建了空间关系的模型a.在单个要素类或是两个要素类之间的要素上定义有效的空间关系b.在位于同一个要素数据集中的要素类上创建_用于确保空间数据的完整性;基于一致的几何要素。_在要素间定义有效的空间关系ArcGIS拓扑类型:地图拓扑和数据库拓扑拓扑(Topology)-拓朴规则a.拓朴关系规则来指定空间数据必须满足的拓朴关系约束。例如指定要素之间的相邻、连接、覆盖、相交、重叠关系等。b.例如在城市规划中,两个相邻的地块之间不能有飞地,可以定义一条相应的拓朴规则:“相邻多边形间不能有空隙”;当以河流作为国界时,河流(线状)必须与国界线一致,可用规则:“线必须被多边形边线覆盖”。c.多边形拓朴规则(9条)1Mustnotoverlap案例:宗地之间不能互相重叠。2Mustnothavegaps案例:土地利用要素类必须是连续的无缝隙的3Containspoint案例:建筑物或宗地必须拥有一个地址(点要素表示)4Boundarymustbecoveredby案例:宗地多边形边线必须由宗地边线2覆盖。5Mutsbecoveredbyfeatureclassofpolygon案例:省要素必须被县要素所覆盖。6Mustbecoveredby案例:县多边形必须位于省多边形内。7Mustnotoverlapwith案例:海洋不能和陆地重合。8Mustcovereachother案例:县要素外边线构成的多边形和这些县的辖省要素类多边形。9Areaboundarymustbecoveredbyboundaryof案例:邮政代码区域是由多块宗地构成的。d.线拓朴规则(12条)1Mustnothavedangles案例:宗地地段不能包含悬挂结点。2Mustnothavepseudo-nodes案例:用于两个结点构成的弧段。3Mustnotoverlap案例:街道不能互相重叠。4Mustnotselfoverlap案例:街道不能自重叠。5Mustnotintersect案例:地块线(等高线)不能相交。6Mustnotselfintersect案例:街道要素不能够自相交7Mustnotintersectortouchinterior案例:地块边线不能和地块边线相交(只能够在端点处接触)。8Mustbesinglepart案例:所有巴士路线必须是单部件要素。9Mustnotoverlapwith案例:道路和铁路不能互相重叠。10Mustbecoveredbyfeatureclassof–lines案例:巴士路线必须被街道所覆盖。11Endpointmustbecoveredby案例:管道末端必须有阀门。12Mustbecoveredbyboundaryof(line)案例:宗地地段要素必须被多边形要素的边线所覆盖。e.点拓朴规则(4条)1Mustbeproperlyinsidepolygons案例:城市点要素必须被行政区划多边形要素所包含。2Mustbecoveredbyboundaryof(point)案例:国界碑必须在国土的边界上。3Mustbecoveredbyendpointof案例:阀门必须被管道末端覆盖。4Pointmustbecoveredbyline案例:收费站必须在公路上。f.特殊拓朴规则Mustbelargerthanclustertolerance这条规则将找到所有比拓朴容限小的要素。但并不会自动删除这些要素,给用户留下操作决定权。3.拓扑(Topology)-拓朴关系实现a.GeoDataBase中并不实际保存拓朴关系b.存储拓扑的属性1要素类一起参与2容限值:指落在以此值为半径的圆形区域内的所有点被看成是一致的,会被捕捉(snap)到一起。3等级:每个参与拓朴约束的要素类都可以人为的赋予一个精度等级,等级越高,在容限值范围内需要移动时越稳定,即级别低的要想等级高的移动。当不同的要素类数据精度不一致时,通常应将精度较高者设为高等级。4规则4.拓扑(Topology)-拓朴关系实现a.GeoDataBase拓朴关系检查与处理b.GeoDataBase拓朴关系的优势E-R图11、ER图向关系模型的转换,注意对多值属性的转换。答:①、实体成为关系;实体的属性映射成为关系的属性;多值属性形成新的关系②、Relationships(1:1):将任一实体的码属性作为其他关系的一个外码③、Relationships(M:1):将“1”侧的关系的主码作为“M”侧关系的外码。④、M:NRelationshipsbecomearelation(M:N中M和N共同形成新表的关键字)12、对于空间数据,ER模型方法的不足之处?为表达空间概念,扩展ER模型主要增加了哪些要素?--实体象形图、关系象形图,读懂扩展ER模型的表示符号。答:1)、ER模型的最初设计隐含了基于对象模型的假设。因此,场模型无法用ER模型进行自然的映射2)、在传统的ER模型中,实体之间的联系由所要开发的应用来导出,而在空间建模中,空间对象之间总会有内在的联系3)、建模空间对象所使用额试题联系类型和“地图”的比例尺有关13、举例说明用象形符号扩展ER图,对于空间数据建模有何好处?答:用象形符号扩展ER图,以便专门处理空间数据类型。这将减少ER图以及所产生的关系模式的复杂度,同时改进空间建模的质量。空间联系(例如Road-Crosses-River)就可以从ER图中省略,用隐式的方式表示。关系模式中的表达多值空间属性的关系和M:N空间联系也就不需要了5、ER模型的作用,ER图包括哪些要素,如何表达多值属性?ER图与空间信息对象模型之间的异同?答:ER图可以以一种避开计算机隐喻的方式来表达这个微型世界,从而把应用中的概念与实现细节分离开来。ER图包括实体(物理上或概念上独立存在的事物或对象)、属性和联系。实体用属性来刻画性质,实体之间通过练习相互作用和关联。属性可以是单值或多值。ER图中实体用矩形表示,属性表示为椭圆,联系为菱形。码属性加下划线,多值属性用双椭圆。异同:①、实体是物体属性的集合;②、ER模型不允许普通用户定义操作;③、在对象模型中关系不被直接支持,但可以由操作来模仿。实体—关系模型(实体属性和关系),扩展的实体关系模型面向对象模型,实体关系图:描述不同实体类型关系的图。(1:1,m:1选择实体和属性:独立性和可辨别性,有自己的属性,其他实体的关系辨别规则和约束性----E-R模型被选择:交流方式好容易转译到逻辑模型,确定是模型的结构(简单和复杂)。E-R模型的空间信息(实体属性关系子集类型)关系基于表(有行和列列包含属性属性属于域关系在数据库模型但不属于应用程序)关系表包含数据,关系方案定义关系,数据库方案是关系方案的集合,关系数据库是一系列关系,元祖顺序无关关系里的元祖是独一无二的关系的度时列的数量基数是行的数量。关系的每一个值不能再分,值是原子的,被说成是标准化的,要求简化没冗余,原子化是第一范式的条件;其他的范式保证了更高的完整性。SQL---数据定义,允许创建修改和删除方案,定义域数据操作:允许更新检索和删除记录。操作(基于科德):并,交、差(一个活多个关系的元祖集要有相容的属性)、投影(选择的属性的子集)、限制(元祖的子集基于属性域)、交(两个关系基