复习题第一章1、地理信息:地理信息是有关地理实体和地理现象的性质、特征和运动状态的表征和一切有用的知识,它是对表达地理特征与地理现象之间关系的地理数据的解释。2、地理数据:是各种地理特征和现象间关系的数字化表示,包括空间位置、属性信息、时空特征3、地理信息系统:一种特定的十分重要的空间信息系统,是在计算机软、硬件系统支持下,对整个或部分地球表层(包括大气层)的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。4、地理空间分析的三大要素:空间位置、属性、时间5、GIS的基本功能:采集、编辑与处理、数据存储和管理、空间查询和空间分析、数据输出6、GIS的组成:硬件系统、软件系统、网络、空间数据、管理和应用人员第二章1、地图投影:将地球椭球面上的点映射到平面上的方法,称为地图投影2、GIS中为什么要考虑地图投影?答:GIS以地图方式显示地理信息,而地图是平面,地理信息则在地球椭球上,因此地图投影在GIS中不可缺少。GIS数据库中地理数据以地理坐标存储时,则以地图为数据源的空间数据必须通过投影变换转换成地理坐标;而输出或显示时,则要将地理坐标表示的空间数据通过投影变换变换成指定投影的平面坐标。GIS中,地理数据的显示可根据用户的需要而指定投影方式,但当所显示的地图与国家基本地图系列的比例尺一致时,一般采用国家基本系列地图所用的投影。3、投影有哪几种变形?答:等面积投影:投影前后面积不变;等距离投影:投影前后长度不变等角投影:投影前后角度不变任意投影:角度、面积、长度均变形4、我国国家的基本比例尺地形图有哪些?1:100万:兰勃特投影大部分分省图、大多数同级比例尺也采用兰勃投影1:50万、1:25万、1:10万、1:5万、1:2.5万、1:1万、1:5000采用高斯—克吕格投影。国家基本比例尺地形图有1:1万、1:2.5万、1:5万、1:10万、1:25万、1:50万和1:100万七种第三章1、概念模型:地理空间中地理事物与现象的抽象概念集,是地理数据的语义解释。2、逻辑模型:GIS描述概念数据模型中实体及其关系的逻辑结构,是系统抽象的中间层3、物理模型:是概念模型在计算机内部具体的存储形式和机制,即在物理磁盘上如何存放和存取,是系统抽象的最底层4、概念模型的分类:对象模型、场模型、网络模型5、对象模型:是将整个研究地理空间看作是一个空域,地理现象和空间实体作为独立的对象分布在该空间区域中,对象模型强调地理空间的单个地理现象,6、场模型:把地理空间中的现象作为连续的变量或体来看待,如大气污染程度、地表温度、地形高度7、网络模型:网络模型是描述不连续的地理现象,与对象模型在某些方面类似,不同之处在于它需要考虑通过路径相互连接多个地理现象之间的连通情况。公路、铁路、通信线路、管道等它们的关系:对象和场可以在多种水平上共存,即在许多情况下需要采用对象模型和场模型的集成。网络模型与对象模型某些方面相同,都是描述不连续的地理现象,不同在于它需要考虑通过路径相互连接多个地理现象之间的连通情况。8、拓扑关系的定义?空间数据有哪些拓扑关系?答:定义:地图上的拓扑关系是指图形在保持连续状态下的变形(缩放、旋转和拉伸等),但图形关系不变的性质。邻接关系、关联关系、包含关系、连通关系第四章答:1、矢量数据结构定义:矢量数据结构是对矢量数据模型进行组织的。通过记录空间对象的坐标及空间关系来表达空间对象的位置。尽可能精确地表示点、线、多边形等实体;坐标空间设为连续,允许任意位置、长度和面积的精确定义。分类:实体数据结构、拓扑数据结构特点:(a)以几何空间坐标为基础,记录取样点的坐标。以这种数据组织方式,就可以得到精美的地图。(b)可以对复杂数据以最小的数据冗余进行存贮,具有精度高、存储空间小等特点。实体数据结构、索引式结构、双重独立编码结构、链状双重独立编码结构(重点)86-92(1)实体数据结构:是指构成多边形边界的各个线段,以多边形为单元进行组织。只记录空间对象的位置坐标和属性信息,不记录拓扑关系。存储:(a)独立存储:空间对象位置直接跟随空间对象;(b)点位字典:点坐标独立存储,线、面由点号组成特征:(a)这种数据结构具有编码容易,数字化操作简单和数据编排直观等优点;(b)相邻公共边界要数字化两遍,存在数据冗余,可能导致输出的公共边界出现间隙或重叠;(c)缺少多边形的邻域信息和图形的拓扑关系;(d)岛只作为一个单个图形,没有建立与多边形的外界联系,处理嵌套多边形比较麻烦适用范围:制图及一般查询,不适合复杂的空间分析(2)索引式结构:数据结构采用树状索引以减少数据冗余并间接增加邻域信息,具体方法:是对所有边界点进行数字化,将坐标对以顺序方式存储,由点索引与边界线号相联系,以线索引与各多边形相联系,形成树状索引结构。优点:树状索引结构消除了相邻多边形边界的数据冗余和不一致的问题,在简化过于复杂的边界线或合并多边形时可不必改造索引表,邻域信息和岛状信息可以通过对多边形文件的线索引处理得到。缺点:比较繁琐,因而给邻域函数运算、消除无用边、处理岛状信息以及检查拓扑关系等带来一定的困难,而且两个编码表都要以人工方式建立,工作量大且容易出错。(3)双重独立编码结构:双重独立编码结构是对图上网状或面状要素的任何一条线段,用顺序的两点定义以及相邻多边形来予以定义。它是以城市街道为编码主体,它的特点是采用了拓扑编码结构。(4)链状双重独立编码结构:链状双重独立式数据结构是DIME数据结构的一种改进。在DIME中,一条边只能用直线两端点的序号及相邻的面域来表示,而在链状数据结构中,将若干直线段合为一个弧段(或链段),每个弧段可以有许多中间点。在链状双重独立编码结构中,主要有4个文件:多边形文件、弧段文件、弧段点文件、点坐标文件2、栅格数据结构答:定义:又称为网络结构或像元结构,是将地球表面划分为大小均匀紧密相邻的网格阵列,在各个网格上给出相应的属性值来表示地理实体的一种数据组织形式。栅格单元的选取方法:中心点法、面积占优法、重要性法、百分比法完全栅格数据结构的组成方式:(a)基于象元方式;(b)基于层方式;(c)基于面域方式特点:属性明显、定位隐含,即数据直接记录属性的指针或属性本身,而所在位置则根据行列号转换成相应的坐标来计算得出。优点:具有数据结构简单、数据模拟方便。缺点:数据量大、难以建立实体间的拓扑关系。通过改变分辨率减少数据量时精度和信息量同时受损。3、压缩栅格数据结构有哪几种?它们的基本思想和压缩规则、及压缩的特点。能写出给出栅格图的几种压缩编码。(重点)答:压缩栅格数据结构有4种:链式编码、游程长度编码、块状编码、四叉树结构(1)链式编码基本思想:又称为弗里曼链码(Freeman)或边界链码。链式编码主要是记录线状地物和面状地物的边界。它将线状地物或面状地物的边界表示为:由某一起点开始按某些基本方向确定的单位矢量链。压缩规则:单位矢量的长度为一个栅格单元,每个后续点可能位于其前继点的8个基本方向之一(如图4.15)。图4.16所示的线实体和面实体可编码为表4.12所示的方式。具体编码过程是:起始点的寻找一般遵从从上到下、从左到右的原则。当发现没有记录过的点,而且数值也不为零时,就是一条线或边界线的起点。记下该地物的特征码及起点的行列数;然后按顺时针方向寻迹,找到相邻的等值点,并按八个方向编码。如遇不能闭合的线段,结束后可以返回到起始点再开始寻找下一个线段。已经记录过的栅格单元,可将属性代码置零,以免重复编码。特点:链码结构可以有效地压缩栅格数据,特别是对计算面积、长度、转折方向和凹凸度等运算十分方便。缺点是对边界做合并和插入等修改,编辑比较困难。这种结构有些类似矢量结构,但不具有区域的性质,因此对区域空间分析运算比较困难。(2)游程长度编码基本思想是:对于一幅栅格数据(或影像),常常有行(或列)方向上相邻的若干点具有相同的属性代码,因而可采取某种方法压缩那些重复的记录内容。压缩规则:把同一行(列)中属性值相同的邻近像元组织在一起,称为一个游程。每个游程用一对数字表达,第一个数字表示这一游程像元中的属性值,第二个数字表示这一游程的长度。特点:压缩比的大小是与图的复杂程度成反比的,在变化多的部分,游程数就多,变化少的部分游程数就少,原始栅格类型越简单,压缩效率就越高。这种数据结构最适宜于类型面积较大的专题要素、遥感图像的分类结构,而不适合于类型连续变化或类型分散的分类图。游程长度编码在栅格加密时,数据量没有明显增加,压缩效率较高,且易于检索,叠加合并等操作,运算简单,适用于机器存贮容量小,数据需大量压缩,而又要避免复杂的编码解码运算增加处理和操作时间的情况。(3)块状编码基本思想:从左上角的像元开始,搜索最大覆盖范围的方形区域,使得这一区域内所有的像元具有相同的属性值,以方形区域为记录单元,记录每一个方形区域。压缩规则:块码编码如下:(1,1,4,1),(1,5,4,8);行号列号个数(5,1,2,1),(5,3,2,3),(5,5,2,8),(5,7,2,8);(7,1,2,3),(7,3,2,3),(7,5,2,3),(7,7,2,8);总共10个多边形优点:一个多边形所能包含的正方形越大,多边形的边界越简单,块式编码的效果越好。块码在合并、插入、检查延伸性、计算面积等操作时有明显的优越性。缺点:游程和块式编码都对大而简单的多边形更有效,而对那些碎部较多的复杂多边形效果并不好。(4)四叉树结构基本思想:是将一幅栅格数据层或图像等分为四部分,逐块检查其格网属性值(或灰度);如果某个子区的所有格网值都具有相同的值,则这个子区就不再继续分割,否则还要把这个子区再分割成四个子区;这样依次地分割,直到每个子块都只含有相同的属性值或灰度为止。压缩规则:98-100页优点:①容易而有效地计算多边形的数量特征。②阵列各部分的分辨率是可变的,边界复杂部分四叉树较高,即分级多,分辨率也高,而不需表示的细节部分则分级少,分辨率低。因而既可精确表示图形结构,又可减少存储量。③栅格到四叉树及四叉树到简单栅格结构的转换比其它压缩方法容易。④多边形中嵌套不同类型小多边形的表示较方便。缺点:树状表示的变换不具有稳定性,相同形状和大小的多边形可能得出不同四叉树结构,故不利于形状分析和模式识别3、十进制的Morton码的计算十进制Morton码(简称MD码)。十进制mortan码可以使用栅格单元的行列号计算(遵循C语言规范,矩阵的第一行为“0”行、第一列为“0”列).先将十进制的行列号转换成二进制数,进行“位”运算操作,如图4.11所示,即行号和列号的二进制数两两交叉,得到以二进制数表示的MD码,再将其转换为十进制数。4、什么是影像金字塔影像金字塔是指在统一的空间参照下,根据用户需要以不同分辨率进行存储与显示,形成分辨率由粗到细、数据量由小到大的金字塔结构。影像金字塔结构用于图像编码和渐进式图像传输,是一种典型的分层数据结构形式,适合于栅格数据和影像数据的多分辨率组织,也是一种栅格数据或影像数据的有损压缩方式。9、栅格数据结构与矢量数据结构相比各有特点答:矢量数据结构:优点:1、数据结构严密,冗余度小,数据量小;2、空间拓扑关系清晰,易于网格分析;3、面向对象目标的不仅能表达属性编码,而且能方便地记录每个目标的具体的属性描述;4、能够实现图形数据的恢复、更新和综合;图形显示质量好。缺点:1、数据结构处理算法复杂;2、叠置分析与栅格图组合比较难;3、空间分析技术比较复杂,需要较复杂的软、硬性条件;4、显示与绘图成本比较高栅格数据结构:优点:1、数据结构简单,易于算法实现;2、空间数据的叠置和组合容易,有利于与遥感数据的匹配应用和分析;3、各类空间分析,地理现象模拟较为容易;4、输出方法快建议成本低缺点:1、图形数据量大,用大像元减小数据量的精度和信息量受损失;2、难以建立空间网格连接关系;3、投影变化实现困难;4、图形数据质量低,地图输出不精美第五章1、数据库中常用的数据模型有哪几种?a、层次模型(HierarchicalModel)b、网状模型(Network