地理信息系统概论复习内容第一章:地理信息系统概论数字地球:1998年美国副总统戈尔提出“数字地球”概念,即一种可以嵌入海量数据、多分辨率和三维的地球。数字地球是对真实地球及其相关现象统一性的数字化重现和认识,其核心思想是用数字化手段统一处理地球问题和最大限度地利用信息资源。虚拟现实GIS:一种最有效的模拟人在自然环境中视、听、动等行为的高级人机交互技术,主要通过虚拟建模语言(virtualrealitymodellanguage,VRML)把GIS数据转换到VR中,为人们提供一个逼真的模拟环境。地理信息科学:关于围绕地理信息系统技术的应用,防碍其成功实施,或在其潜在能力的理解中出现的一般性问题的研究。1、说明GIS在几个不同发展阶段的标志性技术是什么,它们的出现如何促进GIS的发展?答:(1)60年代GIS处于起步阶段:1963年,R.F.Tomlinson首次提出GIS这一术语,并建立了世界上第一个地埋信息系统——CGIS,用于处理大量土地调查资料;稍后,哈佛大学计算机图形学与空间分析实验室研制出SYMAP系统,这是一个通用的地图制图软件包,但竭力发展空间分析模型及开发相应的软件;1968年国际地理联合会(IGU)成立了地理数据收集和处理委员会,对促进地理信息系统的发展起了很大作用。60年代,探索时期(GIS思想和技术方法的探索)人们关注什么是GIS,GIS能干什么。(2)70年代GIS处于巩固发展阶段:由于计算机技术及其在自然资源和环境数据处理的应用,不同规模、不同专题和不同类型的地理信息系统在发达国家纷纷研制成功,如美国森林调查局--美国林业资源信息显示系统。1976年,美国喷气推动实验室--影像信息系统IBIS。1978年,ERDAS成立。GIS的功能并没有得到很大发展,数据库的规模还比较小。这期间,发展研究的重点是空间数据处理的算法,数据结构和数据库管理这三个方面。(3)80年代GIS普及和推广:在发达国家,如加拿大、日本、英国开始将地理信息系统用于国土规划,支持资源和环境管理决策,人们把GIS与RS解决全球性问题,如全球沙漠化,全球可居住地评价,核扩散问题等。同时GIS软件的功能得到很大发展,并开始应用专家系统知识,向智能化的方向发展。如1981年,ESRIARC/INFOGIS发布和1985年,GPS成为可运行系统。(4)90年代—今GIS产业化,理论体系逐步形成:GIS开始走向产业化的道路;GIS理论体系开始形成,GIS已不单是传统学科的一个分支,而成为综合分析和解决全体人类所共同面临的资源、环境、人口和发展问题的公共学科。2、简述GIS的构成和功能。答:构成:(1)系统硬件:GIS主机,GIS外部设备(输入、输出设备),GIS网络设备。用以存储、处理、传输和显示地理信息或空间数据;(2)系统软件:GIS专业软件,数据库软件,系统管理软件等。是系统的核心,用以执行GIS功能的各种操作,包括数据输入、处理、数据库管理、空间分析和图形用户界面等;(3)空间数据:具体描述地理实体的空间特征、属性特征和时间特征,是GIS的操作对象,是GIS所表达的现实世界经过模型抽象的实质性内容;(4)系统开发、管理和使用人员:是GIS工程及其应用成败的关键;(5)应用模型:其构建和选择也是系统应用成败至关重要的因素。基本功能:数据输入、编辑和更新;数据存储和数据库管理;空间信息的处理和变换;空间信息的浏览和查询;信息显示和输出、发布;空间分析和空间模拟;二次开发功能。3、简述地理信息科学的学科体系。第二章:空间数据空间自相关:某个地理变量与其自身通过空间相关联,其理论基础是地理学第一定律。空间数据质量:指空间数据对特定用途的分析和操作适用的程度,即数据质量是指数据适用于不同应用的能力,其中包括不确定性、误差和精度。空间数据的元数据:地理的数据和信息资源的描述性信息。它通过对地理空间数据的内容、质量、条件和其他特征进行描述与说明,以便人们有效地定位、评价、比较、获取和使用与地理相关的数据。不确定性:空间数据的不确定性指信息源没有被完全表达的程度,不仅包括能观察的误差要素,还包括复杂的难以观察的要素(自然本身、人类认识差别、数据处理),具体包括:随机性,模糊性,灰性(部分已知,部分未知)和未确知性(主观上认识的不确定性)。1、简述空间数据的基本特征。答:空间数据具有以下12个特征(具体内容详见PPT):空间性;专题性;时间性;多态性;多尺度性;可靠性;不确定性;选择性;抽样性;完备性;海量性;自相关性。2、简述空间数据质量的含义。答:空间数据是对现实理事物的抽象和表达,由于现实地理事物的无限复杂性和模糊性,以及人类认识和表达能力的局限性,这种抽象和表达是不可能完全达到真实值,而只能在一定程度上接近真实值。而且,真实值往往是不可知的或不可测的(不确定性),准确度和精度问题也总是存在着的。空间数据质量的好坏不是一个绝对的概念。较准确的定义是:空间数据质量指空间数据对特定用途的分析和操作适用的程度。即数据质量是指数据适用于不同应用的能力,其中包括不确定性、误差和精度。第四章:空间数据模型对象模型:将研究的整个地理空间看成一个空域,地理现象和空间实体作为独立的对象分布在该空域中,强调地理空间中的单个地理现象。场模型:也称作域(field)模型,是把地理空间中的现象作为连续的变量或体来看待,如大气污染程度、地表温度、土壤湿度、地形高度以及大面积空气和水域的流速和方向等,根据不同的应用,场可以表现为二维或三维。网络模型:对象模型的一个特例,它是由点对象和线对象之间的拓扑空间关系构成的。镶嵌数据模型:采用规则或不规则的小面块集合来逼近自然界不规则的地理单元,适合于用场模型抽象的地理现象,通过描述小面块的几何形态、相邻关系及面块内属性特征的变化来建立空间数据的逻辑数据模型。不规则三角网TIN:TIN采用不规则的三角网形成对地理空间的完整覆盖。在TIN模型中,样点的位置控制着三角形的顶点,这些三角形尽可能接近等边。TIN能较好地表达地理现象的空间变化,如地表地形就可由一组三角形很好地表示出来。1、何为空间关系?空间关系在描述空间实体特征中的意义何在?答:空间关系是指地理空间实体之间相互作用的关系。包括拓扑空间关系,顺序空间关系,度量空间关系。意义:(1)空间关系能清楚地反映实体之间的逻辑结构关系,它比几何坐标关系有更大的稳定性,不随投影变换而改变。不需要利用坐标或距离,可以确定一种地理实体相对于另一种地理实体的空间位置关系;(2)利用空间关系有利于空间要素的查询;(3)利用空间关系可以重建地理实体。2、简述GIS数据建模的基本框架。答:(详见第四章PPT)3、空间数据的概念模型有哪几种,各有什么特点?答:空间数据的概念模型包括对象模型、场模型和网络模型。特点:对象模型:①按照其空间特征分为点、线、面、体四种基本对象;②对象也可能由其他对象构成复杂对象,并且与其他分离的对象保持特定的关系,如点、线、面、体之间的拓扑关系;③每个对象对应着一组相关的属性以区分各个不同的对象;④对象模型把地理现象当作空间要素(Feature)或空间实体(Entity),一个空间要素必须同时符合三个条件:可被标识;在观察中的重要程度;有明确的特征且可被描述;⑤传统的地图是以对象模型进行地理空间抽象和建模的实例。场模型:①把地理空间中的现象作为连续的变量或体来看待,如大气污染程度、地表温度、土壤湿度、地形高度以及大面积空气和水域的流速和方向等;②根据不同的应用,场可以表现为二维或三维:一个二维场就是在二维空间R2中任意给定的一个空间位置上,都有一个表现某现象的属性值,即A=f(x,y);一个三维场是在三维空间R3中任意给定一个空间位置上,都对应一个属性值,即A=f(x,y,z)。网络模型:网络是由一系列节点和环链组成的,在本质上,网络模型可看成对象模型的一个特例,它是由点对象和线对象之间的拓扑空间关系构成的。4、试分析GIS的几种主要的逻辑数据模型各自的优缺点。答:GIS主要逻辑数据模型:矢量数据模型、栅格数据模型、矢量——栅格一体化数据模型、镶嵌数据模型、面向对象数据模型、三维空间数据模型时空数据模型等。第五章:空间数据结构游程长度编码结构:也称行程编码,其基本思想是:对于一幅栅格数据(或影像),常常有行(或列)方向上相邻的若干点具有相同的属性代码,因而可采取某种方法压缩那些重复的记录内容。其编码方案是,只在各行(或列)数据值发生变化时依次记录该值以及相同值重复的个数,从而实现数据的压缩,并实现数据的组织。链码结构:首先采用弗里曼码对栅格中的线或多边形边界进行编码,然后再组织为链码结构的文件。链式编码将线状地物或区域边界表示为:由某一起始点和在某些基本方向上的单位矢量链组成。单位矢量的长度为一个栅格单元,每个后续点可能位于其前继点的8个基本方向之一。具体编码过程是:起始点的寻找一般遵从从上到下、从左到右的原则。影像金字塔结构:指在统一的空间参照下,根据用户需要以不同分辨率进行存储与显示,形成分辨率由粗到细、数据量由小到大的金字塔结构。影像金字塔结构用于图像编码和渐进式图像传输,是一种典型的分层数据结构形式,适合于栅格数据或影像数据的有损压缩方式。在金字塔结构里,图像被分层表示。八叉树数据结构:将所要表示的三维空间V按X、Y、Z三个方向从中间进行分割,把V侵害成八个立方体;然后根据每个立方体中所含有的目标来决定是否对各立方体继续进行八等份的划分,一直划分到每个立方体被一个目标所充满,或没有目标,或其大小已成为预先定义的不可再分的体素为止。1、总结矢量数据和栅格数据在结构表达方面的特色。栅格与矢量数据结构相比较各有什么特征?答:2、简述栅格数据压缩编码的几种方式和各自优缺点。答:游程长度编码:结构对于游程长度编码,区域越大,数据的相关性越强,则压缩越大,适用于类型区域面积较大的专题图,而不适合于类型连续变化或类别区域分散的分类图(压缩比与图的复杂程度成反比)。这种编码在栅格加密时,数据量不会明显增加,压缩率高,并最大限度地保留原始栅格结构,编码解码运算简单,且易于检索,叠加,合并等操作,这种编码应用广泛。四叉树结构:优点:①存贮量小,只对叶结点编码,节省了大量中间结点的存储,地址码隐含着结点的分割路径和分割次数。对于团块图像,四叉树表示法占用空间上述其他方法要少得多,四叉树表示法基本上是一种非冗余表示法;②线性四叉树可直接寻址,通过其坐标值直接计算其Morton码,而不用建立四叉树(自下而上);③容易执行实现集合相加等组合操作;④四叉树具有可变率或多重分辩率的特点使得它有很好的应用前景,适用于处理凝聚性或呈块状分布的空间数据,特别适用于处理分布不均匀的块状空间数据,但不适用于连续表面(如地形)或线状地物。缺点:①四叉树未能直接表示物体间的拓扑关系。②与非树表示法比较,四叉树表示法的缺点在于转换的不稳定性或叫滑动变异例如,两个图像的差异仅由于平移,就会构成极为不同的四叉树,因而很难根据四叉树来判断这两个图像是否全同,故不利于做形状分析和模式识别,③一个物体的图像在构成四叉树时会被分割到若干个象限中,使它失去了内在的相关性。④矢/栅正反变换还不理想。⑤建立四叉树耗费机时很多。⑥四叉树虽可修改,但很费事。二维行程编码结构:链码结构:3、简述矢量数据编码的几种方式和各自优缺点。答:(1)实体数据结构/spaghetti数据结构:相邻多边形的公共边界要被数字化和存储两遍,节点在数据库中被多次记录,不仅造成数据冗余,还容易造成数据的不一致,引起严重的匹配误差,可能导致输出的公共边界出现间隙或重叠;岛只作为一个单图形,没有建立与外界多边形的联系;每个多边形自成体系,缺少多边形的邻域信息和图形的拓扑关系;难以检查多边形边界的拓扑关系正确与否,如是否存在间隙、重叠、不完整的多边形(死点)或拓扑学上不能接受的环(奇异多边形)等问题。(2)拓扑空间数据结构:包括索引式、双重独立编码结构、链状双重独立编码结构等,其共同的特点是:点是相互独立的,点连成线,线构成面;每条线始于起始结点,止于终