地理信息系统原理邬国锋武汉大学资源与环境科学学院guofengwu@gmail.com第二讲地理数据获取1.地理数据的内容2.地理数据的基本特征3.地理数据测量的尺度与精度4.地理数据来源5.空间数据的采集6.空间数据转换7.属性数据获取8.地理数据质量1、地理数据的内容地理数据是GIS的血液。几乎所有的GIS操作都是围绕地理数据展开的。地理数据源、数据类型、数据质量都直接影响到GIS应用的潜力、成本和效率。地理数据的数字表达可以归为:数字线划数据(DigitalLineGraph,DLG)数字栅格数据(DigitalRasterGraphic,DRG)数字高程模型(DigitalElevationModel,DEM)数字正射影像图(DigitalOrthographicMap,DOM)影像数据(ImageData)属性数据(AttributeData)(在测绘界和空间数据生产部门,将前四种数据统称为4D产品。)数字线划数据(DLG)数字线划数据是将空间地物直接抽象为点、线、面的实体,用坐标描述它的位置和形状。这种抽象的概念直接来源于地形测图的思想。数字线划地图是现有地形图基础上的矢量数据集,并且保存有要素间的空间关系信息数字线划数据(DLG)数字栅格数据(DRG)数字栅格地图(DRG):数字栅格地图是模拟纸质地图的数字化产品,地图经过扫描、纠正、图像处理与数据压缩,形成在内容、几何精度和色彩上与地图完全一致的计算机栅格文件,主要用于计算机上地图查询以及各种计算机设计底图。数字栅格数据(DRG)数字高程模型(DEM)数字高程模型(DEM):定义在x、y域离散点以高程表达地面起伏形态的数字集合。数字高程模型是现实世界地面山川河流起伏在计算机中的数字化表达。它在计算机中直观地反映现实的地貌情况。主要用于规划设计(如高速公路设计,无线通讯台站设计,开挖及填埋土方计算,洪水淹没分析等)。Don’tbeconfusedabouttheexpressionsdigitalterrainmodel(DTM)andigitalelevationmodel(DEM).DEMisonlythemoregeneralexpressionfordigitalsurfacedatabutyoumustdefinethekindofsurfacetheelevationdataarefor:e.g.DEMofthevegetationsurface,DEMofthegroundwatersurfaceorDEMofthereliefoftheearthsurfacewhichisalsocalleddigitalterrainmodel.数字高程模型(DEM)数字正射影像图(DOM)数字正射影像图(DOM):用数字形式储存的正射影像图。它是对遥感影像进行像元纠正、影像镶嵌等一系列处理后形成的影像平面图,带有坐标格网和图廓整饰,其上可叠加线画要素、文字注记等。较传统的地图而言,正射影像图具有信息量丰富、直观易读等特点;它生产周期短,现势性好。主要用于宏观规划、资源普查、环保管理等。这种图给人一种身临其境的感觉,具有很大的实用价值,用它可以修正大量过时的城区地图,并获取大量城市建设信息。数字正射影像图(DOM)影像数据(Imagedata)影像数据包括遥感影像和航空影像,它可以是彩色影像,也可以是灰度影像。影像数据直观而又详细地记录了地表的自然现象,人们使用它可以加工出各种信息,如进一步采集数字线划数据。影像数据(Imagedata)影像卫星信息高雄小港机场211x205像素-13k属性数据属性数据包含两方面的含义:第一类:描述地理实体是什么,有什么样的特性,属于哪一类地理实体类型或地物类型。这种属性一般可以通过目视直接获得,同时考察它的形状和其他地理实体之间的关系;第二类属性是实体的详细描述信息,例如一栋房子的建造年限、房主、住户等,这些属性必须经过详细的调查。属性数据可以分为命名、次序、间隔和比值四种测度中的一种空间特征专题特征时间特征2、地理数据的基本特征空间特征空间特征是指空间地物的位置、形状和大小等几何特征,以及与相邻地物的空间关系。空间位置可以通过坐标来描述。GIS中地理实体的形状和大小一般也是通过空间坐标来体现。空间位置坐标是定义在特定的坐标系统下的,GIS的坐标系统有严格的定义,如经纬度地理坐标系,一些标准的地图投影坐标系或任意的直角坐标系等。空间关系是确定空间位置的另外一种重要方式,通过地理实体之间的相对位置关系,确定各自的空间位置。在GIS中直接存贮地理实体的空间坐标。对于空间关系,有些GIS软件存贮部分空间关系,如相邻、连接等关系。而大部分空间关系则是通过空间坐标进行运算得到。时间特征地理实体都有一定存在时期,描述地理实体空间特征的空间数据总是在某一特定时间或时间段内采集得到或计算得到的,描述了那个特定时期地理实体的空间特征。时间特征对于时序性较强的地理实体和地理现象时间特征尤为重要,比如说人口分布、土地利用等,必须将其至于某个特定的时间段内说明或研究才具有实际意义。地理实体变化的周期有超短周期、短期、中期和长期之分在GIS数据记录中,往往将时间特征作为属性数据的一部分记录,用于说明某个地理实体的其他属性数据和空间数据的记录年代和时间。利用多时态数据在GIS中进行时空分析和动态模拟是当前GIS研究的难点和热点之一。专题特征专题特征亦指地理现象或地理目标的属性特征,它是指除了时间和空间特征以外的空间现象的其他特征,如地形的坡度、坡向、某地的年降雨量、土地酸碱度、土地覆盖类型、人口密度、交通流量、空气污染程度等。专题特征在专题GIS研究的主要内容,它是GIS中的属性数据所要表达的信息。同样的属性数据经过不同专题数据模型的处理可以表达不同的专题特征。3、地理数据测量的尺度与精度地理数据包括定性数据和定量数据:定性数据描述地理实体和地理现象的性质、分类和命名。定性数据主要反映属性特征。对地理实体和地理现象的分类就是一种定性数据。定性数据只从名义或语义上描述在地球表面不同位置某种地理现象的不同性质,不能说明任何数量上或程度上的差异。尽管有些定性数据采用数字形式记录,但也只是某个特征值的代码或标识,而不代表量化的任何概念。对某个地理实体或地理现象的定性描述不是一成不变的,不同的GIS应用领域或区域采用的定性描述标准可能不同,描述的详细程度也可能不尽相同。这表明在不同的应用系统中,定性数据的表达尺度和表达精度是变化的。定量数据定量数据可以描述地理实体的空间特征和属性特征。描述空间特征的定量数据就是空间数据。对于空间坐标的测量,测量的尺度主要取决于采样点的取舍和坐标测量的精确度。属性数据的采集尺度则取决具体应用对地理实体分类的详细程度和特征描述的深度等因素的要求。地图比例尺决定了地图表现的地理实体的精确程度,包括地理实体的数量、形状、空间位置的准确性等。以地图作为数据源的GIS数据的精度也受到比例尺约束。以影像数据作为数据源的GIS数据的精度受到影像数据的空间分辨率的制约。GIS中的比例尺概念又不完全等同于地图。例如按1:1万比例尺的规范建立的地理信息系统,可以输出1:1.5万甚至1:2万比例尺的地图。关于GIS中空间目标的测量尺度和精度,一般原则是计算机输出的地图要满足同等比例尺地图的精度要求。描述属性特征的定量数据主要指一些量化指标,如工农业产值、职工工资等,它反映数量或程度上的差异。影响属性定量数据的精度的因素很多,不同属性特征具有不同的精度衡量标准。4、地理数据的来源现有地图航空像片卫星影像文本数据数字化仪交互终端扫描仪数字摄影测量仪器磁带机磁盘机地理数据库野外测量数据数据源数据采集数据质量数据源可以分为原始数据(第一手数据)和经过加工处理后的数据(第二手数据),又存在非电子数据和电子数据两种形式。数据形式第一手数据第二手数据非电子数据平板仪、工程测量、航空相片、人口普查、社会经济调查地图、统计图表等电子数据全站仪、GPS数据、遥感数据等数据库(空间数据库,其他的专题数据库)等数据源类型数据源野外观测数据地图数据遥感数据统计资料文字报告已有系统的数据野外观测数据平板测量:测量的成果都是纸质地图,通过手扶跟踪数字化和扫描方式成为数字数据;全站仪测量:两种方式,一种是它与电子手簿相连接,将数据存储到电子手簿上,回到室内进行编辑和处理;另一种是将便携机直接与全站仪相连接,直接记录、编辑和处理;GPS测量:得到GPS天线所在位置的3维椭球面坐标;地图数据地图是GIS的主要数据来源,这不仅是因为地图的内容直观与丰富,而且是由于在地理信息系统诞生以前,地图是表示空间与非空间信息强有力的手段;地图的种类不同,按内容划分,包括各种比例尺的普通地图和专题地图。普通地图是以相对平衡的详细程度表示地球表面上的自然要素和社会经济要素,主要表达境界、居民地、交通网、水系、地形和植被等;专题地图重点反映某一种或几种专门的要素,从某种意义上说,一册完备的专题地图集是一个很好的人工操作地理信息系统;为了便于输入可将地图上表达的地理要素根据其分布形状分解为点、线和面三种基本要素。可以利用手扶跟踪数字化和扫描数字化两种方式输入计算机;遥感数据遥感数据是GIS的重要信息源,它至少具有下列一些特点(1)能取得大面积、综合的信息;(2)速度快;(3)能提供各类专题所需要的信息;从卫星或飞机上获取的图像信息主要有胶片和数字磁带两种记录形式。胶片是一种模拟信号,必须通过转换设备把模拟信号变为数字信号后,才能被计算机存储和处理;数字磁带是一种数字图像记录,通过读取设备可以直接进入计算机;遥感数据对GIS硬件和软件要求较高。统计资料统计资料是建立GIS必不可少的资料,在分析中起着重要的作用;包括社会经济数据、人口普查数据、野外调查和监测数据等;统计数据一般都和一定范围内的统计单元和观测点联系在一起;文字报告文字报告可以是各行业、各部门的有关法律文档、行业规范、技术标准、条文条例等;在专题信息系统中,各种文字说明资料对确定专题内容的属性特征起着重要的作用;在区域信息系统中,描述区域地理特征的文字报告是区域综合研究不可缺少的参考资料。已有系统的数据GIS可以从其它已经建立的信息系统中和数据库中获取相关的数据。由于规范化、标准化的推广,不同系统间的数据共享和可交换性越来越强,这样就拓展了数据的可用性,增加了数据的潜在价值。已有系统的数据可以作为InternetGIS的重要数据源之一,Internet上存储者各种各样丰富的数据,通过一定的网络许可就可以访问这些数据,这样可以充分的发挥已有数据的效益,节省数据重复生产的开销,同时也可以一定程度上减少系统之间数据的不一致性。5、空间数据采集数据采集的任务:将现有的上述类型数据采用适宜的采集手段转换成GIS可以处理与接收的数字形式,通常要经过验证、修改、编辑等处理进入地理数据库。数据采集需要考虑的要素:地理空间地理参照系地图投影空间数据的分类与编码属性数据的分类与编码空间数据采集的一般方法空间数据的分类与编码几个概念:分类、代码、编码、标识码编码方法空间数据组织空间数据分层空间数据分类与编码分类、代码、编码、标识码•分类:是将具有共同的属性或特征的事物或现象归并在一起,而把不同属性或特征的事物或现象分开的过程。•代码:是一个或一组有序的易于被计算机或人识别与处理的符号,是计算机鉴别和查找信息的主要依据和手段。又称为标识码•编码:是指确定属性数据的代码的方法和过程。编码的直接产物就是代码,而分类分级则是编码的基础。编码方法在GIS中常用层次分类编码法:是按照分类对象的从属和层次关系作为排列顺序的一种编码方法,它的优点是能明确表示出分类对象的类别和层次关系,代码结构有严格的隶属关系。耕地71园地72林地73牧草地74居民点及公矿用地75交通用地75水域76未利用地77土地利用类型7有林地731灌木