地理数据:是指表征地理圈或地理环境固有要素或物质的数量、质量、分布特征、联系和规律的数字、文字、图像和图形等的总称。地理信息:是有关地理实体的性质、特征和运动状态的表征和一切有用的知识,它是对地理数据的解释。地理信息也可定义为:关于地球表面或地理空间的描述,即对地理对象的位置、形状、属性、时间、空间关系等方面的表达。地理信息系统定义:“地理信息系统是全方位分析和操作地理数据的数字系统”,“GIS是一种采集、存储、管理、分析和显示空间与非空间数据的信息技术”“采集、存储、管理、分析和显示有关地理现象信息的综合系统”“地理信息系统是属于从现实世界中采集、存储、提取、转换和显示空间数据的一组有力的工具。”Maguire将对地理信息系统的认识综合归纳为三种观点:(1)地图观:认为GIS来源于现代的地图学,因而可将GIS看作是一个地图处理与显示系统。这种观点强调系统能生成出高质量的地图和表格。(2)数据库观:强调GIS应具有良好设计的数据库系统,在这个系统中可以使用各种地理数据进行复杂的分析,这种观点强调GIS首先是一个信息系统。(3)空间分析观:强调在数据建库的基础上,通过对地理数据进行空间分析和建模,得到有价值的信息。这种观点强调GIS的地理特性,认为GIS本质是一个地理系统。美国联邦数字地图协调委员会定义GIS的含义:是由计算机硬件、软件和不同的方法组成的系统。该系统设计支持空间数据的采集、管理、处理、分析、建模和显示,以便解决复杂的规划和管理问题。GIS基本构成:一个实用的GIS需要一定的环境支持空间数据的采集、管理、处理、分析、建模和显示等功能,其运行环境主要由五个部分构成,即系统硬件、系统软件、地理空间数据、系统应用人员及应用模型。系统硬件:要由计算机主机、外部设备以及网络环境组成。GIS外部设备包括各种输入和输出设备。如输入的有数字化仪、扫描仪、电子手簿、数字摄影测量设备、全站仪、全球定位系统(GPS)等,主要的输出设备有绘图仪、显示器、打印机以及图形显示终端等。GIS基本功能:(1)数据采集与输入:数据采集与输入是指将系统外部的各种数据写入到GIS系统内部并满足GIS系统管理要求的过程。(2)数据处理与更新:数据处理主要包括图形数据处理与属性数据处理。(3)数据存储与管理:GIS数据库需要存储空间数据和属性数据,除可采用传统的RDBMS来存储属性数据外,空间数据是GIS数据管理的中心。(4)空间查询与分析:空间查询与分析是GIS的特有研究领域及核心所在,也是GIS最有魅力的功能。(5)产品制作与输出:由GIS系统处理与分析而产生的各种图、表、卡、册,可以为专业人士进行决策服务。(6)二次开发与编程:与应用相结合才能发挥GIS的生命力,而与应用相结合,GIS必须具备的基本功能是提供二次开发环境。包括地图控件、开发环境等。GIS与CAD的异同:GIS与CAD系统的共同点在于两者都有坐标系统,都能描述和处理图形数据及其空间关系,也能管理非空间数据。它们的主要区别是CAD偏重于图形数据的制图管理、表达,图形功能极强,但图形关系偏弱,如在CAD中,线条的压盖、欠交、悬挂对图形的表达问题不是很严重,基本上没有空间分析;属性功能偏弱,其属性数据一般利用标注或扩展数据来解决,复杂的属性处理、查询无能为力。而GIS图形关系复杂,除需要表达基本的图形外,还需要表达其空间关系,需要标准的空间符号库支持,具有很强的空间分析功能。此外,CAD制图中通常单幅图作业,其数据量不是很大;GIS通常管理一个区域,且数据类型为多尺度、多源数据。GIS类型:按应用功能划分:工具型GIS、应用型GIS、大众型GIS按研究范围划分:全球GIS、区域GIS、国家GIS按研究内容划分:专题GIS、综合GIS按数据模型划分:矢量GIS、栅格GIS、矢栅混合GIS按数据维数划分:2DGIS、3DGIS、时态GIS(TGIS)按软件功能划分:专业GIS、桌面GIS、手持GIS、组件GIS按软件开发模式划分:(1)GIS模块、集成式GIS;(2)模块化GIS、核心式GIS;(3)组件式GIS、WebGIS;(4)互操作GIS几何纠正:几何校正是指消除或改正遥感影像几何误差的过程。仿射变换的原理与计算仿射变换的公式:仿射变换是使用最多的一种几何纠正方式,只考虑到x和y方向上的变形,其特性是:1)直线变换后仍为直线;2)平行线变换后仍为平行线;3)不同方向上的长度比发生变化。对于仿射变换,只需知道不在同一直线上的3对控制点的坐标及其理论值,就可求出待定系数。但在实际使用时,往往利用4个以上的控制点进行纠正,利用最小二乘法处理,以提高变换的精度。误差方程为:式中,X、Y为已知的理论坐标。其中,n为控制点个数,x,y为控制点坐标,X,Y为控制点的理论值,a1,a2,a3,b1,b2,b3为待定系数。通过上述法方程就可求得仿射变换的待定系数。投影变换:(1)解析变换法:这类方法是找出两种投影间坐标变换的解析计算公式。根据采用的计算方法的不同,又可分为正解变换法和反解变换法。1)反解变换:反解变换法又称间接变换法,这是一种中间过渡的方法,即先解出原地图投影点的地理坐标(φ,λ)对于(x,y)的解析关系式,然后将其代入新图的投影公式中求得其坐标。2)正解变换:正解变换法又称直接变换法,这种方法不需要反解出原地图投影点的地理坐标,而是直接求出两种投影点的直角坐标关系式。(2)数值变换法:如果原投影点的坐标解析式不知道,或不易求出两投影之间坐标的直接关系,可以采用多项式逼近的方法,即用数值变换法来建立两投影间的变换关系式。例如,可采用二元三次多项式进行变换。二元三次多项式为:通过选择10个以上的两种投影之间的共同点,并组成最小二乘法的条件式,即:(3)数值解析变换法:当已知新投影的公式,但不知原投影的公式时,可先通过数值变换求出原投影点的地理坐标(φ,λ),然后代入新投影公式中,求出新投影点的坐标。所谓尺度,在概念上是指研究者选择观察(测)世界的窗口。分析往往会涉及到四种尺度问题,即观测尺度、比例尺、分辨率、操作尺度。1:50万~1:5000比例尺地形图的编号:第三章空间实体特征:空间实体相应的具有空间特征、属性特征、时间特征等特征空间特征空间特征表达了地理事物和现象的客观存在性、几何形态的多样性和它们之间的空间相关性,相应的空间特征又包括空间位置特征、空间几何特征、空间关系等特征。属性特征属性特征也称为专题特征或功能特征时间特征时间特征指空间实体随着时间变化而动态变化的过程。离散对象和连续场:1.离散对象人们认为在地理空间中,只有明确边界的各类地物所占据的地方才是需要表达的,并称之为离散对象(discreteobject)。比如道路、河流、房屋、农田等。离散对象的特点就是可数性连续场认为地表是连续分布的地理现象称之为连续场。比如空气中的污染度的变化、地表中的温度变化、土壤中的湿度变化、河流中的水流变化以及地表的高度变化等空间拓扑关系:空间拓扑关系是指图形发生连续状态下的变形,但图形之间的邻接关系、关联关系和包含关系保持不变的性质。空间数据的拓扑关系对地理信息系统的数据处理和空间分析具有重要的意义,主要表现在:1)根据拓扑关系,不需要利用坐标或距离,可以确定一种地理实体相对于另一种地理实体之间的空间位置关系。因为拓扑数据已经清楚的反映出地理实体间的逻辑结构关系,而且这种拓扑数据较之几何数据有更大的稳定性,即它不随地图投影而变化。2)利用拓扑数据有利于空间要素的查询。例如查询某区域与哪些区域邻接;某条河流为哪些政区的居民提供水源;与某一湖泊邻接的土地利用类型有哪些,用于对生物栖息环境作出评价等,都需要利用拓扑数据。3)可以利用拓扑数据作为工具,重建地理实体。例如建立封闭多边形,实现道路的选取,进行最佳路径的计算等等。如图3-5所示,拓扑邻接关系、拓扑关联关系和拓扑包含关系表达方法简要地阐述如下。1.拓扑邻接。指存在于空间图形的同类元素之间的拓扑关系。例如结点邻接关系N1/N4,N1/N2,…;弧段邻接关系C1/C2,C1/C5…;多边形邻接关系P1/P3,P2/P3…。2.拓扑关联。指存在于空间图形的不同元素之间的拓扑关系,例如结点与弧段的关联关系N1与C1、C3、C6,N2与C1、C2、C5,…;多边形与弧段的关联关系P1与C1、C5、C6,P2与C2、C4、C5、C7,…。3.拓扑包含。指存在于空间图形的不同等级的同类元素之间的拓扑关系。包含关系分简单包含、多层包含和等价包含三种形式。设ID表示当前多边形,IW表示等价包含,IP表示ID为岛(IP0)或非岛(IP=0),则包含关系的形式如图3-6所示。空间数据结构是指适合于计算机系统存储、管理和处理的地学图形的逻辑结构,是地理实体的空间排列方式和相互关系的抽象描述。矢量数据结构是通过记录实体坐标及其关系,尽可能精确地表现点、线、多边形等地理实体的数据组织结构。实体数据结构又称为Spaghetti数据结构或面条数据结构,是指构成多边形边界的各个线段,以多边形为单元进行组织。拓扑数据结构的主要特点是点相互独立,点连成线,线构成面。栅格数据结构概念栅格结构是最简单最直观的空间数据结构,又称为网格结构(raster或gridcell)或像元结构(pixel)。是指将地球表面划分为大小均匀紧密相邻的网格阵列,每个网格作为一个像元或像素,由行、列号定义,并包含一个代码,表示该像素的属性类型或量值,或仅仅包含指向其属性记录的指针。因此,栅格结构是以规则的阵列来表示空间地物或现象分布的数据组织,组织中的每个数据表示地物或现象的非几何属性特征。在转换和重新采样时,需尽可能保持原图或原始数据精度,通常有两种办法:第一,在决定栅格代码时尽量保持地表的真实性,保证最大的信息容量。第二种方法是缩小单个栅格单元的面积,即增加栅格单元的总数,行列数也相应地增加。这样,每个栅格单元可代表更为精细的地面矩形单元,混合单元减少。混合类别和混合的面积都大大减小,可以大大提高量算的精度,接近真实的形态,表现更细小的地物类型。栅格数据结构的压缩编码1.游程长度编码(Run-LengthCode,RLC)游程长度编码是栅格数据压缩的重要编码方法,它的基本思路是:对于一幅栅格图像,常常有行(或列)方向上相邻的若干栅格具有相同的属性代码,因而可采取某种方法压缩那些重复的记录内容。其编码方案是,只在各行(或列)数据的代码发生变化时依次记录该代码以及相同代码重复的个数,从而实现数据的压缩。可用二元组序列(Ai,Pi)表示,i=1,...,K,且K总列数n。其中Ai为属性值,Pi为游程,i为游程序号。例如对图3-15(a)所示的栅格数据,可沿行方向进行如下游程长度编码:(5,2),(9,2),(1,4),(5,2),(9,2),(1,4),(3,3),(4,1),(1,4),(3,3),(4,1),(1,4),(6,4),(1,1),(0,3),(6,4),(1,1),(0,3),(6,4),(5,2),(2,2)(6,4),(5,2),(2,2)游程长度编码对图3-15(a)用了48个整数就可以表示,而如果用前述的直接编码却需要64个整数表示,可见游程长度编码压缩数据是十分有效又简便的。游程编码能否压缩数据量,主要取决于栅格数据的性质,通常可以通过事先估计数据冗余度Re来衡量。Re=1-Q/mn式中:Q为相邻属性值变化次数的累加值;m为行数;n为列数。当Re值大于1/5的情况下,表示栅格数据压缩可取得明显的效果。而其压缩效果,可由压缩比S=mn/K来表达,m、n为行列数,K为游程总数。压缩比的大小是与图的复杂程度成反比的,在变化多的部分,游程数就多,变化少的部分游程数就少,图像越简单,压缩效比就越高,表示压缩效果越显著。2.四叉树编码(Quad-TreeCode)四又树编码的基本思想是将一幅栅格地图或图像等分为四部分,逐块检查其格网属性值(或灰度),如果某个子区的所有格网值都具有相同的值,则这个子区就不再继续分割,否则还要把这个子区再分割成四个子区。这样依次地分割,直到每