空间数据采集与处理•教学内容:数据采集方式,空间数据编辑,数据处理,空间数据相互转换,空间数据质量与精度,空间数据的元数据。•重点难点:空间数据相互转换;空间数据质量与精度。•学习要求:•1、理解数据采集方式;•2、理解空间数据编辑;•3、理解数据处理的概念、内容及意义;•4、掌握空间数据质量的相关概念;•5、理解空间数据误差及质量控制;•6、理解空间数据的元数据。第一节空间数据采集第二节空间数据的编辑与处理第三节空间数据质量第四节空间数据的元数据第一节空间数据采集•地图•遥感影像数据•统计数据•实测数据•数字数据•各种文字报告和立法文件一、数据源种类1.手工方式2.手扶跟踪数字化方式3.扫描方式4.影像处理和信息提取方式5.数据通讯方式通过手工在计算机终端上输入数据,主要是键盘输入。主要用于属性数据的输入。二、数据采集方式1.手工方式2.手扶跟踪数字化方式3.扫描方式4.影像处理和信息提取方式5.数据通讯方式手扶跟踪数字化仪是一种图形数字化设备,是目前常用的地图数字化方式生成矢量数据。数据采集方式数字化仪数据采集方式数字化仪示意图底座感应板定标器手扶跟踪数字化方法有效区域手扶跟踪数字化方法数字化仪板面组成示意图1.手工方式2.手扶跟踪数字化方式3.扫描方式4.影像处理和信息提取方式5.数据通讯方式扫描仪是一种图形、图象输入设备,可以快速地将图形、图象输入计算机系统,是目前发展最快的数字化设备生成栅格数据。数据采集方式小型扫描仪工程扫描仪数据采集方式1.手工方式2.手扶跟踪数字化方式3.扫描方式4.影像处理和信息提取方式5.数据通讯方式从遥感影像上直接提取专题信息。数据采集方式1.手工方式2.手扶跟踪数字化方式3.扫描方式4.影像处理和信息提取方式5.数据通讯方式联网方式下,信息系统内部各子系统之间以及与其它信息系统之间实现信息交流和信息共享的主要方式。数据采集方式第二节空间数据编辑处理•一、空间数据编辑•空间数据编辑的必要性•⑴修正数据输入错误•⑵维护数据的完整性和一致性•⑶更新地理信息空间数据一般性错误⑴数据不完整、重复⑵空间数据位置不正确⑶空间数据比例尺不准确⑷空间数据变形⑸几何和属性连接有误⑹属性数据不完整错误检查主要方法⑴叠合比较法⑵目视检查法⑶逻辑检查法二、空间数据处理数据处理的概念数据处理的内容数据处理的意义对采集的各种数据,按照不同的方式方法对数据进行编辑运算,清除数据冗余,弥补数据缺失,形成符合用户要求的数据文件格式数据处理的概念数据处理的内容数据处理的意义数踞编辑数据压缩数据变换数据格式转换空间数据内插边沿匹配数据提取数据处理的概念数据处理的内容数据处理的意义空间数据有序化检验数据质量实现数据共享提高资源利用效果1.平面坐标变换2.图幅变形校正3.空间数据的压缩处理4.空间数据类型的转换5.空间数据插值6.边界匹配(图幅接边)空间数据处理的方法平移变换0yxP(x,y)P′(x′,y′)xyx′=x+Δx′y′=y+Δy′1、空间数据处理的方法-平面坐标变换旋转变换yP(x,y)0xθP′(x′,y′)x′=x•cosθ-y•sinθy′=x•sinθ+y•cosθx′=x0+(x-x0)cosθ-(y-y0)•sinθy′=y0+(x-x0)sinθ+(y-y0)cosθ1、空间数据处理的方法-平面坐标变换比例变换(图形缩放)点可以通过对其P(x,y)坐标分别乘以各自的比例因子Sx和Sy来改变它们到坐标原点的距离。x′=x·Sxy′=y·Syx′=x0+(x-x0)·Sxy′=y0+(y-y0)·Sy1、空间数据处理的方法-平面坐标变换地图投影变换当系统使用的数据来自不同地图投影的图幅时,需要将一种投影的数字化数据转换为所需要投影的坐标数据地图投影变换正解变换反解变换数值变换1、空间数据处理的方法-平面坐标变换通过建立两个投影的解析关系式,直接把一种投影坐标(x,y)变换成另一种投影的坐标(X,Y)等面积伪圆锥投影地图投影变换当系统使用的数据来自不同地图投影的图幅时,需要将一种投影的数字化数据转换为所需要投影的坐标数据地图投影变换正解变换反解变换数值变换1、空间数据处理的方法-平面坐标变换由一种投影的坐标(x,y)反解出地理坐标(λ,φ),然后再将地理坐标代入另一种投影公式中,求出该投影下的直角坐标(X,Y)地图投影变换当系统使用的数据来自不同地图投影的图幅时,需要将一种投影的数字化数据转换为所需要投影的坐标数据地图投影变换正解变换反解变换数值变换1、空间数据处理的方法-平面坐标变换根据两种投影在变换区内若干同名的坐标点,采用插值法、有限差分法、待定系数法等,实现不同投影之间的转换斜轴等面积方位投影2、空间数据处理的方法-图幅变形校正“橡皮伸缩法”(rubbersheeting)。如图所示:图幅变形校正最常用的方法是六系数的线性变换法(Sprhsky,1987;黄杏元等,1989):上式中x,y为数字化的坐标,X,Y为转换后的坐标,A0,A1,A2,B0,B1,B2为六个未知系数。设有n个控制点(n>2),可用最小二乘法原理来计算这六个未知数:上式中xi,yi为第i个控制点的数字化坐标,ui,vi认为对应的实测坐标,由最小和最小,可以解出A0,A1,A2,B0,B1,B2,实现图幅的变形校正。3、空间数据处理的方法-压缩处理数据压缩的目的节省存贮空间节省处理时间数据压缩途径压缩软件:原数据信息基本不丢失而且可以大大节省存贮空间,缺点是压缩后的文件必须在解压缩后才能使用数据消冗处理:原数据信息不会丢失,得到的文件可以直接使用,缺点是技术要求高,工作量大,对冗余度不大的数据集合效用小用数据子集代替数据全集:在规定的精度范围内,从原数据集合中抽取一个子集,缺点以信息损失为代价,换取空间数据容量的缩小3、空间数据处理的方法-压缩处理常见空间数据的压缩方法曲线数据的压缩面域栅格数据的压缩面域邻接线段的删除特征点筛选法:筛选抽取曲线特征点,并删除全部多余点以达到节省存贮空间的目的。3、空间数据处理的方法-压缩处理常见空间数据的压缩方法曲线数据的压缩面域栅格数据的压缩面域邻接线段的删除通过压缩编码技术来消除冗余数据:链码游程长度编码块码四叉树编码3、空间数据处理的方法-压缩处理常见空间数据的压缩方法曲线数据的压缩面域栅格数据的压缩面域邻接线段的删除数据属性的重新分类和空间图形的化简需要对数据进行压缩相邻界线的删除共同属性的合并3、空间数据处理的方法-压缩处理面域邻接线段的删除3、空间数据处理的方法-压缩处理矢量向栅格转换网格尺寸的确定点的网格化直线网格化多边形网格化栅格向矢量转换网格尺寸的确定点的网格化直线网格化多边形网格化4、空间数据处理的方法-类型转换栅格数据与矢量数据的相互转换矢量数据转换成栅格数据也称栅格化。矢量空间数据一般是以点、线、面存放的。点状数据转成栅格数据时是取离点最近的一个栅格单元来存放,线状数据转成栅格数据时就变成连续的锯齿状的栅格点,必要时可以加宽,面状数据的转换主要是在每个多边形内部用等值的栅格填满。栅格数据转换成矢量数据也称矢量化。普通地图经扫描仪输入后可以通过软件自动或半自动的转成矢量数据。把栅格数据转成矢量点的方法比较简单。栅格数据转成线大致有三个步骤:(1)分类;(2)线的细化;(3)线的提取。栅格矢量化举例(栅格数据)栅格矢量化得到的弧段数据弧段数据自动生成多边形离散空间:空间具有跳跃特征(土地利用类型),重要变化发生在边界上,边界内的变化则是均匀的,同质的,即在各个方面都是相同的。邻近元法:以最相邻近图元的特征值表征未知图元的特征值。连续空间:空间具有渐变特征(地形表面),内插技术必须采用连续的空间渐变模型实现这些连续变化,可用一种平滑的数学表面加以描述。这类技术可分为整体拟合和局部拟合技术两大类。5、空间数据处理的方法-空间数据插值整体拟合技术:拟合模型是由研究区域内所有采样点上的全部特征观测值建立的。通常采用的技术是整体趋势面拟合。这种内插技术一般用于模拟大范围内的变化,而不能提供内插区域的局部特性局部拟合技术:是仅仅用邻近的数据点来估计未知点的值,而不受局部范围外其它点的影响。这类技术包括双线性多项式内插、样条函数、移动拟合法等等。5、空间数据处理的方法-空间数据插值基本提取按照属性或窗口找出所需要的数据查询检索满足一定范围条件的限定性查询(相邻分析检索、相关分析检索、叠置分析检索、边沿匹配检索)布尔处理是指根据用户规定的布尔标准或条件表达式所进行的限定性的多重属性的查询和数理统计。5、空间数据处理的方法-空间数据插值克里格(Kriging)内插法举例克里格(Kriging)内插法举例克里格(Kriging)内插法举例克里格(Kriging)内插法举例数字化边界调整6、空间数据处理的方法-边界匹配(图幅接边)•不同图幅的连接•自动、手工第一种方法是小心地修改空间数据库中点和矢量的坐标,以维护数据库的连续性;第二种方法是先对准两幅图的一条边缘线,然后再小心地调整其它线段使其取得连续。第三节空间数据质量•一、空间数据质量的概念•1、空间数据质量•空间位置、专题特征以及时间是表达现实世界空间变化的三个基本要素。•空间数据是有关空间位置、专题特征以及时间信息的符号记录。•而数据质量则是空间数据在表达这三个基本要素时,所能够达到的准确性、一致性、完整性,以及它们三者之间统一性的程度。2、与数据质量相关的几个概念(1)误差(Error):误差反映了数据与真实值或者大家公认的真值之间的差异,它是一种常用的数据准确性的表达方式。(2)数据的准确度(Accuracy):数据的准确度被定义为结果、计算值或估计值与真实值或者大家公认的真值的接近程度。(3)数据的精密度(Resolution):数据的精密度指数据表示的精密程度,亦即数据表示的有效位数。它表现了测量值本身的离散程度。由于精密度的实质在于它对数据准确度的影响,同时在很多情况下。它可以通过准确度而得到体现,故常把二者结合在一起称为精确度,简称精度。(4)不确定性(Uncertainty):不确定性是关于空间过程和特征不能被准确确定的程度,是自然界各种空间现象自身固有的属性。在内容上,它是以真值为中心的一个范围,这个范围越大,数据的不确定性也就越大。二、空间数据质量评价1、空间数据质量标准空间数据质量标准是生产、使用和评价空间数据的依据,数据质量是数据整体性能的综合体现。目前,世界上已经建立了一些数据质量标准,如美国FGDC的数据质量标准等。空间数据质量标准的建立必须考虑空间过程和现象的认知、表达、处理、再现等全过程。空间数据质量标准要素如下:•数据情况说明•位置精度或称定位精度•属性精度•时间精度•逻辑一致性•数据完整性•表达形式的合理性2、空间数据质量的评价空间数据质量的评价,就是用空间数据质量标准要素对数据所描述的空间、专题和时间特征进行评价。下面给出了空间数据质量评价矩阵表空间数据描述空间数据要素空间特征时间特征专题特征世系(继承性)√√√位置精度√√√属性精度√√√逻辑一致性√√√完整性√√√表现形式准确性√√√三、误差的类型空间数据的质量通常用误差来衡量,而误差定义为空间数据与其真值的差别。一般将GIS数据误差的来源归纳为三类,如表所示。误差类型误差来源误差特征源误差数据年代;数据的空间覆盖范围;地图比例尺;观测密度数据的可访问性,数据格式;数据与用途的一致性;数据的采集处理费用明显易探测由自然变化或原始测量引起的误差位置误差;属性误差:质量和数量方面的误差数据偏差:输入输出错误,观测者偏差,自然变化不明显难测定GIS处理过程引起的误差计算机字长引起的误差拓扑分析引起的误差:逻辑错误、地图叠置操作、分类与综合引起的误差复杂难探测源误差(与数据获取方法有关)测量数字数据的误差•①控制测量误差•②碎部测量误差•③空中三角测量误差•④测图误差地图数字化数据的误差•①制图误差•②数字化误差遥感数据误差•①数据获取误差•②数据预处理误差•③数据转换误差•④人工判读误差操作误差•由计算机字长引起的误差•由拓扑分析引起的误差