4.4空间数据质量分析与控制2空间数据的特点空间数据质量的概念和内容空间数据质量的影响因素分析空间数据质量的误差分析空间数据质量的评价空间数据质量的控制主要内容:1.空间数据的特点SpatiallyrelatedCanbeassignedcoordinatesoranyspatialreference.Onthesurfaceoftheearth.Involveslocationandorganization.ScaleCanbefromgeneraltospecific.Simpletocomplex.Asatellitecangenerateoneterabyte(1012bytes)ofinformationperday.DynamicsSpatialdynamics(variationsinspace).Temporaldynamics(variationsintime).CoordinatesystemScaleTime1Time2空间数据的三个侧面空间特征:表示现象的空间位置或现在所处的地理位置。空间特征又称为几何特征或定位特征,一般以坐标数据表示,例如笛卡尔坐标等。属性特征:表示实际现象或特征,例如变量、级别、数量特征和名称等等。时间特征:指现象或物体随时间的变化,其变化的周期有超短期的、短期的、中期的、长期的等等。三个侧面空间特征是GIS区别于其它软件的根本特征是由于地物或现象的空间分布所带来通常是通过特定空间参照系下的坐标直接表达基于坐标的派生数据定量的度量信息:面积、周长、质心、距离等定性的空间关系:拓扑关系、方位关系时间特征空间数据涉及时间特征的几个方面地物的生命周期(产生、消亡)地物的移动(移动点)属性的时效性相关的问题时间关系时空关系时态GIS数据模型是其关键(时空立方体模型等)专题属性特征地物所固有的,不是由于地物空间分布所带来的特征如某地的年降雨量、土地酸碱类型、人口密度、交通流量、空气污染程度等。这类特征在其它类型的信息系统中均可存储和处理专题属性特征通常以数字、符号、文本和图像等形式来表示空间数据与专题数据空间数据的时态特征数据的测量尺度命名(Nominal)量定性而非定量,不能进行任何算术运算,如一个城市的名字次序(Ordinal)量线性坐标上不按值的大小,而是按顺序排列的数,例如,事故发生危险程度的级别由大到小被标为1,2,3,…间隔(Interval)量不参照某个固定点,而是按间隔表示相对位置的数。按间隔量测的值相互之间可以比较大小,并且它们之间的差值大小是有意义的比率(Ratio)量比率测量尺度的测量值指那些有真零值而且测量单位的间隔是相等的数据。数据的测量尺度GIS数据测量尺度示例PointLineAreaQuantitativeOrdinalQualitative51015Eachdotrepresents500personsProportionalsymbolsLargeMediumSmallQTownAirportFlowContour304050HighwayRoadStreetRoadBoundaryRiver10020PopulationdensityHighimpactLowimpactSwampDesertForrest不同测量尺度数值可以进行的运算命名量==,!=…次序量==,!=,,…间隔量==,!=,,,+,-…比率量==,!=,,,+,-,*,/…2.空间数据质量概念和内容在GIS的几个主要因素中,数据是一个极为重要的因素。在计算机软件、硬件环境选定之后,GIS中数据质量的优劣,决定着系统分析质量以及整个应用的成败。GIS提供的空间数据的分析方法被广泛用于各种领域,用于决策领域的数据,其质量要求应该是可知的或可预测的。研究空间数据质量的目的在于加强数据生产过程中的质量控制,提高数据质量(1)空间数据质量的重要性GeographicDatabaseQueryandAnalysisSpatialDataInputandManagementOutput:DisplayHelpPrevent“Garbagein,Garbageout!”GIS(2)空间数据质量的相关概念准确性(Accuracy)精度(Precision)空间分辨率(SpatialResolution)比例尺(Scale)误差(Error)不确定性(Uncertainty)(2)空间数据质量的相关概念准确性(Accuracy)一个记录值(测量或者观察值)与它的真实值之间的接近程度;空间数据的准确性通常是根据所指的位置、拓扑或者非空间属性来分类的;可以误差(Error)来衡量空间数据的准确性;(2)空间数据质量的相关概念精度(Precision)数据精度表示数据对现象描述的详细程度数据精度和数据准确性的区别:精度低的数据不一定准确度也低;数据精度如果超出了测量仪器的已知准确度,这样的纪录数字在效率上是冗余的;例如:在设计精度为0.1mm的数字化仪上测量返回的坐标数据为(10.11mm,12.233mm),其中就含有冗余的数据;(2)空间数据质量的相关概念空间分辨率(SpatialResolution)分辨率是两个可测量数值之间最小的可辨识的差异;空间分辨率可以看作是记录变化的最小幅度;空间分辨率示例:地图上最细线宽度对应的地理范围,遥感图像上一个像素代表的实际地理范围大小空间分辨率∝数据精度空间分辨率示例RealWorldVectorDataRasterData1pixel=10mX10m分辨率=10m10M10M1Pixel(2)空间数据质量的相关概念比例尺(Scale)地图上一个记录的距离和它所表现的“真实世界”的距离之间的一个比例;如右图中,这幅地图的比例尺=10cm:1000m=1:10000比例尺是刻画数据精度的量(如最小线宽为地图的空间分辨率);(2)空间数据质量的相关概念误差(Error)描述测量值和真实值之间的差别;在大部分情况下,误差的大小是很不准确的,因为待测量的真实值往往无法得到;研究如何给出误差大小的最佳估计以及误差传播规律,是很有用的;误差的分析包括:位置误差(如点、线、多边形的位置误差);属性误差;位置和属性误差之间的联系;产生的误差的环节投影变换:地图投影是将三维地球椭球面到二维场平面的拓扑变换。在不同投影形式下,地理特征的位置、面积和方向的表现会有差异。地图数字化和扫描后的矢量化处理:数字化过程采点的位置精度、空间分辨率、属性赋值等都可能出现误差。数据格式转换:在矢量格式和栅格格式之间的数据格式转换中,数据所表达的空间特征的位置具有差异性。数据抽象:在数据发生比例尺度变换时,对数据进行的聚类、归并、合并等操作时产生的误差建立拓扑关系:拓扑过程中伴随有数据所表达的空间特征的位置坐标的变化。与主控数据层的匹配:一个数据库中,常存储同一地区的多层数据面,为保证各数据层之间空间位置的协调性,一般建立一个主控数据层以控制其他数据层的边界和控制点。在与主控数据层匹配的过程中也会存在空间位移,从而导致误差。数据叠加操作和更新:数据在进行叠加运算以及数据更新时,会产生空间位置和属性值的差异。数据集成处理:指在来源不同、类型不同的各种数据集的相互操作过程中所产生的误差。数据集成是包括数据预处理、数据集之间的相互运算、数据表达等过程在内的复杂过程,其中位置误差、属性误差都会出现。数据的可视化表达:数据在可视化过程中为适应视觉效果,需对数据的空间特征位置、注记等进行调整,由此产生数据表达上的误差。数据处理过程中误差的传递和扩散:在数据处理的各个过程中,误差是累积和扩散的,前一过程的累积误差可能成为下一个阶段的误差起源,从而导致新的误差的产生。不确定性(Uncertainty)对于空间信息科学技术来说,数据的正确性与错误并存,正常与异常并存,精确与粗糙并存,质量高与质量低并存,什么时候是正确的,什么时候不正确的,这些都属于不确定性现象;GIS中数据的不确定性包括:位置的不确定性、属性的不确定性、时域的不确定性、逻辑上的不一致性以及数据的不完整性;研究不确定性可以更好的了解测量数据的性质??(2)空间数据质量的相关概念(3)空间数据质量指标及内容①数据情况说明:对地理数据的来源、内容及处理过程等做出准确、全面和详尽的说明。②位置精度:为空间实体的坐标数据及实体真实位置的接近程度,常表现为空间三维坐标数据精度。它包括数学基础精度、平面精度、高程精度、接边精度、形状再现精度(形状保真度)、像元定位精度(图像分辨率)等。③属性精度:指空间实体的属性值与其真值相符的程度。通常取决于地理数据的类型,且常常与位置精度有关,包括要素分类与代码的正确性、要素属性值的准确性及其名称的正确性等。④时间精度:指数据的现势性;⑤逻辑一致性:指地理数据关系上的可靠性,包括数据结构、数据内容(如毛面积、净面积和扣除面积的关系),以及拓扑性质上的内在一致性。⑥数据完整性。指地理数据在范围、内容及结构等方面满足所有要求的完整程度,包括数据范围、空间实体类型、空间关系分类、属性特征分类(如土地利用分类编码能否涵盖所有现象)等方面的完整性。⑦表达形式的合理性。主要指数据抽象、数据表达与真实地理世界的吻合性,包括空间特征、专题特征和时间特征表达的合理性等。(3)空间数据质量指标及内容3.空间数据质量的影响因素分析空间现象自身存在的不稳定性分布的不确定性、属性类型划分和表达多样性等;空间现象的获取和表达中的误差测量误差、地图投影、数值采样和量化等;空间数据处理中的误差投影转换、地图数字化与扫描矢量化、格式转换、数据抽象(聚类、归并等)、空间分析、可视化等;空间数据使用中的误差:生产者和使用者对数据的解释和理解不同,可通过空间数据的元数据来沟通;空间数据误差的主要来源数据处理过程误差来源数据搜集野外测量误差:仪器误差、记录误差遥感数据误差:辐射和几何纠正误差、信息提取误差地图数据误差:原始数据误差、坐标转换、制图综合及印刷数据输入数字化误差:仪器误差、操作误差不同系统格式转换误差:栅格-矢量转换、三角网-等值线转换数据存储数值精度不够空间精度不够:每个格网点太大、地图最小制图单元太大数据处理/分析分类间隔不合理多层数据叠合引起的误差传播:插值误差、多源数据综合分析误差比例尺太小引起的误差数据输出输出设备不精确引起的误差输出的媒介不稳定造成的误差数据使用对数据所包含的信息的误解对数据信息使用不当空间数据源误差地图、遥感测量(1)地图误差地图固有误差。指用于数字化的地图本身所带有的误差,包括控制点误差、投影误差等。材料变形产生的误差。这类误差是由于图纸的大小受湿度和温度变化的影响而产生的。温度不变的情况下,若湿度由0%增至25%,则纸的尺寸可能改变1.6%;纸的膨胀率和收缩率不相同,即使温度又恢复到原先水平,图纸也不能恢复原有的尺寸数字化误差:数字化仪;扫描矢量化(2)遥感数据误差遥感数据的误差来源:观测过程:受空间分辨率、几何畸变和辐射误差等影响。处理和解译过程:由图像处理中的影像或图像校正和匹配以及遥感解译判读和分类引入的,其中包括混合像元的解译判读所带来的属性误差。(3)测量数据的误差标准椭球体代表地球真实表面空间时,已经引入了一定的误差因素,由于这种误差因素无法排除,一般也不作为误差考虑。测量方面的误差通常考虑的是系统误差、操作误差和偶然误差。(a)系统误差的发生与一个确定的系统有关,它受环境因素(如温度、湿度和气压等)、仪器结构与性能以及操作人员技能等方面的因素综合影响而产生。系统误差不能通过重复测量以检查或消除,只能用数字模型模拟和估计。(b)操作误差是操作人员在使用设备、读数或记录观测值时,因粗心或操作不当而产生的。(c)偶然误差是一种随机性的误差,由一些不可预料和不可控制的因