第六章DEM精度分析内容提纲6.1概述数字高程模型精度研究以1988年为界分为两个阶段:从1958年数字高程模型概念提出到1988年,这个阶段对DEM精度研究的基本特征是内插技术分析和数据采样策略研究;之后,对DEM精度研究逐步由内插分析转向原始数据质量控制与分析。近几年来,随着DEM应用由数据层面向地学建模和地表过程分析的转变,DEM误差与结构特征对应用的影响分析成为一个研究热点。精度是评价模型好坏的重要指标,同时DEM精度也是数字地形建模、数字地形分析和各种地学过程模拟最为关心的问题。6.2DEM的误差源与误差分类6.2.1误差、精度与不确定性误差(error):通常被定义为观测数据与其真值之间的差异。从性质上可分为系统误差、随机误差和粗差。精度:数据准确度(Accuracy)和精密度(Resolution)的统称,指误差分布的密集或离散程度。不确定性(uncertainty):指对真值的认知或肯定的程度,是更广泛意义上的误差,包含系统误差、偶然误差、粗差、可度量和不可度量误差、数据的不完整性、概念的模糊性等。6.2.2DEM误差源分析地形表面特征大量的研究表明DEM的精度随着地形破碎程度的大小而变化,最大的误差往往出现在地形起伏或水平转折处如山脊线、山谷线、地形变化线等部位,并且它们之间的关系是呈明显的线性关联特征。数据源误差用来构建DEM的数据主要来源有野外测量、地形图数字化和摄影测量。各自对应不同的数据源如野外数据质量、地形图误差、航空相片误差。采点设备误差包括地形图手扶或扫描时数字化仪或扫描仪的误差;摄影测量的采点设备误差包括测图仪的误差和计算机计算有效位数。6.2.2DEM误差源分析人为误差人为误差包括数字化对点误差、高程赋值误差和控制点转换误差等。采样点密度和分布采样点应该具有足够的密度并且避免数据贫乏区。地形结构是地形表面的骨架线,采样点一般应该分布在各个地形特征点、特征线处。内插方法内插点的计算高程与实际量测高程之间总存在差值。DEM结构虽然较高分辨率的DEM能反映地形细部,但是以牺牲计算机存储量为代价的,DEM分辨率要和原始数据相匹配。DEM误差分类误差理论误差构成系统误差、随机误差、粗差误差范围全局误差、局部误差误差相关性绝对误差、相对误差误差空间性质周期误差、峰值误差生产过程数据源误差地图数字化误差、野外测量误差、影像数据误差操作与计算机字长误差计算字长上引起的误差、拓扑分析误差、数据分类高程内插误差6.2.3DEM误差分类体系上述误差的分类体系主要是在数据层面进行的,即研究的重点在于原始数据误差和高程内插误差。6.2.3DEM误差分类体系数据误差是DEM数据源误差和由内插引起的高程数据误差。描述误差是DEM对地形表达的误差。P1276.3DEM精度描述指标和精度体系6.3.1DEM精度的数学模型精度是指误差分布的密集或离散程度Ac(DEM)=f(S,M,R,A,Ds,Dn,O)Ac表示DEM的精度;S表示DEM表面的特征;M表示DEM表面建模的方法;R为DEM表面自身的特性(粗糙度);A,Ds,Dn为DEM原始数据的三个属性(精度、分布和密度);O为其他要素。RMSE并不反映单个误差的大小,而是从整体意义上描述了地形参数和其真值的离散程度,因此,RMSE的真正价值在于它能提供真值可能存在的范围。6.3.2常用DEM精度描述指标设高程数据的真值为Z,观测值或计算值为z,则误差定义为ε=Z-z,如果误差个数为n,则数字高程模型中常用的数值精度模型如下表。数值精度模型6.3.2常用DEM精度描述指标误差自相关精度模型:误差的自相关性对各种地形分析结果影响是系统性的,将引起单一的、非空间统计模型(如RMSE)对分析结果评价上的偏差。6.3.2常用DEM精度描述指标误差与精度可视化模型:将抽象单调的数据表达为具体、生动的图形图像数据。频率分布图高程、坡度等地形属性的频率和频率分布图,是分析地形属性分布特征和表示这种特征的一种统计分析方法。地形属性在不同地形区域和分辨率的DEM上所表现的频率往往是有差异的,在频率与频率分布曲线形状上可直观的反映出来,通过对比可分析这种差异的特征。等(高)值线图(contour)通过DEM产生的等高线和原始地形图的套合检查,是检测和剔除原始高程数据误差的有效手段。误差图(ErrorMap)灰度图、晕渲图、三维立体图等计算机可视化技术是空间数据不确定性研究的又一重要工具。在DEM所表示的平面位置上,叠加各种地形参数如高程、坡度、坡向等的误差值或精度值,则可得到地形参数的误差(精度)模型,通过可视化技术,以不同的灰度级别或颜色表示误差大小,可观察统计模型无法反映的误差的空间分布模式、格网分辨率影响、边界匹配误差等。用误差图研究和表现空间数据的不确定性问题,关键是要解决好内插问题。6.4DEM精度评定方法和精度模型DEM精度评定在内容上可通过两种不同的方式进行,一种是平面精度和高程精度分开评定,另一种是两种精度同时评定。DEM高程精度的评定通常有理论分析和实验分析两种途径。理论分析是通过数学方法来寻求对地表起伏复杂变化的统一量度,以及各种内插数学模型的通用表达方式,使评定方法、评定所得的精度和某些规律性的结论有比较普遍的理论意义。实验分析是从数据源随机抽取样区或通过专家经验选取典型地貌样区,通过考虑各种采样方式包括所使用的仪器、采样点密度、采样点分布位置等因素,并直接依据地形情况选用高程内插数学模型,来估算所建数字高程模型的精度。6.4DEM精度评定方法和精度模型6.4.1检查点法和DEM中误差模型检查点即实现将检查点按格网或任意形式进行分布,对生成的DEM在这些点处进行检查。将这些点处的内插高程和实际高程逐一比较得到各个点的误差,然后计算中误差。我国国家测绘局1:1万和1:5万数字高程模型生产技术规定用28个监测点对图幅内和图幅边缘进行检测。6.4.2逼近分析和地形描述误差逼近误差指用简单函数f1(x)近似地代替原函数f(x)时两者的差E=f(x)-f1(x)。逼近误差是由原函数f(x)和逼近函数f1(x)所决定的,是函数误差而非随机误差。6.4.3等高线套合分析和DEM定性评价模型等高线套合分析指将已经获得的DEM数据内插生成等高线,并将刚生成的等高线与原始等高线或其它图形产品(如正射影像图、立体模型等)叠加,用目视检查等高线是否有异常情况,如有则需重测、编辑,直至DEM合格。虽然等高线套合分析简单易行,但本质上是一种定性精度分析模型,不利于DEM的后续应用分析,一般常用作DEM粗差检测和DEM质量判断。6.4.4实验方法和DEM经验模型DEM经验模型建立包括两个基本的环节,即原始数据精确度评价和DEM精度评定。原始数据精确度评价:主要对数据源、数据获取方式、所采用的仪器设备、环境因素、操作员的作业水平等方面对原始数据的质量做出评价,目的是尽量减少原始数据的系统性误差和消除粗差;DEM精度评定:重点研究DEM内插、数据点分布和密度、是否顾及地形特征、建模方法等因素对DEM精度影响。6.4.5理论分析与理论模型DEM精度的经验模型具有较强的地区依赖性,模型建立费时费力,因此通过数学工具来获取在一般意义上的DEM精度模型即获取DEM精度的理论模型有重要的研究意义。一是预测DEM的内插精度;二是能为数据采样提供指导。6.5DEM精度模型分析6.5.1基于等高线数据的DEM精度分析影响等高线数据DEM精度的因素包括:(1)原始数据质量;(2)数据点的分布和密度;(3)内插数学模型;(4)等高距。等高距与内插间距存在函数关系,内插所用数据点绝大多数是相邻等高线上的点,只有这样,内插才合理。6.5.2基于格网数据的DEM精度分析基于格网数据建立DEM需要考虑两个因素的影响。(1)原始数据采样点的误差,可通过对数据采样方式的分析得到;(2)内插方法。不同内插方法会产生不同的内插曲面,引起DEM的表面建模的精度损失。6.6DEM地形描述误差分析(1)概念将在假定DEM高程采样误差为零条件下,模拟地面与实际地面之差异,定义为DEM地形描述误差(以后简称Et)。(2)地形描述性误差的度量栅格中点的高程与该栅格四个角点高程平均高程之差,可以被定义为该栅格的地形描述误差。因此,可以采用栅格窗口分析法实现Et的提取。6.7数据质量及不确定性数据质量是数据的核心。数据质量问题一般用数据准确度,精度、正确度和误差来表示。目前OpenGISConsortim,ISO9000等认为空间数据质量标准(spatialdataqualitystandard)的评估要素包括7个方面:来源(lineage)位置精度(PositionalAccuracy)属性精度(AttributeAccuracy)完整性(Completeness)逻辑的一致性(LogicalConsistency)指数据在数据结构、数据格式和属性编码正确性方面,尤其是拓扑关系上的一致性。语意精度(SemanticAccuracy)现势性(Currency)6.7.1空间数据的不确定性空间数据的不确定性属于一般不确定性的组成部分。空间数据的不确定性指以遥感、地信测绘与绘图为主的空间不确定性。包含空间位置或几何数据和属性数据。误差:如果物体可测量,那么测量结果就存在误差,主要包括位置的准确性和专题准确性。模糊:如两类边界的确定。歧义:如遥感图象的异物同谱,同物异谱。不一致:如不同的研究方法得到不同的结论。6.7.2地理空间数据的不确定分类第一种:对单个数据要么正确的、精确的和清楚地,要么错误的、不精确的和模糊地。对于正确的、精确的和清楚地属于确定性的。第二种:对数据集来说,包括各种专题地图,遥感影像,统计表格具有正确与不正确(错误)并存,精确与不精确(粗糙)并存,清楚与模糊并存,可分与不可分并存的特征。第三种:对于设计、规划和模型等数据的特殊形式来讲,他们的不确定性常用风险性(risk)大小表示。6.7.3地理空间数据的不确定原因(1)不确定性在一定程度上代表模拟数据与真实世界之间具有明显质量差别。这些差别的原因:量测误差(偏差、随机误差)。没有充足的知识去量测具有精度定义的概念。概念不能被清楚定义。测量准确度的局限性或存储设备精度的局限性。(2)不确定性还与用户的专门需求与数据之间的相容性与协调性有关。包括:词汇(术语)上的不同(命名的不同)语义上的不同(同一术语不同的解释)在分类方面的不同数据的几何和逻辑特征的不同(由比例尺和分辨率的原因)(3)不确定性和用户专门要求与数据之间的匹配有关。例如用户要求进行生态建模,但这是一个复杂问题,很难弄清楚需要什么样的数据满足生态建模,于是就形成了建模有关的风险或不确定性。6.7.4地理空间数据的不确定类型(1)客观世界固有的不确定性(2)人为引起的不确定性(1)客观世界的复杂性是造成不确定性的重要原因。地球是一个复杂的,开放的巨系统(钱学森),不仅宏观世界具有复杂性特征,微观世界同样也具有复杂性特征,此复杂性特征是客观世界固有的。不同类型的物质成分,物质结构的连续变化没有明显的分界线。如不同类型的土壤。就同类型的地物,虽有明显的界限,但他们是动态的,瞬间万变的,物态无常的,难以界定。如海岸线。不同类型相邻地物的物质和能量的相互扩散,渗透造成的不确定性。如相邻地物光谱的的相互干扰。如农牧交错带。同物异谱,异物同谱。(2)人为引起的不确定性由于认识过程的复杂性引起的不确定性。以认识为基础的科技进步加快了人类对客观世界的认识过程,新技术的应用带来了新的不确定性。运算过程的不确定性。思考题1.什么是误差?什么是不确定性?二者有何区别和联系?2.DEM精度表达方法有哪些?3.什么是地形描述性误差?