第七讲空间数据质量和元数据中山大学遥感与地理信息工程系空间数据质量元数据空间数据空间数据是有关空间位置、专题特征以及时间信息的符号记录。空间数据质量是指空间数据在表达空间位置、专题特征以及时间信息时能够达到的准确性、一致性、完整性,以及他们三者之间同一性的程度。空间数据的质量具有相对性。几个概念误差——误差反映了数据与真实值或大家公认的真值之间的差异。数据的准确度——结果、计算值、估计值与真实值之间的差异。不确定性——关于空间过程和特征不能被准确确定的程度。数据的精密度——数据表示的精密程度,亦即数据表示的有效位数。空间数据质量评价空间数据质量标准要素数据情况说明属性精度时间精度数据完整性表达形式的完整性逻辑一致性位置精度数据情况说明要求对地理数据的来源、数据内容及其处理过程等做出准确、全面和详尽的说明。位置精度指空间实体的坐标数据与实体真实位置的接近程度,通常表现为空间三维坐标数据精度。它包括数学基础精度、平面精度、高程精度、接边精度、形状再现精度、像元定位精度。平面精度又分为相对精度和绝对精度。属性精度指空间实体的属性与其真值相符的程度。通常取决于地理数据的类型,且常常与位置精度有关,包括要素分类与标准的正确性、要素属性值的准确性、名称的正确性等。时间精度指数据的现势性。可以通过数据更新的时间和频度来表现。逻辑一致性指地理数据关系上的可靠性,包括数据结构、数据内容,以及拓扑性质上的内在一致性。数据完整性指地理数据在范围、内容和结构等方面满足所有要求的完整程度,包括数据范围、空间实体类型、空间关系分类、属性特征分类等方面的完整性。表达形式的合理性主要指数据抽象、数据表达与真实地理世界的吻合性,包括空间特征、专题特征、时间特征表达的合理性。空间数据质量的评价空间数据质量评价矩阵表数据描述数据要素空间特征时间特征专题特征世系(继承性)位置精度属性精度逻辑一致性完整性表现形式准确性空间数据质量问题的来源空间现象自身存在的不稳定性空间数据处理中的误差空间数据使用中的误差空间现象的表达空间现象的表达定义变量概念理解的不一致性导致数据测量误差。表达方式图形的不合理表达产生误差。物理介质的变化测量测量仪器本身有一定的设计精度。数据处理中的误差投影变换地图数字化和扫描后的矢量化处理数据格式转换数据抽象建立拓扑关系与主控数据层的匹配数据叠加操作和更新数据集成处理数据的可视化表达数据处理过程中误差的传递和扩散空间数据使用中的误差对数据的解释过程缺少文档常见空间数据源的误差分析地图数据的质量问题测量数据的质量问题遥感数据的质量问题地图数据的质量问题地图固有误差如控制点误差、投影物差材料变形误差热胀冷缩图形数字化误差跟踪数字化1、数字化要素对象2、数字化仪3、数字化操作扫描数字化原图质量、扫描精度等遥感数据的质量问题遥感仪器遥感图像的处理和解译空间位置和属性方面的误差测量数据的质量问题系统误差受环境因素、仪器结构、操作人员的技能等影响。它不能通过重复观测以检查或消除。操作误差操作误差可通过几何或代数关系检查其一致性,或通过重复观测检查并消除操作误差。偶然误差它由不可预料、不可控制的因素引起。可采用随机模型进行估计和处理。空间数据的质量控制传统手工方法图形:目视方法等属性:逐个检查元数据方法元数据包含大量有关数据的信息,通过跟踪元数据可以了解数据质量的状况和变化。地理相关法用空间数据的地理特征要素自身的相关性来分析数据的质量。如山区河流应当位于微地形的最低点。数字化过程的质量控制数据预处理工作数字化设备的选用数字化对点的精度(0.1mm)数字化限差数据的精度检查(直0.2mm;曲0.3mm)元数据元数据概念Metadata,原意是关于数据变化的描述,即关于数据的数据。目的1、促进数据集的高效利用2、为计算机辅助软件工程(CASE)服务。内容对数据集的描述;对数据项、数据所有者、数据生产历史等的说明;对数据质量的描述;对数据处理信息的说明;对数据转换方法的描述;对数据库的更新、集成方法等的说明。性质元数据应尽可能多地反映数据集自身的特征规律。作用通过元数据可以检索、访问数据库,可以有效的利用计算机资源,可以对数据进行加工处理和二次开发等。元数据的类型(1)分类标准类型内容1、科研型元数据2、评估型元数据3、模型元数据描述对象1、数据层元数据2、属性元数据3、实体元数据元数据的类型(2)分类标准类型在系统中的作用1、系统级别元数据2、应用层元数据元数据的作用1、控制层元数据2、说明元数据空间元数据的概念和标准名称概念空间数据Geospatialdata用于确定具有自然特征或者人工建筑特征的地理实体的地理位置、属性及其边界的信息。类型Type数据类型指该数据能接受的值的类型。对象Object指地理实体的部分或整体的数字表达。实体类型Entitytype对于具有相似地理特征的地理实体集合的定义和描述。点Point确定位置的0维地理对象。结点Node拓扑连接两个或多个链或环的一维对象。标识点Labelpoint显示地图或图表时用于特征标识的参考点。名称概念线Line一维对象的一般术语;线段Linesegment两个点之间的直线段;线String由相互连接的一系列线段组成的没有分支线段,线可以自身或与其他线相切;弧Arc由数学表达式确定的点集组成的弧状曲线;链Link两个结点之间的拓扑关联;环Ring封闭状不相切链环或弧段序列;链环Chain非相切线段或由结点区分的弧段构成的有方向无分支序列;名称概念多边形Polygon在二维平面中由封闭弧段包围的区域;外多边形UniversePolygon数据覆盖区域内最外侧的多边形;内部区域Interiorarea不包括其边界的区域;格网Grid组成一规则或近似规则的棋盘状镶嵌表面的格网或表面的点的集合;格网单元Gridcell表示格网最小可分要素的二维对象;矢量Vector有方向线的组合;栅格Raster同一格网或数字影像的一个或多个叠加层;名称概念像元Pixel二维图形要素,它是数字影像最小要素;栅格对象Rasterobject一个或多个影像或格网,每一个影像或格网表示一个数据层,各层之间的格网单元或像元一致且相互套准。图形Graph与预定义的限制规则一致的0维、一维、二维有拓扑相关的对象集;数据层Layer集成到一起的面域分布空间数据集,它用于表示一个主体中的实体,或者有一公共属性或属性值的空间对象的联合;层Stratum在有序系统中数据层、级别或梯度系列;经度Longitude经线面到格林尼治中央经线面的角度距离;纬度Latitude在中央经线上度量,以角度为单位度量离开赤道的距离;名称概念中央经线Meridian穿过地球两极的地球的大圆圈;坐标Ordinate在笛卡尔坐标系中沿平行于X轴和Y轴测量的坐标值。投影Projection将地球球面坐标系中的空间特征(集)转化到平面坐标系时使用的数学方法;投影参数ProjectionParameters对数据集进行投影操作时用于控制投影误差、变形实际分布的参考特征;地图Map空间现象的空间表征,通常以平面图形表示;现象Phenomenon事实、发生的事件、状态等;名称概念分辨率Resolution由涉及到或使用的测量工具或分析方法能区分的两个独立测量或计算的值的最小差异;质量Quality数据符合一定要求的基本或独特的性质;详述Explicit由一对或三个数分别直接描述水平位置和三位位置的方法介质Media用于记录、存贮或传递数据的物理设备;空间数据元数据标准美国联邦空间数据委员会(FGDC)的空间数据元数据内容标准的影响最大。空间数据元数据的获取获取的三个阶段:数据收集前(键入、关联表)数据收集中(采样测量)数据收集后(计算和参考)空间数据元数据获取的五种方法键盘输入关联表测量法计算法推理法空间数据元数据的管理通常采用元数据库的方式管理元数据。概念层逻辑层RDBMS已存在的软件工具系统物理层元数据管理系统WAISODBMS空间数据元数据的应用为什么使用元数据?完整性可扩展性特殊化安全性查错功能浏览功能程序生成空间数据元数据的应用帮助用户获取数据;空间数据质量控制;在数据集成中的应用;数据存贮和功能实现.