国际元数据标准的发展和研究现状

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

国际元数据标准的发展和研究现状蒋景瞳刘若梅贾云鹏Metadata可以译为元数据,亦可译为描述数据,台湾学者译为诠释数据。迄今人们对该术语的翻译和理解尚不统一。随着计算机技术和GIS技术发展,特别是网络通信技术的发展,空间数据共享日益普遍。管理和访问大型数据集的复杂性正成为数据生产者和用户的最突出的问题。数据生产者需要有效的数据管理和维护办法;用户需要找到更快、更加全面和有效的方法,以便发现、访问、获取和使用现势性强、精度高、易管理和易访问的地理空间数据。在这种情况下,空间数据的内容、质量、状况等元数据信息变得更加重要,成为信息资源有效管理和应用的重要手段。数据生产者和用户都已认识到元数据的重要价值。在许多国家,对元数据感兴趣的已经从中央政府部门扩展到省和地方部门,以及非盈利组织和私人企业。不少国家和国际性组织已经发布实施元数据内容标准,并开发了许多元数据操作工具。地理信息元数据标准和操作工具已经成为国家空间数据基础设施的一个重要组成部分。美国副总统戈尔在其有关“数字地球”的讲话中也把元数据作为数字地球的重要支撑条件之一。一、元数据的定义、作用和意义人们对元数据的理解比较混乱,有的将其与数据字典混为一谈,迄今尚没有一个统一的元数据定义。但是,一般都认为元数据就是“关于数据的数据”。在地理空间数据中,元数据是说明数据内容、质量、状况和其他有关特征的背景信息。元数据并不是一个新的概念。实际上传统的图书馆卡片、出版图书的版权说明、磁盘的标签等都是元数据。纸质地图的元数据主要表现为地图类型、地图图例,包括图名、空间参照系统和图廓坐标、地图内容说明、比例尺和精度、编制出版单位和日期或更新日期、销售信息等。在这种形式下,元数据是可读的,生产者与用户之间容易交流,用户通过它可以非常容易地确定该书或地图是否能满足其应用需要。当地图转换为数字形式时,数据的管理和应用均产生一些新的问题,例如:数据生产者需要管理和维护好海量数据,提高效率,且不受工作人员变动的影响;用户缺乏查询可用数据的方便简洁的途径,不知道在何处能够找到数据;缺少可用数据的技术文件信息,不知道如何获得所需数据;当数据格式对于应用而言直接使用时,不知道如何理解数据和转换数据;不知道有关联系信息,不能远程访问数据资源等。元数据可以用来辅助地理空间数据,帮助数据生产者和用户解决这些问题。元数据的主要作用可以归纳为如下方面:帮助数据生产单位有效地管理和维护空间数据,建立数据文档,并保证即使其主要工作人员退休或调离时,也不会失去对数据情况的了解;提供有关数据生产单位数据存贮、数据分类、数据内容、数据质量、数据交换网络(clearinghouse)及数据销售等方面的信息,便于用户查询检索地理空间数据;提供通过网络对数据进行查询检索的方法或途径,以及与数据交换和传输有关的辅助信息;帮助用户了解数据,以便就数据是否能满足其需求作出正确的判断;提供有关信息,以便用户处理和转换有用的数据。由此可见,元数据是使数据充分发挥作用的重要条件之一。它可以用于许多方面,包括数据文档建立、数据发布、数据浏览、数据转换等。元数据对于促进数据的管理、使用和共享均有重要的作用。原始数据如果没有元数据,就很难有效地进行管理和使用。元数据对于建立空间数据交换网络是十分重要的,网络中心通过设在中心的元数据库可以实时地连接各个分发数据的分结点元数据库,帮助潜在的用户找到其特定应用所需要的数据,实现数据共享。不难预见,元数据在地理信息系统产业中将担当重要的角色。然而,在数字形式下,元数据的建立和维护、生产者与用户之间的交流均不那么容易,需要数据生产者更多的努力,并需要那些随后可能应用数据的用户,或可能修改数据以便符合其需求的用户作出相应的努力。二、元数据的常用形式和标准化的必要性元数据也是一种数据,在形式上与其他数据没有区别,它可以以数据存在的任何一种形式存在。元数据常用形式是填写了数据源和数据生产工艺过程的文件卷宗,也可以是用户手册。用户手册提供的简洁的元数据容易阅读,并且可以联机查询。元数据更主要的形式是与地理信息元数据内容标准相一致的数字形式。数字形式的元数据可以用多种方法建立、存贮和使用:最基本的是文本文件(ASCII)。ASCII文件易于传输给用户,而不管用户使用什么硬件和软件。另一种形式是用超文本链接标示语言(HypertextMarkupLanguage,HTML)编写的超文本文件。用户可以利用NetscapeNavigator,Mosaic,或美国微软公司的InternetExplorer查阅元数据。用通用标示语言(StandardforGeneralMarkupLanguage,SGML)建立元数据。SGML提供一种有效的办法连接元数据元素。这种方法便于建立元数据索引和在空间数据交换网络上查询元数据,并且提供一种在元数据用户间交换元数据、元数据库和元数据工具的方法。地理空间数据交换网络是一个在数据生产者、管理者和用户之间建立的分布式、电子连接网络。它既可包含能够下载的数据集,也可包含有关数据集的信息即元数据。用户通过万维网()进行访问,以便查找所需要的地理空间数据,帮助用户决定是否值得获取这些数据和如何获取。元数据可以组织成为若干等级,从简单的数据基本情况列表,到各个数据集的详细说明文件。最基础等级的元数据可以支持建立一个部门、或一个地区所拥有数据的目录。最详细等级的元数据可以保证潜在用户能够就数据是否满足其需求作出正确的决定。建立元数据是数据生产者的责任。然而,信息技术产品的数据处理和管理工具的快速增涨,已经引起元数据内容和处理的不同,并且没有考虑元数据的共享。唯一能够在不同数据管理软件间交换元数据的途径是统一的元数据标准。元数据标准能够使数据生产者和用户一起着手处理有关元数据交换、共享和管理的问题。元数据标准的研制与实施已引起各国广泛重视,许多国家不但已经完成标准的制定,开发了多种操作工具软件,建成了大量的元数据库,并已投入使用,而且多次召开国际学术讨论会,对元数据的理论、实施、应用及标准化的有关问题进行讨论,国际地理信息元数据标准也在抓紧研制中。三、美国FGDC元数据标准剖析美国联邦地理数据委员会(FederalGeographicalDataCommittee,FGDC)成立于1990年,由来自16个单位的17位专家组成。1992年6月举办了地理空间元数据讨论会,与会者认为需要研制地理空间数据的元数据内容标准(CSDGM)。该委员会下设的标准化工作组起草了CSDGM标准草案,从1992年10月至1993年4月公开征求意见。工作组根据意见修改后,于1993年7月再次征求意见并进行测试。1994年1月和3月对草案又征求意见和测试。1994年8月FGDC通过并发布第一版CSDGM。此后,联邦政府内外的许多单位根据12906号总统令的要求,从1995年开始执行这一标准,并利用自动索引和服务机制,为用户提供通过因特网访问其数据库的服务。FGDC于1997年完成了第二版CSDGM。CSDGM说明一组数字地理空间数据的元数据的信息内容,提供与元数据有关的术语和定义,说明那些元数据元素是必需的、可选的、重复出现的,或者是按CSDGM产生规则编码的。CSDGM是参照文件,它说明当用户在评价数据集的用途、获得该数据或有效使用数据时,需要知道的事情。第二版的CSDGM打印文本有83页。包含7个主要子集和3个次要子集(见表1),共有460个元数据实体(含复合实体)和元素。元数据元素是元数据的关键术语,是其最基本的单元。一个元数据元素说明地理空间数据的某一方面特征。按数据库语言,它们是填入数据的“字段”。一个或若干个元数据元素组成元数据实体。复合实体则由元数据实体、元数据元素和/或其他复合实体构成。每个元数据元素、实体或复合实体均需说明其名称、定义、类型、值域、简称等特征信息。元数据子集是由若干元素、简单的或复合的元数据实体组成的集合。CSDGM标准规定了三种性质的子集、实体和元素。这三种性质是:必需的,即必需提供的信息;一定条件下必需的,即如果正在建立的元数据包含某子集、某个实体,或某个元素说明的特征,则必需提供的信息;可选的,即该信息是可选的,由用户决定是否将其包含在元数据文件中。当用图形表示时,元数据元素为一个三维方框,框内填写元素的关键字名。实体及复合实体则表示为围绕数据元素和/或其他元素的方框。由地理坐标、时间范围和高程范围等三个实体组成。其中,“地理坐标”为复合实体,它由四个元素和一个“地理区域”实体组成。地理区域”实体又由两个元素组成;“时间范围”实体由四个元素组成;“高程范围”实体则由三个元素组成。在元数据文本文件中,这种子集、实体和元素关系,用元素比实体缩进一格的办法表示(称为分层缩排),或者用编号,或者在编号后增加一个小数点和下一层编号表示。例如,实体2.1可以有元素2.1.1和2.1.2等。以下是美国地质测量局发布的30分数字高程模型(DEM)元数据中数据志Lineage)子集的部分内容,它明显地体现了这种缩排结构(其中,加粗部分是元数据数据值,其余是元数据子集、实体和元素名称):Lineage:Source_Information:Source_Citation:Citation_Information:Originator:U.S.GeologicalSurveyPublication_Date:Title:digitalcontourlinesGeospatial_Data_Presentation_Form:mapPublication_Information:Publication_Place:Reston,VAPublisher:U.S.GeologicalSurveyType_of_Source_Media:magnetictapeSource_Time_Period_of_Content:Time_Period_Information:Range_of_Dates/Times:Beginning_Date:19880805Ending_Date:presentSource_Currentness_Reference:groundcondition这里有几点需要注意:──元数据子集、实体和元素名称必需与标准完全一致;──元数据的实体(含复合实体)与其元素之间的关系必需处理好,即元素总是跟随各自的实体;元数据即使符合标准,看起来也可能是不一样的。这是由于标准仅说明元数据的内容,而不是它的格式。不同格式包括:元数据元素分层缩排、编号系统、元素名后加冒号、在元素名称下划线,或者将其作为分开的单词等。可以利用元数据操作工具软件将它们规则排列起来。操作工具可以读入元数据文件,输出与标准一致的元素名称。美国地质测量局(USGS)DougNebert先生搜集编辑了著名的、用于建立地理空间数据文档的、符合FGDC元数据标准的各种元数据操作工具表。这些工具可用于元数据的输入、编辑、预处理、后处理和确认。美国FGDC元数据标准除在美国国内广泛使用外,加拿大、印度等国也已等同采用,作为各自的国家标准。ISO/TC211利用该标准文本作为基础,正在制定相应的国际标准。四、其他元数据标准简介1.电器和电子工程师协会(IEEE)电器和电子工程师协会(IEEE)在1994年2月的白皮书中指出:元数据是关于数据的信息,它使得有效地管理和访问数据成为可能。该协会认为至少有两种元数据,即系统级元数据和应用级元数据。前者是用于管理数据的信息,包括数据访问时间、数据量、当前的存储位置等;后者是帮助用户的信息,包括找到、评价、访问和使用数据的信息。在某些情况下,访问元数据应当比访问数据快。为此,要求将元数据常驻在较高等级的设备上。在处理特大型数据集时这一点特别重要。元数据的内容是没有限定的。一般而言,元数据可以是文件系统或应用所需要的任何信息。它应当是可扩充的。元数据的量也是没有限定的。但是,它总是比其说明的对象,即数据的量小。元数据的大小取决于访问的复杂性,或管理水平的要求。元数据的主要目的是解决数据管理和共

1 / 8
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功