HJ720-2014环境信息元数据规范Environmentinformationmetadataspecification(发布稿)本电子版为发布稿。请以中国环境科学出版社出版的正式标准文本为准。2014-12-25发布2015-03-01实施发布I目次前言………………………………………………………………………………………………………..II 1适用范围………………………………………………………………………………………………………1 2规范性引用文件………………………………………………………………………………………………1 3术语和定义……………………………………………………………………………………………………1 4一般规定………………………………………………………………………………………………………1 5符号与约定……………………………………………………………………………………………………1 6环境信息元数据框架…………………………………………………………………………………………5 7环境信息核心元数据内容……………………………………………………………………………………9 附录A(规范性附录)环境信息元数据XMLSchema…………………………………………………..22 附录B(规范性附录)环境信息元数据扩展原则和方法………………………………………………..33 附录C(资料性附录)环境信息核心元数据示例………………………………………………………..37 附录D(资料性附录)环境信息核心元数据应用的XML示例………………………………………...46 附录E(规范性附录)数据集标识符编码方案…………………………………………………………..51 附录F(资料性附录)应用方案1:污染源自动监控元数据…………………………………………...53 附录G(资料性附录)应用方案2:污染源监督性监测元数据……………………………………….100 附录H(资料性附录)应用方案3:环境统计信息元数据…………………………………………….136 附录I(资料性附录)环境信息元数据扩展示例……………………………………………………….178 II前言为贯彻《中华人民共和国环境保护法》促进环境信息化工作,规范环境信息资源元数据内容,制定本标准。本标准规定了环境信息元数据框架,定义了环境信息核心元数据内容以及用以描述环境信息数据集的标识、内容、管理以及维护等信息。本标准的附录A、B、E为规范性附录,附录C、D、F、G、H、I为资料性附录。本标准为首次发布。本标准由环境保护部科技标准司组织制订。本标准起草单位:环境保护部信息中心、北京市倍思电子数据库工程公司、中国环境监测总站。本标准环境保护部2014年12月25日批准。本标准自2015年3月1日起实施。本标准由环境保护部解释。1环境信息元数据规范1适用范围本标准规定了环境信息元数据框架,定义了环境信息核心元数据内容以及用以描述环境信息数据集的标识、内容、管理以及维护等信息。本标准适用于环境信息元数据编目、建库、发布和查询。2规范性引用文件本标准内容引用了下列文件中的条款。凡是不注日期的引用文件,其有效版本适用于本标准。GB11714全国组织机构代码编制规则GB/T2260中华人民共和国行政区划代码GB/T7408数据元和交换格式信息交换日期和时间表示法GB/T22240-2008信息安全技术信息系统安全等级保护定级指南HJ/T417-2007环境信息分类与代码3术语和定义下列术语和定义适用于本标准。3.1数据集dataset可以识别的数据集合。注:本标准中数据集是指不可再细分的数据集,即能够用一个数据字典唯一描述的数据集合。3.2元数据metadata关于数据的数据。即数据的标识、覆盖范围、质量、空间和时间模式、空间参照系和分发等信息。注:本标准中元数据特指描述环境信息数据集的数据。3.3元数据元素metadataelement元数据的基本单元。注:元数据元素在元数据实体中是唯一的。3.4元数据实体metadataentity一组说明数据相同特性的元数据元素。注:可以包含一个或一个以上元数据实体。3.5元数据子集metadatasection元数据的子集合,由相关的元数据实体和元素组成。3.6环境信息核心元数据environmentinformationcoremetadata描述环境信息数据集昀基本属性的元数据实体和元数据元素。注1:是环境信息元数据的昀小子集。注2:各业务应用时,必须包含环境信息核心元数据。4一般规定按照本标准直接进行元数据应用时,其元数据内容应与第7章保持一致。按照本标准进行元数据记录交换时,其编码应符合附录A规定的格式。环境保护各专业可根据业务自身特点和应用需求在本标准基础上进行扩展,形成各专业数据的元数据应用方案。扩展后的元数据应用方案必须符合第6章定义的环境信息元数据框架,原则上不可对元数据框架进行扩展;其元数据内容必须包含第7章定义的环境信息核心元数据内容,其定义与描述方式必须遵循第5章规定的符号与约定。具体的扩展原则方法应遵循附录B的要求,扩展示例参见附录I。5符号与约定25.1摘要表示5.1.1概述本标准采用摘要表示的方式定义和描述元数据。在以摘要表示的方式定义和描述元数据时,采用以下属性,包括中文名称、英文名称、定义、数据类型、值域、短名、注解、子元素、扩展巴氏范式和示例。5.1.2中文名称各元数据子集、元数据元素或元数据实体的中文名称,用7.2中各小节的标题来表达。例如:7.2.1.1数据集名称5.1.3英文名称对存在国际或行业领域惯用英文名称的元数据子集、元数据实体或元数据元素,则直接采用该英文名称。元数据子集、元数据实体或元数据元素的英文名称,一般用英文全称。所有组成词汇为无缝连写。元数据元素的首词汇全部采用小写字母,其余每个词汇的首字母采用大写;元数据子集和元数据实体的每个词汇的首字母大写。例如:元数据子集“覆盖范围信息”英文名称为“Extent”;元数据实体“地理边界矩形”英文名称为“GeographicBoundingBox”;元数据元素“东边经度”英文名称为“eastBoundLongitude”。5.1.4定义描述元数据子集、元数据实体或元数据元素的基本内容和属性。5.1.5数据类型说明元数据子集、元数据实体或元数据元素的数据类型,允许对其值域内的值进行操作的值域说明。例如复合型、字符串、日期型等。5.1.6值域说明元数据元素可以取值的范围。5.1.7短名短名用于在本标准内唯一识别元数据子集、元数据实体或元数据元素,其确定规则如下:a)短名在本标准范围内必须唯一;b)对存在国际或行业领域惯用英文缩写的元数据实体或元数据元素,其短名直接采用该英文缩写;c)对于根据英文名称形成的短名,在保持唯一性的前提下统一取每个单词前三个字母作为其短名,当如此取词不能保证唯一性时应延展取词位数,通常仅增加一位,如此仍不能保证唯一性时如前继续延长取词,直至保证唯一性为止;d)元数据子集和元数据实体的短名的写法是,所有组成词汇的缩写为无缝连写,并且每个词汇缩写的首字母大写;e)元数据元素的短名的写法是,所有组成词汇的缩写为无缝连写,首词汇全部采用小写字母,其余每个词汇的缩写的首字母大写。例如:元数据元素“数据集提供方电子邮件”的英文名称为“electronicMail”,其短名为“eMail”。5.1.8注解对元数据实体或元数据元素的含义的进一步解释,包括该元数据实体或元数据元素的约束/条件(必选、可选或条件必选)和昀大出现次数。当该元数据元素为条件必选时,应注明其约束条件。5.1.8.1约束/条件说明元数据实体或元数据元素是否必须选取的属性。包括必选(M)、可选(O)和条件必选(C)。——必选M表明该元数据实体或元数据元素必须选择。——可选O3根据实际应用可以选择也可以不选的元数据实体或元数据元素。已经定义的可选元数据实体和可选元数据元素,可指导各业务数据元数据规范制定人员充分说明其业务信息资源。如果一个可选元数据实体未被使用,则该实体所包含的元素(包括必选元素)也不选用。可选元数据实体可以有必选元素,但只当可选实体被选用时才成为必选。——条件必选C当满足约束条件中所定义的条件时必须选择。条件必选用于以下三种可能性之一:a)当在多个选项中进行选择时,至少一个选项必选,且必须使用;b)当另一个元数据元素已经使用时,选用一个元数据实体或元数据元素;c)当另一个元数据元素已经选择了一个特定值时,选用一个元数据元素。5.1.8.2最大出现次数元数据实体或元数据元素可以具有的昀大实例数目。只出现一次的用“1”表示,重复出现的用“N”表示。不为1的固定出现次数可用相应的数字表示,如“2”、“3”、“4”等。5.1.9子元素子元素是通过一定的表示规则以确定一个元数据子集或元数据实体中包含的下一级的元数据实体或元数据元素。表示规则为:“标识符=表达式”。表达式中各符号的含义见表1。表1表达式的符号含义符号含义=由……替换、生成,由……组成+与|或(选择)——在由“|”分开的两项之中选择其一0{a}1表示{}中的元数据元素a为可选项或条件必选项,且昀大出现次数为1;若为条件必选项,约束/条件具体见其注解0{a}n表示{}中的元数据元素a为可选项或条件必选项,且昀大出现次数为N;若为条件必选项,约束/条件具体见其注解a表示元数据元素a为必选项,且昀大出现次数为11{a}n表示{}中的元数据元素a为必选项,且昀大出现次数为N在子元素表示中,{}中均使用元数据元素或实体的中文名称。例如:子元素:数据集提供方=数据集提供单位+0{数据集提供方电话}n+0{数据集提供方地址}1+0{数据集提供方电子邮件}n5.1.10扩展巴氏范式扩展巴氏范式可以更加规范化的表示一个元数据子集或元数据实体与其下一级的元数据实体或元数据元素之间的关系,便于系统实现。与子元素的表示法不同,扩展巴氏范式用“,”代替子元素中的“+”表示“与”关系,{}中均使用该元数据元素的短名,并以“;”作为表达式的结尾。例如:扩展巴氏范式:IdPoC=rpOrgName,0{cntPhone}n,0{cntAdd}1,0{eMail}n;5.2UML图5.2.1概述4本标准采用统一建模语言(UML)描述元数据子集、元数据实体和元数据元素之间的关系。在本标准中,用UML中包的概念表示元数据子集,用UML中类的概念表示元数据实体,用UML类的属性的概念表示元数据元素。5.2.2统一建模语言模型关系及符号说明本标准涉及UML定义的下列几种模型关系,并采用UML静态结构图表示元数据实体间的关系。(1)关联关联用于描述两个或更多类之间的一般关系,见图1。关联的方向必须说明。如果不指明方向,则假定为双向关联。如果是单向关联,关联方向可以在线段终点用箭头来标记。图1关联(2)聚合聚合用于创建两个类之间的部分与整体的关系。在聚合关系中,一个类担当容器角色,另一个类担当容器的构件角色,见图2。图2聚合(3)泛化泛化表示超类与可以替代它的子类之间的关系,见图3。超类是泛化类,而子类则定义为特化类。图3泛化5(4)依赖依赖关系表示对一个元数据子集的理解、使用等依赖其他元数据子集,见图4。图4依赖(5)角色模型中可以使用“角色名称”描述源对象与目标对象之间的关系。在双向关联中,提供两个角色名称。图5说明在UML模型中如何表示角色名称和基数。图5UML角色名称和基数6环境信息元数据框架6.1概述环境信息元数据框架包括8个元数据子集:标识信息、覆盖范围信息、内容信息、维护信息、限制信息、数据质量信息、分发信息和元数据描述信息。环境信息元数据框架如图6所示。6图6环境信息元数据框架各元数据子集的内容见表2。表2环境信息元数据子集序号子集名称子集内容1标识信息标识信息包含唯一标识数据集的信息,内容包括环境信息的数据集名称、数据集发布日期、数据集摘要、数据集提供方、关键字、数据集分类和数据量等信息。标识信息实体是必选的。2覆盖范围信息覆盖范围信息提供数据覆盖