科学数据分类与编码-科学数据共享工程技术标准科学数据共享

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

-SDS/T2122—2004科学数据共享工程技术标准科学数据共享工程数据分类编码方案完成日期:2006年6月××××-××-××实施××××-××-××发布中华人民共和国科学技术部发布SDS/T2122—2004I目次1范围.......................................................................................................................................12规范性引用文件...................................................................................................................13术语和定义...........................................................................................................................24分类原则...............................................................................................................................45分类方法...............................................................................................................................46编码方法...............................................................................................................................87分类编码的使用...................................................................................................................98标准的扩展.........................................................................................................................119分类代码表.........................................................................................................................11附录A资料性附录科学数据共享工程分类编码标准的使用实例...............................81附录B资料性附录本标准与专业数据中心的分类标准之间的映射...........................82SDS/T2122—2004II前言分类是人类认识事物的基础,科学数据分类编码的目的在于准确地识别数据,实施对数据的有效管理,并能按类别开发利用数据,实现数据共享。本分类编码标准的目的在于将具有某种共同特征的数据归并在一起,使之与不具有上述共性的数据区分开来,然后设定某种符号体系进行编码,使之能够进行计算机或人工识别和处理,保证科学数据得到有效的管理,并能支持高效率的查询服务。本分类编码标准是在高层次上对科学数据的分类编码,主要针对数据的归并和信息的组织,不具体涉及信息系统的建设和数据库的字段编码。本标准由XXXX提出。本标准由XXXX归口。本标准起草单位:中国科学院地理科学与资源研究所本标准主要起草人:何建邦,曹彦荣,马立广,李新通,孙灵文,董文,耿崇,赵秀君,许萍华,陈骧君。SDS/T2122—20041科学数据共享工程数据分类编码标准1范围本标准定义了科学数据的分类方法,说明如何将科学数据分类组织为科学数据的目录,并规定了如何将科学数据映射至科学数据目录中。本标准适用于对未编目的科学数据建立目录,也可按本标准修订现有科学数据目录。本标准规定了科学数据分类和编码的规则,用以保证科学数据组织、存储及交换的一致性。编码用于对科学数据库进行分类组织并建立相应的目录。本标准的分类对象是科学数据,不同于学科、专业和行业,不能代替学科、文献、情报、图书分类及学术上的各种观点。2规范性引用文件2.1国家标准类(1)GB/T13745-92学科分类与代码表;(2)GB/T12402-2000经济类型分类与代码;(3)GB/T14467-1993中国植物分类与代码;(4)GB/T17296-2000中国土壤分类与代码;(5)GB17297-1998中国气候区划名称与代码;(6)GB/T1472.1-1993林业资源分类与代码森林类型;(7)GB/T15778-1995林业资源分类与代码自然保护区;(8)GB/T9649-1988地质矿产术语分类代码;(9)GB/T17297-1998中国气候区划名称与代码气候带和气候大区;(10)GBGB/T17296-2000中国土壤分类与代码上纲、亚纲、土类和亚类分类与代码;(11)GB/T14467-1993中国植物分类与代码;(12)GB/T4754-2002国民经济行业分类与代码;(13)GB/T19317-2001专题信息分类与代码;(14)DB/T11.1-2000地震数据分类与代码第一部分:基本类别(15)GB/T18207.1-2000防震减灾术语第一部分:基本术语;(16)GB/T18207.2-2005防震减灾术语第2部分:专业术语。2.2出版物类SDS/T2122—200421)中国图书馆分类法;2)国民经济行业分类与代码;3)中国科学院图书馆分类法;4)中国图书资料文献分类法;5)中国图书资料分类法(第四版);3术语和定义3.1科学数据人类在认识世界、改造世界的科技活动所产生的原始性、基础性数据,以及按照不同需求系统加工的数据产品和相关信息。3.1.1科学数据的内容范围涵盖了目前科学数据共享工程各个专业数据中心(网)的数据,在将来,随着科学数据共享工程的推进,还会覆盖更多专业数据中心的数据。3.1.2科学数据的学科范围按照中华人民共和国国家标准《学科分类与代码表(GB/T13745-92)》中的规定,本标准所指的科学数据基本涵盖了除社会科学、人文科学之外的所有学科内容。3.1.3科学数据的时间范围科学数据应该以近现代的数据为主,尤其是现代科学的数据,兼顾近现代以前的数据。3.1.4科学数据的地域范围主要以中华人民共和国范围内产生的各种科学数据为主,兼顾世界范围内的科学数据。3.2科学数据分类科学数据分类是指根据科学数据的属性或特征,将其按照一定的原则和方法进行区分和归类,并建立起一定的分类体系和排列顺序,以便更好地管理和使用科学数据的过程。3.3科学数据编码科学数据编码是指在分类的基础上,给科学数据赋予有具有一定规律性、计算机容易识别与处理的符号。3.4线分类法又叫层级分类法。是将分类对象按所选定的若干个属性或特征,作为分类的划分基础,逐次地分成相应的若干个层级的类目,并排成一个有层次的,逐级展开的分类体系。3.5分类对象被分类的事物或概念。在本标准中,广义上分类对象为科学数据,狭义上分类对象为科SDS/T2122—20043学数据集。可以认为科学数据集是科学数据的物理的、具体的存在形式。3.6数据集可以标识的数据集合。3.7类目又称类名。是一些在内容上具有共同属性的科学数据的抽象性总称。类目是数据分类编码的构成单元。3.8数据集标引指分析数据集的内容属性及相关外表属性,并用特定语言来表达分析出的属性或特征,从而赋予数据集检索标识的过程。3.9分类标引对主题概念进行分析,并将分析的结果转换为分类检索语言的过程。3.10标引深度指对一个数据集所给予的全部检索标识的数量。即对该数据中具有检索意义的内容特征进行分析描述所达到的深度。3.11组配将两个表示简单概念的类目组合成一个复合类目,用来表示一个分类表中未列出的复杂类目。3.12类目释义或者叫类目注释,是对类目的说明,用于确定类目的内容范围,指出类目之间的关系,规定需要使用的特殊分类方法。3.13类目表是根据类目之间的关系,按照一定的原则组织起来的列表,是整个分类编码的主体,是用以类分数据的依据。3.14检索词也叫入口词。是指用于描述数据系统中内容特征、外表特征和表达用户数据提问的专门语言的基本成分,是构成检索提问式昀基本的单元。3.15专指度是标引词表达数据主题的准确程度。在标引数据时选用的专指度高的标引词越多,则检索出数据的针对性也就越强,查准率就越高。3.16查全率SDS/T2122—20044系统在进行某一检索时,检出的相关数据量与系统数据库中相关数据总量的比率。它反映了该系统数据库中实有的相关数据量在多大程度上被检索出来。3.17查准率指系统在进行某一检索时,检出的相关数据量与检出数据总量的比率。它反映了每次从该系统数据库中实际检出的全部数据中有多少是相关的。4分类原则4.1科学性、系统性与适用性兼顾一方面按照科学数据的属性及其相互间客观存在的逻辑关联以及信息组织的要求进行科学化和系统化;另一方面又要注意和体现用户查询、检索的常规习惯。分类名称应尽量沿用各专业习惯名称,但是要保证规范化,避免发生概念混淆或二义性,尽量使分类方案简便、实用和便于记忆。4.2稳定性、继承性与灵活性兼顾一些行业部门已建成或正在建设的系统中采用了各自的分类和编码方案,必须考虑到实际操作上的方便,重点规范实现部门系统间交换数据时所必需的基本分类与代码,不需要强求各部门系统内部都与本体系的分类代码一一对应。因此,数据分类应以国内使用多年的各种常规分类为基础,并以各要素昀稳定的属性特征为依据制定分类方案及与之相对应的编码方案。4.3完整性和扩展性结合分类体系在总体上应具有很大的概括性和包容性,能够容纳各种各样的科学数据和满足将来可能产生的信息需求。分类在反映数据的属性和数据间的相互关系上保持相对的完整性。而在设计代码结构和进行具体编码时留有适当的余地和确定相应的扩充方法。4.4实用性要有数据保证和用户保证。确保每个类目下要有科学数据,不设没有意义的类目,用户在使用该分类编码表是要能利用到该类目。类目划分要符合用户对科学数据分类的普遍认识。。分类编码昀终要为用户所利用,因此考虑用户检索科学数据的习惯是确定分类编码的主要原则之一。4.5兼容性考虑国内已有分类体系的继承性和实际使用的延续性,并注意提高国际可比性。4.6排他性概念外延的适用范围必须是相互排斥的、互不相容的。即一个分类只能依据一项标准,否则低层次概念就可能出现很多交叉。5分类方法SDS/T2122—20045科学数据共享工程数据分类与编码以实现科学数据共享为目标,为了科学、有效地对科学数据进行组织管理,该分类方法从科学数据本身的内容属性出发,在充分调研现有各综合分类法与行业领域学科专用分类方法的基础上,分析这些分类方法的特点和适用范围,吸取其中适用于科学数据分类的因素,并结合了前沿的信息组织技术方法。该分类体系在总体上具有很大的概括性和包容性,能够涵盖各学科和各行业领域已经产生的和将来可能产生的科学数据。分类在反映科学数据的内容属性和数据间的相互关系上保持相对的完整性,而在设计代码结构和进行具体编码时留有适当的余地,并确定了相应的扩充方法。对科学数据的分类是指在科学数据共享系统中,遵循约定的分类原则和方法,按照数据集的内涵、属性及用户使用的要求,将所有科学数据,按一定的结构体系,分门别类加以集合,从而使得每一个数据集在相应的分类体系中

1 / 86
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功