I项目编号INFO-115-C01文档编号TR-REC-018中国科学院数据应用环境建设与服务科学数据分类规范与分类词表(征求意见稿)中国科学院数据应用环境建设与服务项目组2009年9月I目次 前言.............................................................................II 1范围................................................................................3 2规范性引用文件......................................................................3 2.1国家标准类........................................................................3 2.2出版物类..........................................................................3 3术语和定义..........................................................................3 4缩略语..............................................................................8 5分类原则............................................................................8 5.1现实性原则........................................................................8 5.2稳定性原则........................................................................9 5.3持续性原则........................................................................9 5.4均衡性原则........................................................................9 5.5揭示性原则........................................................................9 5.6规范性原则........................................................................9 5.7系统性原则........................................................................9 5.8明确性原则........................................................................9 5.9扩展性原则........................................................................9 6分类方法............................................................................9 6.1分类主题..........................................................................9 6.2分类方法中的组配.................................................................11 7编码方法...........................................................................11 7.1码位结构.........................................................................11 7.2编码规则.........................................................................11 8分类代码表.........................................................................12 8.1标引的原则.......................................................................12 8.2标引步骤.........................................................................12 8.3分类标引中若干问题的处理.........................................................13 9标准的使用与扩展...................................................................14 9.1标准的使用.......................................................................14 9.2扩充原则.........................................................................14 10一致性............................................................................14 附录A(资料性附录)典型辅助主题.................................................15 A.1辅助主题1——数据获取(G)DataGet..............................................15 A.2辅助主题2——数据形式(T)DataType.............................................15 附录B(资料性附录)科学数据分类编码框架.........................................16 附录C(资料性附录)应用示例.....................................................27 C.1代码的查找示例...................................................................27 C.2数据集的归类示例.................................................................27 II前言科学数据分类规范是对科学数据进行分类的依据,包括分类的原则与方法、分类方案等;分类代码表则是具体分类的呈现,是按照相应分类方式组织的词汇集合,是分类方案的实现。本分类编码标准的目的在于将具有某种共同特征的数据归并在一起,使之与不具有上述共性的数据区分开来,然后设定某种符号体系进行编码,使之能够进行计算机或人工识别和处理,保证科学数据得到有效的管理,并能支持高效率的查询服务。本分类编码标准是在高层次上对科学数据的分类编码,主要针对数据的归并和信息的组织,不具体涉及信息系统的建设和数据库的字段编码。本标准由“中国科学院数据应用环境建设与服务”项目提出。本标准的主要起草单位:中国标准化研究院、中国科学院地理科学与资源研究所。本标准的主要起草人:马胜男、王卷乐、廖顺宝、孙崇亮。3科学数据分类规范与分类词表1范围本规范定义了科学数据的分类方法,说明如何将科学数据分类组织为科学数据的目录,并规定了如何将科学数据映射至科学数据目录中。本标准规定了科学数据分类和编码的规则,用以保证科学数据组织、存储及交换的一致性。编码用于对科学数据库进行分类组织并建立相应的目录。本规范的分类对象是科学数据,不同于学科、专业和行业,不能代替学科、文献、情报、图书分类及学术上的各种观点。本规范适用于中国科学院数据应用环境建设与服务项目中对未编目的科学数据建立目录,也可按本标准修订现有科学数据目录。2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究是否可使用这些文件的昀新版本。凡是不注日期的引用文件,其昀新版本适用于本标准。2.1国家标准类GB/T1472.1-1993林业资源分类与代码森林类型GB/T4754-2002国民经济行业分类与代码GB/T9649-1988地质矿产术语分类代码GB/T10113-2003分类与编码通用术语GB/T12402-2000经济类型分类与代码GB/T13745-92学科分类与代码表GB/T14467-1993中国植物分类与代码GB/T14467-1993中国植物分类与代码GB/T15778-1995林业资源分类与代码自然保护区GB/T17296-2000中国土壤分类与代码GB/T17297-1998中国气候区划名称与代码气候带和气候大区GB/T18207.1-2000防震减灾术语第1部分:基本术语GB/T18207.2-2005防震减灾术语第2部分:专业术语GB/T19317-2001专题信息分类与代码DB/T11.1-2000地震数据分类与代码第1部分:基本类别2.2出版物类中国图书馆分类法国民经济行业分类与代码中国科学院图书馆分类法中国图书资料文献分类法中国图书资料分类法(第四版)SDS/T2122—2004科学数据共享工程数据分类编码方案3术语和定义下列术语和定义适用于本标准。3.1分类基本术语3.1.14类category,class具有某种共同属性(或特征)的事物或概念的集合。GB/T10113-20032.1.13.1.2分类classification按照选定的属性(或特征)区分分类对象,将具有某种共性属性(或特征)的分类对象集合在一起的过程。GB/T10113-20032.1.23.1.3分类对象objectsofclassifcation被分类的事物或概念。在本标准中,广义上分类对象为科学数据,狭义上分类对象为科学数据集。可以认为科学数据集是科学数据的物理的、具体的存在形式。GB/T10113-20032.1.43.1.4线分类法methodoflinearclassification又叫层级分类法。是将分类对象按所选定的若干个属性或特征,作为分类的划分基础,逐次地分成相应的若干个层级的类目,并排成一个有层次的,逐级展开的分类体系。GB/T10113-20032.1.53.1.5面分类法methodofareaclassification选定分类对象的若干属性(或特征),将分类对象按每一属性(或特征)划分成一组独立的类目,每一组类目构成一个“面”。再按一定顺序将各个“面”平行排列。使用时根据需要将有关“面”中的相应类目按“面”的指定排列顺序组配在一起,形成一个新的复合类目。GB/T10113-20032.1.63.1.6混合分类法methodofcompositeclassi