科学数据共享工程技术标准SDS/T2133—2004××××-××-××发布××××-××-××实施中华人民共和国科学技术部发布数据模式描述规则和方法RuleandMethodforDescriptionofDataSchema(征求意见稿)(本稿完成日期:2005年5月)SDS/T2133—2004I目次目次...............................................................................I前言..............................................................................II引言.............................................................................III数据模式描述规则和方法.................................................................11范围.................................................................................12规范性引用文件.......................................................................13术语和缩略语.........................................................................13.1术语...............................................................................13.2缩略语.............................................................................34概述.................................................................................34.1数据模式简介.......................................................................34.2数据模式作用.......................................................................54.3数据模式语言.......................................................................94.4共享科学数据模式..................................................................105数据模式描述规则....................................................................125.1概述..............................................................................125.2UML图形式描述规则...............................................................125.3字典形式描述规则..................................................................186数据模式建立与描述方法..............................................................196.1建模方法概述......................................................................196.2需求收集..........................................................................206.3数据模式建立与描述................................................................266.4标准协调..........................................................................316.5标准实现..........................................................................32附录A数据模式建立与描述的文档模板(资料性附录)...................................34A.1概述..............................................................................34A.1.1数据模式标准的需求收集文档模板..................................................34A.1.2数据模式标准的草案文档模板......................................................34A.1.3数据模式标准的正式文档模板......................................................34A.1.4数据模式标准的征求意见文档模板..................................................34A.1.5数据模式标准的意见处理文档模板..................................................34A.2数据模式标准的需求收集文档(资料性附录)............................................36A.3数据模式标准的草案文档(资料性附录)................................................45A.4数据模式标准的正式文档(资料性附录)................................................56A.5数据模式标准的征求意见文档(资料性附录)............................................69A.6数据模式标准的意见处理文档(资料性附录)............................................75附录B反向工程示例(资料性附录)...................................................81SDS/T2133—2004II前言本标准为第一次制定。本标准由中华人民共和国科学技术部基础研究司提出。本标准由中华人民共和国科学技术部基础研究司归口。本标准主要起草单位:国家信息中心、中科院地理所。本标准主要起草人:徐枫、游松财、宦茂盛、林菁、武晋平、石雯雯、吕明。SDS/T2133—2004III引言根据科学数据共享工程对主体数据库的建设要求,各国家科学数据中心和国家科学数据网已经具备大量的科学数据资源。这些科学数据资源将以主体数据库形式进行建设,以科学数据共享数据集形式进行共享。对科学数据共享数据集的内容进行规范化和标准化描述是真正实现科学数据共享的基本前提。通过数据模式,各个领域能够准确描述和理解科学数据共享数据集的内容,生产、加工出符合科学数据共享工程需求的数据集,进而保证科学数据共享活动的实现。本标准明确了各领域共享数据集的描述方式,使数据集制作人员及数据集用户对共享数据集内容有准确而一致的理解。同时,本标准提出了建立数据模式的具体方法。SDS/T2133—20041数据模式描述规则和方法1范围本标准提出了的构建各数据集的数据模式的规范化描述方式、表示和操作的步骤,规范了各个领域里数据模式的制定,使数据集制作人员及数据集用户对共享数据集内容有准确的理解。本标准适用于各领域制定科学数据共享数据集内容模式时使用,保障数据集生产者及数据集使用者对共享数据集内容能够无歧义的理解。本标准也可以用于一般数据内容建模。2规范性引用文件下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。然而,鼓励根据本标准达成协议的各方,研究是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。SDS/T2132—2004数据元标准化原则与方法SDS/T2134—2004数据交换格式设计规则SDS/T2321—2004科学数据中心建设规范SDS/T2322—2004科学数据网建设规范UnifiedModelingLanguage1.5统一建模语言1.53术语和缩略语本标准采用下列缩略语和术语定义。3.1术语3.1.1.数据模式DataSchema数据的概念、组成、结构、相互关系的总称。注:从本质上,数据模式反映的是人类对客观世界的主观认知。在具体内容上,数据模式涉及到数据的描述范围、描述的方式和描述的结果。3.1.2.概念数据模式ConceptualDataSchema通过抽象、归纳、概括、分类等各种方法,对客观世界的现象进行概括性的描述,重点是定义客观世界的各种基本实体,并对它们的相互关系进行描述。3.1.3.逻辑数据模式LogicalDataSchema概念数据模式的细化,在逻辑数据模式中,考虑到信息技术实现的因素,需要对概念数据模式进一步分析,并增加各种对象和事件,作为物理数据模式建立的基础,逻辑数据模式和具体实现无关。3.1.4.物理数据模式PhysicalDataSchema逻辑数据模式集合了具体的实现技术后形成的,它和具体的实现技术紧密相关。3.1.5.数据模式语言DataSchemaLanguageSDS/T2133—20042用于对数据模式进行分析、构造、表现和记录的语言。3.1.6.实体Entity任何可以明确的人、地方、事件、概念、事物。3.1.7.属性Attribute描述或标识实体的实体或值。3.1.8.值域Domain属性可以取值的范围。注:值域是单独定义的,用于重用,即多个属性可以使用同一个值域。3.1.9.关系Relation实体间的关联。3.1.10.主键PrimaryKey对取值给出唯一性限制的一种属性。注:所有实体实例的该属性取值不会出现重复。通过该键值可以唯一的确定一个实体。在UML中通过设定原型PK标识为“主键”。3.1.11.外键ForeignKey由相关实体的实例指定自身实例的一种属性,是实现一个关系的约束。注:在UML中通过设定原型FK标识为“外键”。3.1.12.包Package在UML中,用于表示实体的组织。3.1.13.类Class对拥有相同的属性、操作、方法、关系和语义的一组对象的描述。注:在UML中类的图形符号是一个矩形框。其中标注出该类的名称,即为对应实体的名称。3.1.14.注释Comment附在实体、关系上的标注文字。注:在UML中注释不具有语义和限制功能。3.1.15.数据集DataSet可以标识的数据集合。3.1.16.数据元DataElement通过定义、标识、表示和值域等一系列属性描述的一个数据单元。3.1.17.国家科学数据中心Scientificdatacenter属于国家科学数据共享平