医药卫生科学数据共享工程技术标准MSDS/TS—200801医药卫生科学数据共享公用数据元目录Commondataelementsdirectoryformedicalandhealth(征求意见稿)医药卫生科学数据共享网标准规范建设课题组(0.1版)(本稿完成日期:2008年1月)MSDS/SS—200801目录前言..............................................................................................................................................3引言..............................................................................................................................................41范围..............................................................................................................................................52规范性引用文件...........................................................................................................................53术语与定义...................................................................................................................................54医药卫生公用数据元目录内容框架...........................................................................................65数据元表达格式...........................................................................................................................75.1数据元的属性................................................................................................................75.2数据元标识符分配........................................................................................................85.3数据元流水号分配........................................................................................................86数据元值的表示方法...................................................................................................................86.1数据类型表示法............................................................................................................86.2字符长度表示法............................................................................................................96.3应用示例........................................................................................................................97医药卫生公用公共数据元...........................................................................................................97.1公共数据元分组............................................................................................................97.2公共数据元目录..........................................................................................................10MSDS/SS—200801前言近年来,通过一系列科技计划和科研活动,我国医药卫生领域积累了相当数量的科学数据。但是这些科学数据的共享问题一直没有得到很好的解决,因而造成了巨大的浪费,严重地制约了医药卫生领域在科研水平、业务技术、决策支持、健康保障等方面的发展。医药卫生科学数据共享工程技术标准化的核心任务之一是解决共享问题,对领域科学数据的数据元进行标准化则是解决数据共享的重要课题之一。本标准的制定过程中,在医药卫生科学数据共享工程标准——《医药卫生科学数据共享数据元标准化的基本原则与方法》的基础上,进一步研究确定了医药卫生科学数据共享工程公用数据元的表达格式、数据元值的表示方法以及数据元的科学分组。同时,深入分析研究医药卫生科学数据共享工程各个专业数据中心的有关资料,根据领域科学数据共享活动的特点和需求,确定医药卫生科学数据共享公用数据元,在《医药卫生科学数据共享数据元标准化的基本原则与方法》的指导下对选定的数据元进行规范描述。本标准的制定,为医药卫生科学数据共享工程公用数据元提供了统一的数据元标准,保证了相同概念的数据元在语义上的无歧义理解,消除因对数据的命名、描述、分类编码不一致所造成的混乱现象,推动和促进医药卫生领域科学数据的集成与共享。本标准为动态维护标准。本标准为第一次制定。本标准由医药卫生科学数据共享网标准规范课题组制定。MSDS/SS—200801引言本标准(《医药卫生科学数据共享公用数据元目录》)是在《医药卫生科学数据共享元数据标准化原则与方法》和《科学数据共享工程公用数据元目录》的基础上进行扩展而成的。医药卫生公用数据元目录在内容上包含科学数据共享的公用数据元目录,同时包含从医药卫生科学数据共享网各个专业中分析和筛选得到的专业层面的公用数据元。本标准在扩展过程中遵循《元数据标准化基本原则和方法》和《医药卫生科学数据共享元数据标准化原则与方法》标准对数据元进行规范化的定义与描述。医药卫生科学数据共享公用数据元目录在科学数据共享标准化工作组人员的协助下,同医学领域的专家共同制定完成的。MSDS/SS—200801医药卫生科学数据共享公用数据元目录1范围本标准规定了医药卫生科学数据共享网中通用性数据元的内容及其表达。本标准适用于医药卫生科学数据共享网的数据资源生产、数据集建库、数据信息交换与共享。2规范性引用文件下列规范性引用文件通过本部分的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有的修改单(不包括勘误的内容)或修订版均不适用于本标准。但是,鼓励根据本标准达成协议的各方,研究是否可使用这些文件的最新版本。但是不注日期的引用文件,其最新版本适用于本标准。ISO和IEC成员维护目前有效国际标准的注册。SDS/T2131—2004科学数据共享工程技术标准-公用数据元目录SDS/T2132—2004科学数据共享工程技术标准-数据元标准化的原则MSDS/TXXX—2005医药卫生科学数据共享数据元标准化原则与方法DICOM数字化影像和通讯标准ICD-10国际疾病分类代码第10版CPT通用操作术语代码SNOMED医学系统化术语学系统LOINC实验室观察结果标识符名称和代码系统DRGs诊断相关分组UMLS统一的医学语言系统IMT国际医学术语3术语与定义本标准采用下列术语和定义。3.1数据data对事实、概念或指令的一种形式化表示,适用于以人工或自动方式进行通信、解释或处理。[GB/T18391.1-2002]3.2数据元dataelement用一组属性描述其定义、标识、表示和允许值的数据单元,在一定语境下,通常用于构建一个语义正确、独立且无歧义的特定概念语义的信息单元。[GB/T18391.1-2002]MSDS/SS—200801注:数据元也是构建元数据和元数据实体的基本单元。3.3数据元目录dataelementdirectory列出并定义了全部相关数据元的一种信息资源。注:数据元目录可有不同层级,例如,ISO/IEC委员会级、国际协会级、行业部门级、公司级、应用系统级。3.4数据元值dataelementvalue数据元允许值集合中的一个值。3.5数据元值的长度dataelementvaluelength数据元值中字符的数目。注:按ASCII字符数目计算数据元值的长度,一个汉字相当于2个字符。3.6数据集dataset具有一定主题的,可以标识并能够被计算机处理的数据集合。注:数据集可以是一个数据库或一个或多个数据文件。4医药卫生公用数据元目录内容框架医药卫生科学数据共享网公用数据元目录的内容来自于两个部分:1)领域公共数据元目录:它的基础是遵循和参考科学数据共享工程的公用数据元目录,并对内容进行筛选,去掉与医药卫生领域无关的数据元并增加了医药卫生领域多个专业共同使用的数据元,如图1所示:图1医药卫生科学数据共享网公用数据元目录与科学数据共享公用数据源目录在内容方面的关系MSDS/SS—2008012)专业数据元目录:来自于医药卫生生领域基础医学、临床医学、公共卫生、中医药学、药学等专业内部常用数据元目录的集合,如图2所示:图2医药卫生科学数据共享网公用数据元目录的内容构成需要特别说明的是,如果有某一个数据元有两个专业分别提出,可以在经过定义确认和标准化处理的基础,作为“医药卫生公共数据元”。两个不同专业的数据元目录中,不应该具有相同的数据元。5数据元表达格式5.1数据元的属性本标准中,数据元是通过标识符、名称、英文名称、说明、表示、值域、同义名称、相关环境、版本、备注这些属性来表达的,其中同义名称和相关环境是可以根据需要选用的可选项。(1)标识符:在数据元目录中,为数据元分配的与语言无关的惟一标识。(2)名称:数据元的中文名称,是标识数据元的主要手段。(3)英文名称:数据元的英文全称。(4)说明:关于数据元的含义和基本特性的说明,并使之区别于其他数据元。(5)表示:数据元值的数据类型及字符长度的组合表示格式。参见5。(6)值域:数据元取值范围或相关内容的说明。如所采用的代码标准,或通过枚举的等方式给出所有可能的取值。(7)同义名称:本数据元的其他许用名称。(可选)(8)相关环境:产生或使用数据元的应用环境的说明。(可选)(9)版本:数据元所在数据元目录的版本标识。(10)备注:对数据元的补充说明(可选)MSDS/SS—2008015.2数据元标识符分配5.2.1标识符设计每个数据元的标识符由8位组成,前两位为英文字母,标识数据元的大类,第3、4位是数字,标识数据元在