第二章医学信息标准化一、信息标准化的定义–狭义:指信息表达上的标准化,在一定范围内人们能共同使用的对某类、某些、某个客体抽象的描述与表达。–医学信息的标准化:指信息标准化在医学领域的具体应用。–广义:指对整个信息的处理:信息传递与通讯、数据流程、信息处理技术与方法、信息处理设备等。第一节标准化概述标准的概念对重复性事物和概念所作的统一规定。它以科学、技术和实践经验的综合成果为基础,经有关方面协商一致,由主管机构批准,以特定形式发布,作为共同遵守的准则和依据。标准的基本特性–标准对象的特定性:广义和狭义–标准制定工具的科学性–标准本质特征是统一性–标准应用的时效性–标准执行的法规性标准化标准化的概念–以指定标准和贯彻实施标准为主要内容的全部活动过程。标准化的特征–标准化化活动领域的广泛性–标准化化活动的动态性和过程性–标准化化活动的目的性和效益性标准化的基本原理–简化原理–统一原理–协调原理–最优化原理信息标准信息标准的概念狭义:信息表达的标准广义:信息处理全过程应遵守的标准:信息采集、传递与通信、数据流程、信息处理的技术与方法、信息处理设备的标准等。医学信息标准p32–广义–狭义医学信息标准分为三类–框架标准–基础标准–操作标准第二节标准的分级、分类和编号标准的分级国家标准行业标准地方标准企业标准国家标准化指导性技术文件国际标准地区标准标准的分类技术标准管理标准工作标准标准的代号和编号国家标准的代号和编号:由大写拼音字母组成–强制性国标GB–推荐性国标GB/T–国家标准化指导性技术文件GB/Z标准的编号行业标准的代号和编号地方标准的代号和编号企业标准的代号和编号第三节国外医学信息标准化进展国际医学信息标准化组织–TC215–分八个工作组欧洲标准委员会世界卫生组织国际标准化组织(ISO)和IECIEC:InternationalElectrotechnicalCommission.国际电子技术委员会标准:是指获得一致同意的,并由公认权威机构认可的文件,这个权威机构负责为公共和常用事物的活动及结果制定和提供规则、指导原则,其宗旨是使该环境达到最佳有序度。标准化:是指针对现存或潜在的问题,为公共的和常用的事物做出某些规定的活动,旨在使该环境达到最佳有序度。因此标准化是为了所有有关方面的利益,特别是为了最佳经济效果,在所有有关方面的协助下进行有序活动,制定实施各项规则的过程。信息的表达:–信息标准化的基础。例如分类编码,名称和内涵的标准化、代码化。信息的交换:–解决不同的系统之间或不同的部门、企业之间对信息共享的问题。信息交换标准–HL7:指定数据交换的格式。–XML:互联网上数据交换的标准语言。–DICOM:医学影象存储和信息交换的标准。二、标准化的发展趋势国际标准化–标准化权威不断提高,ISO标准被100多国家采纳。–国际标准化日趋全面、完善。ICD-10我国的标准化工作–计算机与信息处理标准体系表–软件标准:软件测试文件说明、软件开发流程规范、软件产品文件编制说明、软件工程名词术语等。三、医学信息的标准化医学信息的特点:–种类繁多–面广量大、更新快–量化困难–自然语言标准化的困难医学信息标准化的基础–信息的分类和编码–医学术语和医学专业词汇汇编–医学信息硬件和软件的标准化软件产品的标准化生产和管理软件工程的标准化软件开发环境的标准化分类标准的分类–命名法:每一个事物给予一个唯一的确切代码与名称–分类法:具体对象分类,然后给每一类事物以确切的代码与名称。–用途分类机内代码辅助录入用代码信息交换代码一、分类的概念分类:有两层意思:–设计一种分类方法的过程;–通过分类法将术语中的概念标记为代码或将术语中对象进行编码。分类与编码紧密相连。分类法:某一领域内概念的序化和原理的序化。–按序化原理如何分类称为分类法。–分类法依赖原有知识,又将原有知识进一步扩展。–分类的准则取决与应用目的。例如:为了医学统计或医学研究,对心电异常分类或各种疾病进行分类。例如:医院统计各年龄段的床位。可采用下列年龄分组:0-3岁-婴儿、4-12岁-儿童、13-18岁-青年、19-64岁-成年、65岁以上-老人。这一简单例子中,分类标准就是年龄(唯一)。分类条件–分类所需条件:领域完整性、类间非重叠性、满足既定目标有序化标准的同一性(同一级别只有一个标准)、类别标准明显、应用要求明确而完整、详细程度恰当。–计算机辅助编码系统所需额外条件:允许使用同义词、允许使用不同的词汇库对拼写错误不敏感、可靠性、操作的统一性(对术语排序不敏感)、准确性二、分类的序化原理分类就是领域内概念的有序化,概念根据属性关系来有序化。如按并行关系分成同一类,按包含关系进一步分成子类。如“肺炎为一种肺病”,肺炎是肺病类的子类。在分类过程中贯穿始终的序化标准称为轴。如在ICD疾病分类中有序化标准要考虑:解剖位置、病因学、形态学、功能障碍等这每一项都是轴。分类系统中,一般使用多种有序化标准(轴),情况比较复杂。又如国际社区医疗分类(ICPC)按二轴进行分类。一轴是器官系统,以字母表示,另一轴是医学组分,以二位数字表示。围绕轴心分类可根据特性中所包含的属性关系再分为“类目”、“亚目”、“细目”等。三、分类方法确立目的,找出本质的特性,即确定轴心。围绕轴心进行具体分类:按特性的属性关系,再分为亚目、细目等。具体应用时灵活应用:举例A06阿米巴感染–依据疾病情况(急性、慢性)和病理改变两个轴心进行分类。–A06.0急性阿米巴痢疾–A06.1慢性肠道阿米巴病编码一、编码的概念编码是确定一个对象类别或类别集合(多轴系统)的过程。–类别是用代码表示的。将一种符号体系转换成人或计算机识别和处理的另一种符号体系。–编码是对对象的各方面性质(属性)的解释和归判。二、代码代码是编码的基本构件,代码可以是数字、字母或两者组合.编码类型:(1)数字代码。–可用顺序形式表示。优点:可方便地扩充代码。–随机形式分配。–系列数字。可保留给一类的集合。可用于数目固定的(不希望扩大的)类别集合。(2)记忆(助忆)代码:由相关类的类目名称的一个或多个字母组成。有助于记住代码。例如:医院各部门表示:心脏科用CAR。(3)并列代码是分段组合代码。每段提供相关类的特征。如ICPC中由一个字母(诊断记忆码)后加两位数字码(医学组分)。如D-消化、N——神经等。(3)分级代码。增加类的分级细节。它含有相关类的分级细节信息及与父类的分级关系信息。如ICD-9就是分级代码。–这种编码方式与分级数据库的结构相似,父类在上层,子类在下层。–病人数据可以用某一特定级别的分级代码检索。–低层代码的扩展与修改不影响上层。(5)复合代码。如下图包括行为、设备、目标、解剖位置。若20种行为、10种设备、5类目标、100个解剖位置,可产生10万种复合代码的庞大系统。(6)数值相加代码。只用2的乘方表示数据项和类。与复合代码类似几个特征能复合成一个代码。与复合代码不同,每个特征只用一个数值(而不是一个段)来编码。如,危险因素的存在与缺失容易用这类编码表示.举例:20=1为吸烟者/0为不吸烟者21=2为肥胖者/0为不肥胖者22=4为胆固醇增高者/0为胆固醇不增高者三、信息标准化编码应具有的特点明确的域:–能判断是否属于该域–由于用途和目的不同,同一对象可有不同的信息学属性。完整性与一致性–完整性:信息编码系统能完整的处理相关的信息。用设置“收容组”来保证。–严格做到一码一义,避免一码多义或一义重码科学性–对客体分类编码的完成是对其本质的认识。权威性–应该由政府机构制定和颁布实用性–分类和代码都要有实用价值,符合医学及医院实际需要扩展性与可维护性–要留有扩展的余地–要安排财力人力跟踪维护–预留的空项又必须依据分类编码原理和内在属性关系而定,新的信息将参照其属性及与原有信息的属性关系填充到相应的预留空项中,而不是简单堆放原系统之后。医学信息的分类、编码一、医学信息的分类、编码的方法分类方法,以西药分类为例:–类:抗生素类、心血管类–亚目:心血管类:抗高血压类、抗心律失常类–细目:抗高血压类:利尿剂、血管扩张剂–项目(药品):血管扩张剂:肼苯哒嗪、米诺地尔编码方法–代码的位数:要根据扩展的最多位数进行制定–代码的符号:力求简洁、易于理解记忆二、医学信息学分类编码应遵循的原则科学性:分类有科学依据,轴心体现对象的本质特性,编码有科学意义。标准化:有国际标准、国内标准、部颁标准、行业标准的要用这些标准,不要轻易制定自己的标准。准确化:分类的类目应独立明确、互不包括。亚目从属关系明确。唯一性实用性实用性:分类和代码都要有实用价值,符合医学及医院实际需要。它不能过于简单而失去准确性,又不能过于繁琐而应用困难。结构化:代码与对象的特性以及信息的内涵应有结构化的对应关系,代码的不同位置标识了对象的特性以及它与周围的层次关系。可操作性:分类编码应力求简单明了,易于学习掌握,同时要便于计算机输入。冗余性:除了应包括现有的所有对象及信息外,还应预留一定的空项,以适应随着医学发展不断涌现出来的新信息。这些预留的空项又必须依据分类编码原理和内在属性关系而定,新的信息将参照其属性及与原有信息的属性关系填充到相应的预留空项中,而不是简单堆放原系统之后。国际著名医学信息标准国际疾病分类代码(简称ICD)ICD(InternationalClassificationofDisease)是根据疾病的某些特性,按照规则将疾病分门别类并用编码的方法来表示的系统。ICD1893年出版第一版,1975年出版ICD-9及其后的修订版ICD-9-CM,1994年出版ICD-10。ICD分类依据疾病的四个主要特征:病因、部位、病理、临床表现。ICD包含3位核心代码,这3位是向WHO报告死亡率统计的最低代码要求,可选第4位提供更详细附加代码。ICD除基本诊断术语外,还包含其他医学类医学术语。例如以”V”开头表就诊原因和其他影响健康的因素。表代码疾病001-139感染性和寄生性疾病001-009消化道感染性疾病003其他沙门氏菌疾病-003.0沙门氏菌肠胃炎-003.1沙门氏菌败血症-003.2局部沙门氏菌感染-003.20非特异性局部沙门氏菌感染-003.21沙门氏菌脑膜炎-003.22沙门氏菌肺炎-003.29其他局部沙门氏菌感染-003.8其他特异性沙门氏菌感染-003.9非特异性沙门氏菌感染。我国卫生部2002年1月1日起要求全国统一使用ICD-10。最新的国际疾病分类数据库ICD-10,包括疾病名称记录近一万条。主要包括ICD-10代码、附加码、疾病名称、疾病统计编码及拼音码。以MicrosoftExcel格式编缉,可挂接或转换成其他形式数据库。例如:A39.401脑膜炎球菌性败血症NMYQJXBXZA40.301肺炎球菌性败血症FYQJXBXZ国际社区医疗分类世界全科医生、家庭医生学会(WONCA)不接受ICD分类,而采用自己的ICPC。ICPC是两轴系统。–第一轴是以字母编码的机体各系统(器官和系统)解剖部位。–另一个轴是二位数字的医学组分编码。–组分编码含7个编码集。如“肺炎”编码为R81。(R表呼吸道,81表诊断组分)。–除三位码外,可扩充第四位码更细分或区分同义词。ICPC早期来源于WONCA的ICHPPC-2-Defind,并根据ICD-9和ICD-10作过修改。ICPC可用于根据SOAP(Subjective-Objective-Assessment-Plan)准则(S表主观信息,如主诉;O表客观信息,如化验、实验结果;A表评价,如诊断;P表计划,如治疗、药物等。)的结构化病人就诊编码。ICPC也可用于病情的进程编码。系统医学命名法SNOMED(SystematizedNomenclatureofHumanandVeterinaryMedicine—人类与兽类医学系统术语)是美国病理学会(CAP