数据分析与挖掘技术对医疗质量管理提高的研究与应用数据分析与挖掘技术对医疗质量管理提高的研究与应用数据分析与挖掘技术对医疗质量管理提高的研究与应用数据分析与挖掘技术对医疗质量管理提高的研究与应用余元龙①郭茜②①中山市人民医院,528400,广东省中山市孙文中路2号②广州泓维软件有限公司,510145,广州市中山七路85-99号1603之一摘摘摘摘要要要要本文从数据分析与挖掘的技术角度来探索如何帮助医院提高医疗质量管理,并结合真实项目的建立总结技术与需求的实现与应用。关键关键关键关键词词词词医疗质量管理OLAP多维数据分析指标监控单病种质量管理手术质量管理1111引言引言引言引言医疗质量与广大患者的生命健康息息相关,它是一个医院的立足之本,提高医疗质量、加强医疗质量管理是医院工作的核心和永恒的主题,是医院自身发展的需求也是各项工作开展的出发点。国家卫生部2008年提出的“以病人为中心,以提高医疗服务质量为主题”将医疗质量管理要求提上新的高度。然而由于医疗质量管理涉及的范围广、因素多、过程长,环节复杂多变等原因,医疗质量管理既成为医院工作的重点,亦成为难点。中山大学附属中山医院是中山市唯一一家三甲医院,作为全国20家最先进数字化医院的示范站点之一,从2001年开始实施信息化建设迄今,基本形成了覆盖全院业务流程、多个系统高度集成的一体化信息系统。探索构建一套切实可行的医疗质量管理分析系统具备了现实基础,于2008年医院开始了对医疗质量管理系统的研究与实践。2222医院在医疗质量管理中的困难医院在医疗质量管理中的困难医院在医疗质量管理中的困难医院在医疗质量管理中的困难2.12.12.12.1数据质量问题数据质量问题数据质量问题数据质量问题目前许多数据都是分散在不同系统中,从病案首页无法连接到医嘱、病情记录等,如果发现一个指标异常,必须手工找到该医嘱或病情记录,一份一份查找病历。同时由于原始数据填写不全、不正确,分析中有很多数据缺少或信息错误的。2.2.2.2.2222手工查找和分析手工查找和分析手工查找和分析手工查找和分析医院的质量指标的分析每月由统计室人员专门负责统计,消耗的时间与人力相当大。而且常常由于分析的力度和能见度有限,无法多维度的去了解问题、了解是哪些原因造成某个指标异常,从而无法制定解决问题的方法。2.2.2.2.3333信息需要二次加工信息需要二次加工信息需要二次加工信息需要二次加工由于数据的孤立,造成很多信息无法从各自系统里自动关关联起来,需要经过二次加工。例如在医嘱里只能看到药的名称,没有分类,在分析抗菌药的使用中无法了解到某类药物的事情情况,统计指标。因此在提供报告给管理者的时候需要二次手工加工,一旦数据量庞大时是非常棘手的问题。2.2.2.2.4444环节指标监控分析困难环节指标监控分析困难环节指标监控分析困难环节指标监控分析困难::::只能在每月统计分析异常的质量指标,对环节指标进行监控分析困难。3333如何利用数据分析与挖掘技术帮助医院提高医疗质如何利用数据分析与挖掘技术帮助医院提高医疗质如何利用数据分析与挖掘技术帮助医院提高医疗质如何利用数据分析与挖掘技术帮助医院提高医疗质量管理量管理量管理量管理上述困难按性质归类主要可分成三大问题:系统间数据没关联、数据质量有问题,数据的分析能力弱,以及指标的生成与监控难。数据分析与挖掘技术恰恰是解决这些问题的能手,可以通过三个步骤去建立一个帮助提高医疗质量管理的系统。3333.1.1.1.1第一步第一步第一步第一步,,,,将数据清洗将数据清洗将数据清洗将数据清洗、、、、整合整合整合整合、、、、关联关联关联关联,,,,为能够获得客观的数据为能够获得客观的数据为能够获得客观的数据为能够获得客观的数据、、、、有效的信息有效的信息有效的信息有效的信息、、、、高效的分析与监控奠定基础高效的分析与监控奠定基础高效的分析与监控奠定基础高效的分析与监控奠定基础在整合多个系统数据时,多数据源的数据格式、类型、存储方式会不同,在做数据清洗时需要首先要对数据按照定义进行标准化,其次对于系统中无效数据或无法归类数据,将数据字典合理归类,按照数据字典和标准格式剔除无效数据,对于由于多系统描述相同的对象造成的数据记录重复,通过采用多维度分析,模糊动态匹配的技术剔除单数据源单一信赖数据。在经过初步的清洗、整合和关联后,数据由原来的孤立状态变成了整合状态,数据中多数的遗漏、重复、错误、不匹配也得以发现和解决,并使得一些原本手工要二次加工的数据通过关联直接可以被利用。3333.2.2.2.2第二步第二步第二步第二步,,,,建立自由灵活的多维分析模式建立自由灵活的多维分析模式建立自由灵活的多维分析模式建立自由灵活的多维分析模式3333.2..2..2..2.1111自定义模型自定义模型自定义模型自定义模型模型主要由“维度”、“摘要(指标)”、“信息(动态维度)”构成。维度是自定义模型中的重要概念,通俗说它就是看问题的角度,在医疗质量管理中,所有与之相关的人、事、物在系统中有相应的字段都可以被制定在维度在模型中。3333.2..2..2..2.2222多维分析多维分析多维分析多维分析在自定义模型中,强大的分析功能体现在多维分析,它包括横向上维度的交叉分析,以及纵向上维度的潜入分析。当我们要了解一个问题,可以通过宏观层面发现问题,也可通过横向交叉对比与纵向层层潜入来寻找问题的根源。3333.2..2..2..2.3333手术质量分析举例手术质量分析举例手术质量分析举例手术质量分析举例在手术分析中我们可以充分体现用多维分析和自由潜入功能来了解一个问题的始末细节。选定一个手术,查看死亡率最高的手术,潜入其他维度寻找死亡率高的原因,最终可以了解到死亡率最高或前几位的手术的术式、手术医生、手术时间、麻醉医生、麻醉类型、切合、感染、用药、诊断(病种)、诊断符合等等情况。将死亡率指标与实际医疗行为中的人、事、物关联,找到问题的原因,帮助医院规范医疗行为,提高效率。如图1所示,从某个手术的死亡率来分析问题。图1单个手术与病种死亡率等医疗质量指标分析示意图3333....3333指标的生成指标的生成指标的生成指标的生成、、、、监控与分析监控与分析监控与分析监控与分析3333....3333.1.1.1.1质量指标类型质量指标类型质量指标类型质量指标类型将涉及到与医疗质量相关的经济指标分成三大类:费用性指标,比如住院费、各种类别费用;经营性指标比如会诊次数、诊断符合率;结果性治疗指标,这个也是长期被忽略的可独立成为分析比较的重要指标,如24/48/72小时重返手术室率、与单病种诊断相结合的死亡率、各种死亡类指标和负性事件指标。3333....3333.2.2.2.2核心指标监控方法核心指标监控方法核心指标监控方法核心指标监控方法按照指标需要被监控的不同需求,通过制定成仪表盘来监控最核心的指标。根据指标的类型,可以制定成费用性质量指标仪表盘、运营性指标仪表盘或者治疗结果指标仪表盘。医院可以通过对仪表盘的监控,了解每天每月的重要指标的变化。仪表盘具有提醒功能当发现问题时,管理人员可以直接点击潜入看问题的细节。也可以通过制定成实时报表或图表来监控一些时效性高的指标,对异常情况提出报警或提示。图2仪表盘监控核心指标3333....3333....3333过程质量指标分析过程质量指标分析过程质量指标分析过程质量指标分析过程质量指标很多属于第三类结果性治疗治疗。将每条流程划分到最细致的点,对每个点相关的人、事、物进行分析与监控。4444系统设计系统设计系统设计系统设计4444.1.1.1.1系统的技术基础系统的技术基础系统的技术基础系统的技术基础----OLAPOLAPOLAPOLAP与交叉索引技术与交叉索引技术与交叉索引技术与交叉索引技术将有关医疗行为、过程、因素等海量数据清洗、整合、关联、自由分析,成为系统设计的出发点。其中最主要运用到以下几个技术。1993年代诞生的联机分析处理(OLAP:On-LineAnalysisProcessing)技术成为了系统技术支持的基础。联机分析处理的定义为:使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。交叉索引(crossing-index)技术是一项美国专利技术,由美国泓维软件(DimensionalInsight)的创始人FrederickA.Powers于1995年主导发明,应用在数据模型的建立中,通过对数据的自由交叉索引处理,实现任意“维”之间的关联和潜入来获取最需要的信息,也是通常说的多维分析。此外,ETL(Extract,transformandload)工具Integrator在数据的清洗、整合与关联过程中发挥巨大作用。4.4.4.4.2222数据基础数据基础数据基础数据基础----基于病案首页搭建平台基于病案首页搭建平台基于病案首页搭建平台基于病案首页搭建平台,,,,将医嘱系统接入平台将医嘱系统接入平台将医嘱系统接入平台将医嘱系统接入平台,,,,未来连接手术未来连接手术未来连接手术未来连接手术、、、、ICICICICU、U、U、U、药品药品药品药品、、、、电子病历等各个系统电子病历等各个系统电子病历等各个系统电子病历等各个系统我们从《病案首页》入手搭建分析平台,是由它的性质和状况决定的。它是目前中国医院信息系统中标准化程度最高的应用系统,从它入手建立以医疗质量安全管理为核心的标准化应用体系成本低、可行性大。其次,为了分析监控单病种的质量管理,将医嘱系统、手术、药品、ICU等系统数据关联到病案首页的数据上,陆续整合在一个数据平台上。数据将不再是孤单的某个系统中的数据,而已成为一个数据网络,数据可以相互交流对话。多系统的数据集成也为今后对手术室医疗质量分析,门急诊(包括ICU)质量医疗分析,电子病历医疗质量分析等做好基础。4444....3333系统的设计系统的设计系统的设计系统的设计目前系统基于病案首页的数据上,已拥有近100个维度,40多个原始指标,维度之间能任意交叉、潜入(下钻)分析,并能随时生成数据中所需的,包括二次计算的指标,扩展后的系统基本能涵盖医疗质量监控分析的所有指标。“维度”的建立:将《病案首页》所有的可字段作为可分析的“维度”,在模型中成为直接点击就能看到数据信息的分析角度。维度可以相互任意交叉分析,从而也就是多角度地看问题、聚焦问题,当发现一个问题时依然可以多层次的潜入,找寻到问题根源。图4模型维度建立图“指标”的建立:将医院关注的与医疗质量管理有关的指标抽取,形成一套丰富的指标集合在模型中。对关键指标,可以实时监控,观测指标的变化,也可以了解某个指标在一段时间的趋势走势。当指标出现异常或需要了解更细节的原因时,可以通过不同维度聚焦或潜入分析。通过这样的分析,所有指标从静止的数值变成动态的、可分析、可挖掘的信息。5555总结总结总结总结医疗质量管理是一片广阔的领域,随着技术的发展与医院管理思想的进步,两者的结合才能真正的实现医疗质量管理的提高。数据分析与挖掘技术将数据的价值前所未有的展现与利用,通过对医院数据本身的分析了解问题,做好管理,是帮助医院建立切实可行的管理系统的出发点。这将是个任重道远的过程,通过正确的思路与技术支持,医疗质量管理达到一个新的高度。参考文献参考文献参考文献参考文献[1]卫生部医政司指导-中国医院协会编.单病种质量管理手册,2008,12.[2]赵刚明,王锡宁,舒婷,等.以医疗质量安全为核心的医院信息系统研究.中国数字医学,2009,4(1).[3]王锡宁,武广华,班博,等.新型CHQIS医疗质量检测技术研究.中国医院院长,2009,23.