临床路径在医院管理中的拓展性应用医院信息系统中数据挖掘技术的应用胡光阔①①云南省第一人民医院信息中心650032云南省昆明市金碧路157号关键词:医院信息系统数据挖掘摘要:随着医院信息系统迅猛发展,资料流通量之巨大已到了令人惊叹的地步。常规的数据查询已不能满足医院信息化发展的要求,传统的统计技术也面临了极大的挑战。因此,一种智能化的、综合应用各种统计分析、数据库、智能语言来分析庞大数据资料的数据挖掘技术就应运而生。Keywords:HISDataMiningAbstract:WiththerapiddevelopmentofHIS,thecirculationofinformationhascometoagreatextentamazing.Theconventionaldataquerycannolongermeetthehospitalinformationtechnologydevelopmentofthetraditionalstatisticaltechniquesarealsofacinggreatchallenges.Asaresult,anintelligentandcomprehensivestatisticalanalysisofavarietyofapplications,databases,intelligentanalysisofthelanguageofthehugedataondataminingcameintobeing.随着计算机、网络技术的发展,获得有关资料已经非常简单易行。但是对于数量大、涉及面宽的数据,依靠以往那种由简单汇总、按指定模式去分析的统计方法是无法完成这类数据的分析,能否从数据中提取信息或者知识为决策服务,同时,传统的统计技术也面临了极大的挑战。因此,一种智能化的、综合应用各种统计分析、数据库、智能语言来分析庞大数据资料的技术就应运而生,这就是目前国际上统计最热门的话题“数据挖掘”(DataMining)技术的市场需求和它的技术支持背景。一、数据挖掘的含义和作用数据挖掘就是从海量的数据中挖掘出可能有潜在价值的信息的技术。这些信息是可能有潜在价值的,支持决策,可以为企业带来利益,或者为科学研究寻找突破口。现今医院信息系统迅猛发展,资料流通量之巨大一到了令人咂舌地步,就实际限制而言,便遇到了诸如巨量的记录,这就让我们不得不利用数据挖掘技术。数据挖掘综合了各个学科技术,有很多的功能,当前的主要功能如下:1、分类:按照分析对象的属性、特征,建立不同的组类来描述事物。2、聚类:识别出分析对象内在的规则,按照这些规则把对象分成若干类。3、关联规则和序列模式的发现:关联是某种事物发生时其他事物对发生的这样一种联系。4、预测:把握分析对象发展的规律,对未来的趋势作出预见。5、偏差的预测:对分析对象的少数的、极端的、特例的描述,揭示内在的原因。数据挖掘的各项功能不是独立存在的,在数据挖掘中互相联系,发挥作用。二、医学数据挖掘的特点1、医学数据的隐私性(Privacy)医学数据不可避免地涉及到患者的一些隐私信息,当这些隐私信息使患者在日常生活中遭遇到不可预料的侵扰时,就产生了隐私性问题。隐私性不同于安全性(Security)和机密性(Confidentiality),当未被授权的个人或机构设法取得这些隐私信息时,就产生了安全性问题;当拥有隐私信息的研究人员与未经授权的个人或机构共享这些患者信息时,就暴露出了机密性问题。医学数据挖掘者有义务和职责在保护患者隐私的基础上进行科学研究,并且保证这些医学数据的安全性和机密性。2、医学数据的多样性由于医学数据是从医学影像、实验数据以及医生与病人的交流中获得的,所以原始的医学数据具有多种形式。医学数据包括影像(如PACS)、信号(如ECG)、纯数据(如体征参数、化验结果)、文字(如病人的身份记录、症状描述、检测和诊断结果的文字表述)等。医学数据的多样性是它区别于其它领域数据的最显著特征。3、医学数据的不完整性医学数据的搜集和处理过程经常相互脱节,搜集是以治愈患者为直接目的,而处理是以寻找某种疾病的一般规律为目的,因此搜集的信息可能无法涵盖研究需要的所有信息。此外,人为因素也可能导致据记录的偏差和残缺,许多医学数据的表达、记录本身也具有不确定和模糊性。病例和病案的有限性使医学数据库不可能对任何一种疾病都能全面的反映。4、医学数据的冗余性医学数据库是一个庞大的数据资源,每天都会有大量的记录存储到数据库中,其中可能会包含重复的、无关紧要的、甚至是相互矛盾的记录。例如,对同一疾病,病人所表现的症状、化验结果和治疗措施都可能相同。此外,医学数据还具有时间性特征,医学检测的信号如ECG、影像PACS都是时间函数,具有较强的实效性。三、医院信息系统中的数据挖掘技术的应用1、疾病诊断:正确的诊断对于指导病人的用药及健康显然是重要的,在临床中有些疾病错综复杂,数据挖掘的有关分类分析可以应用与疾病的诊断。粗糙集理论、人工神经网络、模糊逻辑分析在疾病诊断方面是有效的。例如用于肺内孤立结节的影像鉴别诊断。由于良、恶性结节的影像学及临床表现有部分交叉,给影像鉴别诊断带来困难。利用肺内孤立结节病人的胸部高分辨率CT(HRCT)表现,利用结节的征象,选取部分临床资料,用于构建网络。结果显示网络的诊断正确性好于高年资医师的正确性。借助网络的帮助,无论是高年资医师还是初年资医师诊断正确性都能得到明显提高。2、疾病相关因素分析:在医院信息系统数据库中有大量的关于病人的病情和病人的个人信息,包括年龄、性别、居住地、职业、生活情况等,对数据库中的信息进行关联规则分析可以发现有意义的关系及模式,某种疾病的相关发病危险因素分析可以指导患者如何预防该疾病。Kentala等专家曾从赫尔辛基大学附属医院的鼻神经专家系统数据库中提取前庭区与晕头有关的6种发病人数较多的疾病资料,分别为6种疾病建立不同规模的决策树,并针对6棵树单独分析影响每一种疾病发生的重要因素,而且从决策树中提取诊断规则,从而将专家经验知识转化成了可供年轻医师随时参考的有价值的信息。3、在人力资源管理中的应用:能够对医院中现有人才进行聚类分析,从而发现医院内部的人才类型,并可判断某员工属于哪一种类型。4、在医疗质量管理中的应用:医疗保健领域的改革使得费用压力增加,另外一方面对医院医疗质量的需求也增高,以及其他医疗服务机构的增多,使得医院管理者比以往更关心医疗和管理的质量以及费用-效益比率。医疗质量管理的核心是数据、标准、计划以及治疗的质量,这些质标可以用不同的指树来衡量,数据挖掘可以帮助管理者解决下列问题:发现新的有关数据、标准、计划以及治疗的质量指数;检验现有的有关数据、标准、计划以及治疗的质量指数是否有效;提炼、调整有关数据、标准、计划以及治疗的质量指数。数据挖掘可以帮助发现有关提高临床服务效率及质量潜力的证据。5、在医学图像信息系统中的应用:医学领域中越来越多地应用图像作为疾病诊断的工具,如SPECT、CT、MRI、PET等,数据挖掘可以应用于医学图像的分析。例如用于颅内星形胶质细胞瘤良、恶性的影像诊断方面,由于星形胶质细胞恶性肿瘤具有手术风险大、预后不理想的状况,因此术前正确评价肿瘤的良、恶性对于治疗方案的正确选择及预后评估均具重要意义。我们搜集280例星形胶质细胞肿瘤病例的MRI影像资料,由放射科医生对MRI图像进行12方面的特征提取并记录,主要是MRI表现及临床资料,构建网络。结果显示,不仅提高了良、恶性星形胶质细胞瘤鉴别诊断的准确性,而且对于医学影像学教学方面具有一定的实用价值。医院信息系统是一个复杂的信息管理系统,包括电子病历、医学影像、病理参数、化验结果、医嘱管理、财务管理、人力资源管理等,而目前数据挖掘技术主要应用于以结构化数据为主的关系数据库、事务数据库和数据仓库,对复杂类型数据的挖掘尚处在起步阶段。结合医学信息自身具有的特殊性和复杂性,处理好挖掘过程中的关键技术,数据挖掘在医院信息系统中将有广阔的应用前景。参考资料1、《医学数据挖掘综述》周爱华,郑应平,王令群中华医学实践杂志2005年2月第4卷第2期2、《数据仓库与数据挖掘》关俐,梁洪峻微型电脑应用,1999;15(9)3、《数据仓库中的信息存取分析技术的研究》姚宇蓉,何厚存计算机应用研究,1999;16(8)4、《数据挖掘技术在医学领域中的应用》于长春,贺佳等第二军医大学学报2003年11月第24卷第11期5、《医学信息数据库的建立与数据挖掘》屈景辉,廖琪梅等第四军医大学学报2001年1月第22卷第1期