OMAHA白皮书第期2019年10月月名人名言:数据治理是一套帮我们理清每一条数据的分工和责任人的系统。通过策略制定和明确流程规范,这套系统会清晰界定每一份数据的负责人,技术部门和业务部门之间如何协作处理数据,谁拥有数据决策权等问题,强调不同领域业务人员深度参与数据分析与决策,以更有效管理信息,让数据在公司各部门间更顺畅地流通。—DanetteMcGilvary健康医疗数据治理HealthdatagovernanceOMAHA秘书处健康医疗大数据时代,如何走向数据资产价值变现?当我们努力解决“信息孤岛”、“信息烟囱”的技术难题之后发现可用的数据依然乏善可陈,究其根源是在于数据治理中出现混乱或缺失。但目前整个行业对于数据治理的认知与实践仍处于起步阶段,因此建立整体化的数据治理思考框架,明确数据治理过程中涉及到的内容与要求,对于机构开展健康医疗数据具有重要的指导意义。本期导读顾宴菊李莹莹张建楠赵童童朱烨琳内容摘要1数据治理概述健康医疗数据治理域健康医疗数据治理健康医疗治理工具数据治理实践案例OMAHA白皮书2019年10月第14期健康医疗数据治理国内外对于数据治理的认识尚未形成共识,关于数据治理的定义并未统一,但对于“数据资产管理的决策权分配和职责分工是数据治理的核心”目前已形成基本的共识。数据治理起源于企业管理后向各个领域延展应用。关于数据治理模型、治理框架及其相关标准体系和应用实践等的研究是国内外研究的热点和重点,DAMA、DGI、IBM和我国国家标准等已形成了相对成熟的数据治理知识体系极大地推动了全球数据治理实践。伴随着健康医疗大数据的发展,健康医疗数据治理也逐渐成为医院管理中的重要内容,并逐渐向区域健康医疗数据治理发展。健康医疗数据存在的数据质量低下、互联互通标准化程度低、数据开放程度不高、数据资产意识不足、管理制度不完善、数据权责不明及数据安全和隐私保护等问题导致数据价值难以体现,实施健康医疗数据治理刻不容缓。理论研究上,健康医疗数据治理研究集中于体系框架模型及实践应用研究,关于数据共享、隐私安全、伦理、数据归属权等占据目前国外理论研究主流。国内外医疗机构对健康医疗数据治理重视程度正不断加深,但乏于先进的指导框架和精细化实施机制,实际在组织内真正实施开展体系化健康医疗数据治理实践的机构较少。国家标准数据治理框架明确了数据治理的实施对象,包括数据管理体系(数据标准、数据质量、数据安全、元数据管理和数据生存周期)和数据价值体系(数据流通、数据服务和数据洞察)。相关健康医疗数据治理框架和方法论建设为我国健康医疗数据提供了基础支撑,但对比国家标准要求仍存在一定差距。数据标准框架制定滞后、数据质量精细化管理不足、数据资产化管理不足、管理机制落后等构成了阻碍健康医疗数据治理成功实施的主要问题。数据治理软件工具在数据治理实施过程中扮演着重要的角色。Informatica,Collibra,Alation,Semaphore,IBM,Oracle,AlexSolutions,ASGTechnologies等公司作为杰出供应商为数据治理提供了许多工具,健康医疗数据治理工具多趋于平台化建设使用。元数据管理工具对健康医疗数据治理极具价值,如HiTA元数据平台为医院相关信息系统、电子健康档案、区域卫生信息平台规范化建设提供基础支撑。此外,浪潮等为主数据管理提供了较为成熟的工具。为帮助更好地理解健康医疗领域数据治理的方式方法和治理流程,我们列举了Kansas大学医院和首都医科大学宣武医院数据治理实施过程供参考指导。研究简介(一)研究背景(二)研究目标(四)OMAHA基金会(三)研究方法2OMAHA白皮书2019年10月第14期健康医疗数据治理健康医疗数据作为国家重要的基础性战略资源,其重要性毋庸置疑。但是由于健康医疗数据面临着数据质量差、互联互通标准化程度低的问题,其可用性不高,因此就需要对其进行数据治理,以深入挖掘健康医疗数据的潜在价值,推进健康医疗数据的最大化利用。在此背景下,我们通过梳理当前我国健康医疗数据治理的现状,研究健康医疗数据治理规范下8大治理域的现状与差距,介绍相关健康医疗数据治理工具,并辅以健康医疗数据治理实践案例,为有意向在医疗领域进行数据治理的同仁提供参考与指导。本文通过对国内外相关文献和资料进行检索和研究归纳,同时选取国内有代表性的医疗IT领域的意见领袖进行深度访谈,准确把握数据治理在健康医疗领域的应用方向。浙江省讴本开放医疗与健康基金会(OpenMedicalandHealthcareFoundation,简称OMAHA基金会)是一家致力于个人健康医疗数据的开放运动,解决健康医疗领域数据分享难题,促进个人健康信息的有意义使用,为公共健康领域提供公益产品和服务的基金会。基金会的使命是提升公众意识和改善个人健康档案使用环境。OMAHA基金会是由医疗领域意见领袖和行业专家发起和运营的公益组织。2016年3月,经浙江省民政厅批准注册成立。3一、数据治理概述1.数据治理定义目前,关于数据治理的认识国内外尚未形成统一、标准的定义,我们梳理了世界主要数据管理机构对数据治理的定义如下(见表1):从定义来看,DAMA认为数据治理是对数据管理的高层计划和控制。DGI认为数据治理是包含信息相关过程的决策权及责任制的体系,描述了谁在何时何种情况下采取什么样的行动、使用什么样的方法。IBM认为数据治理是组织管理其信息知识并回答问题的能力,如数据来自哪里?数据是否符合公司政策及规则?数据治理实践提供了一个全面的方法来管理、改进和利用信息,以帮助决策者建立对业务决策和运营的信心。中国的国家标准发布最晚,在充分参考了其他机构定义的基础上,强调管控的同时也强调了对绩效与风险的管理。虽然数据治理的定义很多很杂,但对于“数据资产管理的决策权分配和职责分工是数据治理的核心”已形成基本的共识[5]。数据治理并不涉及具体的管理活动,而是专注于通过什么机制才能确保做出正确的决策[6]。由此,数据治理并不是我们通常理解的类似“数据管理”或者是单一的数据质量提升过程,而是一个体系性、系统性的集合,不仅是通过数据的管理提升数据质量,更强调流程设定和权责划分。但多数人在应用时对数据治理的概念常不加以解释和说明,造成了理解的混2.相关概念内涵与关系数据治理包含了众多相关概念,概念之间关系交错往往导致各方在讨论数据治理时的范围与语境并不一致,因此理清数据治理相关概念的关系对于理解后续的内容十分必要。下面我们对主要混淆的概念进行说明。1)数据管理定义数据资源获取、控制、价值提升等活动的集合[GB/T34960.5-2018,定义3.2][7]。2)数据治理与数据管理对于数据管理与数据治理的区分,DGI从职表1主要数据管理机构数据治理定义组织数据治理定义国际数据管理协会(TheGlobalDataManagementCommunity,DAMA)数据治理是对数据资产行使权力和控制的活动集合,包括计划、监控和执行等[1]。国际数据治理研究所(TheDataGovernanceInstitute,DGI)数据治理是指在企业数据管理中分配决策权和相关职责[2]。IBM数据治理委员会(DataGovernanceCouncil,DGCouncil)数据治理是一种质量控制规程,用于在管理、使用、改进和保护组织信息的过程中添加新的严谨性和纪律性[3]。国家标准GB/T34960.5-2018《信息技术服务治理第五部分数据治理规范》数据资源及其应用过程中相关管控活动、绩效和风险管理的集合[GB/T34960.5-2018,定义3.1][4]。1:OMAHA白皮书2019年10月第14期健康医疗数据治理41:能角度出发,认为数据管理是确保通过数据治理制定的政策和实践能有效地帮助数据相关工作的开展的一系列活动。国际标准化组织ISO指出,数据治理履行数据管理的主要职能,即数据治理规定在管理的过程中哪些决策应被制定,以及决策者为谁,而数据管理确保这些决策的制定与执行[8]。张绍华等认为数据治理对数据管理具有领导功能,指导如何正确的履行数据管理职能。数据治理与数据管理具有不同的职能,数据治理的主要职能是评估、指导和监督,而数据管理的职能主要是计划、建设、运营和监控(见图1),数据治理是回答企业决策的相关问题并制定数据规范,数据管理是实现数据治理提出的决策并给予反馈,因此数据治理和数据管理的责任主体也是不同的,前者是董事会,后者是管理层[6]。此外,经常出现的相关概念还包括信息治理、大数据治理等,这类概念与数据治理的核心差别是在于治理对象的不同,数据治理的对象是数据,而前者则分别为信息和大数据。具体来看,治理本身的内涵是相似的,但由于治理对象的不同,有各自的特殊性。需要说明的是,大数据治理本质上可以认为属于数据治理,是数据治理发展的新阶段,数据治理的方法论同样适用于大数据治理,但最明显的区别在于大数据服务创新的区别以及隐私保护要求的重要性与难度更加突出,大数据治理中如何将大数据与现有元数据库的集成是大数据治理的关键。数据治理指导评估监督管理反馈数据管理战略方针监控反馈计划建设运营监控数据治理及相关标准体系的研究是国内外研究的热点之一。数据治理的概念最早起源于企业管理中,国外学界关于“数据治理”的认识始于2004年,H.Watson探讨了“数据仓库治理”在BlueCross和BlueShieldofNorthCarolina两家公司的最佳实践,2005年之后,陆续有学者对“数据治理”展开研究,比较代表性的有J.Griffin、L.Cheong、D.Power,讨论数据治理环境下企业、政府、医院的职能角色、模型、框架、因素与机制等[8]。早期的数据治理主要是数据质量、数据标准、数据模型、元数据、主数据等单一视角的数据管理活动,只能解决数据相关的局部问题,其相互之间没有统一的协调和安排,管理活动之间存在割裂和不一致,导致数据利用的效率降低[9]。因此,建立标准化的数据治理框架,制定数据治理机制来促进数据管理活动的协调一致,更有效地挖掘数OMAHA白皮书2019年10月第14期健康医疗数据治理5据的潜在价值,满足组织战略目标是一直以来的研究重点。在此过程中,ISO、DAMA、DGI、IBMDGcouncil等各自提出了数据治理模型或数据治理框架(具体请见下节),推动了全球数据治理实践。国内数据治理研究最早也出现在2004年左右,但一直没有得到足够的关注。伴随着大数据的发展,如何有效利用数据价值成为关注热点,在此背景下数据治理的研究出现快速增加,并且可以看到2014年以后大数据治理研究也开始起步(见图2)。对于数据治理研究,虽然有较多组织建立了相应的模型框架,但中国是国际上首个提出并推动数据治理的标准化研究的国家。2014年6月,ISO/IECJTC1/SC40(IT治理和IT服务管理分技术委员会)在悉尼召开第一次全会,中国代表团首度提出“数据治理”的概念,引发国际同行的兴趣和研讨[10]。2015年5月,中国代表团在巴西圣保罗召开SC40/WG1第三次工作组会议上,正式提交了《数据治理白皮书》国际标准研究报告,经过讨论和表决,同意由中国国家委员会正式提出新工作项目申请,“数据治理国际标准”立项建议并获得通过。经过会议讨论并形成决议,将数据治理国际标准分为两个部分:ISO/IEC38505-1《ISO/IEC38500在数据治理中的应用》(以下称ISO/IEC38505-1)和ISO/IECTR38505-2《数据治理对数据管理的影响》(以下称ISO/IECTR38505-2)。图中国知网数据治理发表文章数时间趋势2:上海计算机软件技术开发中心等单位的专家作为ISO/IEC38505-1的联合编辑,中国电子技术标准化研究院等单位的专家作为ISO/IECTR38505-2的编辑。2017年3月31日,ISO/IEC38505-1获得国际标准化组织批准,该项