关于大数据在医疗行业应用的调研报告1引言早期的医学研究成果、病人的信息等,往往都以纸质档的形式锁在文件柜中。近年来,随着计算机技术、互联网技术、信息技术等的高速发展,医疗领域内的信息包括病历数据、医学检验数据和医学影像数据等正从纸质的单一数据信息向系统的数据信息方式转变。与此同时,大型卫生信息平台、医疗业务体系也在逐步建立完善。这就决定了,大数据技术必将对医疗卫生领域带来重大影响。大数据技术使得我们可以不再完全依赖于随机采样,通过分析挖掘获取小数据无法提取的有价值信息。大数据技术可以通过临床决策支持、医疗药品研发、健康危险因素分析等方面为医疗领域从大体量、高复杂的数据中提取价值,将有可能给医疗行业开拓一个新的黄金时代。2大数据技术在医疗领域的应用情况及发展前景2.1大数据技术在医疗领域的应用大数据技术在医疗领域的技术层面、业务层面都有十分重要的应用价值。在技术层面:大数据技术可以应用于非结构化数据的分析、挖掘,大量实时监测数据分析等,为医疗卫生管理系统、综合信息平台等建设提供技术支持;在业务层面:大数据技术可以向医生提供临床辅助决策和科研支持,向管理者提供管理辅助决策、行业监管、绩效考核支持,向居民提供健康监测支持,向药品研发提供统计学分析、就诊行为分析支持。(1)大数据技术在医疗系统、医疗信息平台建设中的应用大数据技术可以通过建立海量医疗数据库、网络信息共享、数据实时监测等方式,为国家卫生综合管理信息平台、电子健康档案资源库、国家级卫生监督信息系统、妇幼保健业务信息系统、医院管理平台等提供基本数据源,并提供数据源的存储、更新、挖掘分析、管理等功能。通过这些系统及平台,医疗机构之间能够实现同级检查结果互认,节省医疗资源,减轻患者负担;患者可以实现网络预约、异地就诊、医疗保险信息即时结算。(2)大数据技术在临床辅助决策中的应用在传统的医疗诊断中,医生仅可依靠目标患者的信息以及自己的经验和知识储备,局限性很大。而大数据技术则可以将患者的影像数据,病历数据、检验检查结果、诊疗费用等各种数据录入大数据系统,通过机器学习和挖掘分析方法,大夫即可获得类似症状患者的疾病机理、病因以及治疗方案,这对于大夫更好地把握疾病的诊断和治疗十分重要。(3)大数据技术在医疗科研领域中的应用在医疗科研领域,运用大数据技术对各种数据进行筛选、分析,可以为科研工作提供强有力的数据分析支持。例如健康危险因素分析的科研中,利用大数据技术可以在系统全面地收集健康危险因素数据,包括环境因素,生物因素,经济社会因素,个人行为和心理因素,医疗卫生服务因素,以及人类生物遗传因素等的基础上,进行比对关联分析,针对不同区域、家族进行评估和遴选,研究某些疾病发病的家族性、地区区域分布性等特性。(4)大数据技术在公共卫生管理中的应用大数据可以连续整合和分析公共卫生数据,提高疾病预报和预警能力,防止疫情爆发。公共卫生部门可以分析医疗大数据的变化,通过分析不同地域患者出现相同或相似症状并蔓延的信息,快速检测传染病,进行全面疫情监测,快速响应。此外,还可以提高公众健康风险意识,降低传染病感染风险,为人类阻止或减缓流行病的发展提供依据。(5)大数据技术在健康监测中的应用在居民的健康监测方面,大数据技术可以提供居民的健康档案,包括全部诊疗信息、体检信息,这些信息可以为患病居民提供更有针对性的治疗方案。对于健康居民,大数据技术通过集成整合相关信息,通过挖掘数据对居民健康进行智能化监测,并通过移动设备定位数据对居民健康影响因素进行分析,为居民提供个性化健康事务管理服务。(6)大数据技术在医药研发、医药副作用研究中的应用在医药研发方面,医药公司能够通过大数据技术分析来自互联网上的公众疾病药品需求趋势,确定更为有效率的投入产出比,合理配置有限研发资源。此外,医药公司能够通过大数据技术优化物流信息平台及管理,使用数据分析预测提早将新药推向市场。在医药副作用研究方面,医疗大数据技术可以避免临床试验法、药物副作用报告分析法等传统方法存在的样本数小、采样分布有限等问题,从千百万患者的数据中挖掘到与某种药物相关的不良反应,样本数大,采样分布广,所获得结果更具有说服力。此外,还可以从社交网中搜索到大量人群服用某种药物的不良反应记录,通过比对分析和数据挖掘方法,更科学、更全面地获得药物副作用的影响。2.2大数据技术在医疗领域的发展前景(1)云计算技术云计算是大数据的基础平台与支撑技术,云计算技术在医疗卫生领域中数据存储、管理与分析等方面的支撑,才能使得医疗卫生领域中大数据有用武之地。Hadoop是目前最为流行的大数据处理平台。对Hadoop改进并将其应用于各种场景的大数据处理已经成为新的研究热点。医疗卫生领域需要对Hadoop平台性能改进、实现高效查询处理、索引构建和使用、在Hadoop之上构建数据仓库、实现Hadoop和数据库系统的连接、数据挖掘、推荐系统等。(2)分布式数据库、分布式数据处理技术医疗领域的数据信息量巨大,数据类型复杂,价值密度性低,且不同系统、平台接口不一致等给数据的存储、分析、处理、传输等带来很大挑战。分布式数据库技术为解决这些问题提供了可能。此外医疗数据还具有大规模、持续到达的特点,而要实现海量、复杂的大数据的实时处理更是一个极具挑战性的工作,分布式数据处理技术可以很好地解决这一问题。(3)数据挖掘技术数据挖掘技术是大数据技术的核心。在医疗领域,如何通过数据挖掘技术在海量医疗数据信息中提取出有价值的信息,并应用到临床决策支持、药物研制、健康监测等方面对于未来的医疗领域至关重要。因此,数据挖掘技术在医疗大数据领域潜力十足。3医疗大数据领域公司实例3.1IBM公司IBM云计算大数据科技在医疗行业有着非常广泛的应用。基于云计算大数据科技,IBM通过提供全面的咨询服务,硬件系统、软件系统,及具体的医疗应用解决方案,推动医疗卫生行业在战略与发展、运营和流程、信息技术应用不同层面的发展。通过推动医疗卫生服务和管理机构之间的标准建设,数据共享,信息整合,有效规划信息系统建设和整合,提高医疗卫生机构的服务质量及服务能力,运营管理效率,实现以患者为中心的医疗信息化系统建设。IBM拥有全面的云计算解决方案,从私有云、公用云、混合云、IaaS、PaaS以致未来的SaaS方案均能提供,并且拥有全面的大数据解决方案,通过对实时数据和静态数据进行综合分析,产生分析报告,可以为包括业界领先的数据库、数据处理、数据分析、数据建模与推测等提供解决方案。此外,IBMWatson系统正在开展感知运算系统的前缘,Watson能“听懂”医生的自然语言问题,同时快速分析堆积如山的医疗研究数据给出答案。以下是IBM公司的云计算大数据科技在现在医学领域的应用实例:IBMFlashSystem820+SVC+Storwize完美组合,最好的满足普通三甲医院的HIS系统的存储需求,不管是在性能、可靠性、容量以及可扩展集群方面都可轻松实现;IBMXIV采用最先进的网格存储架构,轻松实现容量与性能的同步扩展,采用高效多快照的定时备份数据保护,采用最简单的管理模式,是普通三甲医院PACS海量数据环境最佳的存储解决方案;DS8000+MetroMirror,完美实现RPO=0的冗灾保护,同时通过固态+EasyTier热点自动优化,无需根据工作负载改变存储策略,满足医院高性能访问的需求。近年来,IBM公司还与一些国际顶级高校合作,将IBM的大数据技术应用到前沿医疗领域。在美国加州大学洛杉矶分校,IBM的科学家与里根医学中心的医生们奋力探索,通过分析患者巨大的数据流来预测导致认知能力损害甚至死亡的脑肿胀;在安大略理工大学,新生儿重症监护专家使用IBM大数据软件分析早产儿的信息数据,使得看护人可以提前24小时发现病情进展并对危及生命的感染采取措施。在纽约州立大学布法罗分校(多发性硬化症的研究领导者),IBM大数据科技被应用在研究超过2000个导致多发性硬化症遗的遗传和环境因素,使研究人员可马上而非数天后分析病案、实验结果、核磁共振扫描和患者满意度问卷;在哈佛医学院布赖海姆女子医院,医学研究人员使用IBM大数据技术研究开给一千万患者的处方药的效果,以辨别数以百万计病患者的药品风险。3.2医惠科技有限公司医惠科技有限公司创立与2009年,以“简约智慧医疗”为理念,以“提高病人安全、医疗质量和临床效率”为目标,以“物联网”和“大数据”等核心技术为依托,致力于为大型医疗机构和全民健康提供“全人全程,可及连贯”的智慧医疗服务体系,致力于建构在医疗信息建设领域可以向合作伙伴提供一个能够展开各种医务工作的平台。基于大数据技术,医惠科技有限公司开发了婴儿防盗系统、第三方药品物流服务平台、营养点配餐管理系统、患者生命体征动态监测系统、固定资产管理系统、人员物资实时定位管理系统等管理系统。医惠科技有限公司的产品覆盖整个数字卫生和智慧医疗信息化应用领域,业务范围遍布中国31个省市自治区及香港、澳门,高端客户超过600多家,2014年以来,医惠科技的“智能开放平台”在全国已经部署了20多家医院。同时,医惠科技有限公司与多家国际知名企业达成长期战略合作伙伴,其中包括:IBM、Intel、Microsoft、CISCO、Honeywell、MOTOROLA。凭借丰富的行业经验、创新的设计理念、先进的解决方案和强大的研发实力承担参与了“十二五”国家高技术研究发展计划(863计划),“十二五”国家重大专项,“十一五”国家科技支撑计划重点项目等项目。“物联网AP”(一种将RFID与WIFI技术结合的智能信息接收和发送产品)与“医疗信息集成整合平台系统”是医惠科技有限公司构建的两个平台系统。“物联网AP”把原来单独控制的WIFI、物联网整合在一个系统里,使得医院可以利用RFID相关技术与传统网络结合,更好地进行医院内部管理、为患者提供服务。而“医疗信息集成整合平台系统”可以解决大型的三甲医院往多个业务系统之间交互不好,维护困难的问题。4相关项目实例4.1项目一:PDS计划(ProjectDataSphere)2014年4月,“癌症生命科学协会CEO圆桌会(theCEORoundtableonCancer)”推出一项独立非盈利性行动计划——PDS计划(ProjectDataSphere)。PDS计划拟打造一个第三阶段癌症临床试验数据共享和分析平台,初始数据集由阿斯利康、拜耳、新基医药(Celgene)、纪念斯隆-凯特琳癌症中心、辉瑞、赛诺菲等共同提供,这些数据已去除患者的个人信息,经过统一编号,供生命科学公司、医院、医疗机构以及独立研究者可以免费使用。该项目正是大数据技术在医疗领域应用的典型事例。该计划可以为临床辅助决策、医疗科研、抗癌药物研制等提供支持。特别是在抗癌药物研制方面,PDS计划有助于发现鲜为人知的癌症候选药物,这些药物可能对某些癌变有一定的疗效,但在某一特定研究中,这些药物可能会因为没有达到研究的主要目标而被抛弃。