NoSQL技术及其在生物医学大数据处理中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

王玉峰jinkam@gmail.com一.背景二.生物医学大数据变革三.走向云端的大数据应用四.总结生物医学关联谱个性化医疗病理研究系统生物学临床诊断药物研发MedicalInformaticsBioInformatics基因组学代谢组学蛋白质组学生物医学数据来源◦高通量测序产生的序列数据◦药物研究实验产生的过程数据◦临床医疗产生的电子病历医学影像数据◦个人移动健康应用汇聚形成的健康数据开启1000美元全基因组测序◦2012年LifeTechnologies公司发布台式基因测序仪IonProton测序数据产出自2005年起接近5个月翻一翻**SteinLD.Thecaseforcloudcomputingingenomeinformatics.GenomeBiol2010;11:207.靶向药物研发成为未来趋势◦临床前研究寻找药物研究的线索功能基因组学、结构基因组学、蛋白质组学、早期临床试验数据、…药物筛选效果早期模拟评估◦临床试验管理各期临床试验数据临床试验数据副作用记录病人档案众多数据源◦EMR、HIS、PACS、LIMS…◦覆盖全部诊疗环节(PoC)最大挑战来自医学影像◦CT、核磁、病理影像…举例◦匹兹堡大学医学中心(UPMC)2PB/1PB移动医疗(mHealth)◦远程健康监护Web2.0社交化健康应用◦PatientLikeMe.com◦好医生在线生物医学BigData个人健康数据临床医疗数据海量测序数据药物研发数据知识个性诊疗临床决策资源优化大数据管理◦versioning、query、sharing大数据整合◦integration、annotation、mashup大数据分析◦modeling、statistics、mining下一代测序分析◦Crossbow、DNANexus公司临床医疗数据管理◦Explorys公司、PracticeFusion公司、安德森肿瘤中心药物研发管理◦FujitsutsClinical◦IT外包:AMAG、EliLilly健康管理◦微软HealthVaultCrossbow:一个全基因组测序分析的软件工作流。在亚马逊AWS云平台上,基于Hadoop实现Map:BowtiSort:BinReduce:SoapSNPDNAnexus:DNS测序数据管理分析SaaS云服务美国Explorys公司,构建了私有云模式的海量临床医疗决策数据库DataGrid◦为第三方医疗机构提供临床及医院运维实时决策支持◦规模:1300万人,400亿医疗事件数据,到2013年达70TB的临床医疗、个人健康、机构运维数据◦采用技术:Hadoop、HBase◦效果:实时挖掘分析,压缩到几分钟PracticeFusion:电子病历SaaS服务◦2007年建立,为诊所医生提供的SaaS模式的电子病历及诊疗管理服务。◦目前100,000用户,2000万注册患者◦提供的功能包括:医生日程安排、病人诊疗计划与预约、电子签方(e-Prescribing)、病人管理、实验室数据集成、在线培训、面向病人的PHR等功能美国德州大学安德森肿瘤中心◦500张床位的医院+研究所◦私有云:8000枚处理器◦数据量:1.4PB临床数据/3PB大量医学影像,图像数量超过了10亿张◦承载应用:人类基因组排序,还是研究肿瘤放射物理学、流行病学,或是对放射治疗进行精确计算、模拟临床试验FujitsutsClinical◦富士通公司面向临床药物试验的全周期数据管理推出的SaaS服务系统AMAG◦AMAG制药公司在Egnyte的云上存储了大约6TB的数据,在亚马逊AWS的简单存储服务上存储了大约2.5TB的数据◦AMAG2009年起就已经不再允许公司的其他业务部门购买那些无法作为SaaS服务使用的软件了微软HealthVault:个人健康管理SaaS服务平台◦2007发布,作为管理个人及家庭成员健康信息的应用平台.目标是“medicalRecordinoneplace”◦允许用户手工录入、上传、从便携检测设备或从第三方医疗机构导入医疗病历记录。支持医患间的医疗健康信息共享。◦通过SDK支持第三方工具与应用的开发与集成,实现了类似AppStore的应用扩展模式,支持移动应用的开发与信息整合◦建立了广泛的合作伙伴生态系统应用名称解决问题数据处理平台规模云服务模式基于的云平台CrossBow基于组数据快速低成本的SNP分析基于IaaS可伸缩软件工具箱亚马逊公有云DNAnexusDNS测序数据的管理及分析流程基于IaaS可伸缩SaaS亚马逊公有云Explorys海量临床医疗及运维数据的管理及实时分析40TBSaaS私有云PracticeFusion面向中小诊所的管理及电子病历服务TB级SaaS私有云安德森肿瘤中心医学数据平台基因组排序、肿瘤放射物理学、流行病学模拟、临床试验分析3PBIaaS私有云FujitsutsClinical面向临床药物试验的全周期数据管理未知SaaS私有云AMAG药物研发数据的管理分析TB级使用SaaS服务Google等公有云HealthVaultPHR个人健康管理服务未知SaaS私有云安全和带宽成为影响大数据云端应用的主要因素走向云端的生物医学大数据集促使计算向数据迁移◦1000GenomesProject,GenBank,Unigene,EnsemblAnnotatedHumanGenomeData基于云计算提升数据处理效能◦Hadoop等大数据处理技术得到了云计算平台的良好支持随着测序技术的普及,临床电子病历以及移动医疗的不断发展,生物医学的“大数据”应用将成为一种常态。云计算为生物医学的大数据处理提供了一种有效的模式,应充分利用云平台推动生物医学数据的聚合与协作利用,借鉴marketplace模式构建我们自己的生物医学大数据集资源谢谢!

1 / 23
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功