BioMedicalBigDataandPrecisionMedicineYixueLiyxli@sibs.ac.cnCAS-MPGPartnerInstititutofComputationalBiologyShanghaiCenterforBioinformationTechnologyOutline•ConceptandBackground•Drivenbygenomicstechnology•Insightintobiomedicalbigdata•Challengeandopportunity•Bioinofrmaticsisakey“Iwantthecountrythateliminatedpolioandmappedthehumangenometoleadaneweraofmedicine–onethatdeliverstherighttreatmentattherighttime…...Tonight,I'mlaunchinganewPrecisionMedicineInitiativetobringusclosertocuringdiseaseslikecanceranddiabetes–andtogiveallofusaccesstothepersonalizedinformationweneedtokeepourselvesandourfamilieshealthier.”StateoftheUnionAddress(国情咨文2015)Tuesday,January20,2015“我希望这个消灭小儿痲痺与绘制人类基因组图谱的国家,能领导医学新纪元,能够在正确的时间为患者提供正确的治疗。……今晚我要发起新‘精准医学计划’,让我们离治愈癌症、糖尿病与其他疾病更近一步,并让我们所有人能获得让自己与家人更健康所需要的个性化信息。”精准医疗研究已成为新一轮国家之间科技竞争热点和引领国际发展潮流的战略制高点PrecisionMedicineInitiativeUSA美国精准医学计划精准医疗概念在大样本研究获得疾病分子机制的知识体系基础上,以生物医学特别是组学数据为依据,根据患者个体在基因型、表型、环境和生活方式等各方面的特异性,应用现代遗传学、分子影像学、生物信息学和临床医学等方法与手段,制定个性化精准预防、精准诊断和精准治疗方案。精准医疗背后是大数据!!!精确医学与个体为中心的数据知识网络以及疾病分类关系关键是生物医学大数据的整合、挖掘与知识发现与管理基于大数据的精准的临床应用持续推动临床诊疗进步药物基因组学检测能够帮助我们确定TheRightDrugTheRightDoseTheRightindication诊断和治疗的遗传检测能够帮助我们确定FamilialscreeningfordiseaseImproveprognosticevaluationTherapeuticdecisions肿瘤基因图谱可以指导靶向治疗ClinicallyactionableresultsComprehensivecoverageDetectsalltypesofcancercausingmutationsChineseversionofPrecisionMedicineProject2:PrecisionMedicineInitiativeCohortProgram(PMI-CP)Project3:DataCenter&TechnologyInfrastructureTCGA&ICGClikeDataRepositoryProject1:Integrated“Omics”TechnologiesProject4:PrecisionProtocol&DiagnosisRoutefortheTreatmentsofDiseasesProject5:Biomarker&DrugTargetDiscoveryProject6:IntegratedClinicalApplication&DemonstrationPlatformBasicResearches&GeneralTechnologiesClinicalApplication&Demonstration美国国家“癌症登月计划”与大数据2016年7月,在华盛顿举行的“癌症登月计划”(CancerMoonshot)高峰会上,美国副总统拜登宣布了一系列推动提早终结癌症的新举措。其中10大重点方向:1、建立一个能让患者直接参与的癌症研究数据合作网络2、建立一个专注于癌症免疫疗法临床试验合作网3、研发克服肿瘤抗药性的方法4、建立一个全国性的癌症数据生态系统5、加强对于儿科癌症主要致病因素的研究6、尽量减少癌症疗法使机体衰弱的副作用7、扩大使用已被批准的癌症预防和早期诊断方法8、通过挖掘过去的患者数据以预测未来患者的疗效9、开发肿瘤三维图谱10、开发新的癌症相关检测技术大数据时代人的智力受到巨大挑战!Seeofweb-textdataHypothesis/knowledgeGoogleSeeofbiologicaldataHypothesis/knowledge???SeeofBio-medicaldataClinicalpathway/consultingreportOutline•ConceptandBackground•Drivenbygenomicstechnology•Insightintobiomedicalbigdata•Challengeandopportunity•Bioinofrmaticsisakey新一代基因组技术的发展和应用TheNextGenerationSequencingMachineIllumina/Solexa/HiSeq2500GeneticAnalyzer800Gb/runAppliedBiosystemsABI3730XL1Mb/dayAppliedBiosystemsIonProton12Gb/runRoche/454GenomeSequencerFLX1000Mb/runPacificBio™SingleMoleculeSequencer3.5Gb/runHiSeqXTen由10台HiSeqX测序仪组成,是定位为“测序工厂”模式的系统,适合运行于大型基因组测序中心,为各类生命科学和生物医学研究提供海量、高效率的测序服务。该测序仪每台每次运行仅需要3天时间,即可产出高达1.8Tb的数据,数据产出效率为现主流测序仪HiSeq2000的12倍。整套系统每年可完成18,000人全基因组测序IlluminaNovaSeq6000测序仪100$可实现一个人的全基因组测序在2017年1月10号的摩根大通医疗健康年会上Illumina公布了2016年的市场表现和进入百美元基因组测序时代的最新测序仪NovaSeq。其中NovaSeq6000型号的测序仪满负荷40小时内可以产出6TB的测序数据,即可实现200个人的样本的全基因组测序。每年可完成43800个人的全基因组测序,测序能力是HiSeqXTen的单台机器的将近2.5倍。测序价格也许很快降到HiSeqXTen的价格的十分之一左右。NovaSeq6000系统新一代测序技术可以干什么?•目标序列捕获测序技术(TargetedResequencing)•循环肿瘤DNA/细胞测序(ctDNA/ctcDNA)•免疫组库测序(IR-SEQ)•单细胞转录因子结合位点测序(scATAC-seq)•大规模单细胞转录组测序(Drop-seq)•……IBM与Illumina合作将基因组数据解释智能化•2017年1月9日——IBMWatson健康和Illumina公司宣布达成合作意向,将整合基因组学智能计算平台WatsonforGenomics与Illumina的BaseSpaceSequenceHub(Illuminacloud-basedgenomicscomputingenvironmentfornext-generationsequencing(NGS)datamanagementandanalysis)以及肿瘤测序流程来扩展对基因组数据的解释。希望能够促进简化基因组数据解释的流程并将其标准化。•WatsonforGenomics嵌入Illumina的新一代测序平台以后,使用Illumina癌症基因组测序panel的研究人员将会迅速获得基因变异相关的功能和临床意义信息,这有助于解释由TruSightTumor170(170个基因的实体瘤基因检测panel)生成的一系列变异数据。•WatsonforGenomics可在短短几分钟内读取TruSightTumor170生成的基因突变数据,同时对大量专业指南、医学印刷品、临床试验手册以及其他知识来源进行梳理,然后提供每个基因组变异的相关信息,并生成一份可供研究人员使用的报告——这一过程通常会花费一周以上的时间才能够完成。WatsonforGenomics每个月可以解读大约10000篇左右科学论文以及100项新临床试验数据。Philips与Illumina合作将基因组数据解释临床化•此次合作旨在结合Illumina世界级的DNA测序技术、BaseSpaceSequenceHub和飞利浦基于云端的创新基因组学平台,获取、分析并解释癌症研究中的基因组学数据,并将基因组学连接到日常的医疗保健中,此过程将会整合患者数据,嵌入到临床路径中,并由实效证据和医疗补偿模式所支持。•整合Illumina用于大规模分析遗传变异与功能的测序系统和飞利浦的IntelliSpaceGenomics临床信息学平台,飞利浦将与Illumina合作开发全新的解决方案,旨在从肿瘤学病例中获得、分析、注释与解释基因组学数据。这些数据将会从与仪器相连的IlluminaBaseSpace®SequenceHub中获得,然后通过飞利浦针对肿瘤学的IntelliSpaceGenomics系统进行处理。•这样一个解决方案会从包括放射学、免疫组织化学、数字病理学、医疗记录以及实验室检测等多个渠道整合数据,然后在一个控制面板视图中显示出来。这个系统让研究人员更加高效地获取有价值信息,最终降低医疗成本,改善治疗效果。IntelliSpaceGenomics&BaseSpace®SequenceHubIntelliSpaceGenomics是一个飞利浦数字健康平台驱动的生态系统,安全、基于云端技术,包括系统、临床应用以及数字化工具,具有大数据管理、预测分析、人工智能和物联网(IoT)功能,帮助临床医生在第一时间作出正确的决定。上述功能让飞利浦IntelliSpaceGenomics能够随时随地为医生和专家提供关于治疗方案的可行信息。BaseSpace®SequenceHub是一个基于云端的平台,延伸了Illumina仪器获取并分析基因组数据的功能,能够管理测序运行和Illumina测序平台并优化操作体验。一系列超值的Illumina与生态系统分析应用都可以在该平台上共享基因组数据。人类基因组计划和第一代测序技术,投入30多亿美元,15年间直接和间接产生经济效益高达投入的146倍,达到5000亿美元以上!Outline•ConceptandBackground•Drivenbygenomicstechnology•Insightintobiomedicalbigdata•Challengeandopportunity•BioinofrmaticsisakeyBigBiologicalDataPersonalizedgeneticbackground•3billionsgenomicDNAbasepairs,22kgenes,300,000proteins,•Personalizedgenomicdifference:6millionsbases“Theoretically,106scalemayisagoodpopulationsamplesizefordetectingcertainphonotyperelatedge