NextGenerationSequencing(NGS)技术简介Sanger测序Sanger测序法仍然为基因测序行业内的金标准,但鸟枪测序法在技术上存在瓶颈。(价格昂贵、步骤繁琐、效率低)NGS=NextGenerationSequencingNGS也称为高通量测序High-throughputSequencing(HTS)第一代测序:SangerSequencing(Sanger测序)第二代测序:NGS=MassivelyParallelSequencing(大规模平行测序)第三代测序:NGS=HTS,SingleMoleculeSequencing(高通量、单分子测序)目前NGS的主要三种测序仪器三种测序仪在高通量水平、测序准确度、存储格式和技术方法上均有差异。罗氏/454基因组测序仪FLX系统焦磷酸测序法光学230-400在第二代中最高读长;比第一代的测序通量大样品制备较难;难于处理重复和同种碱基多聚区域;试剂冲洗带来错误累积;仪器昂贵illuminaHiSeq2000/miSeq可逆链终止物和合成测序法荧光/光学2x150很高测序通量仪器昂贵;用于数据删节和分析的费用很高ABI/SOLiD5500xlSOLiD系统连接测序法荧光/光学25-35很高测序通量;在广为接受的几种第二代平台中,所要拼接出人类基因组的试剂成本最低测序运行时间长;读长短,造成成本高,数据分析困难和基因组拼接困难;仪器昂贵公司平台名称测序方法检测方法大约读长(碱基数)优点相对局限性三大测序平台的技术特点和差异Roche454测序原理Roche454焦磷酸测序原理Roche454测序步骤样品处理主要是针对大片段的DNA分子,如基因组DNA、Fosmid或BAC质粒等,利用超声或氮气打断将这些DNA分子片段化,然后采用琼脂糖凝胶电泳回收或磁珠纯化,选择500-800bp的DNA片段。对于非编码RNA或PCR产物,则不需要这一步骤。一、样品处理Roche454测序步骤二、文库制备文库制备包括接头连接和磁珠纯化两步,454的文库接头分A、B两种,各44bp,由20bp的PCR引物、20bp的测序引物及4bp(TCAG)的“key”碱基构成,其中B接头的5’端带有生物素(Biotin)标记,用于磁珠纯化步骤。Roche454测序步骤三、连接微珠将富集到的文库与测序磁珠、各反应物混合,加入特定的矿物油和表面活性剂,再利用振荡器剧烈振荡,使反应体系形成油包水(water-in-oil)的稳定乳浊液。在理想条件下,每一个液滴,或称微反应器(microreactor)中将只包含一个磁珠和一条单链DNA,通过控制条件,1mL乳液中可以形成至少10的6次方个理想的微反应器。Roche454测序步骤四、emRCRPCR扩增后,每一个磁珠上将形成密集的DNA簇,这些DNA序列完全相同,即可用于后续的步骤。乳液PCR(emRCR)Roche454测序步骤五、反应板准备、上机测序454测序的反应板称为PTP(PicoTiterPlate),含有350万个由光纤组成的小孔,每个孔的直径为29μm,而测序磁珠的直径为20μm,因此每个孔中仅能容纳一个磁珠。Roche454测序步骤六、测序和分析将磁珠与测序试剂加入PTP中,使之可用于上机测序。在454测序仪中,A、T、G、C四种碱基是分别存储在单独的试剂瓶中的,每步反应四种碱基依次加入反应池,当碱基配对结合,就会释放出一个焦磷酸(PPi),而这个焦磷酸在酶的作用下,将荧光素氧化成氧化荧光素,并发出光信号,从而读取出这一位置的碱基信息。Illumina测序原理Illumina合成测序原理Illumina测序流程桥式PCR合成法测序数据读取ABISOLiD测序原理ABISOLiD连接测序原理ABISOLiD测序流程制备DNA文库乳液PCR/微珠富集连接酶测序:SOLiD连接反应的底物是8碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链DNA模板链配对。这样经过五轮测序反应后便可以得到所有的碱基序列SOLID的双碱基编码矩阵ABISOLiD连接测序原理探针的5′末端标记了1种颜色的荧光染料。探针3′端1~5位为随机碱基,其中第1、2位构成的碱基对表征探针染料类型,而3~5位的“n”为随机碱基,6~8位的“z”是可以和任何碱基配对的特殊碱基。SOLiD测序反应的每一轮测序反应会连接第1~5位的碱基,同时切除第6~8位的碱基,同时记录下第1~2位碱基决定的荧光颜色。ABISOLiD连接测序原理ABISOLiD连接测序原理两个碱基共同决定一个颜色,可以极大的提高测序的准确率。ABISOLiD连接测序原理五轮测序反应反应后,按照第0、1位,第1、2位...…的顺序把对应于模板序列的颜色信息连起来,就得到由“0,1,2,3…”组成的SOLiD原始颜色序列。454平台的突出优势是读长。目前454系统的序列读长已超过400bp。虽然454平台的测序成本比其他平台要高很多,不过对于那些需要长读长的应用,如从头拼接和环境微生物组学,它仍是最理想的选择。各个测序平台的特点总结Roche454Illumina1.可扩展的超高通量GenomeAnalyzer系统目前每次运行后可获得超过20GB的高品质过滤数据。经优化后通量还有望上升到95GB,相当于人类基因组的30倍覆盖度。2.需要样品量少GenomeAnalyzer系统需要的样品量低至100ng,能应用在很多样品有限的实验(比如免疫沉淀、显微切割等)中。3.简单、快速、自动化GenomeAnalyzer系统提供了最简单和简洁的工作流程。制备样品文库可以在几小时内完成,一个星期内就能得到高精确度的数据。自动化的流程不减少了手工操作误差和污染可能性,也不需要机器人操作或洁净室。1.无以伦比的通量目前SOLiD3系统单次运行能产生50GB的人基因组序列数据,相当于基因组的17倍覆盖度,这显然是其他任一台新一代测序系统都无法达到的2.准确性。新的超精确检测模块(ECC模块)将提供高达99.99%的精确性;多达98%的可定位碱基的质量值高于45;更多标签以提高灵敏度和动态范围;高准确性的原始读序,支持无参考序列的数据分析。各个测序平台的特点总结ABISOLiD公司平台名称测序方法检测方法大约读长(碱基数)优点相对局限性太平洋生物科学公司(PacBio)PacBioRS实时单分子DNA测序荧光/光学~1000高平均读长,比第一代的测序时间降低;不需要扩增;最长单个读长接近3000碱基并不能高效地将DNA聚合酶加到测序阵列中;准确性一次性达标的机会低(81-83%);DNA聚合酶在阵列中降解;总体上每个碱基测序成本高(仪器昂贵);CompleteGenomicsGeXP遗传分析系统复合探针锚杂交和连接技术荧光/光学10在第三代中通量最高;在所有测序技术中,用于拼接一个人基因组的试剂成本最低;每个测序步骤独立,使错误的累积变得最低低读长;模板制备妨碍长重复序列区域测序;样品制备费事;尚无商业化供应的仪器IonTorrent/LifeTechnology个人基因组测序仪(PGM)合成测序法以离子敏感场效应晶体管检测pH值变化100-200对核酸碱基的掺入可直接测定;在自然条件下进行DNA合成(不需要使用修饰过的碱基)一步步的洗脱过程可导致错误累积;阅读高重复和同种多聚序列时有潜在困难;第三代测序平台的比较差异太平洋生物科学公司(PacBio’s)实时单分子测序方案示意图。A.单个零点启动模式波导纳米结构的侧面图,每个纳米结构含一个DNA聚合酶分子,固定于底部的玻璃面上。波导纳米结构和共焦成像系统确保只对底部进行荧光检测。B.显示了荧光标记的核苷酸底物掺入测序模板的过程。相应的瞬时荧光探测分为5个步骤。太平洋生物科学公司LifeTechnology公司IonTorrent半导体测序芯片技术图示。A.该芯片结构设计的逐层显示图。上层为单个的DNA聚合反应的微池,底部两层构成场效应晶体管离子传感器。每个微池有其相对应的场效应晶体管探头,以鉴别每一个pH值的变化。B.侧面图:微池中,DNA聚合酶将两个重复的TTP核苷酸掺入测序片段中。反应过程中释放出的氢离子被下方的场效应晶体管检测到。CompleteGenomics公司CompleteGenomics公司的DNB阵列生产和cPAL技术的方案示意图。A.待测片段的设计,DNA纳米球的合成,用来放置纳米球规则排列的纳米阵列---这些可以显示DNA纳米球阵列的形成过程;B.图示:用对应于一个独特接头位点的5个碱基的一组普通探针进行测序过程。图中也显示了标准锚定序列和延伸锚定序列。