第二组--第二代测序技术的原理及应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二代测序技术的原理及其应用第二组一、第二代测序技术的简介DNA测序(DNAsequencing)作为一种重要的实验技术,在生物学研究中有着广泛的应用。早在DNA双螺旋结构(WatsonandCrick,1953)被发现后不久就有人报道过DNA测序技术,但是当时的操作流程复杂,没能形成规模。随后在1977年Sanger发明了具有里程碑意义的末端终止测序法,同年A.M.Maxam和W.Gilbert发明了化学降解法。Sanger法因为既简便又快速,并经过后续的不断改良,成为了迄今为止DNA测序的主流。然而随着科学的发展,传统的Sanger测序已经不能完全满足研究的需要,对模式生物进行基因组重测序以及对一些非模式生物的基因组测序,都需要费用更低、通量更高、速度更快的测序技术,第二代测序技术(Next-generationsequencing)应运而生。第二代测序技术的核心思想是边合成边测序(SequencingbySynthesis),即通过捕捉新合成的末端的标记来确定DNA的序列,现有的技术平台主要包括Roche(罗氏公司)/454FLX、Illuminate公司/SolexaGenomeAnalyzer和(ABI公司)AppliedBiosystemsSOLIDsystem。这三个技术平台各有优点,454FLX的测序片段比较长,高质量的读长(read)能达到400bp;Solexa测序性价比最高,不仅机器的售价比其他两种低,而且运行成本也低,在数据量相同的情况下,成本只有454测序的1/10;SOLID测序的准确度高,原始碱基数据的准确度大于99.94%,而在15X覆盖率时的准确度可以达到99.999%,是目前第二代测序技术中准确度最高的。虽然第二代测序技术的工作一般都由专业的商业公司来完成,但是了解测序原理、操作流程等会对后续的数据分析有很重要的作用,下文将以Illumina/SolexaGenomeAnalyzer测序为例,简述第二代测序技术的基本原理、操作流程等方面。二、第二代测序技术的原理Illumina/SolexaGenomeAnalyzer测序的基本原理是边合成变测序。在Sanger等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的dNTP,当DNA聚合酶合成互补链时,每添加一种dNTP就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测DNA的序列信息。三、第二代测序技术的操作流程1)测序文库的构建(LibraryConstruction)首先准备基因组DNA(虽然测序公司要求样品量要达到200ng,但是GnomeAnalyzer系统所需的样品量可低至100ng,能应用在很多样品有限的实验中),然后将DNA随机片段化成几百碱基或更短的小片段,并在两头加上特定的接头(Adaptor)。如果是转录组测序,则文库的构建要相对麻烦些,RNA片段化之后需反转成cDNA,然后加上接头,或者先将RNA反转成cDNA,然后再片段化并加上接头。片段的大小(Insertsize)对于后面的数据分析有影响,可根据需要来选择。对于基因组测序来说,通常会选择几种不同的insertsize,以便在组装(Assembly)的时候获得更多的信息。2)锚定桥接(SurfaceAttachmentandBridgeAmplification)Solexa测序的反应在叫做flowcell的玻璃管中进行,flowcell又被细分成8个Lane,每个Lane的内表面有无数的被固定的单链接头。上述步骤得到的带接头的DNA片段变性成单链后与测序通道上的接头引物结合形成桥状结构,以供后续的预扩增使用。3)预扩增(DenaturationandCompleteAmplification)添加未标记的dNTP和普通Taq酶进行固相桥式PCR扩增,单链桥型待测片段被扩增成为双链桥型片段。通过变性,释放出互补的单链,锚定到附近的固相表面。通过不断循环,将会在Flowcell的固相表面上获得上百万条成簇分布的双链待测片段。4)单碱基延伸测序(SingleBaseExtensionandSequencing)在测序的flowcell中加入四种荧光标记的dNTP、DNA聚合酶以及接头引物进行扩增,在每一个测序簇延伸互补链时,每加入一个被荧光标记的dNTP就能释放出相对应的荧光,测序仪通过捕获荧光信号,并通过计算机软件将光信号转化为测序峰,从而获得待测片段的序列信息。从荧光信号获取待测片段的序列信息的过程叫做BaseCalling,Illumina公司BaseCalling所用的软件是Illumina’sGenomeAnalyzerSequencingControlSoftwareandPipelineAnalysisSoftware。读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割。随着读长的增加,错误率也会随之上升。5)数据分析(DataAnalyzing)这一步严格来讲不能算作测序操作流程的一部分,但是只有通过这一步前面的工作才显得有意义。测序得到的原始数据是长度只有几十个碱基的序列,要通过生物信息学工具将这些短的序列组装成长的Contigs甚至是整个基因组的框架,或者把这些序列比对到已有的基因组或者相近物种基因组序列上,并进一步分析得到有生物学意义的结果。四、第二代测序技术的应用(1)、基因组从头测序及重测序从头测序也叫denovosequencing主要应用于基因组序列未知的物种,DNA片段测序后,用生物信息学软件对序列进行拼接、组装,从而获得该物种的基因组序列图谱。重测序是指该物种基因组序列已被测序,有参考基因组序列的测序工作。由于第2代测序技术测序读长较短,完成基因组的从头测序一般需要第一代测序技术的辅助,但是可以完成简单生物的基因组从头测序及所有生物的基因组重测序。在第二代测序技术的推动下,大量生物的全基因组被顺利测序,大量物种的基因组计划完成。(2)、RNA测序(RNA—sequencing)mRNA是基因与蛋白质之间信息传递的桥梁,具有重要的调控作用。将全部mRNA提取出来,逆转录生成cDNA,用高通量技术进行测序的统称为RNA测序。测序有2种策略,一种将mRNA先反转录成cDNA再打断成片段后测序,另外一种将RNA片段化后再反转录。2008年,Nagalakshmi和Wihelm几乎同时分别在《Science》和《Nature》发表了利用RNA测序技术研究转录组的论文,标志着RNA测序技术的建立[22_23。。在制备测序文库的过程中,如果只抽取带有P01y(A)的RNA称之为转录组测序,如果抽提所有RNA则为全部转录本,如果将带有P01y(A)的RNA过滤掉则为非编码RNA转录本,如果只抽取21~23个,bp的RNA则为miRNA测序口“。对于传统的研究基因表达的方法,RNA测序技术有很多优势,如:灵敏度高、数字信号、无需事先知道基因组信息等。目前,转录组测序已经取代基因芯片成为从整个基因组层次研究基因表达的主流方法。RNA测序的研究内容主要有:转录本结构的研究(起始密码子鉴定、内含子边界确定、UTR确定、可变剪切等),表达量研究,SNP(单核苷酸多态性)位点研究,新转录本检测,非编码区功能研究(小RNA、非编码RNA的研究)口6_271等。随着RNA测序技术迅速发展,RNA测序技术在转录组学的研究中得到了广泛应用,得到高度好评。但是像其他新生技术一样,RNA测序技术也面临一些挑战,比如RNA产生的海量数据的生物信息学处理,获得高质量转录图谱最佳测序量的确定等。(3)、smallRNA测序小RNA测序技术采用胶分离技术,收集样品中18-30nt的RNA片段,利用高通量测序技术,一次性获得单碱基分辨率的数百万条小RNA序列信息,依托强大的生物信息分析平台,鉴定已知小RNA,并预测新的小RNA及其靶标基因。基于IlluminaHiSeqTM2000高通量测序技术的小RNA数字化分析,采用边合成边测序的方法,可减少二级结构造成的区域缺失。该技术可以对高质量序列进行序列长度分布的统计及样品间公共序列统计,将筛选后的高质量序列分类注释,从而获得样品中包含的各组分及表达量信息,并对所有小RNA片段进行注释,对新的miRNA则进行靶基因预测。(4)、染色体免疫共沉淀-测序(5)、DNA甲基化DNA的甲基化主要形成5-甲基胞嘧啶和少量的N6-甲基腺嘌呤及7-甲基鸟嘌呤。在高等生物中,5-甲基胞嘧啶多发于CpG二核苷酸序列中,基因组中60%-90%的CpG是甲基化的。在甲基转移酶(DNMT)的催化作用下,利用S-腺苷甲硫氨酸(SAM)提供的甲基,使CpG二核苷酸序列中的胞嘧啶转变为5-甲基胞嘧啶。由于甲基化胞嘧啶极易在进化中丢失,高等真核生物中CpG序列远远低于其理论值,但在基因组的某些区域中,通常是基因的启动子和第一外显子区,CpG序列密度很高,可以达均值的5倍以上,成为鸟嘌呤和胞嘧啶的富集区,形成所谓的CpG岛。哺乳类基因组中约存在4万个CpG岛,大多位于转录单元的5’区。CpG岛的高甲基化是肿瘤中存在的普遍现象,而启动子CpG岛的高甲基化是除突变和缺失外肿瘤中抑癌基因失活的第三种机制。因此,基因启动子甲基化检测在临床诊断、药物敏感性检测等方面具有很高的应用价值。

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功