Solexa-测序技术原理介绍-20120715

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

测序技术原理及流程北京百迈客生物科技有限公司WhySequencing?•认识DNA序列•从根源上寻找导致蛋白功能差别的位点•为物种鉴定、临床诊断和司法鉴定提供基础•疾病预测•研究基因间的相互作用•揭示物种进化的历程•生命之树一代测序二代测序DNA测序需要解决的基本问题•如何读到DNA片段的碱基信号?–通过扩增来增加DNA的数量来放大信号–有足够多的DNA合成反应中止于同一个碱基•如何读到DNA片段的连续碱基信号?–让合成反应的中止依次出现在每个碱基上•如何读到一批DNA片段的连续碱基信号?–在不同模板的反应间建立有效的隔离方式Contents•Sanger测序技术原理•Solexa(IlluminaGA/HiSeq)测序技术原理•454测序技术原理•SOLiD测序技术原理•四种测序方法比较thefirst-generationsequencingtechnologySanger法测序原理Sanger测序技术PCR末端终止技术+电泳检测技术单个片段序列测定最高通量:小于4MB/天基于平板胶的测序技术96通道毛细管阵列双脱氧终止法测序反应原理•原理:–原料:DNA聚合酶、DNA模板、单链寡核苷酸引物、4种dNTP及4种ddNTP的测序反应体系脱氧核苷酸和双脱氧核苷酸双脱氧终止法测序反应原理•测序过程:–DNA聚合酶在模板链指导下,不断地逐个将dNTP加到引物的3’-OH末端,使引物延伸,合成出新的与模板互补的DNA链。–在链的延长过程中一旦加入双脱氧核苷三磷酸(ddNTP),由于其双脱氧核糖的3’位置缺少一个羟基,不能同后续的dNTP形成磷酸二酯键,链终止延伸。形成一系列具有相同5’-引物端和以ddNTP残基为3’端结尾的长短不一的片段的混合物,通过毛细管电泳,并经过分析从而获得模板DNA的核苷酸序列。Sanger法的特点•原始输出是峰图文件,可以看出信号的细微变化•通量小•单个目标序列的处理灵活性强•系统稳定,操作简便•单个测序长度长,能达到上K•反应单元是一个充满溶液的容器(96孔板或384孔板的一个孔),这是局限了通量的根本Next-generationsequencingtechnologySolexa测序原理及流程介绍solexa测序技术原理Solexa是一种基于边合成边测序技术(Sequencing-By-Synthesis,SBS)的新型测序方法。通过利用单分子阵列实现在小型芯片(FlowCell)上进行PCR反应。新的可逆阻断技术可以实现每次只合成一个碱基,并标记荧光基团,再利用相应的激光激发荧光基团,捕获激发光,从而读取碱基信息。DNA(0.1-1.0ug)SinglemoleculearraySolexaSequencingTechnologySamplepreparationClustergrowth5’5’3’GTCAGTCAGTCACAGTCATCACCTAGCGTAGT123789456ImageacquisitionBasecallingTGCTACGAT…SequencingSingle-ReadSequencing单向测序Paired-EndSequencing双向测序solexa测序策略Single-ReadSequencingSingle-ReadSequencing(SR,单向测序)指只检测基因片段一端的序列信息。接头接头互补接头基因序列OHFlowCell接头diolP7P5dioldiol模板杂交dioldiol延长dioldiol变性序列片段杂交dioldiol1stcycle变性1stcycle退火dioldiol1stcycle延长dioldioldioldiol2ndcycle变性2ndcycle退火dioldioldioldioldioldiol2ndcycle延长n=35总数扩增线性化OH用ddNTP()阻断Cluster扩增完成OHdioldiolOHPrimer加测序引物OHCluster过程结束Paired-EndSequencingPaired-EndSequencing(PE,双向测序)是指检测基因片段的两端序列信息。SingleReadPairedEndFlocell接头SEvsPETemplateHybridization模板杂交UUOHOHGraftedflowcell芯片上的接头UP7P5Initialextension第一链的延长UUDenaturation变性UU片段杂交1stcycledenaturation变性n=25totalUU1stcycleannealing退火UU1stcycleextension延长UU2ndcycledenaturation再变性UU2ndcycleannealing退火UUU2ndcycleextension延长UUU扩增成簇ClusterAmplification扩增后的簇UUP5Linearization(USER)线性化BlockwithddNTPs阻断Primer加测序引物Cluster过程结束SBS进行测序SequencingFirstRead第一端测序DenaturationandDe-Phosphorylation(PNK)变性与去磷酸化OHOHResynthesisofP5Strand合成OHP7Linearization(fpg)线性化OHBlockwithddNTPs阻断Primer加测序引物SequencingSecondRead第二端测序双向测序示意图芯片(Flowcell)Solexa如何实现高通量?•桥式PCR–突破用一个容器来容纳一个反应体系的传统做法——把模板DNA“种”在一块板上,像养竹子一样在周围扩增(桥式PCR)•改变反应控制方式:–放弃了跑电泳分辨荧光的方法–只能采取边合成边检测信号的方法–需要一种可控的方式阻断合成反应–每次只反应一个碱基–从空间的控制变为进程控制反应单位:clusterDNA链合成反应的控制Illumina/GAWorkflowSolexa的特点•通量大且可扩展–只要能够让cluster在可区分的情况下长得密集就能增加通量•成本低•序列短–信噪比会随着冲洗次数增加而降低•灵活性差,对小数据量测序不适用•Image•Intensity/Noise/Signal2•Fastqsolexa测序数据actgImageprocessingBasecallingX,YACGTCycle1Cycle2PositionACGTX,YSequence一些中间结果Fastq•“@”为序列的起始符,1和3行为测序信息;2和4行为序列和质量值•“#ATCACG”为index信息,用于在一个lane内区分样品•“/1”为测序方向的标注,如果测序为双向,那么在1.fq和2.fq里的reads标注分别为“/1”和“/2”•第四行的质量值是字母对应的ASCII码减64。通常质量值最低为“B”,对应2;最高为“h”,对应40@HWI-EAS209_0006_FC706VJ:5:58:5894:21141#ATCACG/1TTAATTGGTAAATAAATCTCCTAATAGCTTAGATNTTACCTTTAGTTTCTTGAGGAGACATT+HWI-EAS209_0006_FC706VJ:5:58:5894:21141#ATCACG/1hhhhhhhhffeefffcffffffddf`feed]`]_Ba_^__[YRTT\]][]dddd^BBBBBBBQualityscore•AqualityvalueQisanintegermappingofp(i.e.,theprobabilitythatthecorrespondingbasecallisincorrect).Twodifferentequationshavebeeninuse.ThefirstisthestandardSangervarianttoassessreliabilityofabasecall,otherwiseknownasPhredqualityscore:•TheSolexapipeline(i.e.,thesoftwaredeliveredwiththeIlluminaGenomeAnalyzer)earlierusedadifferentmapping,encodingtheoddsp/(1-p)insteadoftheprobabilityp:•Althoughbothmappingsareasymptoticallyidenticalathigherqualityvalues,theydifferatlowerqualitylevels(i.e.,approximatelyp0.05,orequivalently,Q13).EmulsionPCR454GSFLX测序原理及流程介绍454测序454GSFLX测序流程454GSFLX测序仪454的特点•“一代半”测序–没有摆脱容器反应,只是把容器做小了,不能在质上不断提高通量•较高的通量•序列长,但是长度需要根据序列的结构而定•对于碱基有偏好性的DNA,结果容易出现indel错误SOLID测序原理及流程介绍n=degeneratebasesz=universalbasesSOLiD的特点•通量大•成本低•序列短–Ligase的方式虽然能一定程度避免phasing/pre-phasing,但增加的复杂度也降低了效率•灵活性差,对小数据量测序不适用•Two-basecoding四种测序方法的比较方法模板隔离方式反应中止方式序列特征数据量测序序列长质量高PE易实现小测序序列短质量中高PE易实现大测序序列中等易出插入缺失PE难实现中等测序序列短质量中高PE难实现大Thanks!

1 / 70
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功