SamplepreparationClusterstationSequencingDataanalysis测序样品的预处理用CS对样品进行扩增对成簇后的样品测序数据处理和拼接•GA与Solexa2006年11月1日,illumina收购Solexa•GA:GAⅠ、GAⅡ、GAⅡⅩGA升级频繁•1G→35G→50GGA最早被为1Ganalyzer,寓意其数据产量为1G。Solexa是一种基于边合成边测序技术(Sequencing-By-Synthesis,SBS)的新型测序方法。通过利用单分子阵列实现在小型芯片(FlowCell)上进行桥式PCR反应。由于新的可逆阻断技术可以实现每次只合成一个碱基,并标记荧光基团,再利用相应的激光激发荧光基团,捕获激发光,从而读取碱基信息。CTAGCTA5’-3’-…-5’GT合成第一个碱基Cycle1:按顺序加入反应试剂清除未反应的碱基和试剂激发碱基荧光并收集荧光信号去除阻断基团和荧光基团Cycle2-n:重复前面的步骤GTCTAGTCTGCTAGACS负责将待测样品“种植”于检测芯片(FlowCell)中并进行扩增。GA负责对芯片内的基因片段进行边合成边测序反应(SBS),收集碱基信息。新旧flowcell的对比:1、进液孔的位置不变,新flowcell的管道直径增大至1.4mm2、制造材质也有所不同进样孔出样孔Single-ReadSequencing单向测序Paired-EndSequencing双向测序IndexedSequencing混合样品测序3.1Single-ReadSequencingSingle-ReadSequencing(SR,单向测序)指只检测基因片段一端的序列信息。接头接头互补接头基因序列将被打断成几百个碱基(或更短),并在两个末端加上接头(adapter)的基因片段按一定浓度进行稀释。将基因片段固定在芯片(FlowCell)上。由于芯片表面连接有一层单链引物(Primer),经处理后的碱基片段与芯片上的引物进行互补连接,被“固定”在芯片上。引物扩增,以样品为亲本链,使芯片引物延长形成复制链。OHFlowCell接头diolP7P5dioldiol模板杂交dioldiol延长dioldiol变性剩下的复制链其一端“固定”在芯片上,另外一端随机和附近的另外一个引物互补,被“固定”住,形成“桥”(bridge)。形成的单链桥,以周围的引物为扩增引物,在芯片表面进行扩增,形成双链。双链经变性成单链,再次形成桥,并作为下一轮扩增的模板继续扩增反应。反复若干轮扩增,每个单分子得到了大量扩增,成为单克隆“DNA簇群”。dioldiol1stcycle变性1stcycle退火dioldiol1stcycle延长dioldioldioldiol2ndcycle变性2ndcycle退火dioldioldioldioldioldiol2ndcycle延长n=35总数线性化OH用ddNTP()阻断Cluster扩增完成OHdioldiolOHPrimer加测序引物OH“DNA簇”在GenomeAnalyzer综合分析仪上进行序列分析。通过SBS法,进行一次反应合成一个碱基,读取一个数据。通过拍照的方法进行捕获数据。每反应一次拍照四次(A、C、G、T各一次)。对取得的序列片段进行处理和拼接。YX123789456TTTTTTTGT…TGCTACGAT…3.2Paired-EndSequencingPaired-EndSequencing(PE,双向测序)是指检测基因片段的两端序列信息。SingleReadPairedEndTemplateHybridization模板杂交UUOHOHGraftedflowcell芯片上的接头UP7P5Initialextension第一链的延长UUDenaturation变性UU1stcycledenaturation变性n=25totalUU1stcycleannealing退火UU1stcycleextension延长UU2ndcycledenaturation再变性UU2ndcycleannealing退火UUU2ndcycleextension延长UUUClusterAmplification扩增后的簇UUP5Linearization(USER)线性化BlockwithddNTPs阻断Primer加测序引物SBS进行测序SequencingFirstRead第一端测序DenaturationandDe-Phosphorylation(PNK)变性与去磷酸化OHOHResynthesisofP5Strand合成OHP7Linearization(fpg)线性化OHBlockwithddNTPs阻断Primer加测序引物SequencingSecondRead第二端测序IndexedSequencing是指将多种样品混合后进行测序的技术。这是为了充分利用solexa高通量的特点,有助于降低成本。3.3IndexedSequencing读长时间(天)密度产量(GB)准确率1x36bp~2.5138-168million4.5-6≥99%2x36bp~5138-168million9.5-11.5≥99%2x45bp~6.5138-168million13.5-16.5>98.5%2x76bp~9.5138-168million20.5-25≥98.5%5.Solexa上机操作CS稀释样品→CS扩增→添加测序引物→送往GA测序GA检查GA→安装FC→FirstBase评估→开始测序稀释样品用于CS上机的样品首先经过QPCR检测浓度后根据任务单上机密度的要求对样品进行稀释。这分为新库和旧库两种情况:新库会根据以往类似样品的经验大概设定一个浓度;旧库即是根据已经上机后的数据计算出相应的浓度。CS扩增这一步开始正式在ClusterStation机器上进行操作,具体可以分为三个阶段:Hybridization&AmplificationLinearization&BlockingSequencingPrimerHybridizationHybridization&Amplification将稀释好的样品加入Flowcell中,使用样品不FC上的接头互补结合,使样品固定于FC中。经桥式PCR反应后使单分子成簇。Linearization&Blocking对桥式PCR后的双链进行变性解链,并使用ddNTP对剩下单链的未端进行阻断。SequencingPrimerHybridization添加特定的测序引物,结束后可送往GenomeAnalyzer进行测序检查GA在开始下一个RUN的测序工作前,首先会对GA进行清洗和检查。包括清洗管道系统、排液测量、激光的状态……安装FlowCell确认GA机器正常后,将经CS制备好的FC安放进GA内。这一步是GA工作比较烦琐的一步,包括梯形棱镜的拭擦清理、FC的拭擦清理和添加浸镜油这三步。为了丌对测序产生影响,棱镜不FC要非常干净,丌得有一点尘屑;而添加浸镜油时更丌能让油沾到FC上。FirstBase评估在正式进行测序前会先进行一个firstbase测序测试,以便对这个RUN有一个初步的了解。通过firstBase可以了解到样品的密度、亮度、均匀度等信息,以此来推测这个RUN的情况。Q&AQ:实验中有什么特别要注意的地方A:定量准确管道通畅棱镜和FC擦拭干净加浸镜油平稳调焦精准Q&AQ:如何判断一个RUN是否成功A:密度亮度错误率GC含量……