RNA测序技术原理及应用遗传的中心法则基因组—转录组—表观遗传组—蛋白组层次什么是转录组?AlltranscriptsAllmRNAsRNA是解读基因组的关键RNAProteinPhenotypeGenotypeDNA测序技术RNA-SeqSmallRNA测序降解组测序Non-codingRNA测序研究对象mRNASmallRNAmRNANon-codingRNA鉴定新分子OOOO表达谱研究OOOO基因结构分析O/XXXOEST测序O/XXXX筛选分子标记OOOX转录融合基因表达O/XXXXRNA测序技术TotalRNAEukaryonProcaryonRemoverRNAEnrichmRNAbyOligoTRNAfragmentationRandomhexamerprimedcDNAsynthesisSizeselection,thenPCRamplificationHiSeq2000sequencingWorkflowofRNA-Seq样品检测文库制备ClusterStationIlluminaSequencing生物信息分析TotalRNA样品检测Agilent2200检测OD260/280:1.8~2.2RNA28S:18S≥1.0;RIN≥7新型安捷伦2200TapeStation系统是新一代测序(NGS)、生物微阵列芯片分析和qPCR工作流程以及蛋白质纯化和抗体生产过程中对生物样品进行质量控制(QC)的理想解决方案。●可扩展的通量—16联或96孔微量滴定板●快速得到结果—平均每个样品只需一分钟便可获得结果●使用简单—可直接使用的ScreenTape预制胶条简化了工作流程●样品用量少—每次运行仅需要不到2ul样品检测报告-合格样品棉铃虫/果蝇检测报告-不合格样品TotalRNAEukaryonProcaryonRemoverRNAEnrichmRNAbyOligoTRNAfragmentation(200bp)RandomhexamerprimedcDNAsynthesisSizeselection,thenPCRamplificationHiSeq2000sequencingWorkflowofRNA-Seq样品检测文库制备ClusterStationIlluminaSequencing生物信息分析真核mRNA的纯化mRNA的纯化主要通过的磁珠与生物素吸附原理从而分离纯化Oligo(dT)25磁珠纯化原理主要是mRNA的3′的polyA与磁珠在bindingbuffer的作用下相结合。磁珠通过MPC(磁分离器)从溶液中分离出来。mRNA与磁珠结合后,再用Tris-HCL在加热条件下解离洗脱到溶液中。链霉亲合素包被磁珠+生物素标记Oligo(dT)25+poly(A)原核mRNA的纯化AmbionMICROExpressKitLNA扣锁型探针mRNA反转录---fragment+RT纯化过的mRNA样品加入1µl的fragmentbuffer70℃作用1.5min。加入1µl的stopbuffer终止反应。加入沉淀剂(NaAc糖原无水乙醇)沉淀产物。RTdscDNA末端修复(防止自连)cDNA3′末端加AAdapter连接第一天消化DNAmRNA的分离mRNA的打断cDNA的合成↓↓第二天末端修复↓↓加接头胶回收3’端加A第三天PCRPCR胶回收↓↓文库制备↓↓文库质量检测:Aligent2100:片段大小、纯度、浓度qPCR:片段大小、浓度手工检测:跑胶验证。TotalRNAEukaryonProcaryonRemoverRNAEnrichmRNAbyOligoTRNAfragmentation(200bp)RandomhexamerprimedcDNAsynthesisSizeselection,thenPCRamplificationHiSeq2000sequencingWorkflowofRNA-Seq样品检测文库制备ClusterStationIlluminaSequencing生物信息分析ApplicationRNA-Seq(单端测序---Quantification)RNA-Seq(双端测序---Transcriptome)Expression-profiling√√AlternativeSplicing-√FusionGene-√SNPdetection-√HiSeq2500ApplicationsofRNA-Seq17RNA-Seq(Transcriptome)WorkflowofRNA-Seq(Transcriptome)TotalRNAEukaryonProcaryonRemoverRNAEnrichmRNAbyOligoTRNAfragmentation(200nt~700nt)RandomhexamerprimedcDNAsynthesisSizeselection,thenPCRamplificationHiSeq2000sequencing101PE生物信息学分析RNA-Seq(Transcriptome)CharacterizethetranscriptomeinunparalleleddetailTechnique220RNA-Seq(Denovotranscriptomeassembly)RNA-Seq(Transcriptomeresequencing)RNA-Seq(Denovotranscriptomeassembly)文库构建测序组装Denovoassembleatranscriptome组装流程数据产出统计及测序数据的成分和质量评估组装结果分析(Contig长度分布、Scaffold长度分布、Unigene长度分布)Unigene(transcript)功能注释Unigene的GO分类Unigene代谢通路分析预测编码蛋白框(CDS)Unigene表达差异分析(两个或两个以上样品)Unigene在样品间的差异GO分类(需两个或两个以上样品)和Pathway富集性分析Denovoassemblytranscriptome信息分析主要内容:Denovoassemblytranscriptome信息分析流程Unigenes的GO注释Pathway分析RNA-Seq(Transcriptomeresequencing)cDNA文库构建测序比对到参考序列Transcriptomeresequencing比对流程比对统计基因表达注释基因差异表达分析基因结构优化可变剪接分析预测新转录本cSNP分析Transcriptomeresequencing信息分析主要内容Transcriptomeresequencing信息分析流程应用---优化转录组注释信息基因结构优化可变剪接鉴定基因融合鉴定RNA水平SNP分析GenomicintergenicregionReadsclusterPairedReadsdistribution优化基因结构鉴定新的转录本Paired-End(PE)ReadsReads比对到参考序列基因间区域鉴定可变剪接(AlternativeSplicing)exon1exon2exon3exon1exon2exon3exon1exon3commonreadsjunctionreadsmRNA鉴定基因融合PairedReadsSingleReadsGeneAGeneB分析RNA水平SNP转录组重测序比对软件:SOAPDenovo转录组测序:组装软件:SoapDenovo比对软件:SoapSNP36转录组研究技术横向比较TechnologyTilingArraycDNAorESTsequesingTranscriptomeSequencingPrincipleHybridizationSangersequencingNext-GensequencingResolutionFromseveralto100SinglebaseSinglebaseThroughputHighLowHighRelianceongenomicsequenceYesNoInsomecasesBackgroundnoiseHighLowLowApplicationSimutaneouslymaptranscribedregionsandgeneexpressionYesLimitedforexpressionYesDynamicrangetoquantifygeneexpressionlevelUptoafew-hundredfoldNotpractical8,000-foldAbilitytodistinguishdifferentisoformsandallelicexpressionLimitedYesYes转录组测序的优势RNA测序与芯片检测基因数比较RNA测序与芯片检测基因的表达量分布Technique1GenomeRes2010Case实验材料收集:叶片,花序,果实,根时间点:0,4,8,12,16,20和24h将每个时间点采集的样品均匀混合测序策略:Illumina测序,1Gdata1.Highlight2.Heat3.Cold4.Salt5.Drought抗逆相关可变剪接外包膜蛋白16(AT2G28900)Intron-retentionControlLowTemperatureResistance低温胁迫相关的AS低温胁迫下这个内含子和对照相比被保留了下来,揭示了可变剪接有重要功能。AS调节机制CCA1生物钟相关基因,例如调节气孔的开关等RNA-Seq单端测序(Quantification)等同于数字表达谱(DGE)WorkflowofRNA-Seq单端测序(Quantification)TotalRNAEukaryonProcaryonRemoverRNAEnrichmRNAbyOligoTRNAfragmentation(200bp)RandomhexamerprimedcDNAsynthesisSizeselection,thenPCRamplificationHiSeq2000sequencing50SE生物信息学分析RNA-Seq单端测序(Quantification)生物信息分析内容测序数据评估筛选差异表达基因表达模式聚类分析GO功能富集分析Pathway富集分析蛋白互作网络分析RNA-Seq单端测序(Quantification)信息分析流程RNA-Seq与基因芯片优缺点比较技术优点缺点RNA-seq1)检测基因数比基因芯片多25%2)定量准,可重复性高(重复相关系数≥0.99)3)数字化信号,无背景噪音,无交叉杂交4)高、低丰度基因均可检测5)不受研究物种限制,模式生物和非模式生物均可检测6)数据可与时俱进,即随数据库更新而更新7)具有较好的分析兼容性,数据格式与芯片相同,可与芯片的分析软件兼容1)样本要求量比基因芯片多2)数据量大,需要具备一定的生物信息分析基础,才能更好的挖掘数据蕴含的丰富信息基因芯片1)平台应用较早2)信息分析软件较多3)有些平台要求样品量少1)检测灵敏度较低、重复性差、检测阈值较狭窄2)有背景噪音,假阳性率>1%3)受物种限制,只能检测部分模式生物4)受基因拷贝数限制,无法检测出低丰度基因5)只能检测已知转录本,无法检测出新转录本6)受数据库数据所限,因探针依靠现有数据库或比较旧的版本的数据库来设计的,可能出现注释不准确的情况casePlantPhysiology2010取样:选取在成熟季节开花后5,10,和15个星期葡萄分别代表葡萄果实成熟中的三个时期(postsetting,ve´raison和ripening)数据量:超过59Mreads数据,长度在36-44bp之间运用RNA-Seq技术对葡萄果实发育过程中复杂转录特征的研究。表二reads在基因组上的分布情况表一测序数据葡萄RNA-Seq单端测序浆果发育三个阶段共有、特有基因表达分布图基因表达量分布