第4章转录组学原理与方法3本章学习内容4.1转录概述4.2转录组学概念4.3生物芯片4.4数字基因表达谱与RNA-seq4.5元转录组学转录开始的识别序列A:大肠杆菌的promoter:-35box:5’-TTGACA-3’-10box:5’-TATAAT-3’B:真核生物的Promoter构造更为复杂:corepromoter4.1转录(transcription)概述567原核RNA聚合酶真核RNA聚合酶89真核基因结构和转录过程1、编码RNA和非编码RNAA:编码RNA:mRNA:4%;寿命短,细菌半衰期为2-3分钟,真核2-3小时;酵母6200个基因中,3/4在通常的营养成长期合成B:非编码RNA:rRNA80%tRNA2、RNA前驱体末端修饰:真核和古细菌5‘-cap3’polyA拼接:内含子除去未拼接的mRNA前驱体为核内异质RNAhnRNA切断反应:tRNArRNA一分子以上合成,切断成熟化学修饰:RNA编辑,新的官能团附加3、细菌的转录和翻译是偶联的RNA的合成和加工14转录组(transcriptome),即一个活细胞所能转录出来的所有mRNA,是从基因组DNA转录的基因总和。转录组学(transcriptomics)也称为表达谱是研究生物细胞中转录组的发生和变化规律的科学4.2转录组学的概念转录组不是细胞的功能执行实体,转录组分析只能间接探讨基因的功能表达序列标签EST(ExpressedSequenceTag)EST是从一个随机选择的cDNA克隆进行5’端和3’端单一次测序获得的短的cDNA部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20到7000bp不等,平均长度为360±120bp。EST来源于一定环境下一个组织总mRNA所构建的cDNA文库,因此EST也能说明该组织中各基因的表达水平16用于转录组数据获得和分析的方法:基于杂交技术的芯片技术包括cDNA芯片和寡聚核苷酸芯片,基于序列分析的基因表达系列分析SAGE(serialanalysisofgeneexpression)大规模平行信号测序系统MPSS(massivelyparallelsignaturesequencing)转录组学的研究方法4.3生物芯片生物芯片主要指通过平面微细加工技术在固体芯片表面构建的微流体分析单元和系统,以实现对细胞、蛋白质、核酸以及其它生物组分的准确、快速、大信息量的检测。基因芯片是最重要的一种生物芯片。生物芯片是继大规模集成电路之后的又一次具有深远意义的科学技术革命。4.3.1生物芯片概述生物芯片阵列型仪器型化合物药物核酸多肽蛋白质受体细胞细胞器病毒微小组织样品筛选浓缩放大毛细管电泳电介质电泳色谱质谱微型光谱仪芯片实验室DNA芯片技术是通过微阵列技术,将高密度DNA片段阵列通过高速机器人或原位合成方式以一定的顺序或排列方式使其附着在如玻璃片等固相表面,以荧光标记的DNA探针,借助碱基互补杂交原理,进行大量的基因表达及监测等方面研究的技术微阵列技术巨大优势在于它可以并行地宏量获取生物信息,借助此技术发展的生物芯片则提供了以核酸杂交为基础的基因水平的表达监控,多态性研究和Genotyping。从而使我们对基因表达调控有更深入的了解芯片实验室(Lab-on-a-chip)或称微全分析系统(MiniaturizedTotalAnalysisSystem,µ-TAS)是指把生物和化学等领域中所涉及的样品制备、生物与化学反应、分离检测等基本操作单位集成或基本集成一块几平方厘米的芯片上,用以完成不同的生物或化学反应过程,并对其产物进行分析的一种技术芯片实验室(Lab-on-a-chip)4.3.2基因芯片发展历史Southern&NorthernBlotDotBlotMacroarrayMicroarray221991年Affymetrix公司在Southernblot基础上,开发出世界上第一块寡核苷酸基因芯片,自此微阵列技术(基因芯片)得到迅速发展和广泛应用,已成为功能基因组研究中最主要的技术手段。但是芯片无法同时大量地分析组织或细胞内基因组表达的状况,而且由于芯片技术需要准备基因探针,所以可能漏掉那些未知的、表达丰度不高的、可能是很重要的调节基因DNAMicroarraysNaturalDNA(PCRProducts)geneexpressiongenomicDNAdetectionArtificialDNA(oligonucleotide)•geneexpression•SNPgenotyping•genemutationon-chipsynthesisspottingGenomicChipsvs.ExpressionChipsGenemRNAProteinGenomicChips:Detectthepresenceorabsenceofagene.Ifpresent,howmanycopies?ExpressionChips:Determineshowageneexpressesitself.Whataretheproductsofthegene?DNA芯片Solidsupport(glass,membrane,plastic,silicon)MiniaturizedarrayofDNA(geneticmaterial)DNA/DNAhybridizationHybridizedprobes(DNAmolecules)arefluorescentlylabeledmRNAcDNAhybridisetomicroarrayLabonachipMicroarray合成后点样板基因芯片的检测系统ScanArraySystemImageanalysisCasestudy:JOURNALOFBACTERIOLOGY.2005,187:7138–7145GlobalTranscriptomeAnalysisofShewanellaoneidensisMR-1ExposedtoDifferentTerminalElectronAcceptorsShewanellaoneidensisisabacteriumwhichcanreducepoisonousheavymetalandcanliveinbothenvironmentswithorwithoutoxygen.ThisproteobacteriumwasfirstisolatedfromLakeOneida,NYin1988.ThisspeciesisalsosometimesreferredtoasShewanellaoneidensisMR-1,indicatingmetalreducing,aspecialfeatureofthisparticularorganism.ThespecialinterestinS.oneidensisMR-1revolvesarounditsbehaviorinanaerobicanenvironmentcontaminatedbyheavymetalssuchasiron,lead,andperhapsevenuranium.Thebacteriacanalsotargetsulfates,nitratesandchromateswhengrownanaerobically.S.oneidensisMR-1whole-genomemicroarrayswhichcontainedatotalof4648elementscorrespondingtouniquesegmentsofindividualopenreadingframes(ORFs)TestO2,Co(III)EDTA;ferriccitrate;hydrousferricoxidecolloidalmanganese(IV);manganesedioxide;sodiumthiosulfate;sodiumnitrate;trimethylamineN-oxide;DMSO,dimethylsulfoxide.Referencefumarate-grownElectronacceptors2827genesshow2-foldchangeinrelativemRNAabundancesinatleastoneoftheelectronacceptor-exposedcultures,relativetofumarateCorrelationbetweenthetop2principalcomponentsrepresentingthebehavioroftheS.oneidensisMR-1transcriptome(A)andexpressionprofilesof6S.oneidensisgenesencodingputativesigmafactors(B).RelativetranscriptabundancesrepresentaratioofmRNAlevelsintestculturestothesedisplayedbythefumarate-grownreference.Valuesof1indicatemRNAabundanceincreaseundertestconditions;valuesof1indicatedecreaseundertestconditions.Hierarchicalclusteringof2827S.oneidensisgenesexhibitingdifferentialexpressioninculturesexposedtometalandnon-metalelectronacceptors.Eachcolumnindicatesindividualelectronacceptor.RelativetranscriptabundancesrepresentaratioofmRNAlevelsintestculturestothesedisplayedbythefumarate-grownreference.Electronacceptorabbreviations:O2,oxygen;CO,Co(III)EDTA;FC,ferriccitrate;FO,hydrousferricoxide;MC,colloidalmanganese(IV);MO,manganesedioxide;S2O3,sodiumthiosulfate;NO3,sodiumnitrate;TM,trimethylamineN-oxide;DMSO,dimethylsulfoxide.60%of28274.4数字基因表达谱(DigitalGeneExpressionProfiling)与RNA-seq数字基因表达谱主要用于某物种的特定组织或细胞在特定生物过程中的基因表达定量研究基因表达研究技术43cDNA(complementaryDNA)quantitativereversetranscriptionPCR(qRT-PCR),labeledprobesbindingtoRNAinNorthernblottinghybridizationofcDNAtoprobesonmicroarraychips.RNA–seqAnapproachforwhole-transcriptomeprofilinginwhichapopulationofRNAisconvertedtocDNAandsubjectedtohigh-throughputsequencing.Sequencesaremappedtothegenometogenerateahigh-resolutiontranscriptomemap.RNA-seq的优势44不需要探针序列,具有较好重复性,样本量相对少不需要根据基因组序列差异改变实验设计可以发现新的遗传特征,描述操纵子和非转录区序列图谱比寡核苷酸杂交更准确,分辨