Transcriptomics转录组学生物化学与分子生物学系生物化学与分子生物学系Transcriptome:Anevolvingdefinition(Thepopulationof)mRNAsexpressedbyagenomeatanygiventime(Abbott,2019)Thecompletecollectionoftranscribedelementsofthegenome.(Affymetrix,2019)生物化学与分子生物学系TranscribedelementsmRNAs:35,913transcripts(includingalternativesplicedvariants)Non-codingRNAstRNAs(497genes)rRNAs(243genes)snmRNAs(smallnon-messengerRNAs)microRNAsandsiRNAs(smallinterferringRNAs)snoRNAs(smallnucleolarRNAs)snRNAs(smallnuclearRNAs)Pseudogenes(~2,000)生物化学与分子生物学系TranscriptomicsDefinitionThestudyofcharacteristicsandregulationofthefunctionalRNAtranscriptpopulationofacell/sororganismataspecifictime.ScopethepopulationoffunctionalRNAtranscripts.themechanismsthatregulatetheproductionofRNAtranscriptsdynamicsofthetrancriptome(time,celltype,genotype,externalstimuli)生物化学与分子生物学系一、转录组学研究全部RNA的表达及功能转录组(transcriptome)指特定状态下一种细胞或组织所能转录出来的所有RNA的总和。——包括编码RNA,即mRNA和非编码RNA(non-codingRNA,ncRNA)转录组学(transcriptomics):是在整体水平上研究细胞基因转录情况及转录调控规律的科学。RNA组学(RNomics):是分析、鉴定非信使小RNA(smallnon-messengerRNA,snmRNA)在特定状态下表达情况、功能及其与蛋白质的相互作用。生物化学与分子生物学系转录组的特点:受到内外多种因素的调节,因而是动态可变的。能够揭示不同物种、不同个体、不同细胞、不同发育阶段及不同生理病理状态下的基因差异表达信息。生物化学与分子生物学系ObservingthetranscriptomeFocussedExperimentalApproaches:NorthernBlottingAnalysisRT-PCR(quantitativeorsemi-quantitative)HighthroughputApproaches:ClosedSystemProfiling:MicroarrayexpressionprofilingOpenSystemProfiling:Serialanalysisofgeneexpression(SAGE)MassivelyParallelSignatureSequencing(MPSS)生物化学与分子生物学系微阵列(microarray)SAGEMPSS研究技术生物化学与分子生物学系(一)微阵列是大规模基因组表达谱研究的主要技术大规模表达谱或全景式表达谱(globalexpressionprofile):是生物体(组织、细胞)在某一状态下基因表达的整体状况。微阵列或基因芯片(DNAchip):利用光导化学合成、照相平板印刷以及固相表面化学合成等技术,在固相表面合成成千上万个寡核苷酸探针,并与放射性同位素或荧光物标记的来自不同细胞、组织或整个器官的DNA或mRNA反转录生成的第一链cDNA进行杂交,然后用特殊的检测系统对每个杂交点进行定量分析。生物化学与分子生物学系Experimentaloverview:HybridizationWashingScancy5channelScancy3channel“Overlayimages”Quantifypixelintensities.CellpopulationACellpopulationBRNAextractionAABBReversetranscriptionAABBKlenowlabelincorporationSampleBlabelledwithcy3dyeSampleAlabelledwithcy5dye生物化学与分子生物学系LimitofDetection:1in30,000transcripts~20transcripts/cellRed–increaseofCy5sampletranscriptsGreen–increaseofCy3sampletranscriptsYellow–equalabundance生物化学与分子生物学系AffymetrixGeneChip®Limits:1:100,000transcripts~5transcripts/cell生物化学与分子生物学系affymetrix生物化学与分子生物学系Affymetrix:GeneExpressionArraysTranscripts/GenesArabidopsisGenome24,000C.elegansGenome22,500DrosophilaGenome18,500E.coliGenome20,366HumanGenomeU133Plus47,000MouseGenome39,000YeastGenome5,841(S.cerevisiae)&5,031(S.pombe)RatGenome30,000Zebrafish14,900Plasmodium/Anopheles4,300(P.falciparum)&14,900(A.gambiae)Barley(25,500),Soybean(37,500+23,300pathogen),Grape(15,700)Canine(21,700),Bovine(23,000)B.subtilis(5,000),S.aureus(3,300ORFS),Xenopus(14,400)生物化学与分子生物学系MicroarrayandGeneChipApproachesAdvantages:RapidMethodanddataanalysiswelldescribedandsupportedRobustConvenientfordirectedandfocussedstudiesDisadvantages:ClosedsystemapproachDifficulttocorrelatewithabsolutetranscriptnumberSensitivetoalternativesplicingambiguities生物化学与分子生物学系(二)SAGE在转录物水平研究细胞或组织基因表达模式SAGE的基本原理:利用锚定酶(anchoringenzyme,AE)和位标酶(taggingenzyme,TE)切割DNA分子的特定位置(一般近3’端),分离SAGE标签(长约14bp,可藉此鉴定基因组中的所有基因),并将这些标签串联起来,然后对其进行测序特点:可全面提供生物体基因表达谱信息可用来定量比较不同状态下组织或细胞的所有差异表达基因生物化学与分子生物学系AnchoringEnzymeNlaIII,recognitionsite:The3’terminusofadaptorAandBarebothTCCRACTAG,wherearecognitionsiteofTaggingEnzymeMmeIflankedwithNlaIIIHuM,PolyakK.NatureProtocols2019生物化学与分子生物学系TaggingEnzymeMmeIrecognitionsite:HuM,PolyakK.NatureProtocols2019生物化学与分子生物学系生物化学与分子生物学系生物化学与分子生物学系SAGEAdvantages:Potential‘open’systemmethod–newtranscriptscanbeidentifiedAccuracyofunambiguoustranscriptobservationDigitaloutputofdataQuantitativeandqualitativeinformationDisadvantages:CharacterisingnoveltranscriptsisoftencomputationallydifficultfromshorttagsequencesTagspecificity(recentlyincreasedlengthto21bp)Lengthoftagscanvary(TEenzymeactivityvariablewithtemperature)AsubsetoftranscriptsdonotcontainenzymerecognitionsequenceSensitivetoasubsetofalternativesplicevariants生物化学与分子生物学系(三)MPSS是以基因测序为基础的基因表达谱分析新技术MPSS的原理:一个含有能够特异识别转录子的信息标签序列(10~20bp)与长的连续分子连接在一起,测出mRNA的一端包含一个10至20个碱基的标签序列。每一标签序列在样品中的频率(拷贝数)代表了与该标签序列相应的基因表达水平。基因表达水平是以计算mRNA拷贝数为基础,是一个数字表达系统。只要将病理和对照样品分别进行测定,即可进行严格的统计检验,能测定表达水平较低、差异较小的基因,而且不必预先知道基因的序列。生物化学与分子生物学系生物化学与分子生物学系生物化学与分子生物学系四、RNA组学研究全部snmRNA人类基因组序列特点:2万2.5万个基因,与蛋白质合成有关的序列占整个基因组的2%左右,其余98%的基因组序列没有得到注释。RNA组学研究范畴:小分子RNA,包括snRNA、snoRNA、scRNA、siRNA、miRNA生物化学与分子生物学系SmallRNACataloguesNaqvi(2009)IntJBiolSciWithincellsthereareavarietyofdiscoveredsmallRNAsinlengthin19-30nt,recentlygoverningdiversecellularprocessessuchasdevelopment,differentiationacrosstheeukaryotickingdom.1.siRNA:shortinterferingRNAasdefensivemechanismtoprotecthostgenomeintegrityfromintrusionofforeignnucleicacids.2.miRNA(microRNA):21-30ntinlengthtranscribedfromhostgenomeloci,involvedinwidecellularprocesses,specifictodevelopmentanddifferentiation.3.tasiRNA(trans-actingshortinterferingRNA):21ntlengthtakenendogenoustranscriptastemplate,underRdRPactivity,followedbyDicertoproducet