韩斌-植物基因组学

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

植物基因组学PlantGenomics韩斌NationalCentreforGeneResearch,SIBS,CAS中科院国家基因研究中心什么叫基因组学?植物基因组的研究内容?基因组学有哪些研究手段和方法?•基因组(Genome:Gene+chromosome)细胞或生物体中一套完整的单倍体遗传物质•基因组学(Genomics)ThomasRoderick,1986基因组作图、测序和分析目前分为结构基因组学和功能基因组学•植物基因组学研究内容包括结构基因组、功能基因组以及基因组研究成果的应用Ⅰ.结构基因组学遗传图(GeneticMappingGenomes):Basedonthecalculationofrecombinationfrequencybylinkageanalysis物理图的绘制(PhysicalMappingGenomes):Basedonmolecularhybridizationanalysis,cloningandPCRtechniques基因组序列测定(SequencingGenomes):Sequencingmethods:thechainterminationprocedureMap-basedclonebyclonestrategyWholegenomeshotgun(WGS)strategySequenceassembly其目标是建立高密度的遗传图、高分辨率的物理图和转录图,最终完成全基因组序列测定和注解(AnnotatingaGenomeSequence)GenepredictionbysoftwareGeneidentificationTranscriptome&ProteomeGenomes,genes,transcriptomes,proteomesQTLDiseasegeneSTSSNPRFLPSSRGeneticmapPhysicalmapGenestructureTranscriptsProteinsCloneProteinattributes:MolecularweightCellularlocationFunctionAssemblyInteraction---ContigassemblyunigeneESTsGenepredictionGeneExpressionMicroarray(GEMs)Sequencing,sequenceassembly1234123124ProteincomplexGATCGTCAGATCAGCATCAGCATCAGCGACTCAGCATCATATCATCAGCACGATCACGACGACTACTACGACTACAGSequencecontigsESTclustering•基因组作图:遗传作图、物理作图、细胞遗传学作图和表达作图在内的整合图谱•遗传图:通过亲本的杂交,分析后代的基因间重组率,并用重组率来表示两个基因之间距离的线形连锁图谱重组率:基因位点之间的相对距离,一个作图单位定义为1厘摩(cM),1cM等于1%的重组率。提高遗传作图的分辨率:选用不同的杂交群体;增加杂交群体的数目;增加分子标记的数目;扩大分子标记的来源。分子标记:绘制基因组遗传图需要的坐标点。分子标记的主要来源是染色体上存在的大量等位基因(在DNA水平上,两个基因间一个碱基的差异就足以形成等位基因)。限制性内切酶片段长度多态性(RFLP)、随机扩增多态性DNA(RAPD)、随机扩增长度多态性(AFLP)、单核苷酸多态性(SNP)和简单重复序列(SSR)•a.分析单个位点的分离•b.检测位点间的连锁•c.估算位点间的重组频率和图距•d.将位点组装成连锁群•e.估算连锁群内的位点线性顺序•物理图谱(physicalmap):指DNA序列上两点的实际距离,它是以DNA的限制酶片段或克隆的大片段的基因组DNA分子为基本单位,以连续的重叠群为基本框架,通过遗传标记将重叠群或基因组DNA分子有序排列于染色体上。•物理图构建方法:克隆技术;杂交法;指纹法;荧光原位杂交技术。部分酶切电泳选取130Kb片段建立BAC库酶切指纹图制作物理图谱Clone-basedrestrictionphysicalmapping.ByMaynardOlson水稻基因组大小4亿3千万碱基对(约为人的基因组的1/8)12对染色体50,000个基因4号染色体:36Mb(占8%)Themorphologyofthe12ricechromosomeABCDEFA完整水稻细胞B光刀破碎后的水稻细胞C荧光下观察释放出来的水稻染色D-F光镊拖动水稻单条染色体(十字中心为被光镊束缚在视场中固定位置的单条染色体,与背景做相对运动〕标尺长度5微米ABIsolationofsinglericechromosomeusingalasermicrobeamtrapLiuetal,J.Biotechnology,2004,109染色体BAC重叠群BAC亚克隆重叠群克隆连克隆测序战略示意图RiceChromosome4mapsAfinephysicalmapofthericechromosome4.GenomeResearch12,817-823(2002)•基因组测序的方法:克隆步移法(BAC-by-BACStrategy)和全基因组鸟抢法(WholeGenomeShotgunStrategy)。•基因组序列的解读:基因组注解异常复杂,它是一个繁杂的复合体,既包含了进化历史上原封未动的部分,也有大量的进化史上重要历史事件的遗迹。基因组有它自身的规律,但是一些“不和谐的韵律”,如从病毒或者原核生物感染或寄生得到的基因组片段、转座元件、假基因以及重复序列的存在,构成了理解基因组结构的四大陷阱。基因组测序战略基于物理图的克隆连克隆法随机挑选BAC克隆测序、逐步步移法(LeeHood)全基因组鸟枪法(CraigVenter)BAC克隆超声波打碎成2~4Kb测序序列组装完成BAC克隆序列构建亚克隆库AssemblyofSequencesTracefilesfromABI377orMegabace1000PregaporPhred(Basecalling)Phrap/PregapConsensusSequenceGap4/(Consed)AnnotatingaGenomeSequenceGenepredictionbysoftware;Geneidentification:expressedsequencetags(ESTs),homologyanalysis,mutations,comparativeanalysisbetweengenomes;Transcriptome&Proteome;•基因组序列注释的三个层次:DNA层次“Where”,即在基因组序列中,基因在哪里?它是如何转录并拼接的?每个外显子的具体边界在哪里?蛋白质层次“What”,即这个基因编码的蛋白质是什么?它有什么样的一级、二级甚至是三级结构?代谢调控过程层次“How”,即这个蛋白质如何行使功能?它参与了什么样的代谢或调控过程?在真核生物中,遗传信息从基因组DNA转录成pre-mRNA,后者经过拼接、戴帽、加尾等加工变成成熟的mRNA,mRNA从细胞核进入细胞质中,在这里被翻译成蛋白质,然后该蛋白质到达它的靶位点行使相应的生物学功能。中心法则•核苷酸水平上的分析:基因预测软件以及全长cDNA和EST数据的分析;重复序列、假基因及其他;•蛋白质水平上的分析:核苷酸水平的序列分析给出了每一个基因的准确结构,随后的工作就是命名每个基因所编码的蛋白质,并预测每种蛋白质的可能功能,最终得到一张明确的基因组成清单。•基因家族的分析:Orthologous(直向同源)基因,指共同祖先的直接后代(没有发生基因复制事件)之间的同源基因,具有相近甚至相同的功能,由相似的途径调控,在不同的物种中扮演相似甚至相同的角色;Paralogous(共生同源)基因,指两个物种的同源基因分别是共同祖先基因组中由复制事件而产生的不同拷贝的后代。基因家族的基因通常属于共生同源基因的范畴。基因组注解异常复杂,它是一个繁杂的复合体,既包含了进化历史上原封未动的部分,也有大量的进化史上重要历史事件的遗迹。基因组有它自身的规律,但是一些“不和谐的韵律”,如从病毒或者原核生物感染或寄生得到的基因组片段、转座元件、假基因以及重复序列的存在,构成了理解基因组结构的四大陷阱。InsertionofaretroviralgenomeintoahostchromosomeConsensusSequenceEMBL(Genbank)AnnotationCodingFeaturesGeneMarkFGENESHblastxblastnESThits(Wu-Blast2vsSwiss&PIR)MAR-FindertRNAscan-SEMARProteintRNAhitsNthomologiesblastnRiDBGenefinding•Goal:Findgenesandgenestructuresfromgenomicsequences5'UTR3'UTRPromoterpredictionineukaryotes•Componentsineukaryoticpromoterregions•Corepromoterandenhancerelements•Predictionmethodologiesaresimilartothoseusedforgeneprediction(acombinationofsignalandcontextmeasures,inbothcorepromoterregionsandtranscriptionfactorbindingsites).•Accuracygenerallylowerthangeneprediction.HighfalsepositiveGenePredictionWindowTotalGenes4,658Averagegenesize(bp)2,779Genedensity(bppergene)7,441Averageexonpergene4.4Averageexonsize(bp)340Averageintronsize(bp)376AverageBACGC(%)44.16AveragegeneGC(%)47.22AverageintergenicGC(%)42.30AverageexonGC(%)53.0AverageintronGC(%)39.0StatisticsofAnnotatedChromosome4GeneSet&FunctionalClassificationTotalNumberoftheGeneSet4658genespredicted1681ofthemhaveuniquericeESTmatches70tRNAs,4snRNAsFunctionalClassificationCellularmetabolism555/12%Transcription259/5.6%Signalling256/5.5%Transport198/4.1%PlantDefence161/3.5%ProteinFate85/1.8%Growth81/1.8%Others3063/65%高等生物的着丝粒aa1a2a1a2a1a2geneduplicationspeciationSpeciesISpeciesIIa1anda2areparalogs,whilea1inspeciesIanda1inspeciesIIareorthologs(soarea2inspeciesIands2inspeciesII)homologousgenesdivergedbyspeciation.Orthologsusuallysharethesamefunctions.homologousgenesproducedbyageneduplication

1 / 92
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功