Chapter3GenomeandGene第一节基因一、基因概念的发展(一)经典遗传学1、1865,Mendel:控制性状的因子---遗传因子2、1909,Johannsen提出基因(gene)的概念,取代遗传因子3、1910,1916,Morgan:将基因定位在染色体上1、In1941,BeadleandTatum一基因一酶学说阐明了基因是通过对酶的控制来决定性状的一基因一蛋白一基因一多肽链2、In1944,AveryDNA是生物遗传的物质基础(二)分子遗传学对基因概念的新发展3、In1961,JacobandMonod乳糖操纵子模型(1)结构基因(structuralgene)指可编码非调控RNA或蛋白质的一段DNA序列血红蛋白编码核糖体RNA基因(2)调节基因(regulatorygene)指其表达产物参与调控其它基因表达的基因。lacZlacYlacAPlacIPlacOlaclacImRNA小结基因可控制生物的性状基因位于染色体上基因的物质基础是DNA(或RNA)基因是通过指导合成蛋白质或RNA来决定性状的基因有结构基因和调节基因之分(三)基因概念的进一步发展1、重叠基因(Overlappinggenes)一个基因的部分序列位于另一个基因的序列内(同一段DNA能携带两种不同蛋白质的信息)Sanger(1977)年发现了ΦΧ174单链DNA病毒中有6个基因是重叠的。OverlappinggenesinphageØX174采莲人在绿杨津,在绿杨津一阙新;一阙新歌声漱玉,歌声漱玉采莲人。2、断裂基因(SplitGenes)指基因内部被一个或更多不编码顺序所隔裂(1)内含子(intron):DNA序列中不出现在成熟mRNA的片段;(2)外显子(extron):DNA序列中出现在成熟mRNA中的片段。DiscoveryIn1977,RobertsandSharp3、跳跃基因:JumpingGenes(Transposons)存在于染色体DNA上可自主转移座位的基本单位,可在同一染色体内或不同染色体之间移动Transposonsinmaize40年代初,McClintock研究玉米花斑糊粉层和植株色素产生的遗传基础时发现转座因子4、管家基因(组成型基因)Housekeepinggenes:是那些(理论上)在所有细胞中都表达的基因,因为其功能对任何细胞型都是必要的。(维持细胞生存不可缺少)5、奢侈基因(Luxurygenes):在特殊的细胞类型中大量表达并编码特殊功能产物的基因。(与细胞分化有关,与组织特异性表达有关)二、基因的定义产生一条多肽链或功能性RNA所必须的全部核苷酸序列1、RNA基因(RNAgenes)编码功能性的RNA分子RNA产物有很多参与基因表达的调控,如MicroRNA2、蛋白质编码基因(protein-codinggenes)(1)编码区(codingregion)指在翻译时对应于多肽的氨基酸序列的一段核苷酸序列(2)非翻译区(Untranslatedregions,UTR)能够转录但不被翻译的核苷酸序列功能:蛋白质合成的调控5’-UTR;3’-UTRATG5’TAA3’3、顺反子:等同于基因,是编码一条完整多肽链的一段核苷酸序列。多顺反子:原核生物中数个结构基因常串联在一起,受同一调节区控制,转录生成的mRNA可编码几种功能相关的蛋白质。lacZlacYlacAPlacIPlacOlaclacIUAAAUGAUGUAA…...5’3’单顺反子:一个编码基因转录只生成一个mRNA分子,经翻译生成一条多肽链。UAAA……AAAAUG5’3’第二节遗传信息的传递一、中心法则(Thecentraldogma)In1958,Crick1.DNA是自身复制的模板;2.DNA通过转录作用将遗传信息传递给中间物质RNA;3.RNA通过翻译作用将遗传信息表达成蛋白质。中心法则揭示了遗传信息的传递方向,反映了DNA、RNA和蛋白质之间的相互关系。DNARNAProteinTranscriptionTranslationreplication二、中心法则的挑战1、反转录(Reversetranscription)In1970,BaltimoreandTemin发现逆转录酶(reversetranscriptase)2、RNA复制3、RNA编辑(RNAediting)是指转录后的RNA在编码区发生碱基的加入,丢失或转换等现象4、表观遗传(EpigeneticInheritance)是指在DNA序列没有发生变化的情况下,基因表达的可遗传的改变ThecalicophenotypeshowseffectsofmosaicismofX-linkedtraitsinfemalemammals–anepigeneticphenomenon.(1)表观遗传修饰(Epigeneticmodification)DNA甲基化;组蛋白修饰;microRNA(2)表观遗传学补充了“中心法则”忽略的两个问题:a、哪些因素决定了基因的正常转录和翻译b、对基因组而言,不仅仅是序列包含遗传信息,而且其修饰也可以记载遗传信息。5、朊病毒(Prion)疯牛病,学名为牛海绵状脑病(BSE)人和动物的可转移性神经退化疾病In1982,Prusiner,discoveringprionPrPC→PrPSc三、修改后的中心法则proteinDNARNAreplicationtranscriptionReversetranscriptionRNAeditingRNAreplicationtranslation第三节基因组(Genome)一、概述:1、概念:是指细胞或生物体单倍体染色体上的所有遗传物质的总称(包括所有的遗传信息)(1)细菌和病毒基因组:是指染色体上所含的全部DNA(2)二倍体及多倍体真核生物的基因组:一个物种单倍体所有染色体上的遗传物质的总称。如人类基因组:包括24条染色体2、基因组大小(Genomesize)haploidgenomeC值(C-value):sizeofthehaploidgenome一种生物单倍体基因组DNA的总量讨论:C值大小与生物遗传复杂性是否成正相关?C值在低等真核生物中与遗传复杂性有一定的正相关,但在高等真核生物中却并非如此,它们的C值变化不定。Insects4.7107~1.2107Amphibians9.5108~1.01011Floweringplants9.5107~1.21011C值矛盾(C-valueparadox)生物基因组的大小同生物在进化上所处地位的高低无关3.基因密度是指每Mb基因组DNA上基因的平均数目。生物体的复杂度与基因密度存在大致负相关的关系。Why?二、真核生物基因组(一)非编码DNA不编码蛋白质的DNA序列(没有确定功能)如人类:30亿对核苷酸,预计10万个基因,实际为2~2.5万蛋白编码基因(占整个基因组的1%)内含子基因间隔序列(功能未知)1、内含子物种基因平均长度平均内含子个数/基因mRNA平均长度线虫4kb3~43kb果蝇11kb3~43kb人类16kb6~72.5kb内含子的普遍性不仅大多数蛋白质编码的基因有内含子,rRNA,tRNA基因也有内含子。大肠杆菌噬菌体T4胸腺嘧啶合成酶基因有内含子。某些低等真核生物的线粒体和叶绿体基因中有内含子。内含子的相对性内含子有时也编码蛋白并非真核生物所有的基因都有内含子真核生物组蛋白基因,酵母的大多数基因无内含子具有编码功能的内含子:如可移动内含子编码3种蛋白质:(1)内切核酸酶:能切割DNA上的靶序列并且允许内含子插入(2)反转录酶:以自身RNA为模板产生DNA拷贝(3)成熟酶:在将特定内含子从前体mRNA中剪除时起作用内含子的移动类似转座机制内含子的类型(1)GU-AG内含子:真核细胞核mRNA前体中(2)AU-AC内含子:真核细胞核mRNA前体中(3)Ⅰ型内含子:主要在真核细胞核rRNA前体中自我剪接(4)Ⅱ型内含子:细胞器RNA、某些原核生物RNA自我剪接内含子与进化(1)特点:外显子的保守程度远高于内含子,内含子的序列是多变的(2)合理解释:内含子序列最终不出现在mRNA的序列中,即使发生改变也不会受到自然选择的压力(3)在进化上的意义a、有利于生物遗传的相对稳定b、积累突变的内含子可能演化为新的基因c、扩大了生物体的遗传信息储量2、基因间隔序列非重复序列重复序列----人的基因间隔序列主要由重复序列组成串联重复序列:如卫星DNA分散重复序列:如Alu元件(二)重复序列DNA非重复序列/中度重复序列/高度重复序列附:复性动力学:根据序列的拷贝数不同在基因组DNA复性过程中的复性速率不同的原理,来识别不同种类的重复序列DNA的一种技术。思考:复性速度与基因组重复序列拷贝数的有什么关系?人类和E.coliDNA的理想复性动力学曲线(一)非重复序列(NonrepetitiveDNA)基因组中只有一个或几个拷贝的DNA序列(真核生物结构基因多属于非重复序列)(二)中度重复序列(moderatelyrepetitiveDNA)基因组中重复次数在10~104之间的DNA序列如rRNA、tRNA的基因,组蛋白基因1、串联重复序列(Tandemrepeatsequences)基因簇:基因家族中一组相同或相关基因串联排列在一起如:rDNA---基因簇重复多次组蛋白基因(5genes)---基因簇重复多次2、散在重复序列(dispersedrepetitiveDNA)分散分布在基因组中的中等重复序列(1)短散在元件SINE:如Alu元件(~300bp)(2)长散在元件LINE:如L1元件(6500bp)功能:没有被证明有功能(三)高度重复序列(highlyrepetitiveDNA)基因组中重复成千上万次卫星DNA(SatelliteDNA)1、概念:真核生物基因组中由许多短的基本重复单位构成的连续重复的一种高度重复序列。短重复单位:2bp至20~30bp5’–ATAAACTATAAACTATAAACT–3’3’–TATTTGATATTTGATATTTGA–5’果蝇的卫星DNA重复单位n密度梯度离心,卫星DNA与其他DNA分开。形成两个峰:较大的主峰和高度重复序列小峰BuoyantdensityOpticalabsorbanceMouseDNA/CsClMainbandsatellite2、特点:大多GC含量低,因而具有较低的浮力密度3、位置:卫星DNA位于着丝粒部位是异染色质的组成成分4、功能:没有被证明有功能微卫星DNA(microsatelliteDNA)简短串联重复---STR特点:(1)重复单位长度在2~6bp之间(2)较为平均地沿染色体分布小卫星DNA(minisatelliteDNA)可变串联重复---VNTR特点:(1)拷贝数具有高度可变性(2)重复单位长度在15~65bp之间(3)一般出现在染色体的末端DNAfingerprintingGGGCAGGAXGCCCGTCCTXCProgenyParents56789(三)基因家族一个祖先基因经重复或突变所产生的功能相关的同源基因假基因:基因家族中因突变而失去功能的基因基因簇:基因家族中一组相同或相关基因串联排列在一起而形成如rRNA、tRNA和组蛋白的基因;孤独基因:基因家族中在独立位点上的单个基因典型的基因家族1.tRNA基因单倍体人基因组中1300个tRNA基因,tRNA基因簇.2.rRNA基因l00copy.rRNA基因簇(重复单元:28S、18S、5.8s-rRNA)3.组蛋白基因30-40copy.组蛋白基因簇(重复单位:H1,H2A,H2B,H3、H4)特点:无intron,Poly(A)-RNA.4.珠蛋白基因(四)DNA的多态性DNA序列发生变化而导致的个体间核苷酸序列的差异1、RFLP(限制性片段长度多态性)DNA序列上的微小变化,甚至1个核苷酸的变化,也能引起限制性内切酶切点的丢失或产生,导致酶切片段长度的变化2