第二章基因概念的发展与DNA的结构图3-1本章主要内容:一、“基因”概念的发展二、DNA的结构三、基因概念的多样性一、“基因”概念的发展1、产生;2、经典“基因”概念的建立;3、经典“基因”概念的发展;早期的“基因”概念“融合遗传理论”(Hippocrates):父本精液与母本胚胎中的体液融合后,传递给后代并控制子代个体的性状表现;“获得性遗传理论”(Lamarck):物种的形成是对环境的适应过程,环境对形态的改变一旦发生就可以获得并遗传给后代,使生物体逐渐转变为新种;“泛生论”(Darwin):生物体一切性状的表现受控于体内各部位的各种泛生粒;“种质论”(Roux):生物体的性状表现是由各组织、器官的体质细胞控制的,而体质细胞由种质细胞产生。种质虽不直接控制性状的表达,但可繁衍自身,世代相继,种质是连续的。19世纪中叶,奥地利生物学家Mendel传递规律-分离规律和自由组合规律。他所指的遗传因子,即基因概念的萌芽。1、萌芽与产生1900年,deVires、Corres和Tscher-makVon三人分别在月见草、玉米和豌豆的杂交实验中证实了孟德尔定律,标志着遗传学的诞生。1909年,Johannsen首次用“基因”取代了“遗传因子”,并提出“基因型”和“表现型”。此时,“基因”只是一个抽象的符号。1926年,Morgan发表《基因论》,首次提出了“三位一体”的基因概念:基因首先是一个功能单位,能控制蛋白质的合成,从而控制生物性状发育;其次它是一个突变单位,在一定条件下,野生型基因能突变成相应的突变型基因,从而表现出各种变异类型;第三,它是一个重组单位,两个不同基因可重组,产生与亲本不同的新类型;2、经典基因概念的建立另外,基因在染色体上按一定顺序、间隔一定距离线性排列,各自占有一定的区域。3、经典“基因”概念的发展(i)“一个基因一个酶”假说的提出;(ii)顺反子、突变子和重组子概念的产生;(iii)操纵子模型的提出;“一个基因一个酶”假说(1941年,Beadle和Tatum)认为生物的性状可分为许多单位性状,每个单位性状均受一种酶影响,而酶决定于基因的表达。顺反子、突变子和重组子(1955年,Benzer)顺反子是一个遗传功能单位,一个顺反子决定一条多肽链;突变子是能发生突变的最小单位,可以是一个或几个核苷酸,其中任一核苷酸的改变都可形成一个突变子;重组子是能够交换的最小单位,有起点和终点,各个重组子之间均有一定的距离,彼此间能发生交换。操纵子模型(1965年,Jacob和Monod)将乳糖操纵子的基因分为结构基因、调节基因、操纵基因和启动基因二、DNA的结构1、核酸概述(化学成分、种类和分布)2、DNA的一级结构3、DNA的二级结构4、DNA的超螺旋结构5、DNA序列中的不寻常结构6、DNA的性质(变性与复性)(一)核酸概述(1)核酸的化学成分核苷酸分子由三个部分组成:碱基:嘧啶(双环)、嘌呤(单环)五碳糖:核糖或脱氧核糖磷酸核苷(1)碱基—糖之间是β—糖苷键(2)糖—磷酸之间是磷酸酯键核酸有两种:脱氧核糖核酸(DNA)和核糖核酸(RNA)。两种核酸的主要区别如下:DNA含的糖分子是脱氧核糖,RNA含的是核糖;DNA含有的碱基是腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)和胸腺嘧啶(T),RNA含有的碱基前3个与DNA完全相同,只有最后一个胸腺嘧啶被尿嘧啶(U)所代替;DNA通常是双链,而RNA主要为单链;DNA的分子链一般较长,而RNA分子链较短。(2)核酸的种类真核生物的绝大部分DNA存在于细胞核内的染色体上;少量的DNA存在于细胞质中的叶绿体、线粒体等细胞器内。RNA在细胞核和细胞质中都有,核内则更多地集中在核仁上,少量在染色体上。(3)核酸的分布细菌也含有DNA和RNA;多数噬菌体只有DNA;多数植物病毒只有RNA;动物病毒有些含有RNA,有些含有DNA。流感病毒大肠杆菌(二)DNA的一级结构DNA的一级结构,就是指4种核苷酸的连接及其排列顺序,表示了该DNA分子的化学构成。(三)DNA的二级结构DNA的二级结构是指两条多核苷酸链反向平行盘绕所生成的双螺旋结构。沃森(左)和克里克(右)1、DNA双螺旋结构主要内容(1)两条多核苷酸链以右手螺旋的形式彼此以一定的空间距离,平行地环绕于同一轴上;(2)两条多核苷酸链走向为反向平行,即一条链磷酸二酯键为5’-3’方向,而另一条为3’一5’方向,二者刚好相反;(3)每条长链的内侧是扁平的盘状碱基,碱基一方面与脱氧核糖相联系,另一方面通过氢键与它互补的碱基相联系。互补碱基对A与T之间形成两对氢键,而C与G之间形成三对氢键。上下碱基对之间的距离为0.34nm;(4)每个螺旋为3.4nm长,刚好含有10个碱基对,其直径约为2nm;(5)在双螺旋分子的表面大沟和小沟交替出现。3、DNA二级结构的多态性A-DNA的结构特点:(1)B-DNA中,2-脱氧核糖的构象出现了变化从而使同股多核苷酸链中相邻磷酸基间的距离缩短0.1nm。这一变化使每匝螺旋的碱基对数由B-DNA的10转变为A-DNA的11。(2)A-DNA的另一重要差别在于碱基对在螺旋中的位置,在B-DNA中,碱基对集中于螺旋轴;而在A-DNA中,碱基对向大沟方向移动了约0.5nm,这一变化的结果改变了B-DNA的外形和沟的尺寸Z-DNA的结构特点:(1)Z-DNA是左手螺旋,每个螺旋含12个碱基对,比A-DNA拧得更紧;(2)双螺旋中不存在深沟,只有浅沟;(3)双螺旋的轴心也在碱基对之外,即轴心不再穿过碱基对之间的氢键,而位于氢键之外靠近胞嘧啶碱基一侧。Z-DNA轴心所处的方向正好与A-DNA相反;(4)Z-DNA中磷酸二酯键的连接不再呈B-DNA中的光滑状,而是呈锯齿形,这就是Z-DNA名称的由来;(5)Z-DNA中的碱基对不像B-DNA中那样位于双链的中央,鸟嘌呤碱基的第8个碳原子位于双链之外(在B-DNA申,糖、磷酸键覆盖了C8位置)。由于Z-DNA上几乎不存在易被蛋白质识别的沟,Z-DNA可能是利用位于双链分子外围的鸟嘌呤碱基与化学物质发生识别反应三种不同构象的DNA活性B-DNA是活性最高的DNA构象,B-DNA变构成为A-DNA后,仍有活性,但若局部变构为Z-DNA后则活性明显降低。即:B-DNA>A-DNA>Z-DNA(四)DNA的超螺旋结构超螺旋结构是DNA高级结构的主要形式,可分为正超螺旋与负超螺旋两大类,他们在特殊情况下可以相互转变,如:超螺旋DNA可采取两种拓扑学上相当的形式。一种相当于双螺旋绕圆柱体旋转;另一种相当于双螺旋相互盘绕。超螺旋的这两种形式可以相互转变(下图)。天然的DNA都呈负超螺旋,但在体外可得正超螺旋如溴乙锭的嵌人环形DNA分子会由于超螺旋化而变得更为致密,它们在超离心中的沉降速度和在凝胶电泳中的迁移速度都增加,故超螺旋DNA可通过这两种方法来检测和分离。(五)DNA中的不寻常结构DNA的不寻常结构是以一定的DNA序列为基础的。交替的嘧啶、嘌呤重复序列倾向形成Z-DNA,反向重复序列倾向形成十字形结构,构成镜像重复的同型嘧啶-同型嘌呤序列可能形成三链结构,而富含G的序列可能形成四链结构等。(六)DNA的性质1、DNA变性是指当双螺旋DNA加热至生理温度以上(接近100ºC)时或受到极端酸碱溶剂、变性剂等处理后,它就失去生理活性。这时DNA双股链间的氢键断裂,最后双股链完全分开并成为无规则线团的过程。简而言之,就是DNA从双链变成单链的过程。增色效应:它是指在DNA的变性过程中,它在260nm的吸收值先是缓慢上升,到达某一温度后即骤然上升的效应(见下图)。Tm(变性温度):增色效应达到最大值一半时的温度。2、DNA复性它是指热变性的DNA如缓慢冷却,已分开的互补链又可能重新缔合成双螺旋的过程。复性的速度与DNA的浓度有关,因为两互补序列间的配对决定于它们碰撞频率。作业:1、解释“三位一体”?2、核酸的化学成分和种类分别是什么?3、什么是DNA的一级和二级结构?B-DNA的结构特点是什么?4、比较三种DNA二级结构的特点。5、什么是DNA变性、复性、增色效应、Tm值?三、近代“基因”概念的多元化(i)断裂基因的发现与结构特点;(ii)重叠基因的含义与种类;(iii)重复基因的含义;(iv)假基因的含义;(v)跳跃基因的含义与结构特点。在真核生物中,每种生物的单倍体基因组的DNA总量是恒定的,称之为C值,它是每种生物的一个特性,不同物种的C值差别很大。(一)C值与C值悖理C值和进化之间的复杂性并没有严格的相应关系。譬如,肺鱼的C值达1011bp,而人类C值才只有109bp。这种C值与生物进化复杂性不相对应的现象称为C值悖理。说明真核生物基因组中必然存在大量的不编码基因产物DNA序列。含义:它是指共用一段DNA序列的两个或两个以上结构基因的互称。(二)重叠基因种类:(1)套叠基因,即一个基因的序列完全落在另一个基因序列之中;(2)两个基因仅有一个核苷酸重叠,即前一个基因的终止点和后一个基因的起始点重叠;(3)三层重叠基因,即三个不同基因共用一段核苷酸序列;(4)双链DNA分别作模板,按不同方向转录出独特的mRNA。(三)重复基因它是指在真核生物基因组中具有一份以上拷贝的基因。这些拷贝或在一条染色体上串联排列,或分散在多条染色体上,包括寡拷贝和多拷贝基因。DNA的重复序列组织(1)高度重复序列:高度重复序列的长度为2~10bp,在基因组中可串联重复至105~107次,约占基因组的1~50%,平均为15%。这些重复序列常称为卫星DNA。有些卫星DNA位于染色体的中心粒,它们可能在减数分裂中承担一定的功能;有一些重复序列位于染色体的端粒,它们是由一些富含GC的序列组成,重复20~100次;高度重复序列也散布于整个基因组中,它们可分为长(6~7kb)和短(79~300bp)散布重复序列两类。(2)中度重复序列:中度重复序列包括rRNA和组蛋白基因,每一基因组约含10—10000拷贝。(3)单一序列:单一序列包括酶在内的各种蛋白质基因,数目在一个到几个。单一序列构成人基因组的65%和约接近细菌、病毒以及质粒基因组的全部。(4)反向重复序列:包括一种能与同股或另一股链中相应互补的序列。这种序列单股时形成发夹结构,双股时形成十字形结构,这些序列能迅速复性。发夹序列约占人基因组的6%。图3-11含义:它是指看似正常基因,却不能表达任何RNA或蛋白质,包括已知功能基因的残存拷贝、散在分布的长细胞核因子和短细胞核因子。(四)假基因假基因的结构特点:(1)不同部位有不同程度的缺失或插入;(2)缺少正常基因的内含子和启动子;(3)5’端都有真核生物mRNA分子特有的AATAAA信号,造成转录启动区的缺陷;(4)两侧有顺向重复序列。(五)断裂基因它是指在真核生物中,大多数编码蛋白质的基因是不连续的,即在其编码氨基酸的序列之间插入了非编码DNA序列的基因。主要由两部分组成:插入结构基因内的间隔序列称为内含子,转录为成熟mRNA的DNA片段称为外显子。血红蛋白链基因中编码氨基酸的序列之间被一个550bp长的非编码序列和一个120bp短的非编码序列隔开了下图中表明DNA的双链有些部位拆开了,使得其中的一条与mRNA互补的链和mRNA杂交了;而另一条DNA单链则凸出成环。如果基因是连续的,则在电镜下只能看到一个单链(较细)的环(A)。如果基因中含有一个插入序列(B),则可看到两个单链的环和一个较粗的双链DNA的环(由间插序列所形成)。图3-13图3-14内含子的起源:第一类认为mRNA前体的内含子来源于自我剪接的内含子,它在原核生物与真核生物分化以前的原始基因中就存在;第二类则认为它不是来源于自我剪接的内含子,而是来源于原始基因的编码或非编码序列。间隔基因的意义:(1)有利于生物遗传的相对稳定;(2)增加变异概率,有利于生物的进化;(3)扩大生物体的遗传信息储量;(4