BiochemistrySixthEditionChapter4:DNA,RNA,andtheFlowofGeneticInformationCopyright©2007byW.H.FreemanandCompanyBerg•Tymoczko•Stryer这个母亲和她的两个女儿基因相同,所以她们长得很相像。基因必须表达后才能执行其功能。蛋白质调节基因的表达。锌指纹蛋白是一个调节基因表达的蛋白质。该蛋白质(用绿色球表示锌;用红色表示蛋白质)能够与相应的DNA区域(黑色)结合。这段DNA区域就是基因表达的调控区域[(left)BarnabyHall/Photonica.(right)Drawnfrom1AAY.pdb]。图4.1核酸的聚合物结构。图4.2核糖和脱氧核糖。糖单位的院子用阿拉伯数字加“’”表示,以区别于碱基原子的序号(图4.4)。图4.3DNA和RNA的骨架。核酸骨架用3’-到5’-的磷酸二酯键连接。其中一个糖单位用红色强调,一个磷酸基用蓝色强调。图4.4嘌呤和嘧啶。碱基原子的编号不加“’”。RNA分子用尿嘧啶替代DNA的胸腺嘧啶。图4.5核苷的糖苷键是b-型。图4.6腺嘌呤核苷5’-三磷酸(ATP)和脱氧鸟嘌呤核苷3’-磷酸(3’-dGMP)。缩写pApCpG或pACG表示一个三核苷酸DNA,是用磷酸二脂键连接的脱氧腺苷单磷酸、脱氧胞苷单磷酸、和脱氧鸟苷单磷酸。p表示一个磷酸基团(图4.7)。5'-端有一个磷酸基团与核糖5'-OH结合。注意,核酸与多肽链一样有极性。因此,ACG和GCA是两种不同的化合物。大肠杆菌基因组只有一个DNA双链,每条链的长度是460万核苷酸(图4.8)。已知DNA最长的生物是印度muntjak(亚洲鹿),其基因组长度与人基因组长度相当,但只有3种染色体,其中最长的染色体长度含有10亿多个核苷酸。如果将这种DNA分子完全伸展,其长度将超过1英尺。有些植物染色体含有更长的DNA分子。在确定DNA三维结构的过程中发现碱基特异性配对。MauriceWilkins和RosalindFranklin获得了DNA纤维的x-光衍射图谱(图4.10)。该衍射图谱说明DNA是两条链缠绕形成规则的螺旋结构。从这些数据及其他数据,JamesWatson和FrancisCrick推测DNA具有双螺旋结构,这种双螺旋结构与核酸的功能相吻合。JamesWatson和FrancisCrick从x-光衍射图谱推测的DNA双螺旋结构具有下列特征:1.两条核酸链方向相反,围绕同一轴缠绕形成螺旋结构。2.糖-磷酸骨架在双螺旋外侧,碱基处于双螺旋内部。3.碱基几乎与双螺旋轴垂直,相邻碱基间的距离是3.4A。这种间距在x-光衍射图谱(图4.10)中可以看出。一个螺旋结构重复是34A,10个碱基。因此每个碱基旋转36o。4.螺旋的直径是20A。图4.11Watson-Crick的DNA双螺旋结构模型。一条多核苷酸连用蓝色表示,另一条多核苷酸连用红色表示。嘌呤和嘧啶碱基用较浅的颜色表示,糖磷酸骨架的颜色较深。(A)轴向观测图。沿螺旋轴(垂直方向)每隔34A(即一条链的10个核苷酸)就出现一次重复。(B)星形观测图,沿螺旋的纵轴朝里面观察。鸟嘌呤与胞嘧啶配对和腺嘌呤与胸腺嘧啶配对的形状几乎相同(图4.12)。碱基配对能够解释ErwinChargaff在1950年观察的现象,即所有DNA分子中腺嘌呤与胸腺嘧啶的比例和鸟嘌呤与胞嘧啶的比例几乎相同,而腺嘌呤与鸟嘌呤的比值在不同物种中差异很大(表4.1)。在双螺旋内部,一层碱基对堆积在另一层碱基对上。碱基堆积作用包括(1)疏水效应稳定了DNA双螺旋结构。疏水碱基聚集于双螺旋内部(避开DNA的水环境),而双螺旋表面更亲水。(2)疏水效应使碱基堆积于另一个碱基之上,一对碱基的范德华力达2~4kJ/mol(0.5~1kcal/mol),跟多碱基堆积产生的总和非常显著。此外DNA分子骨架的刚性五元环糖基结构也有利于碱基堆积。半保留复制图4.14密度梯度离心分离15NDNA和14NDNA。(A)离心管的紫外吸收图谱显示两条不同的DNA条带。(B)两条带的紫外吸收峰。1958年MathewMeselson和FranklinStahl的试验验证了这个假说。图4.15用密度梯度离心检测E.coliDNA的半保留复制。DNA条带的位置取决于DNA分子的15N和14N含量。复制一代,所有DNA是一半为15N,另一半是14N的杂合链。实验解释。图4.16半保留复制模型。亲本DNA用蓝色表示,新合成DNA用红色表示。核酸堆积碱基所吸收的紫外光比非堆积碱基所吸收的紫外光弱,这种效应叫减色效应(hypochromism)。因此,核酸熔化的检测就很简单,只是测定紫外吸收值。核酸的最大吸收峰在260nm波长处(图4.17)。核酸堆积碱基所吸收的紫外光比非堆积碱基所吸收的紫外光弱,这种效应叫减色效应(hypochromism)。因此,核酸熔化的检测就很简单,只是测定紫外吸收值。核酸的最大吸收峰在260nm波长处(图4.17)。DNA熔点(Tm)指一半的双螺旋结构遭到破坏的温度。Tm值与DNA纯度无关。图4.18线粒体环状DNA的电镜图谱。(A)松弛的环状DNA。(B)超螺旋环状DNA。封闭的DNA分子就是环状DNA。双螺旋DNA的轴进一步扭曲缠绕形成超螺旋(图4.18B)。超螺旋具有重要的生物学意义,原因是(1)超螺旋使DNA分子压缩更紧密;和(2)超螺旋可能阻碍或促进双螺旋的解旋,从而影响DNA与其它分子之间相互作用。图4.19茎环结构。单链DNA或单链RNA能够形成茎环结构。图4.20一个RNA分子所形成的复杂结构。RNA链可以折回与自身链的另一区域形成复杂结构。(A)茎环结构含有标准的Watson-Crick碱基对,也有非标准的碱基配对。(B)RNA分子的三维结构和三个核苷酸之间的远程相互作用。左边图中,胞苷酸用蓝色表示、腺苷酸用红色表示、鸟苷酸用黑色表示、鸟苷酸用绿色表示。右边图中,标准Watson-Crick碱基对的氢键用黑色虚线表示,其它氢键用绿色虚线表示。图4.21DNA聚合酶催化的聚合反应。DNA合成具有下列特征:1.需要四种前体(即脱氧核苷5'-三磷酸dATP,dGTP,dCTP,和TTP)和Mg2+离子。2.需要模板。新进入的核苷酸与模板链相应位点的碱基完全互补,DNA聚合酶才能催化此反应形成磷酸二酯键。因此DNA聚合酶催化反应模板指导的、合成与模板互补的DNA链。3.需要引物启动DNA合成。引物链序列与模板链互补,并且有游离的3'-OH。DNA聚合酶催化的链延伸反应是生长链3'-OH亲核攻击脱氧核苷三磷酸最内部的磷原子(图4.22),形成磷酸二酯键,释放焦磷酸。随后焦磷酸酶水解焦磷酸、形成两个磷酸根。DNA链延伸的方向从5'-到3'-。4.很多DNA聚合酶能够删除DNA链误配核苷酸,从而纠正错误。这些DNA聚合酶的核酸酶活性能够切除碱基错误的核苷酸。核酸酶活性显著提高了DNA合成的忠实度,使每个碱基的错误率低于10-8。图4.22链延伸反应。DNA聚合酶催化磷酸二酯键的形成。有些病毒的基因是RNA1.有些病毒的基因也是DNA。2.有些病毒的基因是RNA。病毒是用蛋白质包裹遗传物质的颗粒,独立状态下病毒不能繁殖,但是能够在细胞内繁殖、并从一个细胞转移到另一个细胞。3.烟草花叶病毒能够感染烟草叶子。病毒颗粒有一个单链RNA分子(有6390核苷酸),和包裹该核酸分子的蛋白质衣壳。衣壳由2130个完全相同的亚基构成。一种RNA聚合酶在RNA模板指导下合成RNA分子(负责病毒RNA的复制),这种酶称为RNA-指导的RNA聚合酶。4.另一类重要的RNA病毒是反转录病毒。图4.23反转录病毒遗传信息流动(从RNA到DNA)。反转录酶是感染病毒颗粒携带的DNA聚合酶,能够将反病毒RNA基因组转变成DNA。反转录没具有下列活性:催化合成与RNA链互补的DNA链;降解RNA/DNA杂合链的RNA链;随后合成另一条与RNA序列相同的DNA链。DNA序列信息转化成RNA和蛋白质的过程叫基因表达1.mRNA是蛋白质合成的模板。大肠杆菌的一个基因或一组基因转录产生一种mRNA分子。真核生物一个基因就能产生一种mRNA。细胞内mRNAs差异很大。在原核生物,mRNA分子的平均长度是1.2kb左右。真核生物mRNA有相应的结构(包括茎环结构),这些结构能调节mRNA的翻译效率和mRNA的寿命。2.tRNA是多肽合成的氨基酸载体。tRNA的长度约为75核苷酸(相当于25kd)。3.rRNA是核糖体的主要组分。原核生物有三类rRNA,原核rRNA分别为23S,16S,和5SRNA。每个核糖体含有一个23S,一个16S,和一个5SRNA。RNA分子是蛋白质合成的真正催化剂。图4.24RNA聚合酶。RNA聚合酶有很多亚基,包括b-亚基(红色)和b'-亚基(黄色)。这些亚基之间形成一个“钳子”结构将转录DNA夹住。活性位点还有一个Mg2+(绿色),弯曲管道表示多肽链骨架。RNA聚合酶需要下列组分:1.模板。优先选择的模板是DNA双链。单链DNA分子也能充当RNA合成的模板。但是RNA分子(无论单链还是双链)都不能充当负责转录的RNA聚合酶酶促反应的模板,RNA-DNA杂合链也不能充当RNA聚合酶促反应的模板。2.活化前体,即四种核苷5‘-三磷酸。3.二价金属离子,如Mg2+或Mn2+。RNA合成和DNA合成有几个共同点(图4.25)。(1)合成方向也是从5'-3'。(2)延伸机制类似,即生长链的3'-OH亲和进攻参与的核苷三磷酸最内部的磷原子。(3)合成的驱动力是焦磷酸水解。与DNA聚合酶不同的是,RNA聚合酶促反应不需要引物。此外RNA聚合酶没有核酸酶活性,缺乏校正功能。RNA接受DNA序列指导的证据序列测定图4.27原核生物(A)和真核生物(B)的转录启动子。图中标出了启动子的公共序列。转录起始位点的核苷酸是+1位,与+1位相邻的5’-核苷酸叫-1位。所显示的序列是编码链的核苷酸序列。图4.28EcolimRNA3’-末端的核苷酸序列。该区域有一个稳定的发夹结构,发夹结构后面是一串尿苷酸。另一种终止机制需要r因子协助。图4.29真核mRNA的修饰。真核生物mRNA转录产物需要修饰。5’-末端添加帽子核苷酸,3’-末端添加poly(A)。图4.30氨基酸与tRNA分子连接。氨基酸(蓝色)与tRNA分子末端腺苷酸的3’-OH连接形成酯。图4.31氨酰-tRNA分子的通用结构。氨基酸与RNA分子3’-末端结合。反密码子是模板识别位点。tRNA分子三叶草结构中碱基之间有很多氢键(绿色点)。氨酰-tRNA合成酶催化将氨基酸与相应的tRNA分子连接,反应需要ATP水解提供能量。一种氨基酸至少有一种氨酰-tRNA合成酶。tRNA分子识别模板的位点就是三碱基构成的反密码子。1.三个核苷酸编码一个氨基酸。2.密码子不重叠。如果一个序列是ABCDEF,在重叠的情况下ABC编码第一个氨基酸,BCD编码下一个氨基酸,CDE编码第三个氨基酸,如此下去。在不重叠的情况下,ABC编码第一个氨基酸,DEF编码第二个氨基酸,如此下去。遗传学试验证实密码子不重叠。3.密码子没有逗号。从固定的起点开始,一个接一个地读下去,没有逗号(不会停顿)。4.遗传密码有简并性。很多氨基酸有多个遗传密码。三联碱基有64种组合。3种三联碱基是终止密码子,其余61种组合编码20种氨基酸。因此多数氨基酸有一个以上的密码。编码同一氨基酸的不同三联碱基称为同义密码(synonyms)。多数同义密码子处于同一方格中(除非某个氨基酸有4个以上的同义密码)。同义密码通常前两位的核苷酸相同,只是第三位的核苷酸有差异,如编码颉氨酸的GUA,GUC,GUG,和GUU。就是说大多数同义密码子最后一位核苷酸不同。仔细观察密码子表还发现,XYC和XYU通常编码同一氨基酸,而XYG和XYA也是编码同一种氨基酸。我们在第30.3节介绍tRNA反密码子特性时会指出这种等效性的结构基础。原核生物的起始氨基酸。UAA