第8章转录产物的加工化学工业出版社基因转录的直接产物即初级转录物(primaryrtanscripts)通常是没有功能的,必须经历转录后加工(posttranscriptionalprocessing)才会转变为有活性的成熟RNA分子。转录产物的加工是基因表达的一个重要环节,对其进行深入研究,可以促进生命科学基础学科的发展,例如核酶就是在研究转录产物加工时发现的。此外,这一领域的研究,也有可能为生命科学在农业和医学领域的应用提供新途径,比如参与转录产物加工的小RNA,及其与蛋白质的复合物RNP如何影响某些基因的表达和细胞的功能,有无可能用此途径控制疾病,已成为当前研究工作的一个热点领域。本章主要讨论RNA剪接的机制,可变剪接、反式剪接和RNA编辑将在第12章介绍。8.1原核生物RNA的转录后加工在原核生物中,rRNA的基因与某些tRNA的基因组成混合操纵子,其余tRNA基因也成簇存在,并与编码蛋白质的基因组成操纵子。它们在形成多顺反子转录物后,经切割成为rRNA和tRNA的前体,然后进一步加工成熟。除了少数例外,原核生物的mRNA一经转录,通常都立即进行翻译,一般不进行转录后的加工。8.1.1原核生物tRNA前体的加工E.coli基因组共有约60个tRNA基因,大于按照变偶假说推算出来的反密码子的需求数,说明某些tRNA基因不是只有一个拷贝。原核生物的tRNA基因以多顺反子(poly-cistron)的形式被转录,转录产物都是很长的前体分子。通常由多个相同tRNA基因或不同的tRNA串联排列,或与rRNA的基因,或与编码蛋白质的基因组成混合转录单位。tRNA前体必须经过切割和核苷酸的修饰,才能成为有功能的成熟分子。8.1.1.1tRNA3'-端的成熟tRNA前体分子的3'-端是在多种RNase的共同参与下逐步加工成熟的,在离体条件下,这些酶是RNaseP、RNaseF、RNaseD、RNaseBN、RNaseT、RNasePH、RNaseII和多核苷酸磷酸化酶(polynucleotide,PNPase)。(1)切割首先由内切核酸酶RNaseP将tRNA前体分子水解成为3'-端和5'-端仍含有额外核苷酸的tRNA片段,随后,由内切核酸酶RNaseF对tRNA前体靠近3'-端处进行逐步切割。研究发现,RNasePH和RNaseT对tRNA前体分子3'-端的正确剪接和成熟十分重要(图8-2)。(2)修剪外切核酸酶RNaseD从前体3'-端再逐个切去附加序列,这个酶具有严格的选择性,它能识别整个tRNA分子的结构,是tRNA的3'-端成熟酶。(3)添加3‘-端CCA已知所有成熟tRNA分子的3’-端都有CCA-OH结构,这是氨基酸接受部位的特有结构。细菌有两类不同的tRNA前体,I型前体分子的附加序列被切除后,即显露出自身所具有的3‘-端CCA-OH结构。II型前体分子自身没有3’-端的CCA结构,其成熟分子的CCA-OH结构是在切除3‘-端附加序列后,在tRNA核苷酰转移酶的作用下,逐个添加上去的。tRNA+CTP→tRNA-C+PPitRNA-C+CTP→tRNA-CC+PPitRNA-CC+ATP→tRNA-CCA-OH+PPi8.1.1.2tRNA分子5′-端的成熟由RNaseIII水解生成的tRNA片段,其5'-端仍含有额外的核苷酸,这些额外的核苷酸由RNaseP催化切除。来自细菌和真核细胞细胞核的RNaseP结构非常类似,都含有RNA和蛋白质,其中的RNA称为MlRNA,其Mr约为125×103,而蛋白质的Mr只有14×103。体外实验发现MlRNA单独存在时,也有一定的催化活性。tRNA前体分子的5'-端一般都有约40nt的前导序列,可以形成RNaseP能够识别的茎环二级结构,使RNaseP能将tRNA前体5'-端额外的核苷酸逐个切除(图8-2)。8.1.1.3核苷酸的修饰成熟的tRNA分子中存在着许多的修饰碱基等成分,包括各种甲基化碱基和假尿嘧啶核苷。tRNA修饰酶具有高度特异性,每一种修饰核苷都有催化其生成的修饰酶。tRNA甲基化酶对碱基及tRNA序列均有严格要求,甲基供体一般为S-腺苷甲硫氨酸(S-adenosylmethionine,SAM)。tRNA分子中的假尿嘧啶核苷合成酶催化尿苷的糖苷键转移,由尿嘧啶的N1变为C5。8.1.2原核生物rRNA前体的加工E.coli有rrnA~rrnG共7个rRNA转录单位分散在基因组中,每个转录单位由16SrRNA、23SrRNA、5SrRNA以及tRNA的基因组成。它们在染色体上并不紧密连锁,但每个rRNA的排列和序列十分保守。tRNA基因在操纵子中的数量、种类和位置都不固定,或在16SrRNA和23SrRNA之间的间隔序列中,或在5SrRNA的3'-端之后。所有的转录单位都含有两个启动子,P1在16SrRNA基因的转录起点上游150~300bp处,P2在P1下游110bp处。rRNA基因的初级转录物为30S的rRNA前体分子,其Mr为2.1×106,约6500nt,5'-端为pppA。由于原核生物rRNA前体的加工一般与转录同时进行,因此不易得到完整的前体。rRNA前体的加工主要由RNaseIII负责,从RNaseIII缺陷型的E.coli中可分离得到30SrRNA前体(P30)。RNaseIII是一种负责RNA加工的内切核酸酶,它的识别部位是特定的RNA双螺旋区。比较不同rRNA前体分子序列时发现,其间隔序列很相似,且23SrRNA和16SrRNA各自的5'-端与3'-端可形成茎环结构。RNaseIII在茎部错位两个2bp的位点切割,产生16SrRNA的前体P16(17S),和23SrRNA的前体P23(25S)。5SrRNA的前体P5在RNaseE作用下产生,RNaseE可识别P5两端形成的茎环结构。随后,P5、P16和P23两端的多余序列需被核酸酶切除。图8-1为原核生物rRNA前体加工的示意图,图中1所指的是RNaseIII的水解位置,2所指的是RNaseP的水解位置,3所指的是RNaseE的水解位置。不同细菌rRNA前体的加工过程并不完全相同,但基本过程类似。在rrn操纵子的16SrRNA与23SrRNA基因之间具有400~500bp的间隔序列,并有一到几个tRNA基因。如E.coli有4个rrn操纵子的这一间隔序列内有单个tRNAGlu因。其他3个rrn操纵子的间隔序列有2个tRNA基因,即tRNA1Ile和tRNA2Glu。rRNA前体要先经过甲基化的修饰,才能被内切核酸酶和外切核酸酶切割。原核生物rRNA有多个甲基修饰成分,可甲基化碱基和核糖,最常见是2'-甲基核糖。16SrRNA约含10个甲基,23SrRNA约20个,其中N4-2'-O-甲基胞苷(m4Cm)是16SrRNA特有的成分。5SrRNA一般无修饰成分,不进行甲基化反应。8.1.3原核生物mRNA前体的加工细菌的转录和翻译不存在时空间隔,mRNA的初始转录产物一般不需要加工,在转录的同时即可翻译。多顺反子的mRNA可被翻译成多聚蛋白质,再切割成不同的蛋白质分子,但也有少数多顺反子mRNA需通过内切核酸酶切成较小的单位后才进行翻译。例如,E.coli位于89~90位置的一个操纵子含有rp1J(编码核糖体大亚基蛋白L10)、rplL(编码核糖体大亚基蛋白L7/L12)、rpoB(编码RNApolβ亚基)和rpoC(编码RNApolβ'亚基)4个基因,在转录出多顺反子mRNA前体后,由RNaseIII将核糖体蛋白与RNApol亚基的mRNA切开,各产生两个成熟的mRNA,之后再各自进行翻译。核糖体蛋白质的生成必须与rRNA的合成水平,和细胞的生长速度相适应,其mRNA应当有较高的翻译水平。而细胞内RNApol的水平则要低得多,其mRNA不需要较高的翻译水平。将二者的mRNA切开,有利于它们各自的翻译调控。某些噬菌体多顺反子mRNA也有类似的加工过程,如大肠杆菌T7噬菌体早期转录区的6个基因,转录生成一条多顺反子的mRNA前体,前体分子内每个mRNA之间分别形成茎环结构。由RNaseIII对茎结构内不配对的小突环进行酶切,将前体分子酶切成为6个成熟的mRNA,再进行各自的翻译(图8-3)。研究发现,这种由茎环结构调控的RNA加工有一定的普遍性。8.2真核生物tRNA前体的转录后加工8.2.1真核生物tRNA前体的结构特点真核生物tRNA基因的结构与原核生物有两个较大的差异。(1)基因排列tRNA基因数目比原核生物多,E.coil约有60个tRNA基因,果蝇有750个,酵母有320~400个,爪蟾约8000个。真核生物的tRNA基因成簇排列,各基因之间有一定的间隔。但各个tRNA基因作为独立的单位转录,tRNA前体是单顺反子的。(2)内含子结构真核生物tRNA基因有内含子,其前体必须经过剪接。内含子的特点是:①长度和序列没有共同性,一般有16~46个核苷酸。②位于反密码子的下游(即在3'-端一侧)。③内含子和外显子间的边界没有保守序列,其内含子的剪接方式不符合一般规律。真核生物tRNA前体中内含子的精确切除信号是tRNA分子高度保守的二级结构,而不是内含子的保守序列,剪接需要RNase的参与。8.2.2内含子的剪接真核生物tRNA前体分子的剪接分为两步:①tRNA内切核酸酶(tRNAendonuclease)切割前体分子中的内含子;②RNA连接酶(RNAligase)将两个半分子连接在一起。用凝胶电泳分析在tRNA前体中加入内切核酸酶后的反应结果,呈现两条带,其中一条是剪切后游离的内含子片段,另一条是通过氢键配对结合在一起的5'-端和3'-端外显子,又称为tRNA的半分子(tRNAhalfmolecule),是剪切的中间产物(图8-4)。在内切酶切割时。3'-端切点生成2',3'-环磷酸,5'-端切点生成-OH基,由于3'-端的末端结构特殊,不能直接连接,需在环磷酸二酯酶(cyclicnucleotidephosphodiesterase)作用下,使2',3'-环磷酸水解,形成3'-OH和2'-磷酸基。3'-端半分子的5'-OH在多核苷酸激酶(polynucleotidekinase)催化下磷酸化,才能进行连接反应。在连接过程中,首先由ATP通过形成连接酶-AMP共价中间物将连接酶激活,然后,将两个外显子通过3',5'-磷酸二酯键连接起来。多余的2'-磷酸由磷酸酶水解除去(图8-5)。tRNA的加工ProcessingoftRNAsinbacteriaandeukaryotes.TheyeasttRNATyrisusedtoillustratetheimportantsteps.Thenucleotidesequencesshowninyellowareremovedfromtheprimarytranscript.Theendsareprocessedfirst,the5'endbeforethe3'end.CCAisthenaddedtothe3'end,anecessarystepinprocessingeukaryotictRNAsandthosebacterialtRNAsthatlackthissequenceintheprimarytranscript.Whiletheendsarebeingprocessed,specificbasesintherestofthetranscriptaremodified.FortheeukaryotictRNAshownhere,thefinalstepissplicingofthe14-nucleotideintron.IntronsarefoundinsomeeukaryotictRNAsbutnotinbacterialtRNAs.8.2.3在3'-端添加-CCA真核生物中所有tRNA前体分子均缺乏3'-端的-CCA-OH结构,必须在tRNA核苷酸转移酶(tRNAnucleotidetransfer