-1第三章生物信息的传递(上)─从DNA到RNA转录的概述合成RNA的酶类原核与真核生物mRNA的特征比较原核生物的转录真核生物的转录内含子的剪接、编辑及化学修饰-3生物信息的传递从DNA到RNA基因作为唯一能够自主复制、永久存在的单位,其生物学功能是以蛋白质的形式表达出来的。DNA序列是遗传信息的贮存者,它通过自主复制得到永存,并通过转录生成信使RNA,翻译生成蛋白质的过程来控制生命现象。-4基因表达包括转录(transcription)和翻译(translation)两个阶段。转录是指拷贝出一条与DNA链序列完全相同(除了T→U之外)的RNA单链的过程,是基因表达的核心步骤。翻译是指以新生的mRNA为模板,把核苷酸三联遗传密码子翻译成氨基酸序列、合成多肽链的过程,是基因表达的最终目的。-5DNA分子中的核苷酸排列顺序不但决定了胞内所有RNA及蛋白质的基本结构,还通过蛋白质(酶)的功能间接控制了细胞内全部有效成份的生产、运转和功能发挥。-6第一节转录的概述要点:编码链(有意义连)模板链(反义链)转录的基本过程-7•与mRNA序列相同的那条DNA链是编码链(codingstrand)或称有意义连(sensestrand)•根据碱基互补原则指导mRNA合成的DNA链则被称为模板链(templatestrand)或称反义链(antisensestrand)-8DNA模板与mRNA分子及多肽链之间存在共线性关系-9因为只有mRNA所携带的遗传信息才被用来指导蛋白质生物合成,所以人们一般用U、C、A、G这4种核苷酸而不是T、C、A、G的组合来表示遗传性状。-10生物体内拥有三类RNA:•编码特定蛋白质序列的mRNA;•能特异性解读mRNA中的遗传信息并将其转化成相应氨基酸后加入多肽链中的tRNA;•直接参与核糖体中蛋白质合成的rRNA。-11转录的基本过程无论是原核还是真核细胞,转录的基本过程都包括:•模板识别•转录起始•通过启动子•转录的延伸和终止-12•模板识别阶段主要指RNA聚合酶与启动子DNA双链相互作用并与之相结合的过程。转录起始前,启动子附近的DNA双链分开形成转录泡以促使底物核糖核苷酸与模板DNA的碱基配对。•转录起始就是RNA链上第一个核苷酸键的产生。-13转录起始后直到形成9个核苷酸短链是通过启动子阶段,此时RNA聚合酶一直处于启动子区,新生的RNA链与DNA模板链的结合不够牢固,很容易从DNA链上掉下来并导致转录重新开始。-14•一旦RNA聚合酶成功地合成9个以上核苷酸并离开启动子区,转录就进入正常的延伸阶段。所以,通过启动子的时间代表一个启动子的强弱。•一般说来,通过启动子的时间越短,该基因转录起始的频率也越高。-15•RNA聚合酶离开启动子,沿DNA链移动并使新生RNA链不断伸长的过程就是转录的延伸。•大肠杆菌RNA聚合酶的活性一般为每秒50-90个核苷酸。随着RNA聚合酶的移动,DNA双螺旋持续解开,暴露出新的单链DNA模板,新生RNA链的3’末端不断延伸,在解链区形成RNA-DNA杂合物。-16真核生物RNA聚合酶不能直接识别基因的启动子区,需要一些被称为转录调控因子的辅助蛋白质按特定顺序结合于启动子上,RNA聚合酶才能与之相结合并形成复杂的前起始复合物(preinitiationtranscriptioncomplex,PIC),以保证有效地起始转录。-1737℃时,转录生成mRNA的速度大约是每分钟2500个核苷酸,即每秒钟合成14个密码子,而蛋白质合成的速度大约是每秒钟15个氨基酸。正常情况下,从一个基因开始表达到细胞中出现其mRNA的间隔约为2.5分钟,而再过半分钟就能在细胞内测到相应的蛋白质。-20第二节合成RNA的酶类、转录因子要点:1.大肠杆菌RNA聚合酶(全酶、核心酶、σ因子):性质与功能2.真核生物RNA聚合酶Ⅰ、Ⅱ、Ⅲ:性质与功能3.转录因子-21RNA聚合酶RNA聚合酶是转录过程中最关键的酶,主要以双链DNA为模板,以4种核苷三磷酸作为活性前体,并以Mg2+/Mn2+为辅助因子,催化RNA链的起始、延伸和终止,它不需要任何引物,催化生成的产物是与DNA模板链相互补的RNA。-22•RNA或RNA-DNA双链杂合体不能作为模板。•原核和真核生物的RNA聚合酶虽然都能催化RNA的合成,但在其分子组成、种类和生化特性上各有特色。-23大多数原核生物RNA聚合酶的组成是相同的,大肠杆菌RNA聚合酶由2个α亚基、一个β亚基、一个β’亚基和一个ω亚基组成,称为核心酶。加上一个σ亚基后则成为聚合酶全酶(holoenzyme),相对分子质量为4.65×105。-25表3-1大肠杆菌RNA聚合酶的组成分析亚基基因相对分子量亚基数组分功能αrpoA3.7×1042核心酶核心酶组装,启动子识别。βrpoB1.5×1051核心酶β和β’共同形成RNA合成的活性中心。β’rpoC1.6×1051核心酶?11×1041核心酶未知σrpoD7.0×1041σ因子存在多种σ因子,用于识别不同的启动子-26α亚基可能与核心酶的组装及启动子识别有关,并参与RNA聚合酶和部分调节因子的相互作用。T4噬菌体感染大肠杆菌后对α亚基的一个精氨酸残基进行ADP糖基化修饰,造成RNA聚合酶全酶对启动子亲和力降低。-27由β和β’亚基组成了聚合酶的催化中心,它们在序列上与真核生物RNA聚合酶的两个大亚基有同源性。β亚基能与模板DNA、新生RNA链及核苷酸底物相结合。-28σ因子的作用是负责模板链的选择和转录的起始,它是酶的别构效应物,使酶专一性识别模板上的启动子。核心酶在T7噬菌体DNA上约有1300个结合位点,平均结合常数为2×1011。-29•σ因子可以极大地提高RNA聚合酶对启动子区DNA序列的亲和力,酶底物结合常数提高103倍,酶底物复合物的半衰期可达数小时甚至数十小时。•σ因子还能使RNA聚合酶与模板DNA上非特异性位点的结合常数降低104倍,使酶底物复合物的半衰期小于1秒。•σ因子使RNA聚合酶全酶识别启动子序列的特异性提高了107倍。-30表3-2大肠杆菌中的σ因子能识别并与启动子区的特异性序列相结合因子基因功能-35区间隔(bp)-10区σ70rpoD广泛TTGACA16-18TATAATσ32rpoH热休克TCTCNCCCTTGAA13-15CCCCATNTAσ54rpoN氮代谢CTGGNA6TTGCA-31枯草杆菌中有6种不同相对分子质量的σ因子,其中σ55是主要存在形式,出现在营养细胞中,σ29则主要出现在胞子形成阶段,参与胞子形成期基因转录的调控。在大肠杆菌中,最常见的调控因子是由rpoD基因所编码的σ70。-32由rpoH编码的σ32是与热休克启动子所控制的基因转录密切相关。由rpoN编码的σ54则参与细胞的氮代谢。由T4噬菌体所编码的σ55能与大肠杆菌RNA聚合酶的核心酶结合,启动T4晚期基因的转录。-33真核生物中有3类RNA聚合酶,其结构比大肠杆菌RNA聚合酶复杂,它们在细胞核中的位置不同,负责转录的基因不同,对α-鹅膏覃碱的敏感性也不同。真核生物RNA聚合酶一般有8-14个亚基所组成,相对分子质量超过5×105Da。-35表3-4真核生物RNA聚合酶的亚基RNA聚合酶ⅠRNA聚合酶ⅡRNA聚合酶ⅢRPA1RPB1RPC1RPA2RPB2RPC2RPC5RPB3RPC5RPC9RPB11RPC9RPB6RPB6RPB6其他9个亚基其他7个亚基其他11个亚基-36真核生物RNA聚合酶的主要特征:聚合酶中有两个相对分子质量超过1×105Da的大亚基;同种生物3类聚合酶有“共享”小亚基的倾向,即有几个小亚基是其中3类或2类聚合酶所共有的。-37-38表3-6真核细胞中的部分转录调控因子分析转录因子DNA结合区的特征DNA结合区序列在生物体内的分布组成型转录因子CTF/NF1CAAT区5’-GCCAATCT-3’广泛CPCAAT区5’-GCCAATCT-3’广泛C/EBPCAAT区5’-GCCAATCT-3’广泛Sp1GC区5’-GGGCGG-3’广泛Oct-1八碱基区5’-ATGCAAAT-3’广泛Oct-2八碱基区5’-ATGCAAAT-3’B-淋巴细胞应答蛋白热激因子HSE5’-CNNGAANNTCCNNG-3’受热激以后血清反应因子SRE5’-CCATATTAGG-3’受血清生长因子刺激细胞特异性因子GATA-1–5’-GATA-3’成红细胞Pit-1–5’-ATATTCAT-3’腺体细胞MyoD1E区5’-CANNG-3’成肌细胞NF-кBКB位点5’-GGGACTTTCC-3’淋巴细胞-39表3-7常见的转录抑制剂抑制剂靶酶抑制作用利福霉素细菌全酶和β亚基结合,抑制起始利迪链霉素细菌核心酶和β亚基结合,抑制起始放线菌素D真核RNA聚合酶Ⅰ与DNA结合,阻止延伸Α-鹅膏蕈碱真核RNA聚合酶Ⅱ与RNA聚合酶Ⅱ结合Ⅰ-40第三节mRNA原核生物mRNA的特征真核生物mRNA的特征-41原核与真核生物mRNA的特征比较RNA在大肠杆菌细胞内占总RNA的2%左右,tRNA占16%,rRNA则占80%以上。真核细胞的mRNA往往以较大相对分子量的前体RNA出现在核内,只有成熟的、相对分子质量明显变小并经化学修饰的mRNA才能进入细胞质,参与蛋白质的合成。所以,真核细胞mRNA的合成和功能表达发生在不同的空间和时间范畴内。-42原核生物mRNA的特征1.半衰期短。2.原核生物中,mRNA的转录和翻译是在同一个细胞空间里同步进行的,蛋白质合成往往在mRNA刚开始转录时就被引发了。3.-432.原核细胞的mRNA(包括病毒)有时可以编码几个多肽,而真核细胞的mRNA最多只能编码一个多肽。我们把只编码一个蛋白质的mRNA称为单顺反子mRNA(monocistronicmRNA),把编码多个蛋白质的mRNA称为多顺反子mRNA(polycistronicmRNA)。-44几乎所有mRNA都可以被分成3部分:编码区和位于AUG之前的5’端上游非编码区以及位于终止密码子之后不翻译的3’端下游非编码区。编码区从起始密码子AUG开始经一连串编码氨基酸的密码子直至终止密码子。-453.原核生物mRNA的5’端无帽子结构,3’端没有或只有较短的多聚(A)结构。原核生物起始密码子AUG上游7-12个核苷酸处有一被称为SD序列(Shine–Dalgarnosequence)的保守区,因为该序列与16S-rRNA3’端反向互补,所以被认为在核糖体-mRNA的结合过程中起作用。-464.原核生物常以AUG(有时GUG,甚至UUG)作为起始密码子,而真核生物几乎永远以AUG作为起始密码子。-47真核生物mRNA的特征1.半衰期较原核生物长,但平均也只有5小时。编码功能蛋白的真核基因都通过RNA聚合酶II进行转录,几乎都是单顺反子,其长度在几百到几千个核苷酸之间。一个完整的基因,不但包括编码区(codingregion),还包括5'和3'端长度不等的特异性序列,它们虽然不编码氨基酸,却在基因表达的过程中起着重要作用。-48“基因”的分子生物学定义是:产生一条多肽链或功能RNA所必需的全部核苷酸序列。真核生物mRNA结构上的最大特征是5’端的帽子及3’的多聚(A)结构。-492.真核生物mRNA的5’端存在“帽子”结构。真核生物基因转录一般从嘌呤(主要是A,也可能是G)起始,其5’端大都经过修饰,第一个核苷酸保留了5’端的三磷酸基团。用核酸酶处理成熟mRNA,其5’端并不产生预期的核苷三磷酸,而产生以5’-5’三磷酸基团相连的二核苷酸,5’终端是一个在mRNA转录后加上去的甲基化鸟嘌呤。-50-513.绝大多数真核生物mRNA具有多聚(A)尾巴。除组蛋白基因外,真核生物mRNA的3’末端都有多聚(A)序列,其长度因mRNA种类不同而变化,一般为40-200个左右真核基因的3‘末端转录终止位点上游15~30bp处的保守序列AAUAAA对于初级转录产物的准确切割及加多聚(A)是必需的。-52图3-18真核生物mRNA