现代分子生物学指导老师:杨林松演绎人:徐楸能18.1真核基因表达调控相关概念和一般规律8.1.1基因表达的基本概念•基因组:一个细胞或病毒所携带的全部遗传信息或整套基因。•基因:指能产生一条肽链或功能RNA所必需的DNA片段。它包括编码区和其上下游区域。以及在编码片段间(外显子)的间断切割序列(内含子)•基因表达:基因经过转录、翻译,产生具有特异生物学功能的蛋自质分子或RNA分子的过程。•基因表达调控:受内源及外源信号调控的这个调控的过程。28.1.2真核基因的断裂结构•1.外显子与内含子现已证明大多数真核基因都是蛋白质编码序列和非蛋自质编码序列两部分组成的(表8-1)。编码序列称为外显子,非编码序列称为内含子。在一个结构基因中,编码某一蛋自质不同区域的各个外显子并不连续排列在一起,而常常被长度不等的内含子所隔离,形成镶嵌排列的断裂方式。所以真核基因有时被称为断裂基因。3许多情况下,高等真核基因核DNA序列中对应于外显子的部分可能还不到10%图8-1是哺乳动物二氢叶酸还原酶基因,全长25一31kb,但6个外显子总长只有2kb。少数基因根本不带内含子。前尚不清楚内含子的生理功能。某些基因完全除去内含子以后,照样可以产生有活性的mRNA;另一些基因,如SV40T抗原基因,一旦除去内含子,成熟mRNA运人细胞质基质的过程就完全被阻断。4•研究发现,只有真核生物具有切除基闪中内含子,产生功能型mRNA和蛋内质的能力,原核生物一般不具有这种本领。如果要在原核细胞里表达真核基因,必须首先构建切除内含子的重组基因,才有可能得到所研究的蛋白质。5•2.外显子与内含子的连接区•真核基因断裂结构的另一个重要特点是外显子-内含子连接区的高度保守性和特异性碱基序列。•外外显子-内含子连接区就是指两者的交界或称边界序列,它有两个重要特征:内含子的两端序列之间没有广泛的同源性,因此内含子两端序列不能互补,说明在剪接加工之前,内含子上游序列和下游序列不可能通过碱基配对形成发夹式二级结构。外显子-内含子连接区序列虽然很短,但却是高度保守的,因此,该序列可能与剪接机制密切相关,是RNA剪接的信号序列。6•序列分析表明,几乎每个内含子5’端起始的两个碱基都是GT,而3’端最后两个碱基总是AG,由于这两个碱基的高度保守性和广泛性,把它称为GT-AG法则,•由于内含子两末端的序列不同,可定向标明内含子的两个末端,根据剪接加工过程沿内含子自左向古进行的原则,一般将内含子5‘端接头序列称为左剪接位点,3’端接头序列称为右剪接位点,故将前者称为供体位点,后者为受体位点。•外显子-内含子连接区的保守序列几乎存在于所有高等真核生物基闪中,表明可能存在着共同的剪接加工机制。但是在线粒体基因和酵母tRNA基因中不存在这类保守序列,暗示存在不同类型的剪接过程。7•3.外显子与内含子的可变调控•在基因转录,加工产生成熟mRNA分子时,内含子通过剪接加工被去掉,保留在成熟MRNA分子中的外显子被拼接在一起,最终被翻译成蛋白质。因此通过反转录酶的作用,该cDNA分子只含有外显子,没有内含子。•有些真核基因,如肌红蛋白重链基因却能精确地剪接成一个成熟的mRNA,我们称这种方式为组成型剪接。一个转录产物组成型剪接只能产生一种成熟的mRNA,编码一个多肤。但是,有不少真核基因的初级转录产物可通过不同的剪接方式,产生不同的mRNA并翻译成不同的蛋白质。另外一些核基因在转录时选择了不同的启动子,或者在转录产物上选择不同的多(A〕位点而使初级转录物具有不同的二级结构.因而影响剪接过程,最终产生不同的mRNA分子。8•选择性剪接:同一基因的转录产物由于不同的剪接方式形成不同mRNA的过程。•选择性剪接的典刑例子:小鼠淀粉酶基因表达的组织特异性变化9•在小鼠肝和唾液腺这两种组织中,淀粉酶mRNA的编码序列完全相同,但5‘端起始部分长度不同。•事实上,L外显子只是唾液腺淀粉酶基因中内含子序列的一部分,将在mRNA成熟过程中被切除。•有实验证明,由S外显子起始的转录产物是由L外显子起始转录产物的100倍以上。•由于一个基因的内含子成为另一个基因的外显子,形成基因的差异表达,这是真核基因断裂结构的一个重要特点。108.1.3基因家族•真核细胞的DNA是单顺反子结构,很•少出现置于一个启动子控制之下的操纵子。真核细胞中许多相关的基因常按功能成套组合,被称为基因家族。•同一家族的成员有时紧密地排列在一起,成为一个基因簇;但更多的时候,它们分散在同一染色体的不同部位.甚至位于不同的染色体上。具有各自不同的表达调控模式。11•1.简单多基因家族•简单多基因家族中的基因一般以串联方式相连。•基因组分析表明,大肠杆菌中共有7个这样的拷贝,每一个拷贝中只有tRNA基因的种类、数量和存在部位有些变化。12•在真核生物中,前rRNA转录产物的沉降系数为45S(约有1400个核苷酸),包括18s、28s和5.8S三个主要分子。前rRNA分子中至少有100处被甲基化(主要是核糖的2-OH甲基化),初级转录产物也被特异性RN4酶切割降解。产生成熟rRVA分子。这个过程需要snoRNA的参与(图8-4)•5SrRNA作为一个独认的转录单位,由RNA聚合酶3(而不是聚合酶I)完成转录。13果蝇tRNA基因家族具有两个海胆组蛋白家族所没有的特点:在基因家族中含有3个tRNAlys基因,而基因家族中的每个基因都单独按各自的方向进行转录。2.复杂多基因家族•复杂多基因家族一般由几个相关基因家族构成,基因家族之间由间隔序列隔开,并作为独立的转录单位。•海胆基因家族和果蝇tRNA基因家族(下图):14•3.发育调控的复杂多基因家族•血红蛋白是动物体内输送分子氧的住要载体,由2a2b组成的四聚体加血红素辅基(结合铁原子)后形成功能性血红蛋白。已知所有动物物种中血红蛋白基因的基本结构都相同(图8-6).•然而,在生物个体发育的不同阶段,却出现几种不同形式的a和b亚基。15•人a一珠蛋白基因簇位于16号染色体短臂上,占30kb左右.其中ξ为胚胎期基因(表8-2)。•β一珠蛋自基因簇位于11号染色体短臂上.占50-60kb。(图8-7)16不同发育阶段血红蛋白亚型17•胚胎期类α-珠蛋自,最先以ξ2型出现。以后逐渐被ξ1型所取代。•在胎儿期有两类等分子数β型链。因此,胚胎型血红蛋白中含有两个ξ2型α链和两个ξ2型β链。新生儿出生后,98%的血红蛋白中含有两个仪α2单位和两个β亚单位,2%的血红蛋白含两个α2单位和两个β亚单位。在每个基因家族中,基因排列的顺序就是它们在发育阶段的表达顺序(图8-8)。188.1.4基因表达的方式和特点1.基因表达的方式•根据对刺激的反应模式,可分为组成性表达和选择性表达两大类。•某些基因在个体的所有细胞中持续表达,这些基因即为管家基因.其表达模式又被称为组成性基因表达。管家基因通常具备以下特点:•①细胞结构和代谢过程中所必需的基因,例如编码rRNA、肌动蛋白、微管蛋白等的基因;②通常能够保持较高的表达量。根据这些特点,实验研究中常把rRNA、肌动蛋白或微管蛋白基因作为RT-PCR的对照。•在特定环境信号刺激下,相应的基因被激活,基因表达产物增加,这种基因称为可诱导基因。而如果基因被环境信号所被抑制,这种基因就是可阻遏基因(repmssihlegene)。基因表达调控大多数是对这些基因的转录和翻译速率的调节,从而导致其编码产物的水平发生改变并影响其功能。192.基因表达的时空特异性•基因表达的时间特异性(temporalspecificity),即按功能需要,某一特定基因的表达严格按特定的时M顺序发生。多细胞生物基因表达的时间特异性又称阶段特异性。•基因表达的空间特异性,是指在个体生长过程中,某种基因产物按不同组织空间顺序出现,基因表达伴随时间顺序所表现出的这种分布差异,实际上是由细胞在不同器官的分布所决定的。所以,空间特异性又称细胞或组织特异性。空间特异性的基因表达也普遍存在于动、植物生长发育的各个阶段,如果蝇胚胎发育中许多调节体节形成的基因表达均呈现出显著的组织特异性。基因表达调控能够维持细胞的增殖、分化,维持个体的生长、发育,有助于生物体更好地适应外界环境变化。208.1.5真核基因表达调控一般规律•真核生物和原核生物在基因表达调控上的巨大差别是由两者基本生活方式不同所决定的。原核生物一般为自由生活的单细胞,只要环境条件合适,养料供应充分,它们就能无限生长、分裂,因此,它们的调控系统就是要在一个特定的环境中为细胞创造高速生长的基础,或使细胞在受到损伤时,尽快得到修复。它们主要是通过转录调控,以开启或关闭某些基因的表达来适应环境条件(主要是营养水平的变化)。环境因子往往是调控的诱导物,群体中每个细胞对环境变化的反应都是直接和基本一致的。21主要步骤22•真核生物(除酵母、藻类和原生动物等单细胞类之外)主要由多细胞组成,每个真核细胞所携带的基因数a及总基因组中蕴藏的遗传信息最都大大高于原核生物,如人类细胞单倍体基因组就包含有3x10^9bP总DNA,约为大肠杆菌总DNA的800倍,是噬菌体总DNA的10万倍左右!•真核生物基因组DNA中有许多重复序列,基因内部还常插入不翻译成蛋白质的序列,都影响了真核基因的表达。真核生物的DNA还常与蛋白质(包括组蛋白和非组蛋白)结合,形成十分复杂的染色质结构。染色质构象的变化、染色质中蛋白质的变化及染色质对DNA酶敏感程度的变化等都会对基因表达产生重要影响。23•此外,真核生物染色质被包裹在细胞核内,基因的转录(核内)和翻译(细胞质基质内)被核膜所隔开,核内RNA的合成与转运,细胞质基质中RNA的剪接和加工等无不扩大了真核生物基因调控的范围,使真核生物基因调控达到了原核生物所不可能拥有的深度和广度。对大多数真核细胞来说,基因表达调控的最明显特征是能在特定时间和特定的细胞中激活特定的基因,从而实现“预定”的、有序的、不可逆转的分化、发育过程,并使生物的组织和器官保持正常功能。24•真核生物基因调控可分为两大类:•第一类是瞬时调控或称可逆性调控,它相当于原核细胞对环境条件变化所做出的反应,包括某种底物或激索水平升降时,或细胞周期不同阶段中梅活性的调节;•第二类是发育调控或称不可逆调控,是真核基因调控的精髓部分,它决定了真核细胞生长、分化、发育的全部进程。25根据基因调控在同一事件中发生的先后次序,又可将其分为转录水平调控及转录后水平调控,前者可以分为遗传水平的DNA调控和表观遗传水平的染色质调控,后者又进一步分为RNA加工成熟过程的调控、翻译水平的调控及蛋白质加工水平的调控等。268.2真核基因表达的转录水平调控真核细胞与原核细胞在基因转录、翻泽及DNA的空间结构方面存在如下差异:•1.在真核细胞中,一条成熟的mRNA链只能翻译一条多肤链,原核生物中常见的多基因操纵子形式在真核细胞中比较少见.•2.真核细胞的DNA与组蛋白和大量非组蛋白结合.只有一小部分DNA是裸露的。•3.高等真核细胞DNA中大部分不转录;大部分真核细胞还存在不被翻译的内含子•4.真核生物能够有序地根据生长发育阶段的需要进行DNA片段重排,还能在需要时增加细胞内某些基因的拷贝数、这种能力在原核生物中也是极为鲜见的。27•5.真核生物基因转录的调控区大,它们可能远离核心启动子几百个甚至上千个碱基对。虽然这些凋节区也能与蛋白质结合.但是并不直接影响启动子区对于RNA聚合酶的接受程度,而是通过改变整个所控制基因5’上游区DNA构型来影响它与RNA聚合酶的结合能力。•6.真核牛物的RNA在细胞核中合成,只有经转运穿过核膜,到达细胞质基质后,才能被解译成蛋白质.原核生物中不存在这样严格的空间间隔。•7.许多真核生物的丛因只有经过复杂的成熟和剪接过程,才能被顺利地翻译成蛋白质。28•8.2.1真核基因的一般结构特征•一个完整的真核基因,包括编码区,5’和3’端长度不等的特异性序列,它们虽然不编码氨基酸,却在基因表达的过程中起重要作用。(如下图)所以,基因的分子生物学定义是:产生一条多肽链或功能RNA所必须的全部核苷酸