第八章真核基因的表达与调控基因基因表达(mRNA)基因表达调控(蛋白)多层次调控1.真核生物基因组断裂基因1.外显子与内含子的连接区2、外显子与内含子的可变调控•组成型剪接:一个基因的转录产物通过剪接只能产生一种成熟的mRNA。•选择性剪接:同一基因的转录产物由于不同的剪接方式形成不同mRNA。(变位剪接)PS外显子SPL外显子L外显子2外显子3DNA50b2800bp161bp4500bp205bp327bp初始转录本:在唾腺中转录成熟mRNA:1663nt初始转录本:在肝中转录成熟mRNA:1773nt图18-57小鼠淀粉酶(amy)基因利用不同启动子产生两个不同的mRNA基因家族(genefamily)基因家族(genefamily):真核细胞中许多相关的基因常按功能成套组合,被称为基因家族。假基因•假基因(pseudogene)具有与功能基因相似的序列,但由于有许多突变以致失去了原有的功能,所以假基因是没有功能的基因,常用ψ表示。•是基因组中因突变而失活的基因,无蛋白质产物。一般是启动子出现问题。假基因的产生有两种方式•1.复制(duplication)即复制后基因发生序列变化而失去功能,这样产生的假基因带有内含子,称为non-processed或duplicatedpseudogenes•2.返座(retrotransposition),即mRNA转录本经过反转录为cDNA,再插入基因组,由于插入位点不合适或序列发生变化而导致失去功能。这种类型的假基因不含内含子,被称为processedpseudogenes,或retropseudogene。真核基因表达方式•组成性表达(管家基因)•选择性表达(可诱导基因可阻遏基因)组成型表达(constitutiveexpression)基因表达不受时期、部位、环境影响,没有时空特异性。某些基因在一个个体的几乎所有细胞中持续表达,通常被称为管家基因(housekeepinggene)。eg:DNA聚合酶、RNA聚合酶、肌动蛋白意义:维持生命适应性表达(adaptiveexpression)指环境的变化容易使其表达水平变动的一类基因表达。•可诱导的基因(induciblegene):表达水平增高•可阻遏的基因(repressiblegene):表达水平降低•eg:β-半乳糖苷酶•意义:适应环境基因表达的时空特异性1、时间特异性(temporalspecificity)按功能需要,某一特定基因的表达严格按特定的时间顺序发生,称之为基因表达的时间特异性。2、空间特异性(spatialspecificity)在个体生长全过程,某种基因产物在个体按不同组织空间顺序出现,称之为基因表达的空间特异性,又称细胞或组织特异性(cellortissuespecificity)。真核基因的表达调控的特点:原核细胞——环境因素对调控起决定性的作用。群体中每一个细胞对环境变化的反应是直接的和一致的。真核细胞——基因表达调控最明显的特征是在特定时间,特定的细胞中特定的基因被激活,实现“预定”的、有序的、不可逆转的分化、发育,并使生物的组织和器官保持正常功能。这是生命活动规律决定的,环境因素在其中作用不大。真核生物基因调控可分为两大类:•第一类是瞬时调控或称可逆性调控,它相当于原核细胞对环境条件变化所做出的反应,包括某种底物或激素水平升降,或细胞周期不同阶段酶活性的调节;•第二类是发育调控或称不可逆调控,是真核基因调控的精髓部分,决定了真核细胞生长、分化、发育的进程。根据基因调控在同一事件中发生的先后次序又可分为:DNA水平调控--转录水平调控--转录后水平调控--翻译水平调控--蛋白质加工水平的调控2.真核基因转录水平表达调控一、真核基因转录(一)真核基因结构“基因”的分子生物学定义:产生一条多肽链或功能RNA所必需的全部核苷酸序列。真核基因调控主要在转录水平上进行,受大量特定的顺式作用元件(cis-actingelement)和反式作用因子(transactingfactor)调控。真核生物的转录调控大多数是通过顺式作用元件和反式作用因子复杂的相互作用来实现的。(2)增强子:指能提高转录起始频率的DNA序列。SV40的转录单元上发现,转录起始位点上游约200bp处有两段长72bp的正向重复序列。增强子特点:(P89)增强子对转录的影响•增强子的功能受DNA双螺旋空间构象的影响。增强子可能有如下3种作用机制:▫影响模板附近DNA双螺旋结构,导致DNA双螺旋弯折或在反式因子的参与下,以蛋白质之间的相互作用为媒介形成增强子与启动子之间“成环”连接,活化基因转录。▫将模板固定在细胞核内特定位置,如连接在核基质上,有利于DNA拓扑异构酶改变DNA双螺旋结构的张力,促进RNA聚合酶在DNA链上的结合和滑动。▫增强子区可以作为反式作用因子或RNA聚合酶进入染色质结构的“入口”。沉默子(silencer)•沉默子是可降低基因启动子转录活性的一段DNA顺式元件。与增强子作用相反。沉默子的DNA序列被调控蛋白结合后阻断了转录起始复合物的形成或活化,使基因表达活性关闭绝缘子(insulator)•绝缘子(insulator)长约几百个核苷酸对,是通常位于启动子同正调控元件(增强子)或负调控因子(为异染色质)之间的一种调控序列。绝缘子本身对基因的表达既没有正效应,也没有负效应,其作用只是不让其他调控元件对基因的活化效应或失活效应发生作用。•绝缘子的作用是有方向性的,反式作用因子1、定义:能直接或间接地识别或结合在各类顺式作用元件核心序列上,参与调控靶基因转录效率的蛋白质。TFⅡD(TATA)、CTF(CAAT)、SP1(GGGCGG)、HSF(热激蛋白启动区)转录调节因子识别增强子、沉默子等。通过DNA-蛋白质相互作用,基本转录因子识别启动子,通过DNA-蛋白质相互作用。共调节因子通过蛋白质-蛋白质相互作用,协调调控1.分类•转录因子:激活因子、阻遏因子•共调节因子:共激活因子、共阻遏因子2、结构DNA结合结构域转录活化结构域结构域结构域是指蛋白质亚基结构中明显分开的紧密球状结构区域,又称为辖区。•酵母双杂交由Fields在1989年提出.他的产生是基于对真核细胞转录因子特别是酵母转录因子GAL4性质的研究.GAL4包括两个彼此分离的但功能必需的结构域.位于N端1-174位氨基酸残基区段的DNA结合域(DNAbindingdomain,DNA-BD)和位于C端768-881位氨基酸残基区段的转录激活域(Activationdomain,AD).DNA-BD能够识别位于GAL4效应基因(GAL4-responsivegene)的上游激活序列(Upstreamactivatingsequence,UAS),并与之结合.而AD则是通过与转录机构中的其他成分之间的结合作用,以启动UAS下游的基因进行转录.DNA-BD和AD单独分别作用并不能激活转录反应,但是当二者在空间上充分接近时,则呈现完整的GAL4转录因子活性并可激活UAS下游启动子,使启动子下游基因得到转录。•Fields建立了一个双杂交系统,DB与X蛋白融合,AD与Y蛋白融合,如果X、Y之间形成蛋白-蛋白复合物,使GAL4两个结构域重新构成,启动特异基因序列的转录•该实验的结果表明由X和Y相互作用使得AD和BD在空间上接近,激活了报告基因LacZ的转录.一般地,将DB-X的融合蛋白称作诱饵(bait),X往往是已知蛋白,AD-Y称作猎物(prey),能显示诱饵和猎物相互作用的基因称报告基因,通过对报告基因的检测,反过来可判断诱饵和猎物之间是否存在相互作用.DNA结合结构域:模体螺旋-转折-螺旋(Helix-turn-helix,H-T-H)锌指结构(zincfinger)碱性-亮氨酸拉链(basic-leucinezipper)碱性-螺旋-环-螺旋(basic–helix/loop/helix,bHLH)1、螺旋-转折-螺旋(HTH)这类蛋白质分子中有至少两个α螺旋,中间由短侧链氨基酸残基形成“转折”蛋白质能识别DNA,主要是靠着蛋白质氨基酸侧链与DNA的碱基之间形成氢键以及疏水性作用来完成;识别时不必打开双螺旋。红色部分为识别螺旋,蓝色部分则起帮助识别螺旋定位到DNA大沟上的作用。2、锌指结构配位键2-9个由大约30个氨基酸残基的肽段与锌螯合形成的指形结构。锌以四个配位键与肽链的Cys或His残基结合,指形突起的肽段含12-13个氨基酸残基,嵌入DNA的大沟中,由指形突起或其附近的某些氨基酸侧链与DNA的碱基结合而实现蛋白质与DNA的结合。TFIIIACys2/His2锌指见于SP1,TFⅢA等Cys2/Cys2锌指见于甾体激素受体•344aa,N端与DNA结合•9个锌指,每个~30aa•与5srRNA基因内启动子(50bp)结合TFIIIA转录因子SP1(GC盒)、连续的3个锌指重复结构。3、碱性-亮氨酸拉链•二聚体•亮氨酸之间相互作用形成二聚体,形成“拉链”。•肽链氨基端20~30个富含碱性氨基酸结构域与DNA结合。•这类蛋白质的DNA结合结构域实际是以碱性区和亮氨酸拉链结构域整体作为基础的。即bZIP结构。蛋白中每隔6个氨基酸就有一个亮氨酸残基,导致第7个亮氨酸残基都在螺旋的同一方向出现。定义:出现在DNA结合蛋白质和其它蛋白质中的一种结构基元(motif)。当来自同一个或不同多肽链的两个α-螺旋的疏水面(常常含有亮氨酸残基)相互作用形成一个圈对圈的二聚体时就形成了亮氨酸拉链。4、碱性-螺旋-环-螺旋在免疫球蛋白κ轻链基因的增强子结合蛋白E12与E47中,羧基端100~200个氨基酸残基可形成两个两性α螺旋,被非螺旋的环状结构所隔开,蛋白质的氨基端则是碱性区,其DNA结合特性与亮氨酸拉链类蛋白相似。bHLH类蛋白只有形成同源或异源二聚体时,才具有足够的DNA结合能力。当这类异源二聚体中的一方不含有碱性区(如Id或E12蛋白)时,该二聚体明显缺乏对靶DNA的亲和力。亮氨酸拉链(leucinezipper)螺旋-环-螺旋(H-L-H)结构转录活化结构域•转录激活结构域(transcriptionactivationdomains)一般由30-100个氨基酸残基组成,负责结合并激活别的转录调控蛋白。如GAL4分子中有2个这种结构域,分别位于多肽链的第147-196位和第768-881位.在不同的转录活化域有下列特征性结构:▫带负电荷的螺旋结构。哺乳动物细胞中糖皮质激素受体的两个转录活化域都有酸性的螺旋结构,它们可能与TFIID复合物中某个通用因子或RNA聚合酶II本身结合,具有稳定转录起始复合物的作用。▫富含谷氨酰胺的结构。SP1是启动子GC盒的结合蛋白,共有4个参与转录活化的区域,其中最强的转录活化域含25%左右的谷氨酰胺▫富含脯氨酸的结构。CTF-NF1因子羧基端富含脯氨酸(达20%~30%)。在Oct2、Jun、AP2、SRF等哺乳动物因子中也有富含脯氨酸的结构域。3.染色体及DNA水平的调控异染色质化p327异染色质是包装成20-30nm,不具有转录活性的染色质•组成性异染色质(constitutiveheterochromatin)是指在各种细胞中,在整个细胞周期内都处于凝聚状态的染色质,如着丝粒,端粒,核仁形成区等。•兼性异染色质(facultativeheterochromatin)指在某些特定的细胞中,或在一定的发育时期和生理条件下凝聚,由常染色质变成异染色质,这本身也是真核生物的一种表达调控的途经。莱昂假说(Lyonhypothesis)•巴氏小体是一个失活的X染色体,失活的过程就称为莱昂化(lyonization);•在哺乳动物中,雌性个体细胞中的两个X染色体中有一个X染色体在受精后的第16天(受精卵增殖到5000-6000,植入子宫壁时)失活;•两条X染色体中哪一条失活是随机的;•X染色体失活后,细胞继续分裂形成的克隆中,此条染色体都是失活的;•生殖细胞形成时失活的X染色体可得到恢复。☆活性染色质对DNaseⅠ的敏感性p31