第七章克隆基因的表达7.1基因表达的含义生物的遗传信息是以基因的形式储存在DNA分子上的,将DNA分子所承载的遗传信息转变为由特定氨基酸顺序构成的多肽或蛋白质分子的过程,即为基因的表达(geneexpression)。基因表达的过程为:利用各种先进的基因导入技术及细胞培养方法已实现了外源基因在动植物及酵母等真核宿主细胞中的表达。利用真核细胞作宿主表达系统的优点是:(1)能识别和除去外源基因中的内含子,加工形成成熟的mRNA,即带内含子的天然基因是可以利用的;(2)真核细胞将表达的蛋白糖基化,而大肠杆菌表达的蛋白是无糖基化的,糖基化对某些表达蛋白的免疫原性影响很大。真核细胞作宿主表达系统尚存在以下几个问题:(1)转化真核细胞的效率低;(2)表达效率不够高;(3)细胞培养(动植物)工艺较复杂,成本高;(4)选择标记及选择系统较少。总体而言,真核细胞作为表达宿主尚不成熟,有待于进一步发展、完善。目前普遍采用原核生物作为表达宿主,原核生物(大肠杆菌)繁殖速度快,培养简单,因此一些用传统和常规方法不能或难以大量生产的有生理活性的蛋白,如果采用“工程菌”来生产就方便得多。7.2外源基因在大肠杆菌中表达的基本条件1.基因的编码区域内必须无插入序列(无内含子),因为原核细胞中缺乏拼接加工系统;2.基因必须置于大肠杆菌启动子的控制之下,并能有效地为大肠杆菌RNA聚合酶所识别和转录;3.所生成的mRNA必须稳定,且转译效率高;4.表达产物不会被宿主细胞的蛋白酶迅速降解。7.3影响基因表达的主要因素7.3.1转录转录是指遗传信息从DNA分子转移到RNA分子的过程,是以DNA分子中的一条链(有意义链、转录链)为模板,在转录酶的催化下,进行的一种聚合反应。转录酶即依赖于DNA的RNA聚合酶。大肠杆菌的RNA聚合酶由不同亚基(2’ω)组成,分子量约46万。完整的RNA聚合酶,即2’ω,称为全酶(holoenzyme);没有亚基的RNA聚合酶称为核心酶(coreenzyme)。亚基(因子)容易同核心酶解离,其功能是使核心酶能稳定地结合到DNA的启动子上,故又称为起始因子。真核生物有三种不同的RNA,因而其RNA聚合酶也有三种,分别参与不同类型的RNA分子的合成。由RNA聚合酶催化的转录过程可分为起始、延长和终止三个步骤。7.3.1.1启动子标志基因转录起始的位点称启动子。在大肠杆菌中,启动子被RNA聚合酶的因子所识别。启动子是一段DNA序列,常位于基因或操纵子编码顺序的上游,RNA聚合酶结合在上面。1.原核细胞的启动子原核细胞的启动子在转录起始点的上游有两个高度保守的区域:(1)位于转录起始点上游约10个bp的10区域,TATAAT序列(pribnowbox),也称10序列。10序列的实际位置在不同的启动子中略有变动,其不同碱基的出现频率为:T89A89T50A65A65T100。10序列有助于DNA局部双链解开,因为10序列含有较多的A-T对,所以双链分开所需的能量较低。(2)中心约在35位置的TTGACA序列,也称为35序列或识别区。各碱基出现的频率为:T83T83G81A61C69A52。35序列提供RNA聚合酶识别的信号。这两个区域对于决定启动子的强度非常重要,事实上很小的差异对启动子指导转录的效率有重大影响。一般启动子序列与保守序列相似程度越高,启动子就越强。强启动子是能维持高频率转录的启动子,通常控制那些细胞需要其大量转译产物的基因转录;而弱启动子具有相对较低的转录效率,指导那些仅需要其少量转译产物的基因转录。利用基因工程技术,可将由弱启动子所控制的基因放在强启动子的下游,从而获得高效表达。两个保守区之间的DNA对启动子的功能也有影响,各启动子都需要一些最适的间隙,通常认为间隙为17bp的启动子功能较强。2.真核细胞启动子中可以找到三个保守区:(1)位于12至32bp之间的TATA框,序列为TATAATATA,其功能可能为DNA双链开始解开并决定转录的起点位置。(2)位于70至80bp区域的CAAT框,序列为GGTCAATCT,其主要作用可能与RNA聚合酶的结合有关。(3)位于更上游约70至100bp处的GC框,序列为GGGCGG,也称为增强子(enhancer),其作用为促进基因的转录,对基因的表达可产生显著的增强作用。增强子有时位于基因3’端下游区或在内含子中。真核生物的启动子极为复杂,不同启动子之间的差异较大。例如5srRNA基因,启动子在基因下游,且在基因内部:又如爪蟾tRNAMet基因,启动子分成两部分:真核生物与原核生物的基因结构和转录转译过程均有明显差异,大肠杆菌的RNA聚合酶不能识别动物启动子顺序,真核细胞的启动子在原核细胞中功能很差,所以要得到真核细胞蛋白的有效表达,应将真核基因放在原核细胞的强启动子控制之下。3.常用于表达载体的启动子:(1)PLac:乳糖启动子,是控制LacZ基因转录的序列。Lac启动子可被IPTG诱导,加入该试剂到培养基后,将使表达载体中Lac启动子下游插入的基因开始转录,表达产物为包含-半乳糖苷酶的融合蛋白。(2)Ptrp:色氨酸启动子,通常是编码参与色氨酸生物合成过程中的几种酶的基因簇上游序列。trp启动子被色氨酸抑制,但易被-吲哚丙烯酸诱导,也可用色氨酸饥饿诱导,所合成的蛋白质产量高于PLac表达载体系统。(3)PL:噬菌体左向启动子,负责DNA分子转录的启动子之一。PL是一种可被大肠杆菌RNA聚合酶识别的强启动子,该启动子被cI基因产物所抑制,用PL构建的表达载体上结合一个温敏型阻遏物基因(cI857),在较低温度(低于30℃)下cI蛋白可抑制PL,在较高温度(42℃)时cI蛋白失活,导致克隆基因的转录。(4)Ptac:由Ptrp和PLac杂合而成,启动效果比二者均强,仍可被IPTG诱导。目前市售的Ptac有两类(PtacI和PtacII)。7.3.1.2终止子提供转录停止信号的DNA序列称为终止子,它可被RNA聚合酶识别并停止合成mRNA。通常终止信号是一小段DNA片段,它的RNA转录本上碱基对可自身相互配对形成柄-环结构。目前已检测了20多种终止序列,一般特性为:(1)有一个逆向重复的碱基序列,可表示为:ABCDEF-XYZ-F’E’D’C’B’A’,其中A和A’,B和B’等均为互补碱基对,故可发生链内的碱基配对(转录时双链解开),在RNA转录本上形成柄-环(stemandloop)结构。(2)临近环端的假柄区段(有时完全在柄内)的G+C碱基含量丰富。(3)终止序列有时存在高A+T区段(有时不存在这种区段),这种结构转录成相应的RNA,则会产生出6~8个U碱基(U末端序列)。终止子有两种不同的类型,一种只取决于DNA的碱基顺序,另一种需要终止蛋白质的参与。依赖于蛋白质的终止反应,对一些调节机理而言是十分重要的。协助RNA聚合酶识别终止信号的辅助因子(蛋白质)称为终止因子(terminationfactors)。有些终止子的作用可被特异的因子所阻止,使RNA聚合酶得以越过终止子继续转录,这称为通读(readthrough),这类引起抗终止作用的蛋白质叫抗终止子因子(antiterminationfactors)。在克隆基因的末端,存在一个转录终止区是十分重要的,这是因为:(1)若干非必需的转录本的合成,会使细胞消耗巨大的能量,用于制造大批不必要的蛋白质;(2)在转录本上有可能形成一些不希望其出现的二级结构,从而降低转译效率;(3)有时会出现启动子阻塞现象,克隆基因启动子所开始的转录,有时会干扰另一个必要的基因或调节基因的转录。转录终止区的存在,可使上述这几种不利的现象得以避免。7.3.2转译(翻译)mRNA蛋白的过程。原核生物的转译过程包括多肽链合成的起始、延长和终止三个步骤。1.转译起始序列mRNA有效地转译依赖于mRNA的稳定性及结合到核糖体上的能力。大肠杆菌mRNA的核糖体结合位点是转译的起始密码子及SD序列,要获得良好的表达,关键是起始密码子以及SD序列必须处在易接触的部位。细菌的起始密码子(initiationcodon,initiator)通常是AUG,它转译为n-甲酰基甲硫氨酸;少数情况下是GUG,转译为缬氨酸。真核生物的起始密码子总是AUG,并转译为甲硫氨酸(其在DNA中的相应顺序为ATG)。所谓SD序列是由Shine-Dalgarno首先提出,为细菌核糖体有效结合和转译起始所需要的序列。它以不同长度(3~9个bp)组成,包含5’-UAAGGAGGU-3’的全部或其中的一部分,位于mRNA5’-末端不转译的前导区段内,其起点距转译起始密码子AUG约3~11个碱基。这个SD序列与16s核糖体RNA的3’-末端碱基AUUCCUCCACUAG(反SD序列)互补,控制转译的起始。2.影响mRNA转译效果的因素:(1)SD序列与反SD序列的互补程度:互补程度高,则表达强。(2)SD序列与AUG之间的间隔距离(spacer),使用不同的启动子,表达不同的基因,其最佳间隔不一样。(3)–20bp到+13bp这一段序列中不要有二级结构(发卡结构)。(4)连接在SD序列后面的4个碱基的改变,会对转译效率发生很大的影响,如果这个区域由4个A组成,其转译作用最为有效;而当其被4个C或G替代,则转译效率仅为最高值的25~50%。(5)直接位于起始密码子AUG左侧的碱基三联体的组成,对转译效率也有重要影响,以-半乳糖苷酶mRNA的转译为例,三联体为UAU或CUU时,转译最有效,而若为UUC或UCA时,则转译水平下降20倍。(6)在起始密码子AUG后面的核苷酸序列对核糖体结合也有一定影响。3.转译后的修饰与加工在很多情况下,由mRNA转译成蛋白质,最初合成的肽链需经过转译后的加工和修饰才能成为有活性的功能蛋白。在真核细胞中,有时需将前体蛋白降解为功能蛋白,有时需要发生某种修饰,如进行糖基化变为糖蛋白等。而细菌细胞中没有这一过程,这就可能造成克隆基因在细菌中合成的功能蛋白不具有与原来完全相同的生物活性。克隆基因合成的蛋白质常常遇到新的宿主细胞中蛋白酶的迅速降解,尤其是短肽。实验证明,在细菌中真核基因以融合蛋白表达比非融合蛋白更为稳定。所谓融合蛋白是指它的氨基端是原核细胞序列,羧基端是真核细胞序列,这种融合蛋白仍具有真核细胞的抗原性,可用作抗原。该融合蛋白包括位于氨基端的原核蛋白(通常为-半乳糖苷酶或-内酰氨酶的一部分),能被蛋白酶或溴化氰裂解的特殊序列,以及目的蛋白(多肽)。一般融合蛋白要经过后加工,切除原核细胞序列,才表现出活性,所以在多肽前设计一个特殊序列,如Met(甲硫氨酸),用溴化氰裂解,打断Met与其他氨基酸之间的肽键,即可将原核序列切除掉。注意,该方法的前提是多肽中无Met。融合蛋白的有用性质:(1)许多融合蛋白在细菌中较为稳定,可保护基因产物不被降解;(2)有些融合蛋白用化学方法处理后可以释放出有生物活性的真核肽,如人体胰岛素等;(3)有些融合蛋白可以用作抗原,如制备口蹄疫疫苗等。融合蛋白要比多数大肠杆菌的菌体蛋白大,因此在蛋白质凝胶电泳中易于鉴定。可将融合蛋白条带从凝胶中切割下来,冻干,碾成粉末,即可用作抗原。为了合成融合蛋白,常采取与表达载体上编码-半乳糖苷酶或-内酰氨酶的基因相连接的方法,构建成杂合基因。pUR278~292这些LacZ融合载体在LacZ基因的3’端有适应所有三种读框的克隆位点:BamHI、SalI、PstI、XbaI、HindIII和ClaI。在适当的克隆位点插入DNA片段,即可产生由DNA片段编码的并有-半乳糖苷酶活性的融合蛋白。7.3.3其他因素1.质粒拷贝数及稳定性对表达效率的影响:细胞中的核糖体数量,与任何一种mRNA分子数目相比,都是大大超量的。提高克隆基因表达效率的途径之一,是增加相应的mRNA分子的数量。而影响mRNA分子合成速率的因素有两种:(1)启动子强度;(2)基因的拷贝数。对于第一种情况,可采用强启动子;对于第二种情况,可将基因克隆到高拷贝数的质粒