第十四章大肠杆菌基因工程四、基因工程菌的遗传不稳定性及其对策第十四章大肠杆菌基因工程三、大肠杆菌基因工程菌的构建策略二、外源基因在大肠杆菌中高效表达的原理一、大肠杆菌作为表达外源基因受体菌的特征五、利用重组大肠杆菌生产人胰岛素一、大肠杆菌作为表达外源基因受体菌的特征大肠杆菌基因工程1、大肠杆菌表达外源基因的优势全基因组测序,4405个ORF基因克隆表达系统成熟完善繁殖迅速、培养简单、操作方便、遗传稳定被美国FDA批准为安全的基因工程受体生物一、大肠杆菌作为表达外源基因受体菌的特征大肠杆菌基因工程2、大肠杆菌表达外源基因的劣势缺乏对真核生物蛋白质的复性功能缺乏对真核生物蛋白质的修饰加工系统内源性蛋白酶降解空间构象不正确的异源蛋白细胞周质内含有种类繁多的内毒素二、外源基因在大肠杆菌中高效表达的原理启动子1大肠杆菌基因工程终止子23核糖体结合位点4密码子5质粒拷贝数a.启动子最佳距离的探测目的基因EEAEE启动子A酶切开Bal31酶解目的基因1启动子b.启动子的筛选AprorigalKpKO1终止密码子采用鸟枪法战略,将合适大小的DNA片段克隆到启动子探针质粒pKO1上受体细胞染色体DNA上的galE、galT与质粒上报告基因galk的表达产物联合作用,可将培养基中的半乳糖酵解成红色素物质转化galE+、galT+、galK-的大肠杆菌受体菌株含有外源启动子活性的重组克隆1启动子c.启动子的构建-35区序列-10区序列PlLPrecAPtrpPlacPtraAPtac启动子TTGACAGATACTTTGATATATAATTTGACATTAACTTAGACATAATGTTTTACATATAATTTGACATATAATPtac=3Ptrp=11Plac1启动子d.启动子的可控性P乳糖启动子Plac的可控性(1):OPO高效转录阻遏蛋白诱导乳糖异丙基-b-D-硫代半乳糖苷(IPTG)野生型的Plac与其控制区Olac偶联在一起,在没有诱导物存在时,整个操纵子处于基基底水平转录底水平表达;诱导物可以使启动子Plac介导的转录大幅提高1启动子启动子的可控性Plac乳糖启动子Plac的可控性(2):O高效转录Plac上游附近拥有CAP结合区,cAMP激活CAP,进而促进Plac介导的转录。CAPcAMP基因工程中使用的乳糖启动子均为抗葡萄糖代谢阻遏突变型,即PlacUV5。PlacUV5O高效转录葡萄糖代谢使cAMP减少,阻遏Plac介导的转录。PlacO葡萄糖代谢基底水平转录cAMP浓度降低1启动子启动子的可控性Ptrp色氨酸启动子Ptrp的可控性:Otrp除去色氨酸色氨酸启动子Ptrp受色氨酸-阻遏蛋白复合物的阻遏,转录呈基底状态。在培养系统中去除色氨酸或者加入3-吲哚丙烯酸(IAA),便可有效地解除阻遏抑制作用。基底水平转录色氨酸或加3-吲哚丙烯酸高效转录阻遏蛋白(IAA)OtrpPtrp在正常细菌培养体系中,除去色氨酸困难,常添加IAA诱导Ptrp介导的目基因的表达。高效转录OtrpPtrp1启动子启动子的可控性l噬菌体启动子PlL的可控性:噬菌体启动子PL受CI阻遏蛋白(cl857表达)阻遏,很难直接诱导控制。在基因工程中常使用温度敏感型的cI突变基因cI857控制PL。cI857阻遏蛋白在42℃时失活脱落,PL便可介导目的基因的表达。PtrpABcI857PL目的基因阻遏作用但在大型细菌培养罐中迅速升温非常困难,故常使用一个双质粒控制系统,用色氨酸间接控制目的基因表达PtrpABPL表达色氨酸1启动子强化转录终止的必要性外源基因在强启动子的控制下表达,容易发生转录过头现象,即RNA聚合酶滑过终止子结构继续转录质粒上邻近的DNA序列,形成长短不一的mRNA混合物。终止子2过长转录物的产生在很大程度上会影响外源基因的表达(如降低转录效率、增加能量消耗、不能形成正确二级结构降低翻译效率及干扰其他生物功能)。强终止子的选择与使用目前常用的终止子是来自大肠杆菌rRNA操纵子上的rrnT1T2以及T7噬菌体DNA上的Tf。pCP1AproriTcr筛选Apr、Tcs的转化子终止子2对于一些终止作用较弱的终止子,通常可以采用二聚体终止子串联的特殊结构,以增强其转录终止作用。终止子也可以象启动子那样,通过特殊的探针质粒从细菌或噬菌体基因组DNA中克隆筛选。外源基因在大肠杆菌细胞中的高效表达还与mRNA的翻译起始效率密切相关。大肠杆菌细胞中结构不同的mRNA分子具有不同的翻译效率,它们之间的差别有时可高达数百倍。mRNA翻译的起始效率主要由其5‘端的结构序列所决定,称为核糖体结合位点(RBS)。3核糖体结合位点大肠杆菌核糖体结合位点包括下列四个特征结构要素:(1)核糖体结合位点的结构3核糖体结合位点A.位于翻译起始密码子上游的6-8个核苷酸序列5’-UAAGGAGG-3’,即Shine-Dalgarno(SD)序列;D.基因编码区5’-端若干密码子的碱基序列。C.SD序列与翻译起始密码子之间的距离及碱基组成;B.翻译起始密码子AUG有些用GUG或UUG;(2)核糖体结合位点对外源基因表达的影响①SD序列的影响:一般来说,mRNA与核糖体的结合程度越强,翻译的起始效率就越高,而这主要取决于SD序列与16SrRNA的碱基互补性,其中以GGAG四个碱基序列尤为重要。对多数基因而言,上述四个碱基中任何一个换成C或T,均会导致翻译效率大幅度降低。3核糖体结合位点(2)核糖体结合位点对外源基因表达的影响②SD序列与起始密码子之间的序列的影响:SD序列下游的碱基若为AAAA或UUUU,翻译效率最高;而CCCC或GGGG的翻译效率则分别是最高值的50%和25%。3核糖体结合位点紧邻AUG的前三个碱基成份对翻译起始也有影响。对于大肠杆菌β-半乳糖苷酶的mRNA而言,在这个位置上最佳的碱基组合是UAU或CUU,如果用UUC、UCA或AGG取代之,则酶的表达水平低20倍。(2)核糖体结合位点对外源基因表达的影响③SD序列与起始密码子之间的距离的影响:SD序列与起始密码子之间的精确距离保证了mRNA在核糖体上定位后,翻译起始密码子AUG正好处于核糖体复合物结构中的P位,这是翻译启动的前提条件。在很多情况下,SD序列位于AUG之前大约七个碱基处,在此间隔中少一个或多一个碱基,均会导致翻译起始效率不同程度的降低。3核糖体结合位点(2)核糖体结合位点对外源基因表达的影响④起始密码子及其后续若干密码子的影响:大肠杆菌中的起始tRNA分子可以同时识别AUG、GUG和UUG三种起始密码子,但其识别频率并不相同,通常GUG为AUG的50%而UUG只及AUG的25%。除此之外,从AUG开始的前几个密码子碱基序列也至关重要,至少这一序列不能与mRNA的5’端非编码区形成茎环结构,否则便会严重干扰mRNA在核糖体上的准确定位。3核糖体结合位点(1)生物体对密码子的偏爱性不同生物或不同蛋白的编码基因,对简并密码子使用频率并不相同,具有一定的偏爱性。4密码子(1)生物体对密码子的偏爱性偏爱性产生的决定因素:生物基因组中的碱基含量在富含AT的生物(如单链DNA噬菌体fX174)基因组中,密码子第三位上的U和A出现的频率较高;而在GC丰富的生物(如链霉菌)基因组中,第三位上含有G或C的简并密码子占90%以上的绝对优势;密码子与反密码子相互作用的自由能行中等强度规律细胞内tRNA的含量如GGG、CCC、GCG、GGC、AAA、UUU、AUA、UAU等使用少;如GUG、CAC、UCG、AGC、ACA、UGU、AUC、UUG等使用多;4密码子(2)密码子偏爱性对外源基因表达的影响原核生物和真核生物基因组中密码子的使用频率具有较大程大的差异性,因此外源基因尤其是高等哺乳动物基因在大肠杆菌中高效翻译的一个重要因素是密码子的正确选择。一般而言,有两种策略可以使外源基因上的密码子在大肠杆菌细胞中获得最佳表达:外源基因全合成同步表达相关tRNA编码基因4密码子(2)密码子偏爱性对外源基因表达的影响按照大肠杆菌密码子的偏爱性规律,设计更换外源基因中不适宜的相应简并密码子,重组人胰岛素、干扰素以及生长激素在大肠杆菌中的高效表达均采用了这种方法。外源基因全合成4密码子(2)密码子偏爱性对外源基因表达的影响对于含不和谐密码子种类单一、出现频率高、而本身分子量又较大的外源基因而言,则选择相关tRNA编码基因同步克隆表达的策略较为有利。同步表达相关tRNA编码基因4密码子例如,在人尿激酶原cDNA的412个密码子中,共含有22个精氨酸密码子,其中7个AGG、2个AGA,而大肠杆菌受体细胞中tRNAAGG和tRNAAGA的丰度较低。采用同步表达策略表达量得以提高。(1)质粒拷贝数对细菌生长代谢的影响目前实验室里广泛使用的表达型质粒在每个大肠杆菌细胞中可达数百甚至上千个拷贝。5质粒拷贝数解决上述难题的一种有效策略是将重组质粒的扩增纳入可控制的轨道。质粒多-增加负担-影响细菌生长代谢。(2)质粒扩增时序的控制pCP3拥有一个温度可诱导型的复制子pCP3PLMCSoriApr在28℃时,每个细胞的质粒拷贝数为60;在42℃时,拷贝数迅速增至300–600;在42℃下,受体细胞染色体上的CI基因表达的温度敏感型阻遏蛋白失活,因此,用一种手段同时控制质粒拷贝数和基因的表达。5质粒拷贝数三、大肠杆菌基因工程菌的构建策略1、包涵体型异源蛋白的表达2、分泌型异源蛋白的表达3、融合型异源蛋白的表达4、寡聚型异源蛋白的表达5、整合型异源蛋白的表达6、蛋白酶抗性或缺陷型表达系统的构建大肠杆菌基因工程1、包涵体型异源蛋白的表达(1)包涵体及其性质在某些生长条件下,大肠杆菌能积累某种特殊的生物大分子,它们致密地集聚在细胞内,或被膜包裹或形成无膜裸露结构,这种水不溶性的结构称为包涵体(InclusionBodies,IB)。1、包涵体型异源蛋白的表达(1)包涵体及其性质性质:富含蛋白质的包涵体多见于生长在含有氨基酸类似物培养基的大肠杆菌细胞中;由高效表达质粒构建的大肠杆菌工程菌大量合成非天然性的同源或异源蛋白质,后者在一般情况下也以包涵体的形式存在于细菌细胞内。也含有少量DNA、RNA及脂类等。1、包涵体型异源蛋白的表达(2)以包涵体形式表达目的蛋白的优缺点A.包涵体表达形式的优点:能简化外源基因表达产物的分离操作能在一定程度上保持表达产物的结构稳定1、包涵体型异源蛋白的表达(3)以包涵体形式表达目的蛋白的优缺点B.包涵体表达形式的缺点:丧失了原有生物活性,必须通过有效的变性复性操作,才能回收得到具有正确空间构象(因而具有生物活性)的目标蛋白,因此包涵体变复性操作的效率对目标产物的收率至关重要。然而,这也是一个技术难题,尤其当目标蛋白分子中的Cys残基数目较高时,体外复性蛋白质的成功率相当低,一般不超过30%1、包涵体型异源蛋白的表达(4)以包涵体形式表达目的蛋白的操作如果未进行特殊设计(如分泌型表达或融合型表达),外源基因在大肠杆菌中表达的蛋白量占细胞总蛋白量20%以上时,表达产物一般倾向于形成包涵体。因此,以包涵体形式表达目的基因操作的关键就是选择高表达的载体。事实上,这种高表达率也是包涵体法的长处所在。1、包涵体型异源蛋白的表达(5)包涵体的变性与复性操作C共价修饰的蛋白质蛋白质变性复性的动力学原理:C1C2CnCUI1InNX1X2XnXAgAgAgAgI有效变复性过程中的中间状态X脱离有效变复性,进入集聚的中间状态N天然状态的蛋白质U变性状态的蛋白质A集聚状态的蛋白质在细菌细胞内,集聚状态和共价修饰的蛋白质不能复性,因此需要在体外进行人工变性(解除共价修饰和驱散集聚体)复性操作。1、包涵体型异源蛋白的表达包涵体的溶解与变性:包涵体的溶解与变性的主要任务是拆开错配的二硫键和次级键在人工条件下,使包涵体溶解并重新进入复性途径中。能有效促进包涵体溶解变性的试剂包括:清洗剂SDS、正十二醇肌氨酸,廉价,但影响复性和纯化促溶剂盐酸胍、尿素,前者昂贵,尿素便宜,但常被自发形成的氰酸盐污染,后者能与多肽链中的氨基反应混合