大肠杆菌高效表达重组蛋白策略前言重组蛋白的制备在蛋白结构分析和医疗应用领域十分重要。药物蛋白的研究需要高纯度的重组蛋白来进行药物动力学和物理化学的研究[1]。重组蛋白在检测酶活、连接配体、蛋白相互作用等生物学领域广泛应用。已经表达出多种重组蛋白被证明有很大的应用潜力[2,3]。通过基因工程改造的方法已经获得了许多性状优良的宿主菌表达系统,尤其是通过大肠杆菌可以大量表达外源基因编码的重组蛋白[4]。但是仍然有两个问题制约着大肠杆菌表达系统对重组蛋白的表达:一个是表达量低,还有一个就是表达错误折叠的蛋白包涵体[5]。蛋白的表达和纯化工艺一直在发展进步,但是超过30%的重组蛋白为不具有生物活性的包涵体,严重影响了重组蛋白的生产应用[6,7]。在理想条件下,重组蛋白由强启动子进行表达,产生大量的具有生物学活性的可溶性重组蛋白。但是,强启动子会导致重组蛋白的过表达,从而影响宿主菌体的生长并产生包涵体[8]。在某些条件下可以通过变性、复性的方法使包涵体恢复活性[9],但是复性后的蛋白是否能够完全恢复活性仍然未可知。一般来讲,可以通过表达条件的优化来促进蛋白的可溶性表达,比如:诱导温度、培养基组成、宿主菌的种类。还可以通过多种方案来解决蛋白不溶的问题:蛋白重新折叠[10],构建融合蛋白[11]。另外想要进一步增加蛋白可溶性可以与分子伴侣共表达[8]或者低温诱导[12]。本文对目前主要的促进蛋白可溶表达的方法进行了比较全面的总结。1.大肠杆菌表达系统的构建1.1选择表达宿主菌对于大规模的表达重组蛋白,一般选择胞内表达或者周质空间表达。与周质空间表达相比,胞内表达的表达量更高,因此应用更为广泛。在实验研究和实际生产中,已经有很多大肠杆菌表达系统广泛应用于。在表达体系中较为常用的大肠杆菌为B菌株和K12菌株及它们的衍生菌株(表1[13])。美国国立研究院已经认证了K12菌株的标准性以及安全的使用方案,因此K12菌株在生产应用中具有极大的优势。但是由B菌株演变而来的BL系列菌株与K12相比,突变了lon和ompT两个基因[14],因此具有许多表达优势:产物积累少,缺少蛋白酶,防止产物被降解。这些优势使得BL菌株也具有非常广泛的应用[15,16,17]。通常来讲,针对不同的重组蛋白,宿主菌的选择也是不同的。如果重组蛋白含有大肠杆菌稀有密码子,就需要宿主能够表达针对这些密码子的tRNA,比如BL21(DE3)CodonPlus-RIL,Rosetta(DE3)等菌株。如果重组蛋白具有许多二硫键,则需要宿主表达环境为氧化条件的。AD494宿主菌是硫氧还蛋白突变型,可以促进二硫键的折叠。Origami菌株为硫氧还蛋白突变和谷胱甘肽还原酶突变,进一步加强了二硫键在细胞内的形成[18]。另外一方面,如果表达的重组蛋白对于宿主菌是有毒性的,则需要表达为包涵体的形式。表1:常用于重组蛋白表达的宿主菌及其特点1.2质粒的设计理想的基因转录是质粒和启动子功能协同完成的。广泛使用的质粒都是由复制子、启动子、标记位点、多克隆位点、融合蛋白联合调控进行转录的(图1[20]。)重组蛋白的表达量与质粒的拷贝数、结构、分离稳定性有关。如果拷贝数低形成的mRNA数量少,蛋白的表达量就会降低。高拷贝数可以提高蛋白的表达量,但是这也会给宿主造成代谢上的负担。拷贝数很大程度上由起始子的复制情况决定的,也体现出质粒是严密调控还是松散调控。图1.质粒的基本构成高拷贝数质粒在生产应用中并不令人满意。首先,宿主为了保存高拷贝数质粒,不得不在培养基中增加筛选抗生素。但是FDA限制临床应用产品中添加剂的含量。其次,高拷贝数质粒存在分离不稳定性,尤其是在低抗生素的条件下[23,24]。第三,高拷贝数质粒的表达和维持需要大量能量,不可避免的会影响宿主菌的生长和蛋白的合成。另外一个缺点就是,大量蛋白的过表达容易产生包涵体。利于蛋白产品高表达的大肠杆菌表达系统应该是严密调控并且高转录效率的。但是如果目的蛋白有毒性,则会损伤宿主细菌。另外有些特殊的宿主只能与特定的质粒组合才能获得理想的重组蛋白。表2.大肠杆菌表达中经常使用的启动子有多种启动子已经成功的用于表达各类重组蛋白(表2[25,26,27,17]),。其中,lac启动子及其衍生物,tac和trc,在研究和工业化中有着重要的应用[28,25]。tac和trc启动子比lac启动子更强,这三个启动子都是由IPTG进行诱导的。IPTG可以抑制lac启动子的阻遏,因此重组表达的水平由培养基中IPTG的浓度进行调控。但是,IPTG价格比较昂贵,且对许多菌株有毒性作用。为了解决这些问题,通突变筛选的方法获得了可以通过温度的调节控制热敏启动子[29]。从T7噬菌体中得到的T7启动子也广泛的应用于蛋白重组表达。T7噬菌体RNA聚合酶可以识别T7启动子,DNA链的延长速率比大肠杆菌RNA聚合酶快5倍。宿主菌染色体中含有前噬菌体(λDE3)可以编码T7噬菌体聚合酶,在T7启动子衍生物L8-UV5的调控下可以进行表达。这种新的lac启动子减少了对于AMP的依赖,也减少了对于葡萄糖抑制的敏感性。因此T7启动子系统被认为比lac启动子系统更为强大。通过T7启动子系统可以获得重组目的蛋白占总蛋白含量50%,但是大多以包涵体的形式存在[23,30]。储热调控启动子系统比如λ噬菌体pL和pR启动子,也用于生产治疗性蛋白。质粒中含有热敏性的cI857阻遏组件,可以通过温度的变化控制pL和pR启动子。由于温控法容易操作,所以适合于大规模的产业化应用,同时也可以减少培养基的污染。但是温控诱导也有其局限性,由于热激会抑制菌体的生长,对重组蛋白的表达也会造成一定压力。但是对于蛋白产品的质量和产量,这些压力都是可以忽略的。λ噬菌体pL和pR启动子也可以在低温下进行调控,应用于表达可溶蛋白或者热敏感蛋白[31]。应用营养调控启动子phoA和trp时,培养基的营养成分要确保菌体的正常生长并且能够利用磷酸盐进行诱导。这种诱导方法与其他的方法相比,诱导时间范围非常广泛[32]。另外一种严谨型启动子lux,从费时弧菌中分离得到,具有群体感应元件,在基因表达中由luxI进行调控,通过添加自诱导AHL物进行转录的激活。AHL的浓度通常为IPTG浓度的1/1000,因此这种方法更加经济利于生产放大[33]。2.融合标签的选择通过选择蛋白表达环境的方法不一定能够使蛋白可溶,因此进一步采用融合标签的方法加强可溶蛋白的表达。在重组蛋白中增加融合标签可以增加蛋白的可溶性,并且使亲和纯化的过程更为简便[34]。尽管这些标签最开始是用于促进目的蛋白的分选及纯化,近些年的研究表明,融合标签也可以促进蛋白的产量,加强蛋白的溶解性,并且促进蛋白的正确折叠[35]。许多大肠杆菌表达质粒都可以在不同的启动子调控下表达多种融合标签:多聚组氨酸、麦芽糖连接蛋白(MBP)、谷胱甘肽转移酶(GST)[36]。选择标签的主要依据是蛋白本身的特性以及蛋白处理的阶段,比如:是否为治疗蛋白,层析分离的成本以及过程可控性的影响[37]。组氨酸标签时目前应用最为广泛的融合标签。通过金属离子螯合层析的方法可以对组氨酸标签标记的目的蛋白进行分离纯化。蛋白上的组氨酸标签与固载的金属离子奥何物相互作用[38]。另外通过MBP标记的蛋白可以通过形成交联直链淀粉进行一步纯化[39],之后用含有10mM麦芽糖的非变性缓冲液洗脱连接上的蛋白。GST也是一个亲和力标签,通过固载谷胱甘肽可以对GST标记的可溶蛋白进行分离。洗脱缓冲液一般含有还原型谷胱甘肽。GST标记的重组蛋白也可以通过酶催化或者免疫测定的方法进行定量检测[34]。想要系统的分析融合标签对于可溶蛋白的作用还是比较困难的,蛋白加入不同的融合标签后的反应也不相同[6,40]。标签的选择十分重要,标签可能会影响天然蛋白之间的相互作用、翻译后修饰、是否可溶、重组蛋白的表达胞内定位等多个方面[41,42]。一些标签在很多条件下(含有盐离子、还原剂、表面活性剂)都可以实现功能,因此在之后的研究中可以弹性的选择不同的缓冲液组成,与标签的功能相适应[34]。3.提高蛋白转录效率蛋白在大肠杆菌中的转录过程可以被分为4个部分:起始、延伸、终止、核糖体循环。在大多数情况下,翻译的起始是蛋白合成决定速率的关键步骤。这个效率由每条mRNA5’末端的翻译起始区(TIR)的序列和结构决定[43]。翻译起始区(TIR)由四部分组成:(1)核糖体结合位点(SD)序列,(2)起始密码子,(3)核糖体结合位点和起始密码子之间的区域,(4)在SD序列上游或是起始密码子下游的翻译增强子。调控TIR序列可以降低或者提高大肠杆菌中重组蛋白的表达[44,45]。已经证明了六个核苷酸的SD序列(AGGAGG)比其他更长或者更短的序列在表达绿色荧光蛋白(rGFP)方面效率更高[46]。在这个研究中,A/U合并的加强子使rGFP的表达增强了13倍。在对TIR区域进行修饰的时候要避免mRNA的二级结构覆盖SD序列或者起始密码子。在SD区域中进行单点突变会使RNA噬菌体MS2外壳蛋白的表达降低500倍[47]。将起始密码子AUG从碱基配对的mRNA结构中暴露出来,可以有效提高大肠杆菌中IL-10的表达量,比野生型的表达量高10倍[48]。最近,科学家研究出了翻译起始的生物学模型,可以通过设计核糖体的结合位点来改变翻译起始速率。这个技术可以实现速率控制,并且细微精确的调整重组蛋白的表达[43]。表达量的精确程度对蛋白的分泌十分重要,如果表达速率太快会影响细菌的分泌过程,导致最终蛋白产量低。但是为了重组蛋白产量的最大化,翻译水平通常选择高分泌水平的表达方案[49,44]。4.提高mRNA的稳定性mRNA的稳定性(半衰期)也会影响大肠杆菌中的表达速率。mRNA在大肠杆菌中的降解主要是由于RNA酶的存在,包括内切酶(RNaseE,KandIII和外切酶(RNaseII和多核酸磷酸化酶)。RNA酶和活性和菌体的生长环境有关[50]。对于高表达系统而言,提高mRNA的稳定性主要有两个策略:通过宿主的基因改造或者改变菌体生长条件,使mRNA的两端更具有防护性,避免被RNA酶水解[51]。实验证明,在序列5’端非编码区中添加ompA基因可以形成一个茎环结构,有效的延长外源mRNA的半衰期[52]。在人类IL-2的cDNA翻译终止子的位置添加来源于苏云金杆菌的penP基因,可以加强mRNA的稳定性,提高IL-2在大肠杆菌中的表达量[52]。研究表明,在C末端添加的rne基因,可以编码RNA酶,导致mRNA的降解,因此对rne基因进行突变可以提高mRNA的稳定性,促进重组蛋白的表达量[53]。含有这种突变的菌株已经应用于商业生产领域。5.密码子优化除了TIR序列和mRNA的稳定性以外,大肠杆菌密码子的特异性也影响蛋白的翻译。表达含有稀有密码子的外源基因会导致菌体生长停滞,蛋白表达过程中过早结束翻译,基因产生移码,缺失等现象[54]。当稀有密码子聚集时,这种现象更明显[55]。解决这个问题的办法是根据大肠杆菌偏好性,综合的优化基因序列,已经有多种方法可以对大肠杆菌和其他宿主菌进行优化[56]。经过密码子优化后的抗体序列在周质空间的表达量为原始基因的100倍[57]。添加稀有密码子同源的tRNA也可以弥补密码子偏好的问题。大肠杆菌Rosetta(DE3)菌株具有pRARE质粒可以编码tRNA,识别只有真核细胞中才具有的稀有密码子。通过这种菌株生产人类重组蛋白时,68种蛋白中有35种的产量获得了明显的提高[58]。这种菌株可以表达在BL21(DE3)中无法表达的蛋白。应用pRARE质粒提高大肠杆菌重组蛋白的表达量非常实用,其效果在多个试验中得到了验证[59,60]。6.培养基环境对可溶表达的影响在大肠杆菌中想要获得具有生物学活性的可溶蛋白需要平衡DNA转录、蛋白翻译、蛋白折叠三个过程。大肠杆菌中高效表达可以获得占总蛋白30%的重组蛋白,如果加入分子伴侣和调节因子可以获得更多。另外,许多蛋白的正确折叠需要二硫键的正确形成以及糖基化,而大肠杆菌胞内表达环境不能满足这些调节。所以