基因表达系统原核表达系统真核表达系统蓝藻表达系统大肠杆菌表达系统芽孢杆菌表达系统链霉菌表达系统酵母表达系统昆虫细胞表达系统植物细胞表达系统哺乳动物细胞表达系统第五章外源基因的表达一、大肠杆菌基因工程二、酵母杆菌基因工程三、哺乳动物基因工程四、高等植物基因工程五、外源基因表达产物的分离纯化一、大肠杆菌基因工程E.coli作为表达外源基因受体菌的特征外源基因在E.coli中高效表达的原理E.coli基因工程菌的构建策略基因工程菌的遗传不稳定性及其对策利用重组E.coli生产人胰岛素(一)E.coli作为表达外源基因受体菌的特征E.coli表达外源基因的优势:全基因组已测序,共有4,405个开放阅读框架,大部分基因生物学功能已鉴定;基因克隆表达系统成熟完善;繁殖迅速、培养简单、操作方便、遗传稳定;被美国FDA批准为安全的基因工程受体生物。E.coli表达外源基因的劣势:缺乏对真核生物蛋白质的翻译后加工修饰系统,如糖基化、磷酸化;缺乏对真核生物蛋白质的复性功能,表达产物多以无活性的包涵体形式存在;内源性蛋白酶易降解空间构象不正确的异源蛋白,造成表达产物不稳定;细胞周质内含有种类繁多的内毒素,痕量内毒素即可导致人体热原反应。(二)外源基因在E.coli中高效表达的原理强化蛋白质生物合成抑制蛋白质产物降解恢复蛋白质特异性空间构象启动子终止子核糖体结合位点密码子质粒拷贝数强化蛋白质生物合成1、启动子(promoter,P)启动子:位于结构基因上游,能被RNA聚合酶识别、结合并启动基因转录的一段DNA序列,长40-60bp。因此,E.coli表达载体所用的启动子必须是E.coli启动子。没有启动子,基因就不能转录。E.coli的RNA聚合酶不能识别真核基因的启动子。位于转录起始点上游35bp处,由10bp组成,5’-TGACA。E.coli启动子是由两段彼此分开且又高度保守的核苷酸序列组成:位于转录起始点上游5-10bp处,由6-8bp组成,5’-TATAAT,富含A和T,又称TATA盒。-10区:-35区:-35区与RNA聚合酶s亚基结合-10区与RNA聚合酶的核心酶结合在转录起始点附近,DNA被解旋成单链,RNA聚合酶使第1和2个核苷酸形成磷酸二酯键,并在其作用下向前推进,形成新生mRNA链。TGACATATAAT-35区-10区+1位转录起始点开始转录-10区和-35区的碱基组成及其间隔序列。启动子和外源基因转录起始点之间的距离。启动子的强弱取决于:启动子是控制外源基因转录的重要元件,mRNA生成速率与其强弱密切相关。-10和-35区与保守序列(5’-TATAAT、5’-TGACA)相似度越高,启动子活性越强。-10和-35区的间距越接近17bp,启动子活性越强。-10区和-35区的碱基组成及其间隔序列:大多数E.coli启动子与所属基因转录起始点之间的距离是6-9bp,但对外源基因而言,这个距离范围未必最佳。启动子和外源基因转录起始点之间的距离:1)启动子最佳距离的探测目的基因EEAEE启动子A酶切开Bal31酶解目的基因将目的基因插在一个强启动子下游,若克隆菌内检测不到mRNA,有必要考虑调整启动子与基因之间的距离。2)启动子的筛选:探针质粒pKO1的报告基因:半乳糖激酶基因galK终止子Amprori无启动子的galKpKO13.9kb用同位素32P标记ATP,测定从ATP转移到半乳糖的32P的放射性强度,可推算galK表达的半乳糖激酶的量,由此比较启动子的强弱。3)启动子的构建:-35区序列-10区序列启动子来源PlacPtrpPLPrecAPtacTTTACATTGACATTGACATTGATATTGACATATAATTTAACTGATACTTATAATTATAATPtac=3Ptrp=11Plac双Plac串联=2.4Plac乳糖操作子色氨酸操作子噬菌体早期操作子recA基因Ptrp-35区+Plac-10区4)启动子的可控性:外源基因的全程高效表达,会对E.coli的生理生化过程造成不利影响。外源基因持续高效表达的重组质粒,在细胞若干次分裂后,会部分甚至全部丢失,导致重组菌不稳定。措施:利用可控性启动子,调整外源基因的表达时序,通过启动子活性的定时诱导,将外源基因的转录启动限制在受体细胞生长的某一特定阶段。目前广泛应用的E.coli可控性启动子来自相应的操纵子,都含有与阻遏蛋白特异性结合的操纵子序列,其介导的外源基因在E.coli中通常以极低的基底水平表达。乳糖启动子Plac的可控性:高效转录乳糖、IPTG诱导PlacOlac乳糖、IPTG可解除阻遏作用,诱导Plac介导的目的基因表达。PlacOlac野生型Plac与其控制区Olac偶联在一起。基底水平转录阻遏蛋白无诱导物存在时,Plac受阻遏蛋白阻遏,转录呈基底水平表达。色氨酸启动子Ptrp的可控性:PtrpOtrpPtrp受Trp-阻遏蛋白复合物的阻遏,转录呈基底水平。基底水平转录Trp阻遏蛋白高效转录OtrpPtrp在操作上,去除Trp困难,往往通过加入IAA,诱导Ptrp介导的目的基因表达。除去Trp高效转录OtrpPtrp或加入IAA在培养体系中,去除Trp或加入3-吲哚丙烯酸(IAA),可解除阻遏作用。噬菌体启动子PL的可控性:升温至42℃时,cI857失活脱落,解除阻遏作用,PL便可介导目的基因高效表达。高效表达PL目的基因42℃PL目的基因基底水平表达cI857PL受温度敏感的cI857阻遏蛋白阻遏,转录呈基底水平。在大型发酵罐中迅速升温困难,常使用双质粒控制系统,间接控制目的基因表达。cI857PtrpAIAA去阻遏BPL目的基因阻遏作用B表达PLPtrpATrp目的基因cI857应是诱导型的,可通过简单方式、使用廉价诱导物诱导,如温度诱导、IPTG诱导。最佳启动子必须具备条件:必须是强启动子,能使外源基因表达量达细胞总蛋白的10-30%以上;应呈现低水平的基础转录;2、终止子(terminator,T)强化转录终止的必要性:过长转录物的产生会影响外源基因的表达。外源基因在强启动子控制下表达,易发生转录过头现象,RNA聚合酶滑过终止子,继续转录邻近序列,形成长短不一的mRNA混合物。过长转录产物影响外源基因表达的原因:1)转录产物越长,RNA聚合酶转录一分子mRNA所需的时间就相应增加,外源基因转录效率下降。2)若外源基因下游紧接载体的重要功能基因,则RNA聚合酶在此处的转录,可能干扰其生物功能,甚至导致其不稳定性。4)过长的mRNA往往不能形成理想的二级结构,大大降低翻译效率。3)过长的mRNA往往产生大量无用的蛋白质,增加工程菌无谓的能量消耗。pCP1AmproriTcr筛选Ampr、Tcs的转化子也可通过探针质粒筛选,唯一的克隆位点处于启动子和报告基因的翻译起始密码子之间,当终止子插入该位点时,由启动子介导的报告基因转录被封闭,从而减少或阻断报告基因的表达。PT强终止子的选择与使用:对终止作用较弱的终止子,可采用二聚体终止子串联的特殊结构,以增强转录终止作用。常用终止子来自E.colirRNA操纵子上的rrnT1T2、T7噬菌体DNA上的T。E.coli偏爱使用终止密码子UAA,当其后连上一个U而形成四联核苷酸时,转译终止效率会得到进一步加强。3、核糖体结合位点外源基因在E.coli中的高效表达不仅取决于转录启动的频率,还与mRNA的翻译起始效率密切相关。结构不同的mRNA分子具有不同的翻译效率,差别高达数百倍。mRNA的翻译起始效率主要由其5’端的结构序列决定,即核糖体结合位点(ribosomalbindingsite,RBS)。1)SD序列:E.coliRBS的结构:识别核糖体小亚基中16SrRNA3’端区域3’-AUUCCUCC-5’,并与之专一性结合,将mRNA定位于核糖体上,启动翻译。位于翻译起始密码子上游的6-8个核苷酸序列:5’-UAAGGAGG-3’。2)翻译起始密码子:E.coli绝大部分基因以AUG作为翻译起始密码子,但有些基因也使用GUG或UUG作为翻译起始密码子。RBS对外源基因表达的影响:1、SD序列的影响:mRNA与核糖体结合越强,翻译起始效率越高,结合程度取决于SD序列(5’-UAAGGAGG-3’)与16SrRNA的碱基互补性。以GGAG尤为重要,4个碱基中任何1个换成C或T,均会导致翻译效率大幅度下降。2、翻译起始密码子的影响:E.coli起始tRNA可同时识别AUG、GUG和UUG三种起始密码子,但识别频率不同:GUG为AUG的50%、UUG为AUG的25%。3、SD序列与起始密码子之间距离的影响:SD序列与起始密码子之间的精确距离保证mRNA在核糖体上定位后,AUG正好处于P位,这是翻译启动的前提。通常SD序列位于AUG前约7bp处,在此间隔中少1个或多1个碱基,均导致翻译起始效率不同程度的降低。4、SD序列与起始密码子之间序列的影响:SD序列下游碱基为AAAA或UUUU时,翻译效率最高;为CCCC或GGGG时,翻译效率是最高值的50%和25%。如:-半乳糖苷酶mRNA,在此位置上的最佳碱基是UAU或CUU,如用UUC、UCA或AGG取代之,酶的表达水平下降20倍。紧邻AUG的前3个碱基也会影响翻译起始效率。5、起始密码子后续若干密码子的影响:从AUG开始的前几个密码子的碱基序列也至关重要,这一序列不能与mRNA的5’端非编码区形成茎环结构,否则会严重干扰mRNA在核糖体上的准确定位。目前广泛使用的E.coli表达型质粒均含有与启动子来源相同的RBS,序列和间隔是最佳的。4、密码子生物体对密码子的偏爱性:不同生物、甚至同种生物不同的蛋白质编码基因,对简并密码子的使用频率不同,具有一定的偏爱性。生物体对密码子偏爱性的决定因素:生物基因组中的碱基含量;密码子与反密码子相互作用的自由能;细胞内tRNA的含量。1、生物基因组中的碱基含量:在富含AT的生物(如单链DNA噬菌体X174)基因组中,密码子第3位上U和A出现频率较高。在GC丰富的生物(如链霉菌)基因组中,第3位上含G或C的简并密码子占90%以上。2、密码子与反密码子相互作用的自由能:适中的作用强度有利于蛋白质生物合成的迅速进行。弱配对作用可能使氨酰基tRNA进入核糖体A位需要花费更多的时间。强配对作用则可能使转肽后核糖体在P位逐出空载tRNA分子耗费更多的时间。如:GGG、CCC、GCG、GGC、AAA、UUU、AUA、UAU等使用少。GUG、CAC、UCG、AGC、ACA、UGU、AUC、UUG等使用多;3、细胞内tRNA的含量简并密码子使用频率与相应tRNA的丰度呈正相关。表达量高的基因含有较少种类的密码子,这些密码子又对应于高丰度的tRNA分子,以便细胞能以更快的速度合成需求量大的蛋白质。密码子偏爱性对外源基因表达的影响:原核生物和真核生物基因组中密码子的使用频率有较大差异,因此哺乳动物基因在E.coli中高效翻译的一个重要因素是密码子的正确选择。使外源基因上的密码子在E.coli中获得最佳表达的策略:外源基因全合成同步表达相关tRNA编码基因1、外源基因全合成按E.coli密码子的偏爱性规律,更换外源基因中不适宜的简并密码子。如:重组人胰岛素、干扰素、生长激素在E.coli中的高效表达均采用了这种方法。可将这两个tRNA编码基因克隆在另一高效表达质粒上,构建双质粒表达系统。2、同步表达相关tRNA编码基因如:人尿激酶原基因的412个密码子中,有22个Arg密码子,其中7个AGG、2个AGA,而E.coli中tRNAAGG和tRNAAGA丰度较低。5、质粒拷贝数质粒拷贝数对细菌生长代谢的影响:表达型质粒在每个E.coli细胞中达数百甚至上千个拷贝,质粒的扩增过程常发生在受体细胞对数生长期,而此时正是细菌生理代谢最旺盛的阶段。质粒的过度增殖、目的基因的高效表达会影响受体细胞的生长代谢,进而导致重组质粒的不稳定性、目的基因表达水平下降。措施:将重组质粒的扩增纳入可控制的轨道。质粒扩增时序的控制:pCP3拥有温度可诱