基因工程原理纲要第一讲基因工程概论属实第二讲基因工程的主要技术第三讲基因工程的酶学基础第四讲基因克隆的载体与受体第五讲目的基因的克隆与分离第六讲克隆基因的检测与鉴定第七讲克隆基因的表达与产物纯化第八讲基因表达的调控第七讲基因的表达、调节与产物纯化第一节外源基因在原核细胞中的表达一、原核生物基因表达的特点1.只有一种RNA多聚酶识别原核细胞的启动子,催化所有的RNA合成。2.以操纵子为单位数个相关的结构基因与其调控区结合形成一个表达的协同单位。3.转录和翻译偶联、连续进行。4.不含内含子,缺乏转录后的加工系统。5.调控主要在转录水平上。6.mRNA的核糖体结合位点。Shine-Dalgarno(SD)sequence:含有一个启始密码子和一段同核糖体16SRNA3’末端碱基互补的序列,叫Shine-Dalgarno(SD)序列。二、原核表达系统的注意事项1.外源基因不能带有内含子。2.必须用cDNA3.不能直接用真核基因组DNA。4.必须利用原核细胞的调控原件(启动子等)5.防止外源基因产物对宿主细胞的毒害。三、原核生物基因表达的调控1.启动子是DNA上的能与RNA聚合酶结合并能起始mRNA合成的序列。(1)启动子序列大肠杆菌的所有启动子中都有两段一致顺序(consensussequence)。-35Box和-10Box①-35boxRNA聚合酶δ亚基的识别位点。5’–TTGACA-3’②-10box(PribnowBox)5’–TATAAT-3’5’TTGACATATAAT转录起始位点17bp核糖体结合位点(2)翻译的起始位点①核糖体结合位点(RBS)ribosomebindingsite1)Shine-Dalgarno(SD)sequence:2)起始密码:位于SD序列下游。AUG(91%)GUG(8%)UUG(1%)2.RNA多聚酶大肠杆菌只有一种类型的RNA多聚酶转录tRNA,rRNA和mRNA。结构全酶是一个5聚体,含有两个α小亚基,和2两个大亚基(β和β′),一个σ亚基。3.转录终止子在表达载体克隆位点的下游一般设计一段转录终止子。启动子操纵子S-D序列目的基因终止子内终止子intrinsicterminator:E.coli中促使转录终止的DNA位置有一段反向回文顺序,其后紧接一串A,称为内终止子,形成终止信号。原因:①茎环结构②多聚A/U反向回文顺序被转录后,立即形成一个茎环结构,使转录物与模板之间配对的碱基数降低,整个减弱了RNA与DNA的互作。由于茎环3’段紧接一串A/U的配对,稳定性比较差,有利于转录物脱落而不利于转录延续。4.翻译终止密码5.翻译增强子大肠杆菌偏爱UAAU。一般安置上全部的三个终止密码防止核糖体跳跃(skipping)。Translationenhancer能够显著增强外源基因在大肠杆菌细胞中的表达效率的特殊序列。T7噬菌体基因10前导序列(简称g10-L序列);大肠杆菌atpE基因mRNA5’-UTR中富含U的区段。6.基因工程常用的原核启动子(1)最佳启动子必须具备的条件①必须是一种强启动子能使外源基因的蛋白产量达到细胞总蛋白的10%-30%以上。②应呈现低水平的基础转录③应是可诱导型的便于表达毒性蛋白等。用温度或化学试剂诱导。(2)乳糖启动子lac来自大肠杆菌的乳糖操纵子。用乳糖或其类似物IPTG充当诱导物,与阻遏蛋白结合,解除抑制。PlacO目的基因I结合阻遏物RNA酶结合产生阻遏蛋白操纵基因启动子阻遏物基因结构基因AYZOP调控区CAP结合位点启动序列操纵序列结构基因Z:β-半乳糖苷酶Y:透酶A:乙酰基转移酶ZYAOPDNAmRNA阻遏蛋白IDNAZYAOPpol没有乳糖存在时阻遏基因mRNA阻遏蛋白有乳糖存在时IDNAZYAOPpol启动转录mRNA乳糖半乳糖β-半乳糖苷酶①乳糖操纵子控制区的结构“可移动的lac启动子小片断”组成:阻遏物作用区CAP作用区RNA聚合酶作用区长度:203bp的HaeIII片断(包括β-半乳糖苷酶的前8个密码)。大肠杆菌乳糖操纵子控制区的结构(3)色氨酸启动子trp来自大肠杆菌的色氨酸操纵子。(4)PL和PR启动子四、外源蛋白在大肠杆菌中的表达部位1.细胞质中表达包涵体(inclusionbody)是存在于细胞质中的一种不溶性蛋白质聚集折叠而成的晶体结构物。形成原理未知。①优点②缺点使重组蛋白易于分离、免受蛋白酶降解、不损害寄主细胞回收的蛋白生物活性差。例:在大肠杆菌细胞内表达人生长激素(humangrowthhormone,hGH)。2.周质中表达(1)周质(periplasm)格兰氏阴性大肠杆菌位于内膜和外膜之间的细胞结构部分。蛋白质从细胞质转运到周质的复杂机理目前不完全清楚优点:容易被浓缩和纯化、有利于正确折叠、被降解的少。①常用的原核信号肽(2)信号肽(signalpeptide)能带领蛋白穿过膜到达周质。但以后需要正确切割掉。一般位于N端。①大肠杆菌的信号肽:phoA、OmpA、OmpT、OmpF、LamB、β-内酰胺酶(lactamase)、肠毒素(enterotoxin)ST-II、LT-B等②金黄色葡萄球菌的蛋白A。③枯草芽孢杆菌的内切葡聚糖酶(endoglucanase)。④胡萝卜欧氏杆菌的PelB蛋白。②真核信号肽也能在细菌中起作用。鼠源RNase、人生长激素信号肽。3.胞外表达使在大肠杆菌细胞中表达的外源蛋白分泌到细胞外的培养基中。用溶血素(hemolysin)基因构建分泌性融合蛋白;或与细菌素释放蛋白(bacteriocinreleaseprotein)共表达。由于需要穿过两层膜,大肠杆菌只能分泌极少的蛋白质到培养基中,效果都不太理想。五、几种类型的原核表达载体1.非融合型表达载体载体表达出的外源基因蛋白质不与细菌的任何蛋白质融合在一起。S-D序列ATG-外源基因-TAG优点:产物结构接近于真核细胞体内的蛋白质结构。缺点:容易被宿主菌的蛋白酶所破坏。pKK223-3载体哈佛大学Gilbert实验室建立的。表达能力强。组成结构:①强启动子:tac(trp-lac):trp的-35区lacUV5的-10区②操纵基因:乳糖操纵子系统。lac操纵基因举例③调节基因:宿主菌染色体上的乳糖操纵子系统。如JM105菌。LacI④终止子:rrnB的强终止子rrnB强终止子⑤S-D序列和插入位点区:S-D插入位点区⑥载体的其余部分:来自pBR322质粒。⑦表达诱导物:IPTG(乳糖的类似物,不会被降解)宿主lacItacPLacOS-D插入位点区rrnBT阻遏物IPTG2.分泌型表达载体载体表达出的外源蛋白质与细菌的分泌信号肽连在一起,可被宿主菌分泌到细胞周质中。如:pINIII系列:pINIII-comA1,pINIII-comA2,pINIII-comA3,组成结构①强启动子:Ipp(脂蛋白基因启动子)和lacUV5启动子。②调节基因:lacI③S-D序列和起始密码ATG。④分泌信号肽:大肠杆菌外膜蛋白基因ompa。⑤插入位点区(多克隆位点)。IpplacPlacOS-D/ATGompa插入位点3.融合蛋白表达载体系统—pGEX系列表达出的外源基因产物蛋白是与质粒载体上的菌体蛋白连接在一起的。(1)优点(2)组成结构便于融合蛋白的分离和纯化。①启动子:tac②操纵基因:lacP③调节基因:lacI④S-D序列⑤ori:pBR322ori⑥融合肽:GST(谷胱甘肽巯基转移酶)(3)产物提纯GST融合蛋白用GlutathioneSepharose亲和层析柱分离纯化。lacItaclacPlacOS-D/ATGGST插入位点TGA(4)产物分离用凝血酶或Xa因子可以把外源蛋白从GST上切下来。(5)其他融合蛋白系统His-tag(组氨酸标签):在外源多肽的N端或C端接上6个组氨酸(His)。His-tag能与Ni2+柱结合,但很容易被EDTA(或咪唑溶液)洗脱下来,可以纯化蛋白质。六、影响外源基因表达效率的因素1.启动子的结构对表达效率的影响(1)一致顺序越接近一致顺序,启动子越强。(3)-35区和-10区的碱基顺序(2)-35区与-10区之间的距离间隔为17bp时,启动子最强。2.转译起始序列对表达效率的影响(1)S-D序列5’-AGGAGGU-3’S-D序列后面的4个碱基:如果是A(T),翻译效率最高;如果是G(C),效率只有50%或25%。(2)起始密码AUGAUG左侧的三个碱基也有影响。β-半乳糖苷酶的mRNA中:AUG左侧如果是UAU或CUU时,最为有效;如果是UUC、UCA或AGG时下降20倍。(3)其它多顺反子的mRNA与核糖体的结合位点有一个或几个终止密码。噬菌体外壳蛋白或核糖体蛋白mRNA的核糖体结合位点有多个U。3.启动子与外源基因之间的距离4.转录终止区对表达效率的影响5.载体拷贝数及稳定性对表达效率的影响6.外源蛋白在菌体中的稳定性对表达效率的影响转录终止区的存在保证载体不会转录非必须基因,不必浪费源量和能量、不会干扰正常的表达。增加载体的拷贝数会增加转录出的mRNA数目。增加表达效率。但过度的外源基因的表达会影响宿主的正常生长。七、提高表达水平常用的方法1.选择强启动子序列,如tac等2.调整S-D序列与AUG碱基的距离3.改变起始密码下面的几组密码子一般为5-9bp。距离过长或过短都影响真核基因的表达。根据不同的启动子选择不同的距离。能提高翻译的起始效率。5.减轻宿主细胞的代谢负荷4.增加mRNA的拷贝数和稳定性在外源基因的下游插入“重复性基因外回文序列”能防止mRNA受到3’→5’外切酶的攻击。合理地调节代谢负荷与外源基因高效表达的关系。(1)诱导表达将宿主生长代谢与外源基因表达分开。一般采用温度诱导或药物诱导。λPL启动子是温度诱导型32℃cI857(cI的温度敏感突变等位基因)阻遏物有活性,抑制λPL启动子,外源基因不表达,宿主大量生长。42℃:cI857阻遏物失活,PL启动子启动,外源基因高水平表达,宿主生长受到限制。cI857PLPO外源基因λPL启动子是药物诱导型调节基因lacI(位于宿主基因组内或载体上)始终产生阻遏物。无IPTG:阻遏物与lac操纵基因结合,抑制外源基因转录。宿主大量生长。有IPTG:阻遏物与IPTG结合,lac操纵基因解放,外源基因大量转录。宿主生长受抑制。(2)表达载体诱导复制将宿主的生长与载体的复制分开。当需要宿主大量生长时,抑制载体质粒的复制。当宿主大量生长后,再诱导载体质粒的复制,增加拷贝数。6.提高表达产物的稳定性防止被宿主的酶降解。(1)设计成融合蛋白这是避免被降解的最好措施。N末端:由原核基因编码一段多肽,C末端:是完整的真核外源基因。(2)使用突变菌株,保护外源蛋白不被降解减少宿主菌本身的蛋白酶的表达。①使用次黄嘌呤核苷(lon)缺陷型菌株,减少宿主菌的蛋白酶合成。②大肠杆菌的htpR基因突变也减少蛋白酶的降解作用。③T4噬菌体的pin基因产物能抑制细菌的蛋白酶。可把pin增加到载体上。细菌蛋白分泌的条件:①有信号肽。位于N端,一般为15-30aa。真核与原核的结构相似,功能相似,可以互换。②蛋白质内有与分泌相关的aa序列。为蛋白指明目的地。③细胞内的转运机制。信号肽酶I、信号肽酶II等近20多种蛋白质的参与。真核细胞中的分泌蛋白能在大肠杆菌中很好地分泌表达;但非分泌蛋白很难在大肠杆菌中分泌。内涵肽