1启动子克隆方法研究进展随着基因工程的发展,常常需要构建一种能高水平表达异源蛋白质的表达载体。启动子对外源基因的表达水平影响很大,是基因工程表达载体的重要元件。因此研究启动子的克隆方法,对研究基因表达调控和构建表达载体至关重要。迄今为止,国外尚未见到有关启动子克隆方法的综述性报道,国内仅孙晓红等曾就启动子的结构、分类、克隆方法和食用菌中已经分离到的启动子作过综述。而近年来又有许多改进的克隆启动子的方法获得了多方面的成功,本文就近年来改进的启动子克隆方法作一综述,以期促进对启动子分离技术的应用。1启动子克隆的几种方法1.1利用启动子探针载体筛选启动子启动子探针型载体是一种有效、经济、快速分离基因启动子的工具型载体,包含2个基本部分:转化单元和检测单元。其中,转化单元含复制起点和抗生素抗性基因,用于选择被转化的细胞;检测单元则包括1个已失去转录功能且易于检测的遗传标记基因以及克隆位点。利用启动子探针载体筛选启动子的过程为,先选用1种适当的限制性核酸内切酶消化切割染色体DNA,然后将切割产生的DNA限制片段群体与无启动子的探针质粒载体重组,并按照设计的要求使克隆的片段恰好插在紧邻报告基因的上游位置;随后再把重组混合物转化给寄主细胞,构建质粒载体基因文库,并检测报告基因的表达活性。当插入段同时满足(1)具有基因启动子序列;(2)具有翻译启始区;(3)具有启始密码子;(4)插入方向正确;(5)插入片段3'端编码区序列抗性基因编码区读码框一致,则有可能形成有功能的抗性融合基因,从而启动抗性基因的表达。最早由Rachael等在大肠杆菌中以四环素抗性基因作为报告基因构建了启动子探针质粒pBRH3B,并克隆了一些原核和真核启动子片段。其后Donna等以氯霉素抗性基因作为报告基因,Fodor等以大肠杆菌LacZ为报告基因,构建了酵母启动子探针质粒并克隆了一些启动子片段。构建启动子探针型载体,较为常见的检测标记基因有β-半乳糖苷酶基因(lacZ)、氯霉素乙酰转移酶基因(cat)、四环素抗性基因(Tet')和卡那霉素抗性基因(Kan')。近年来,人们渐渐较多地使用潮霉素B磷酸转移酶(hph)基因作为检测标记基因。李维等曾构建了含有hph抗性基因的启动子探针型载体pSUPV8,直接在大肠杆菌中分离黄孢原毛平革菌基因的启动子。先用Sau3AI酶切黄孢原毛平革菌基因总DNA,再与用BamHI酶切后的pSUPV8相连,转化大肠杆菌,用间接筛选法从氨苄青霉素和潮霉素抗性平板上筛选重组子,得到6个双抗重组子(pCH1~pCH6),电泳检测插入片段分别命名为CHl~CH6;再用原生质体转化法将重组子分别转化黄孢原毛平革菌,对获得的转化子进行复筛,仅pCH6的转化平板上有稳定生长的菌落,说明了CH6片段在黄孢原毛平革菌中具有启动基因表达的功能。该2方法不需要知道具体基因的序列,可随机筛选启动子,避免了引物设计,能获得大量的启动子片段。1.2利用PCR技术克隆启动子即根据发表的基因序列,设计引物,克隆基因的启动子,由于PCR法简便快捷,近年来人们较多采用此方法克隆基因启动子。苏宁等根据已报道的水稻叶绿体16SrRNA启动子基因序列设计5'启动子序列的引物,以水稻叶绿体DNA为模板,PCR扩增出16SrRNA基因5'启动子区的片段,酶切克隆到pSK的SacI和SphI位点,构建测序载体质粒pZ16S,进行序列测定,结果表明所克隆的片段长为144bp,含有SD序列。同源比较结果表明,所克隆的片段与水稻叶绿体16SrRNA启动子序列具有100%的同源性。上述的PCR方法简便、快捷、操作简单,是人们较为广泛使用的技术。1.3环状PCR环状PCR包括I-PCR(Inverse-PCR)和P-PCR(Panhandle-PCR)。这2种PCR都是根据一端已知序列设计的嵌套式引物进行PCR。1.3.1I-PCRI-PCR是1988年由Triglia最早提出的一种基于PCR的改进的染色体步行方法。I-PCR的实验程序包括,基因组DNA经酶切后用T4DNA连接酶进行自连接,产生环状DNA片段;以环化产物为底物,用根据已知片段设计的反向引物进行PCR扩增,从而得到含有未知片段的扩增产物(流程如图1所示)。韩志勇等以I-PCR技术为基础克隆了转基因水稻的外源基因旁侧序列。先用小量法提取转基因水稻的总DNA,总DNA用10倍过量的限制内切酶进行过夜酶切,酶切片段进行自连接,然后根据工程质粒的T-DNA区设计2对反向引物,进行套式PCR扩增旁侧序列。建立了适合于处理大量材料的克隆转基因水稻中外源基因旁侧序列的技术体系。在1周内克隆了35个转基因水稻株系中外源基因的旁侧序列,长度在300~750bp之间。I-PCR法快速、高效、稳定,操作相对简单,花费少,PCR引物设计比较方便。1.3.2P-PCRP-PCR是由Jones等提出的利用末端反向重复序列与已知序列互补配对形成环状单链模板,有效增强了引物与模板结合的特异性。反应需要3个根据已知序列设计的引物,3个引物在已知序列内呈线性排列,其中第3个引物可作为接头使用,可与已知序列互补配对形3成锅柄状单链模板。其过程为,首先酶切基因组DNA,产生5'或3'粘末端,然后连接上合适的接头(primer3),连接好后最好用核酸外切酶I除去多余的接头,由于连接上的接头与已知序列是反向重复序列,变性后的DNA单链可退火形成锅柄状单链模板,之后分别用3个单引物进行3次PCR扩增,能有效地扩增2~9kbp的大片段未知序列(流程如图2所示)。黄君健等成功地应用P-PCR技术从正常的人外周血单核细胞基因组DNA中扩增端粒催化亚基hTERT基因5'端上游旁侧序列,获得了hTERT基因翻译启始位点上游2090bp的基因组DNA序列。首先用酶切消化基因组DNA,得到带有GATC的5'突出端的DNA片段。然后利用已知的hTERTcDNA序列设计PCR引物,用常规的PCR方法扩增出1条大约900bp的基因组特异片段,序列分析为hTERT的基因组DNA片段。根据得到的基因组DNA序列的信息,确定P-PCR的引物退火区,并合成了5'磷酸化的连接寡核苷酸和4条基因特异性引物,其中连接寡核苷酸5'端的4个碱基CTAG与上述核酸内切酶消化产生的5'突出端GATC互补,然后将连接寡核苷酸与基因组酶切产物连接,以连接产物为反应模板,进行PCR,使模板自身进行退火-延伸反应,以形成Panhandle结构。最后以单链Panhandle为模板,4条基因特异序列为引物进行嵌套式PCR,最终获得了1条约2kb的含hTERT基因启动子的DNA片段。Jones4等利用改进的P-PCR,在形成panhandle结构之前3'末端连上ddCTP,使引物错配的机率减少,特异性增加。他们从人类基因组DNA已知位点侧翼扩增了4~9kb的大片段未知序列。P-PCR是目前能够扩增距已知序列最远的未知DNA序列的方法,有很高的特异性。1.4利用载体或接头的染色体步行技术克隆基因启动子这类方法的第一步都是酶切基因组DNA,连接载体或接头,既可以用pUCl8等质粒载体,也可以使用λDNA等噬菌体载体,只要选用的载体带有合适的酶切位点;同样根据实验需要,接头既可以是双链也可以是单链,然后根据基因组DNA序列设计的特异引物和载体的通用引物或接头序列进行扩增。1.4.1利用载体的PCRShyamala等利用的单特异性引物PCR(SSP-PCR)对以小鼠伤寒杆菌组氨酸转运操纵子为起点进行连续步行。以M13mpl8RFDNA为载体。用PstI和AraI酶切基因组DNA,PstI和XmaI酶切载体DNA,然后连接基因组片段和载体片段,用根据基因组DNA序列设计的特异引物和载体的通用引物进行扩增,由于非特异片段没有单特异引物结合的位点,即使有载体连到非特异片段,也无法得到大量扩增,而使特异片段得到有效扩增。1.4.2利用接头的PCR王新国等利用衔接头的方法,设计了位于单链DNA两端互补的颠倒末端重复序列,增加了反应的特异性,在胡萝卜II型转化酶基因启动子的克隆方面取得了新的进展。首先将胡萝卜基因组DNA分别用PvuI、SmaI、DraI、EcoRV酶切,并设计了1个衔接头长链序列和1个衔接头短链序列,并在衔接头短链的3'末端带有1个氨基的衔接头,能够阻止聚合酶催化的衔接头短链的延伸,同时衔接头的长链和短链之间是反向重复序列。将酶切片段与此衔接头连接,取连接产物做模板,以衔接头引物和基因特异引物做PCR,在首轮PCR中只有限定的远端基因特异引物有结合位点,当基因特异引物延伸产生的DNA链通过衔接头时,才能产生衔接头引物的结合位点,PCR才能以衔接头引物和基因特异引物进行指数扩增。而另一方面,如果非特异合成产生了DNA两端都有双链衔接头序列的PCR产物时,这种PCR产物在每次变性后,单链DNA末端的衔接头反向重复序列将形成锅柄结构,此结构比引物-模板杂交更稳定,能抑制非特异序列的指数增长。最后得到主要的PCR产物为3.4kb、1.3kb、0.6kb和0.4kb。将EcoRV-衔接头体系的PCR产物克隆、测序、同源性比较,得到1个新的胡萝卜II型转化酶基因启动子序列,它含有类似于TATAbox和CAATbox的元件,在启动子的远上游区域含多个AT富含区,该启动子的发现对于研究植物中的糖代谢具有重要的意义。接头引物的相对位置如图3所示。5这种方法具有便于操作、实验线路简单的优点,但是特异性较差,产物需进一步杂交验证。1.5YADE法Prashar等在扩增cDNA3'端时采用“Y”形接头,以减少接头引物的单引物扩增。其原理是接头引物处于“Y”接头的2个分叉单链上,序列与接头一样,只有与特异引物引导合成了接头的互补序列后,接头引物才能退火参与扩增,流程如图4。方卫国等尝试将YADE法引入到昆虫病原真菌的分子生物学研究,并取得了成功,建立了适合于球孢白僵菌和金龟子绿僵菌YADE体系。在已克隆的类球孢白僵菌类枯草杆菌蛋白酶基因CDEP-1的基础上,利用YADE法,克隆到该基因的启动子CDEPP。先酶切球孢白僵菌基因组DNA,然后与“Y”形接头相连,取连接产物做模板,先以基因特异引物1做线性扩增,再以线性扩增产物为模板,以接头引物和基因特异引物2做指数扩增,只有当线性扩增时合成了含有接头引物的互补单链,接头引物才能与其发生退火,参与指数扩增,从而有效防止了接头引物的单引物扩增。最后得PCR产物,进行序列分析确定为CDEP-1的上游启动子序列。6在应用YADE法时,内切酶的选择至关重要。好的内切酶产生适合PCR扩增的片段,太大太小都不行。为了得到合适的内切酶,需要从众多的内切酶中筛选。研究表明,不同的物种有自己合适的内切酶。YADE法延伸的起始片段可以是基因组DNA片段,也可以是cDNA片段,在延伸cDNA片段时,设计的引物需要避开内含子和外显子的边界,在内含子的位置未知的情况下,可考虑多合成1~2条特异引物,以提高扩增未知片段的机率。该方法假阳性低、效率高,理论上能扩出所有目的片段。很早就有用随机引物的PCR,但由于无法有效地控制由随机引物引发的非特异产物的产生,所以一直未能广泛应用。近年来由IJiu等设计的TAIL-PCR(TermalAsymmetricInterlacedPCR)又叫热不对称交错PCR,则解决了这个问题,后来有研究表明,经改良过的TAIL-PCR成功地从突变体中克隆到外源插入基因的旁侧序列,从而为启动子的克隆提供了有效的新方法。在利用特异引物和随机引物进行PCR中一般有3种产物生成:(1)由特异性引物和简并引物扩增出的产物;(2)由同一特异性弓l物扩增出的产物;(3)由同一简并引物扩增出的产物。在TAIL-PCR反应中,其中后2种目标产物可以通过以嵌套的特异性引物进行的后续反应来消除。TAIL-PCR的基本原理是利用目标序列旁的已知序列设计3个嵌套的特异性引物(specialprimer,简称sp1,sp2,sp3,约20bp),用它们分别和1个具有低Tm值的短的随机简并引物(Arbitrarydegeneratepr