1CRISPR/Cas9-basedgenomeeditingtechnologyArobustCRISPR/Cas9vectorsystemformultiplextargetingofgenomicsitesinmonocotanddicotplants亚热带农业生物资源保护与利用国家重点实验室华南农业大学生命科学学院刘耀光课题组(ygliu@scau.edu.cn)1.pYLCRISPR/Cas9多靶点载体介绍CRISPR/Cas9是新近发展的基因组编辑技术(图1)。CRISPR/Cas9切割靶序列仅需要single-guideRNA(sgRNA)以及由sgRNA引导的Cas9蛋白,比锌指核酸酶(ZFNs),TALENs更加简便,高效,因而成为基因组编辑工具的首选。我们利用CRISPR/Cas9技术可方便地进行多重靶向的特征,构建了一套用于单子叶和双子叶植物的多靶点CRISPR/Cas9基因打靶载体系统。本套载体将Cas9蛋白表达盒整合到双元载体上,用于装载多个sgRNA表达盒的多克隆位点BsaI位于靠近双元载体RB位置。sgRNA表达盒元件设在中间质粒载体上,利用酶切连接和PCR方法拼装好,再利用GoldenGate或GibsonAssembly克隆方法组装到双元载体上。本载体系统已经发表(Maetal.,2015,MolecularPlant,DOI:10.1016/j.molp.2015.04.007)。5’NNNNNNNNNNNNGNNNNNNNNNNNNNNNNNNNTargetSitePAMNNNNNNNNNNNN-3’3’NNNNNNNNNNNNNCCNNNNNNNNNNNN-5’NNNNNNNNNNNNNNNNNNNN5’-G/ANNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAACGAUAGAAAACUAUUGCCUGAUCGGAAUAAAAUUCas9nucleaseCleavagesitegenomesequenceRuvC-likedomainHNHdomainCUUGAAAAAGUGGCACCGAGCGUGGCUUUUUU-3’NGGFigure1.AworkingmodeloftheCRISPR/Cas9system.TheCas9-sgRNAcomplexlocatestothetargetsitetocleavetheDNAtoproducedoublestrandbreak(DSB).22.CRISPR/Cas9载体与sgRNA载体图谱2.1CRISPR/Cas9双元载体本套载体系统的双元载体骨架为pCAMBIA-1300(ACCESSION:AF234296),Cas9p为本实验室设计合成的植物优化密码子基因,它模拟了禾本科植物基因具有5’端GC含量较高的特征(Figure2)。这些质粒在E.coliTOP10F’(LacIq)菌株繁殖,该菌株LacIq基因型产生的阻碍蛋白可抑制ccdB大肠杆菌致死基因的表达。我们对pYLCRISPR/Cas9载体采用了新的命名,与旧的命名对应关系见表1。pYLCRISPR/Cas9Pubi-H,-B载体中的Cas9p用PUbi驱动,优选用于单子叶植物的基因打靶;对于双子叶植物,我们前期使用pYLCRISPR/Cas9P35S-H在拟南芥获得了uniform简单突变(双等位突变,杂合突变,纯合突变)以及嵌合突变(Maetal.,2015)。但是,我们最近发现用pYLCRISPR/Cas9Pubi-H在拟南芥的打靶效果效率比使用pYLCRISPR/Cas9P35S-H的效果效率更高,能得到更多的简单突变。因此也推荐在双子叶植物优先使用PUbi驱动Cas9p的载体pYLCRISPR/Cas9P35S-H或pYLCRISPR/Cas9P35S-B。Figure2.ACRISPR/Cas9systemformonocotanddicotplants.pYLCRISPR/Cas9Pubi-H,-B(above);pYLCRISPR/Cas9P35S-H,-N,-B(below);HPT(-H),Bar(-B),andNPTII(-N)encodehygromycinBphosphotransferase,PPTacetyltransferaseandneomycinphosphotransferaseII,respectively.NLS,nuclearlocalizationsequence.ThekeysequencesincludingrestrictionsitesforcloningandanalysisofsgRNAexpressioncassettesaregiven.TwoBsaI-cuttingsties[BsaI(B-L)andBsaI(B-R)]forcloningthesgRNAexpressioncassettesareseparatedbyashortenformoftheccdBnegativeselectiongene.3表一pYLCRISPR/Cas9载体新旧命名对应关系新命名原命名适用植物种植物抗性pYLCRISPR/Cas9Pubi-HpYLCRISPR/Cas9-MH,pYLCRISPR/Cas9-MTmono单子叶/双子叶潮霉素pYLCRISPR/Cas9Pubi-BpYLCRISPR/Cas9-MB单子叶/双子叶草甘磷pYLCRISPR/Cas9P35S-HpYLCRISPR/Cas9-DH双子叶潮霉素pYLCRISPR/Cas9P35S-BpYLCRISPR/Cas9-DB双子叶草甘磷pYLCRISPR/Cas9P35S-NpYLCRISPR/Cas9-DN双子叶卡那霉素2.2CRISPR/sgRNAvectorssgRNA序列全长97nt,分为两部分,5’决定靶序列的20nt(seedsequence)和3’区域为保守的结构序列。因此构建针对特定靶位点的sgRNA,只需要克隆决定靶序列的5’端20nt。sgRNA用smallnuclear(sn)RNAU6/U3启动子驱动,以保证转录出的sgRNA停留在细胞核中与Cas9结合。本方案用PCR扩增的方法构建包含靶序列的sgRNA表达盒,并在扩增引物5’端引入顺次排列的位置特异BsaI酶切位点,用于GoldenGate克隆。或在扩增引物5’端加入互补序列用于GibsonAssembly连接克隆。为了提高构建好的多靶点载体的稳定性,避免在农杆菌或者植物基因组中sgRNA表达盒之间发生同源重组,从水稻克隆了4个不同snRNA启动子(OsU3,OsU6a,OsU6b,OsU6c),用于单子叶植物;从拟南芥中克隆了4个不同snRNA启动子(AtU3b,AtU3d,AtU6-1,AtU6-29),用于双子叶植物。Figure3.(A)OverallstructureofeightbasicsgRNAintermediatevectors.(B)ThetwoBsaIcuttingsequencesaregivenintwelvesgRNAvectors(inalinearform),includingotherfourvectors4(pYLsgRNA-OsU3/LacZ,pYLsgRNA-OsU6a/LacZ,pYLsgRNA-AtU3b/LacZ,andpYLsgRNA-AtU3d/LacZ)thathaveanadditionalLacZgene(198bp)asacloningselectionmarker.TheU3andU6promotersfromrice(Os)andArabidopsis(At)andthesgRNAsequenceareseparatedbythevectorbackbone,toavoidamplificationoftheuncutplasmidsbyPCRwithshortextensiontimeduringtheconstructionofsgRNAexpressioncassettes.Cutting(smallarrows)withBsaIproducesdifferentnon-palindromicstickyendstothepromotersandanendtothesgRNAsequence.(C)Arepresentativeregulartargetandanirregulartarget,theirtargetadaptorsfortheOsU6apromoter,andthetranscribed5’sequencesareshown.Aligatedtarget-sgRNAexpressioncassetteisamplifiedbynestedPCRusingprimersU-F/gR-RandPps/Pgs.PpsandPgsareposition-specificprimerswithBsaIsitesfortheGoldenGateligation(TableS1),orwithoverlappingendsforGibsonAssembly(TableS3).3.靶位点选择和接头设计3.1靶位点选择建议对1个目的基因设计2个靶点(尤其只有一个靶基因),以降低某靶点打靶不成功的风险。可在ORF5’区和功能结构域各设计1个靶点,使之任何1个靶点的突变都可以产生功能缺失,或2个靶点之间的序列被敲除。设计靶点的原则:(1)目的基因(转录方向)的正链和负链靶点的打靶效率大致相同,都可以设计靶点;(2)Regulartargets&irregulartargets(见以下说明)有同等打靶效率;(3)靶点的GC%尽量不要低于40%,靶点序列GC%偏高(50-70%)有较高的打靶效率。靶点内(按5-N20NGG-3方向)不要有连续4个以上的T,以防RNAPolIII将其作为转录终止信号;(4)虽然非特异打靶(脱靶)对植物基因打靶不是很重要的问题,但应进行靶点特异性分析:用靶点+NGG(前后各加几十碱基)与基因组做blast(选Somewhatsimilarsequences),避免使用与同源序列差异少于5个碱基的靶点(在切点附近和PAM可有2个碱基差异就具有特异性)。可以使用在线软件CRISPR-P()做这个分析,但可使用的靶点序列不一定限于Regulartargets(AN19NGG或GN19NGG),见以下关于Regulartarget&irregulartarget说明。(5)打算用一个靶序列敲除2个或以上的同源基因时,选择同源基因中碱基完全相同的区域为靶位点。(6)把靶点序列连接到sgRNA序列的5’端[(20bptarget)GTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTT],利用在线软件RNAFoldingForm(=mfold/RNA-Folding-Form2.3)做二级结构分析。靶序列与sgRNA序列产生连续配对7bp(注意:RNA可以产生U-G配对)以上会抑制其与染色体DNA靶序列结合靶点,因此要避免使用连续配对7bp以上的靶序列。3.2靶点接头设计U6/U3基因由III型RNA聚合酶转录,转录起始点是确定的碱基位置。例如,U6为G碱基,U3为A碱基。因此,由U6/U3启动子驱动的sgRNA首碱基一定是G或者A。但是设计的靶序列的首碱基不一定刚好是G或者A,因此设计接头引物时需分两种情况考虑:(1)如果目标区NGG(PAM)上游第20碱基是A(用U3启动子)或G(用U6启动子),作为常规靶点(regulartarget),将A/G下游19碱基可按下图所示合成接头。55-ggcANNNNNNNNNNNNNNNNNNN-3’(forw