《发育医学电子杂志》2017年1月第5卷第1期JDevelopmentMed,Jan2017,Vol.5,No.1·35·CRISPR/Cas9的原理及其在疾病治疗中的研究进展王亮 赵同标(中国科学院动物研究所 干细胞与生殖生物学国家重点实验室,北京 100101)·综述·规律成簇间隔短回文重复序列(clusteredregularlyinterspacedshortpalindromicrepeats,CRISPR)及其相关Cas9蛋白介导的新一代基因编辑技术具有操作容易、成本低廉的优势,可实现精确高效的基因编辑功能,包括定点插入、定点敲除及定点突变等,已广泛用于多种动植物的基因编辑。近年来,CRISPR技术迅速发展,应用范围已拓展到基因调控、表观修饰、基因成像等领域。其在疾病治疗方面更是显示出广阔的应用前景。本文首先介绍CRISPR的作用机制、工作模型,进而就其研究历史及最新进展进行阐述,并对其在疾病治疗方面的应用进行归纳举例。1 CRISPR/Cas系统概述随着DNA双螺旋结构的解析及中心法则的确立,分子生物学技术获得迅猛发展,DNA重组技术的出现更是开启了生命科学的新纪元,为实现基因组定点编辑提供了理论基础与技术保障。长期以来,科学家一直致力于如何精准、高效地对基因组进行操作,以实现对基因功能的解析及遗传性状的修饰。由此,相继发展出了ZFN(zincfingernucleases)、TALEN(transcriptionactivator-likeeffectornucleases)及CRISPR等基因编辑技术。这3种基因编辑技术都基于同一原理,即通过特定的DNA结合结构域识别并结合到特异性的目标DNA序列上,引导序列特异性的内切酶在目标序列附近进行切割,造成DNA双链断裂(double-strandedbreak,DSB),进而激活体内的DNA修复系统,包括非同源末端连接(non-homologousendjoining,NHEJ)和/或同源重组修复(homology-directedrepair,HDR)。通过这两种修复途径,可以实现对基因组改造的目的,即基因敲除、引入特异突变和基因插入等。ZFN和TALEN都是以蛋白质介导的,通过特异的结合蛋白与DNA目标位点结合,在非特异性的核酸酶FokⅠ的作用下进行切割[1-2];而CRISPR/Cas9则是以RNA介导的,以碱基互补配对结合目标DNA序列,这样针对每个位点只需简单变换引导RNA序列即可,不必像前者一样每次合成和组装不同的DNA识别蛋白;此外,CRISPR还可同时编辑1个细胞中的多个位点[3],位点选择也更加多样和灵活。因此,CRISPR操作容易,成本低,而且准确、高效,很快便得到了广泛应用。2 CRISPR/Cas系统的结构、作用机制及工作模型2.1 CRISPR/Cas系统的结构及作用机制 CRISPR/Cas系统由CRISPR基因簇和Cas蛋白共同组成,是细菌和古细菌抵抗噬菌体侵染的一种适应性免疫机制[4]。CRISPR基因簇由多个重复序列(repeat)及与外源基因元件一致的非重复间隔序列(spacer)组成R-S结构。噬菌体初次侵染宿主细胞时,CRISPR系统可通过R-S结构识别入侵核酸,并基金项目:科技部973计划(2013CB966901);国家自然科学青年基金(31400831);国家自然科学面上基金(31570995)通讯作者:赵同标(Email:tbzhao@ioz.ac.cn)·36·《发育医学电子杂志》2017年1月第5卷第1期JDevelopmentMed,Jan2017,Vol.5,No.1通过扫描外源DNA序列上潜在的PAM(protospaceradjacentmotif)获取邻近的一小段DNA序列,将其加工后重组到两个重复序列之间形成新的非重复间隔序列,获得针对该噬菌体的免疫能力[5];当噬菌体再次侵袭时,CRISPR系统即可根据新获得的非重复间隔序列转录加工出引导RNA(guideRNA,gRNA),引导Cas蛋白识别并切割目标DNA[6],从而达到免疫防御的效果。CRISPR/Cas系统可分为Ⅰ、Ⅱ、Ⅲ型,其中在产脓链球菌中发现的Ⅱ型系统由于只需1个Cas蛋白(即Cas9)即可发挥核酸内切酶活性,相对比较简单且操作容易,因而研究最为广泛,被改造成为现今高效的基因编辑工具CRISPR/Cas9。改造后的CRISPR/Cas9将原本独立的crRNA(CRISPRRNA)及tracrRNA(trans-actingCRISPRRNA)融合为一条单链引导RNA(single-strandedguideRNA,sgRNA)[4]。CRISPR基因座首先转录出前体crRNA及tracrRNA,两者通过碱基互补配对形成异二聚体,然后在Cas9的帮助下,前体crRNA被核酸内切酶RNaseⅢ剪切为成熟crRNA[7]。成熟crRNA含有可与目标DNA互补配对的非重复间隔序列,即人工设计的20nt的gRNA,可引导Cas9蛋白实现对目标DNA序列的切割,使得CRISPR/Cas9系统更加简化,并被广泛应用于基因编辑领域。Cas9蛋白含有多种同源物,包括SpCas9、SaCas9及AnaCas9等,其中广泛应用于基因编辑领域的是SpCas9。SpCas9由α螺旋状的识别瓣叶(recognitionlobe,REC)和核酸酶瓣叶(nucleaselobe,NUC)组成。REC可识别并结合sgRNA和目标DNA的复合体。NUC包含HNH核酸酶结构域、RuvC-样核酸酶结构域、PAM相互作用区(PAM-interactingdomain,PI)及楔形域(wedgedomain,WED)。HNH与RuvC可分别切割目标DNA上与crRNA互补及非互补的DNA链。PI负责与目标DNA的PAM区相互作用,促进Cas9蛋白切割的特异性。对于SpCas9蛋白而言,PAM为目标DNA的5’-NGG-3’序列,它的PI结构域的两个精氨酸残基(Arg1333和Arg1335)可以通过氢键与非目标链PAM的GG二核苷酸结合[8],从而区别于其他类型的Cas9蛋白(如SaCas9识别的是5’-NNGRRT-3’PAM)。此外,SpCas9也可识别5’-NAG-3’序列,但切割效率明显降低。WED则可与REC共同识别crRNA-tracrRNA二聚体的互补配对区及目标DNA的PAM区[9]。CRISPR/Cas9系统的组成结构及功能见表1。Cas9蛋白对目标DNA序列的切割见图1。表1CRISPR/Cas9系统的组成结构及功能组分及结构单元功能sgRNAcrRNA识别目标DNA约20bp的片段并互补配对,引导Cas蛋白进行切割tracrRNA与crRNA形成异二聚体Cas9蛋白REC识别并结合sgRNA和目标DNA的复合体NUC核酸酶HNH切割与crRNA互补的目标DNA链核酸酶RuvC切割非目标DNA链PI与目标DNA的PAM区相互作用WED识别sgRNA以及目标DNA的PAM注:sgRNA:单链引导RNA(single-strandedguideRNA);crRNA:CRISPRRNA;tracrRNA:trans-actingCRISPRRNA;REC:识别瓣叶(recognitionlobe);NUC:核酸酶瓣叶(nucleaselobe);PAM:protospaceradjacentmotif;PI:PAM相互作用区(PAM-interactingdomain);WED:楔形域(wedgedomain)注:REC:识别瓣叶(recognitionlobe);tracrRNA:trans-actingCRISPRRNA;sgRNA:单链引导RNA(single-strandedguideRNA);NUC:核酸酶瓣叶(nucleaselobe);PAM:protospaceradjacentmotif;crRNA:CRISPRRNA图1Cas9蛋白切割目标DNA示意图《发育医学电子杂志》2017年1月第5卷第1期JDevelopmentMed,Jan2017,Vol.5,No.1·37·2.2 CRISPR/Cas9切割目标DNA的工作模型[10]及修复机制 在这个模型中,Cas9蛋白在未激活时处于自身抑制的状态,其HNH由于与RuvC结合而无法显示切割活性[11]。只有当sgRNA结合上之后才能使其构象发生改变,在两个瓣叶之间形成可容纳DNA的通道[9],从而使得Cas9蛋白展示出DNA识别结构[12]。随后,Cas9-sgRNA复合体通过PI结构域结合到目标DNA的PAM基序上,启始PAM附近的DNA双链打开,促进sgRNA-DNA异源二聚体形成[8]。只有当sgRNA-DNA碱基对显著匹配后,DNA双链才能完全打开,形成sgRNA-DNA异源二聚体。这里应当注意,异源二聚体的形成并不要求与gRNA的20个碱基全部配对,成熟crRNA末端含有一段称为“种子区”的序列,其对目标DNA的严格匹配仅限于紧随PAM的7个核苷酸[13];而PAM远端的区域可以容许少数错配。有研究表明,10nt以上的gRNA结合即可启动HNH构象改变[12],虽然效率低于全部匹配的情况[14]。最终,Cas9-sgRNA-DNA三元复合物的形成使HNH构象发生改变,HNH和RuvC通过核酸内切酶活性切割目标DNA链:HNH切割与crRNA互补配对的模板链,切割位点位于PAM的5’端的第3个碱基外侧;RuvC对另一条链进行切割,切割位点位于PAM上游的3~8碱基之间[15]。结果造成DSB,机体随之启动修复机制。修复机制包括NHEJ及HDR两种类型,见图2。NHEJ是一种易错修复,能够在DSB位点造成随机插入或删除,当发生移码突变或重要结构破坏时可实现基因敲除[16];HDR则可通过导入donorDNA的方法,以同源重组的方式在DSB处生成所需的序列替换,实现基因定点删除、插入、突变或基因矫正[17]。然而,在细胞内,NHEJ发生频率远高于HDR。为提高同源重组介导的精确修复就需要提高HDR发生的频率。Lin等[18]发现在同步化的M期细胞导入Cas9-sgRNA复合体可以将HDR的比率从9%提高到33%;Yu等[19]通过大规模小分子筛选发现L755507和brefeldinA能提高HDR比率。此外,通过添加抑制剂Scr7[20]阻断NHEJ途图2CRISPR/Cas9介导的非同源末端连接(NHEJ)与同源重组修复(HDR)径中关键的DNA连接酶Ⅳ或敲降编码该酶的基因[21],也能间接达到提高HDR比率的目的。3 CRISPR/Cas9的研究历程与最新进展3.1 CRISPR/Cas9研究历程中的重要事件 从1987年首次发现CRISPR重复序列,到如今CRISPR/Cas9技术获得广泛应用,仅仅经历了短短的30年时间,其间包含了一个又一个里程碑式的发现,促成了CRISPR技术的广泛应用。其中,DoudnaJ、CharpentierE和华人科学家张锋率先将CRISPR从细菌免疫防御系统开发为实用的基因编辑工具[3-4],奠定了CRISPR技术在基因编辑领域的重要地位。研究历程的重要事件见表2。3.2 CRISPR/Cas9研究的最新进展 CRISPR/Cas9技术的问世,极大地推动了生物学研究进程。其不仅在基因编辑领域展现出无与伦比的优势与应用价值,同时也可通过改造应用于基因调控、表观修饰、基因成像等方面。接下来对近年来这些方面取得的进展进行汇总。3.2.1 CRISPR/Cas9与基因编辑 近来发现CRISPRⅡ型系统的另一核酸内切酶Cpf1蛋白能够不依赖于tracrRNA,只通过crRNA对目标DNA进行切割,且其切割效率及特异性均类似于Cas9蛋白[33-35]。同样来源于CRISPRⅡ型系统的C2c2蛋白则包含两个高等真核生物和原核生物与RNA酶相关的核苷酸结合域,可以靶向RNA切割,删除特定序列,降低相应蛋白的表达水平[36-37]。这些发·38·《发育医学