CRISPR/Cas9系统及其应用CRISPR-Cas系统简介CRISPR-Cas系统作用机理CRISPR-Cas9基因编辑系统的构建载体构建、导入目的生物或细胞系、筛选CRISPR-Cas9系统的应用CRISPR-Cas9系统的不足之处提高打靶特异性的策略小结1CRISPR-Cas系统简介1.1CRISPR-Cas系统的来源成簇规律间隔短回文重复序列(Clusteredregularlyinterspacedshortpalindromicrepeats)。CRISPR/Cas系统是一种广泛存在于细菌与古细菌中的,由RNA介导的、可遗传的获得性免疫系统。1.2CRISPR-Cas系统的研究历史1987年,日本课题组在K12大肠杆菌的碱性磷酸酶基因附近发现串联间隔重复序列,随后发现其广泛存在于细菌和古细菌的基因组中,2002年,正式将其命名为成簇的规律间隔的短回文重复序列2005年发现CRISPR的间隔序列(spacer)与宿主菌的染色体外的遗传物质高度同源,推测细菌可能通过CRISPR系统可能以类似于真核生物的RNAi方式抵抗外源遗传物质的入侵。2007年,Barrangou等首次发现细菌可能利用CRSPR系统抵抗噬菌体入侵;2008年,Marraffini等发现细菌CRISPR系统能阻止外源质粒的转移,首次利用实验验证了CRISPR系统的功能2013年初,MIT的研究组首次利用CRISPR/Cas9系统对人293T细胞EMX1和PVALB基因以及小鼠Nero2A细胞Th基因实现了定点突变。同年Mali利用CRISPR/Cas9在人293T细胞和K652细胞基因的靶位点形成双链或单链的切口,从而激活细胞的DNA修复机制高效介导外源基因定点插入。1.3CRISPR-Cas系统的结构CRISPR-CAS系统的组成主要包括:由不连续的重复序列R(repeat)与长度相似的间区序列S(spacers)间隔排列而成的CRISPR簇,前导序列L(leader)以及一系CRISPR相关蛋白基因cas。1.4CRISPR-Cas系统的类型•CRISPR/Cas系统有3种类型,其中,产脓链球菌的TypeⅡ型系统是被改造的最为成功的人工核酸内切酶,已经在人类细胞、小鼠、斑马鱼中成功实现了基因组定点修饰,目前被广泛应用于真核细胞的基因组编辑中。•Ⅱ型CRISPR/Cas系统包含3个主要基因位点:编码相关蛋白的位点(Cas9、Cas1、Cas2、Csn2),编码含重复片段的小RNA位点(CRISPR位点)和1个辅助小片段RNA(tracrRNA位点)。2CRISPR-CAS系统的作用机理2.1适应:间隔序列的获得当外源DNA片段入侵后,CRISPR/Cas识别入侵的核酸和扫描外源DNA潜在的PAM(NGG序列),将临近PAM的序列作为候选protospacer,然后在CRISPR基因座的5'端合成重复序列,再将该DNA的1个片段(约20bp)整合到两个重复序列之间,从而使得菌体拥有“记忆”。2.2表达:表达并加工CRISPRCRISPR区域首先转录成前体RNA(pre-crRNA),之后被Cas蛋白剪切成更小的crRNA,即成熟的crRNA,包含1个间隔序列和部分重复序列。同时,tracrRNA也会被转录并和crRNA形成一种双链的RNA结构,再与Cas9蛋白组成具有DNA内切酶活性的复合物。2.3干扰:干扰入侵核酸复合物在crRNA的引导下,由Cas9蛋白的核酸结构域对外源DNA分子进行切割。首先RNA/Cas9复合体沿外源入侵DNA进行扫描,当遇到PAM序列且DNA序列可与crRNA互补配对形成一个R环时,Cas9蛋白将分别利用HNH与RuvC结构域对DNA的互补链与非互补链进行切割,而形成DNA的双链断裂。PAM(Protospaceradjacentmotif)•在嗜热链球菌中,PAM序列多数为5‘-NGG,而5’-NAG虽然效率低一些,但也可用于靶DNA的定位,可扩展在基因组编辑中靶DNA的选择范围。•介导切割效率依次为:NGGNGANAG•人类基因组中每8bp就会出现一个PAM•在Ⅰ型与Ⅱ型CRISPR/Cas系统中,自身基因组CRISPR序列的下游无PAM序列,从而将自身基因组DNA序列与外源DNA序列区分开,避免自我免疫。crRNA•成熟crRNA可分为5’手柄、3’发卡结构和间隔序列,5’手柄具有保守性,3’发卡是核酸内切酶识别位点,5’端重复序列均质性较3’端好,其与PAMs一起保护自身CRISPR序列不被误切。•crRNA末端还含有一段起“种子区”作用的序列,它决定着寻找靶基因的效率,该区域仅需1个位点发生突变即极可能无法正确识别靶基因,但在种子区外发生少量突变则不容易导致识别功能失效。•CRISPR/Cas9对靶点的识别需要PAM(NGG)和靠近PAM的11bp的种子序列完全保守,14bp(PAM+种子序列)序列中的任何一个碱基突变之后CRISPR/Cas9的切割效率基本降至零。tracrRNA(trans-activatingcrRNA)•指导RNaseⅢ和Cas9完成前体crRNA的成熟。•tracrRNA对靶点的识别和切割是必需的,tracrRNA的5'端与成熟的crRNA3'端有部分序列(约13bp)能够配对进而形成茎环结构,对维持crRNA与靶点的配对可能十分重要。Cas9蛋白900-1600个氨基酸组成的多结构域蛋白Cas9REC--在REC识别区中的一个富含精氨酸的α-螺旋负责与RNA-DNA异源二聚体的3‘端8~12个核苷酸的结合HNH结构域--在crRNA互补链PAM元件上游3nt处切割。位于HNH结构域的H840A突变体可导致HNH结构域的失活RuvC结构域--在非互补链PAM元件上游的3~8nt处切割。位于RuvC结构域中的D10A突变体可导致RuvC结构域的失活。(RuvC则分为3个亚结构域:RuvCⅠ位于蛋白的N端,RuvCⅡ/Ⅲ分别位于HNH结构域的两侧)PAM结合区3CRISPR-Cas9基因编辑系统的构建3.1sgRNA设计•目前,大多数研究将与靶DNA互补的crRNA与tracrRNA融合为一条单独的引导RNA(singleguideRNA,sgRNA).将sgRNA设计为100nt左右,包含位于5'端20nt的DNA互补区、crRNA以及位于3'端70~80nt的tracrRNA。•通常设计的sgRNA具有二级发卡结构和1条3'端尾,设计的sgRNA与靶基因有1~3个碱基错配并不影响编辑效率,但是,靠近PAM元件的12个碱基要严格配对.crRNA/tracrRNA/Cas9sgRNA/Cas9•目前(2014.10)报道的CRISPR/Cas系统中使用的gRNA有2种结构,一种是M.Jinek等最先提出的,将一部分重复序列和一部分tracrRNA的序列直接拼接到一起形成的嵌合RNA结构。•另一种与第一种基本相同,只是3‘端更长,添加了完整的tracrRNA序列.关于2种结构的优劣,麻省理工学院张峰研究团队做了细致的研究,他们发现,3’端越长,gRNA表达丰度越高,相应的打靶效率也越高。为了保证足够的打靶活性,推荐gRNA的3’端长度不低于67nt为好,而长度为85nt时效率最高.•在设计Guide序列时,需要特别注意第一个碱基必须是G,如果您选取的Guide序列的第一个碱基不是G,需要自行加上一个G,因为这个G对于起始转录非常重要。•在线工具设计:麻省理工学院的CRISPRDesign:德国癌症研究中心的E-Crisp:•Cas9蛋白来源于细菌,因此要让Cas9蛋白高效地转运到哺乳动物细胞核内,需要在Cas9蛋白的N端或是C端加上真核细胞的核定位信号。•对于添加NLS信号的位置,目前尚存在争议。L.CONG的研究发现,在Cas9蛋白的N端和C端同时添加NLS信号最能有效的指导Cas9蛋白入核。而P.Mali等在Cas9蛋白的C端添加1个NLS信号构建的CRISPR/Cas9基因编辑系统在人类的细胞中最高可以达到25%的敲除效率,表明在C端添加1个NLS信号是足以引导Cas9蛋白进入核中的。但是南京大学的研究人员却发现,无论是在Cas9蛋白的N端添加3个还是在N端、C端同时添加SV40核定位信号均不能使Cas9蛋白进入293T细胞的细胞核中,只有在N端添加核定位信号并且在核定位信号和Cas9蛋白之间加上32个氨基酸残基的接头才能指导Cas9蛋白入核。这些不一致的结果有可能是由于各个研究中FLAG标签添加位置的不同引起的,但同时也说明Cas9蛋白在折叠过程中可能干扰了NLS信号识别。4载体构建、导入目的生物或细胞系、筛选4.1载体构建Cas9蛋白和gRNA的表达框可以分开放到2个载体上,也可以直接构建在同1个载体上,方便Cas9蛋白和gRNA的协同表达。这2种策略各有好处。比如,构建在同一载体上有利于Cas9蛋白和gRNA的协同表达,这一点非常适合于难转染的细胞。而分开放在2个表达载体上则能更方便快速的对候选的gRNA进行打靶效率和脱靶情况的检测。构建gRNA时,只要基因的序列连接到gRNA骨架上,或者直接合成带有靶序列的gRNA再连接到表达载体上即可。4.2导入目的生物或细胞系•在人工培养的哺乳细胞中,可通过电穿孔(electroporation)、核转染(nucleofection)与脂质体介导转染等方法将非自主复制的质粒DNA导入细胞中,使Cas9与sgRNA可进行瞬时表达。•慢性病毒载体(lentiviralvectors)也已用于在人类或小鼠细胞中组成型表达Cas9与sgRNA。•体外转录的RNA也可直接注射导入斑马鱼、果蝇或小鼠的胚胎细胞中•质粒越大,成功率越低4.3筛选将Cas9、引导RNA以及一条含有突变位点的靶DNA的同源重组修复模板共同转化到目的菌株中。若在Cas9对基因组靶DNA序列产生DNA双链断裂后,可利用导入的同源重组修复模板进行DNA修复,由于修复模板在识别互补区或PAM位点中存在突变位点而不能被Cas9再次切割,因而可存活;而未能进行同源重组修复的基因组则由于Cas9的切割降解,无法存活。利用该方法可明显提高基因组编辑后的筛选效率,且在基因组中不残留筛选标记。5CRISPR-Cas9系统的应用基因组编辑技术是一种可以在基因组水平上对DNA序列进行改造的遗传操作技术。这种技术的原理是构建一个人工内切酶,在预定的基因组位置切断DNA,切断的DNA在被细胞内的DNA修复系统修复过程中会产生突变,从而达到定点改造基因组的目的。通过修复途径,基因组编辑技术可以实现三种基因组改造,即基因敲除,特异突变的引入和定点转基因5.1CRISPR-Cas9介导的基因组精确编辑技术例子:基因敲除的实验过程1.在靶基因序列中寻找NGG序列获得其附近20多个碱基的序列,设计出sgRNA并合成该序列2.将sgRNA及cas9基因连入载体3.转化感受态,质粒小提,测序验证4.细胞培养与细胞转染5.敲除效果检测6.建立稳定敲除的细胞株5.2CRISPR-Cas9介导的转录抑制与转录激活抑制:在CRISPR/Cas9的Ⅱ型系统中将Cas9中的切割域突变,会使Cas9蛋白失去对DNA的切割活性,但不影响其与DNA结合的能力。这种失去DNA切割活性的Cas9蛋白被命名为DeadCas9。将dCas9与gRNA在细胞中共表达,则gRNA可以介导dCas9蛋白与DNA结合。如果dCas9结合到靶基因的阅读框内,可阻断RNA聚合酶的延伸作用;如果dCas9结合到靶基因的启动子区域则可阻止基因转录的起始.激活:将dCas蛋白与具有转录激活的蛋白质功能域融合则可构建具有转录激活活性的CRISPR-on系统。CRISPR转录激活系统的靶序列位置对激活效率有重要影响。当靶序列与启动子的距离合适时,激活效率较高;靶序列处于启动子上游较远