RNA的防护:CRISPRs保护原核生物免受移动基因元件(第2组翻译人员:黄亚宁,李淑娟字秋艳,陆晓媚,匡双便,徐蕾)摘要:在原核生物中CRISPR/Cas体系提供了对入侵病毒和质粒的抗性。在机制中有三个明显的阶段已经被识别。首先,入侵的片段DNA作为间隔区(spacer)整合到重复的CRISPR位点。随后,CRISPR被转录,而转录物被Cas蛋白反复地裂开,生成短包的RNA(crRNA),crRNA含有spacer序列。最后,crRNA指导Cas蛋白机械mechiery到互补的入侵目标,或是DNA或是RNA,从而抑制病毒后质粒的增值。这篇文章,我们讨论了现在已经了解到的这种神奇的具有遗传性的防御系统,并描述与真核生物中RNAi功能的相似性和区别。大纲:1引言2CRISPR位点和Cas基因3作用方式4与真核生RNAi的类比5结论参考文献1引言通过有移动遗传元件的基因材料的连续性交换,来显著地影响到质量和数量的微生物的进化。病毒存在于地球上大多数丰富的实体中(Bergh等人1989;Wommack和Colwel等人2000),他们通过一系列的活动来进行扩增:病毒吸附到宿主的细胞壁,穿过细胞膜注入病毒基因组(DNA或RNA),病毒基因组的表达,病毒基因组的复制以及病毒蛋白衣的组装,最后是子代病毒的释放(Sturino和Klaenhammer,2004)。质粒是另外一种独立的可移动元件。质粒进入到宿主寄主后,或是游离在细胞质或是作为宿主基因组的整合序列。质粒可以通过结合作用从供体细胞转运到受体,利用专用的转移系统(Llosa等人。2002)。尽管偶然功能的获得是水平基因转运的结果,与可移动元件的重组也可以引起严重破坏(或是结构上的破坏或是宿主基因组的调控区域导致的功能丧失)。另外,噬菌体感染可能最终导致宿主细胞的裂解。为了避免这些有害的影响,复杂机制进行演变从而防御宿主生物体核酸受可遗传性元件的入侵。几种防御系统已经认识了,原核生物中的免疫系统与真核生物有很大不同。一个被动式防御机制可以作用在病毒粒子吸附的水平或是注入它的遗传物质。宿主中病毒受体蛋白的自发突变可以扰乱病毒的附着和遗传物质的注入,但不应先感到宿主的健康,比如说,但大肠杆菌的麦芽糖孔蛋白使用λ-噬菌体(197)。而众所周知的主动防御机制是限制性-修饰(R-M)系统。专一的甲基化转移酶类修饰了宿主DNA中可能破裂的位点,防止被限制酶解链。引入外来的DNA缺乏这些修饰,因此可以被内切酶有目的的消化(回顾,Tock和Dryden,2005)。额外的作用机制呈现了与真核生物细胞凋亡的功能相似性,这个机制是原核生物失败的感染机制(Abi)。这个机制抑制噬菌体的增值,或是通过阻塞噬菌体的复制机构或是通过抑制宿主的翻译。这个结果是宿主和病毒都死亡,它们的牺牲保全剩下的躯体(Chopin等人。2005)。近年来,另外一个防御机制已经被发现,这个机制是基于集群规律性穿插短回文重复序列(CRISPRs)和CRISPR关联的基因(cas基因)。CRISPR/Cas体系可以将来自入侵的可移动元件的核酸片段整合到短的成熟RNAs(crRNAs).这些crRNAs特定地指导Cas的蛋白机构到它们互补的目标:或是来自侵入的病毒或质粒的DNA或是RNA。因此,CRISPR/Cas体系可以提供宿主获得可遗传的抗性(回顾Sorek等人。2008;先人Oost等人。2009;Horvath和Barrangou2010;Karginov和Hannon2010;Marraffini和Sontheimer2010a)。这篇文章,我们叙述了CRISPR/Cas体系作用机制的特征,并讨论了与真核生物RNA干扰的相似处和不同之处。2CRISPR位点和Cas基因CRISPRs在1987年首次发现,当一个来自大肠杆菌K12的染色体片段被测序(Ishino等人。1987)。从那以后,许多CRISPR序列在真核生物中被识别(概述看:)。CRISPRs中48%的细菌组的序列已经被检测出,其中95%的序列为古细菌的基因组。CRISPRs由一簇相同的重复序列组成,这些序列被不全相同的相似长度的间隔序列分开(见后面的讨论)。CRISPR的排列常常是在前面的是多达500个碱基对的富含AT的引导肽序列(Jansen等人。2002)。每个基因组CRISPR位点的数量冲1到20,长度变化从很小到上百的重复间隔对。目前最长记录是绿弯菌属的CRISPR,有374重复序列和间隔区。CRISPR12种主要的类型已经被提议,以重复序列的相似性为依据(Kunin等人。2007)。重复序列的大小变化从24到47bp,因此,间隔区的大小从24到72bp。这个重复序列和间隔区的大小典型地在30bp左右。一些重复序列有编码潜在牢固二级结构的CRISPRRNAs的回文序列,因此,其他序列似乎缺少这种序列(图1B)。每一簇主要和一种Cas的亚型相关,在后面讨论。在2005年,三个不同的研究小组独立地观察到至少一个间隔序列的子集是与噬菌体和质粒DNA序列是相同的(Bolotin等人,2005;Mojica等人,2005;Pourcel等人,2005)。匹配间隔序列的病毒或质粒片段叫做原间隔(Deveau等人,2008)。来源于病毒序列的间隔序列导致了假设,即CRISPR/Cas体系可能涉及到原核生物对外来核酸的抗性(回顾Makarova2006)。CRISPR的组成是超变量,在宿主环境中快速地被染色体外的元件所塑造(Lillestol等人,2006;Andersson和Banfield2008;Tyson和Banfield2008;Banfield和Young2009;Held和Whitaker2009;Lillestol等人,2009)。染色体外的元件通过广泛基因转移轮流响应(Andersson和Banfield,2008)或通过突变(Deveau等人,2008;Heidelberg等人,2009;Semenova等人,2009;Ploeg,2009)来避免CRISP的防御机制,说明宿主和捕食者的正在作斗争。图1:所有在这篇文章中描述的4中亚型的CRISPR/Cas,所有的八种CRISPR/Cas参见Haft等人05年和VanderOost等人09年的文献A:在四种试验研究过的生物中cas基因临近结构示意图,每一种都用框图代表一种亚类型。CRISPR由灰矩形代表的leader,红方块代表的重复子,还有蓝矩形代表的spacer。只显示了一种CRISPR的片段。基因用箭头指出,蓝色箭头指出基因有可能涉及到spacer需求。黄箭头指出基因涉及到CRISPR转录,处理和目标干涉。核酸内切酶剪切前crRNA生成crRNA这个过程用Blod箭头着重标出。Hatchingpattern指出基因的相似性:RAMP基因拥有纵线,聚合酶基因拥有横线,CasC同源物有虚线(diagonallines)其他无关紧要的基因都涂满颜色。构成CasC复合体的基因用下划线标出。B:各种生物中的CRISPRRna重复序列在此给出。酶切点位用三角形标出,经管重复序列不尽相同,所有CRISPRRNA酶切事件产生一个八核苷酸的5'端柄。请注意,在Streptococcusthermophilus中的CRISPRRNA酶切没点还没有被证实。回文结构用下划线标出。就如早先Kunin等人研究过的一样,P.furiosus中的序列并不像能够形成茎环结构的样子。C:预测不同CRISPRRNA的重复序列的二级结构。切割位点用箭头指示。如前面库宁等人所描述的,古菌P.Furiosus的重复是不可能形成一个颈环结构(库宁等人,2007).b这个最佳保守cas基因是呈现在所有亚型的cas1和cas2(Haft等人,2005)。因此,他们是目前适合CRISPR/Cas的标记。假定的核酸酶/整合酶Cas1(Makarova等人,2006)作为一个需要金属离子的核酸酶已经被说明,这个核酸酶可以裂解ssDNA和dsDNA,从dsDNA中裂解约80bp长度的DNA片段。Cas1结构揭示了一个具有两个区域体系的异常的折叠(Wiedenheft等人,2009)。小的Cas2蛋白从富含U区域裂解ssRNAs。解决了来自几个物种的Cas2的晶体结构,揭示了铁氧还蛋白折叠,对于内切核糖核酸酶而言是很不平常的(Beloglazova等人,2008)。认为Cas1参与了间隔区的整合(Makarova等人,2006)。预测当间隔区已经存在于CRISPR阵列时,大肠杆菌中的Cas1和Cas2不参与抗病毒作用机制的防御阶段,这个预测与观察是一致(Brouns等人,2008;Hale等人,2009)。在几个基因组中包括Geobactersulfurreducens的基因组,Cas1与Cas4基因的融合说明Cas4,一个类似RecB的核酸酶超敏感位点(Makarova等人,2006),可能也参与了间隔区的获得(Oost等人,2009)。Cas3是一个特殊的例子,是一个典型的单一的多肽,由2个区域组成:一个DH区域,在双链寡核苷酸中有一个依赖金属离子的核酸酶活性(Aravind和Koonin1998;Han和Krauss,2009)和一个DEAD/H盒解旋酶区域(Makarova等人,2006)。有趣的是,在Cas亚型这些区域是分隔的,并且在Cas亚型中Cas3与Cas2融合(Makarova等人,2006)。Cas5和Cas6,以前解释为核心Cas蛋白,表示一类远离相关Cas蛋白,作为RAMPs涉及到。他们似乎有相似的3D结构,并共享至少羧基末端富含甘氨酸的环(Makarova等人。2002)。两个RAMP蛋白(CasEandCas6)最近发现是一个不依赖金属离子的内切酶,这个内切酶参与到CRISPRRNA(pre-crRNA)的加工,后面有描述(Brouns等人,2008;Carte等人,2008)。另外,最近发现了由多个亚基组成的Cas复合物的两种类型。在大肠杆菌中,一个复合体是由5个基因簇cse1–4andcas5e(Cas5eandCse3是RAMPs)编码的,并且这个产物形成了一个Cse复合体称为Cascade(CRISPR-associatedcomplexforantiviraldefense,CRISPR关联的抗病毒复合物)(Brouns等人,2008)。一个crRNA-结合Cmr-复合体包含Cmr-6已从火球菌属中分离出来(Hale等人,2009)。对实验性地确定和假设的内容以及核心Cas蛋白和Cas复合体的描述见表1.3作用方式这CRISPR/Cas机制可以分为三个不同的阶段。第一阶段涉及整合入侵移动遗传元件的核酸片段作为一个新间隔区进入CRISPR位点。第二阶段,这CRISPR作为一个前导体(前导-crRNA)转录,随后被一个直接的内切核糖核酸酶清除,导致成熟的crRNA仍然和一个Cas蛋白复合体相联系。在第三和最后一个阶段,crRNA指导Cas复合体了解和侵入核酸去中和侵入者,主要是通过分裂。3.1新间隔区的整合第一个实验证据表明,从噬菌体侵染乳酸菌嗜热链球菌实验中可以得出这CRISPR/Cas系统确实是一个抗病毒防御系统,它有一个Csn-亚型的CRISPR/CAS位点(图1A)。筛选那些在幸存的细菌中适应CRISPR位点细菌表明一个族群的幸存者获得了一个新的噬菌体专一性的间隔区片段(图2)。随后删除这些新的间隔序列造成获得性抗性的损失,表明间隔存在和噬菌体抗性的相关性。比较分析间隔区目标区域的病毒基因组表明一个序列基元叫做CRISPR基元或原-间隔区下游的原-间隔区邻近的基元(PAM)。噬菌体不仅通过原-间隔区的突变响应寄主的抗病性,而且通过在基元的突变,说明噬菌体和细菌间持续的斗争。间隔区没有一个完美的PAM,间隔区也不是完整的,但是这些经常伴随着有一个完美的PAM的间隔区,后者对于抗病性可能是必须的。数据表明PA