基因组编辑应用基因编辑技术不长角的奶牛基因编辑的定义:通过精确识别靶细胞DNA片段中靶点的核苷酸序列,利用核酸内切酶对DNA靶点序列进行切割,从而完成对靶细胞DNA目的基因片段的精确编辑。基因编辑的优势与传统的以同源重组和胚胎干细胞(embryonicstemcell,ES)技术为基础的基因打靶技术相比,基因编辑新技术保留了可定点修饰的特点,可应用到更多的物种上,效率更高,构建时间更短,成本更低。基因编辑原理现代基因组编辑技术的基本原理是相同的,即借助特异性DNA双链断裂(DNAdouble-strandbreaksDSBs)激活细胞天然的修复机制,包括非同源末端连接(NHEJ)和同源重组修复(HDR)两条途径。第一代:ZFN(锌指核酸酶)第二代:TALEN(转录激活样效应因子核酸酶)第三代:CRISPR/Cas9(成簇的规律性间隔的短回文重复序列)第四代:NgAgo-gDNA韩春雨基因编辑发展史ZFN基因组编辑技术ZFN技术是第一代基因组编辑技术,其功能的实现是基于具有独特的DNA序列识别的锌指蛋白发展起来的。1986年Diakun等首先在真核生物转录因子家族的DNA结合区域发现了Cys2-His2锌指模块。1996年,Kim等首次人工连接了锌指蛋白与核酸内切酶。2005年,Urnov等发现一对由4个锌指连接而成的ZFN可识别24bp的特异性序列,由此揭开了ZFN在基因组编辑中的应用。ZFN=DNA识别域+核酸内切酶DNA识别域:由一系列Cys2-His2锌指蛋白(zinc-fingers)串联组成(一般3~4个),每个锌指蛋白识别并结合一个特异的三联体碱基。核酸内切酶:非特异性核酸内切酶FokI,形成二聚体时切割双链DNA。ZFN原理和机制ZFN由锌指蛋白(ZFP)和FokⅠ核酸内切酶组成。其中,由ZFP构成的DNA识别域能识别特异位点并与之结合,而由FokⅠ构成的切割域能执行剪切功能,两者结合可使靶位点的双链DNA断裂(DSB)。于是,细胞可以通过同源重组(HR)修复机制和非同源末端连接(NHEJ)修复机制来修复DNA。HR修复有可能会对靶标位点进行恢复修饰或者插入修饰,而NHEJ修复极易发生插入突变或缺失突变。两者都可造成移码突变,因此达到基因敲除的目的。ZFN诱导的基因组编辑技术可应用于很多物种及基因位点,具有较好的发展潜力。缺点:(1)以现有的策略设计高亲和性的ZFN,需要投入大量的工作和时间;(2)在细胞中持续表达ZFN对细胞有毒性;(3)虽然三联体设计具有一定特异性,但仍然存在不同程度的脱靶效应。TALEN基因组编辑技术2009年,研究者在植物病原体黄单胞菌(Xanthomonas)中发现一种转录激活样效应因子(TAL蛋白),它的核酸结合域的氨基酸序列与其靶位点的核酸序列有恒定的对应关系,一个模块单元识别一个碱基,简单且特异性极好。随后,TALE特异识别DNA序列的特性被用来取代ZFN技术中的锌指蛋白。它可设计性更强,不受上下游序列影响,具备比ZFN更广阔的应用潜力。TALENs包含两个TALEN蛋白,每个TALEN都是由TALEarray与FokⅠ融合而成.其中一个TALEN靶向正义链上靶标位点,另一个则靶向反义链上的靶标位点.然后FokⅠ形成二聚体,在靶向序列中间的spacer处切割DNA,造成双链DNA断裂,随后细胞启动DNA损伤修复机制.针对不同的TALEN骨架,其最适宜的spacer长度不同,其长度范围一般为12~20bp.实验结果表明,TALENs在靶向DNA时,第一个碱基为T时其结合效果更佳。通过组合各类模块,可对任意核苷酸序列进行靶向特异性敲除或内源基因的表达调控。目前已在人、大鼠、小鼠、猪、羊、斑马鱼、拟南芥及酵母等多类物种中得到成功应用。CRISPR/Cas9基因组编辑技术CRISPR/Cas9系统的发现可以追溯到1987年,日本学者首次在大肠杆菌(E.coli)基因组中发现一连串短的空间间隔重复序列。随后,在其他细菌和古细菌中也发现了这一特殊的序列。2002年科学家才将其命名为成簇的规律间隔短回文重复序列(Clusteredregularlyinterspacedshortpalindromicrepeats,CRISPR),现有测序结果显示40%的细菌基因组中含有CRISPR位点。2005年,科学家们发现CRISPR中的许多间隔序列来源于质粒和病毒,CRISPR的基因座能够被转录,并且Cas基因编码的蛋白具有核酸酶和解旋酶结构域,因此推测CRISPR/Cas是利用无义的RNAs标记外源核酸序列的防御系统。2011年,才揭示了CRISPR/Cas系统的分子机制:当病毒首次入侵时,细菌会将外源基因的一段序列整合到自身的CRISPR的间隔区;病毒二次入侵时,CRISPR转录生成crRNA前体(pre-crRNA),pre-crRNA经过加工形成含有与外源基因匹配序列的crRNA,该crRNA与病毒基因组的同源序列识别后,介导Cas蛋白结合并切割,从而保护自身免受入侵。2013年,研究者报道了CRISPR/Cas9系统可高效地编辑基因组。其中分别在人类细胞和小鼠细胞中成功对部分基因实现了编辑。CRISPR/Cas系统概述CRISPR/Cas系统广泛存在于细菌和古菌中,是它们的一种适应性免疫系统,能够识别自身和外源入侵DNA片段。CRISPR/Cas系统有3种类型:Ⅰ型、Ⅱ型和Ⅲ型。Ⅰ型和Ⅲ型CRISPR/Cas系统较为复杂,需要多个Cas蛋白形成复合体切割DNA双链,而Ⅱ型CRISPR/Cas系统只需要一个Cas9蛋白核酸酶来切割DNA双链,即为现在广泛应用于遗传学基因编辑的CRISPR/Cas9系统。TypeⅡ系统中只有一种核酸酶—Cas9核酸酶,在该系统中Cas9蛋白与crRNA参与对抗外源噬菌体和质粒的入侵。目前,TypeⅡ系统在基因组编辑中应用的最为广泛。CRISPR-Cas主要由两部分组成:CRISPR/Cas的结构CRISPR是一个特殊的DNA重复序列家族,广泛分布于细菌和古细菌基因组中。CRISPR位点通常由短的高度保守的重复序列(repeats)组成,重复序列的长度通常21~48bp,重复序列之间被26~72bp间隔序列(spacer)隔开。CRISPR就是通过这些间隔序列(space)与靶基因进行识别。识别切割Cas(CRISPRassociated):存在于CRISPR位点附近,是一种双链DNA核酸酶,能在guideRNA引导下对靶位点进行切割。它与folk酶功能类似,但是它并不需要形成二聚体才能发挥作用。CRISPR/Cas9系统由间隔重复CRISPR基因座转录出来的pre-crRNA、多功能的Cas9核酸酶和tracrRNA组成,其中tracrRNA促进pre-crRNA的成熟,以及形成具有切割活性的crRNA-tracrRNA-Cas9三元复合体。病毒或质粒入侵细菌后,其基因组DNA暴露于细菌胞浆之中,经过同源重组,CRISPR重复序列转录、翻译出的Cas复合物对外来DNA进行剪切,产生新的spacer序列。如果产生的新spacer序列能够与CRISPRarray内部的短重复序列部分互补,将会通过某种未知的方式整合到细菌基因组的CRISPRarray序列中,从而对该病毒或质粒产生特异性免疫记忆。CRISPR/Cas9系统的工作原理和机制CRISPR/Cas9系统的工作原理和机制当同类的病毒或者质粒再次入侵该细菌时首先,tracrRNA与pre-crRNA的重复序列结合;第二,内源RNaseⅢ切割pre-crRNA/tracrRNAs复合体,切除5′末端的间隔序列,形成成熟的crRNA,并与tracrRNA形成被称为向导RNA(SingleguideRNA,sgRNA)的嵌合RNA分子;第三,每一个成熟的sgRNA能够引导Cas9蛋白定位到双链DNA的靶位点上并在原型间隔毗邻序列(Proto-spaceradjacentmotif,PAM)的上游3~8bp位置对结合的序列进行切割(图2A)。Cas9的特异性靶点依赖于原型间隔序列3′端PAM序列,不同的Cas9突变体在基因组中拥有不同的PAM序列,来源于酿脓链球菌(Streptococcuspyogenes)的Cas9识别一个5′-NGG-3′的PAM,而来源于嗜热链球菌(Streptococcusthermophilus)和脑膜炎奈瑟氏菌(Neisseriameningi-tidis)的Cas9分别识别5′-NNAGAAW-3′的PAM和5′-NNNNGATT-3′的PAM。Cas9拥有两个核酸酶结构域分别是蛋白中间的HNH结构域和蛋白氨基酸末端附近的RuvC-like结构域,其中HNH切割与crRNA互补的链,切割位点位于PAM序列上游3bp,RuvC-like切割非互补链,切割位点位于PAM序列上游3~8bp,从而造成双链的断裂。Cas9的特异性靶点和两个核酸酶结构域CRISPR/Cas9产生的DSB能够激活细胞和生物体自身修复机制,产生两种不同的修复途径NHEJ和HDR修复。NHEJ能够高效地引入不同长度的插入或者缺失突变,导致转录阅读框编码序列,转录激活相关的启动子和增强子的损坏;而HDR的修复通常会引入特定位点的突变或者在外源供体DNA模板存在时对靶位点进行可预测的插入。1.PAM序列区是CRISPR/Cas9系统行使切割功能的基本条件。如果靶序列3′端没有PAM序列,即使靶序列与sgRNA序列完全匹配,Cas9蛋白也不会切割该序列位点.2.sgRNA与目标基因组相结合的20nt序列区决定着CRISPR/Cas系统的靶向特异性。CRISPR/Cas9系统的关键点3.sgRNA的长度也与特异性密切相关。sgRNA的5′端额外增加两个鸟嘌呤核苷酸后能够显著提高CRISPR/Cas9系统的特异性。CRISPR/Cas9基因编辑系统的特异性决定于sgRNA上的识别(~20nt)。然而,在复杂的生物基因组中,sgRNA的识别序列可能会与非靶点DNA发生局部匹配(Partialmatch)。这种局部匹配,目前可归结为两类:(1)sgRNA与脱靶位点DNA序列长度相同,但存在碱基错配。(2)脱靶位点DNA序列长度比sgRNA多或少几个碱基,通过形成DNA凸起(DNAbulge)或RNA凸起(RNAbulge)来完成其他碱基的正确配对。CRISPR/Cas9系统的脱靶效应CRISPR/Cas9系统在基因组DNA片段编辑中的应用1.DNA片段靶向删除2.DNA片段靶向反转3.DNA片段靶向重复4.DNA片段靶向插入5.染色体靶向易位类别ZFNTALENCRISPR/Cas9NgAgo-gDNA构成ZFArray∷Fok1TALENArray∷Fok1Cas9∷sgRNANgAgo-gDNA靶向元件ZFArray蛋白TALENArray蛋白sgRNA核糖核苷酸gDNA脱氧核糖核苷酸切割元件FokΙ蛋白FokΙ蛋白Cas9蛋白Ago蛋白优势单位点编辑单位点编辑多位点编辑多位点编辑靶向序列18bp30bp23bp20bp切割类型双链断裂,单列缺刻双链断裂,单列缺刻双链断裂,单列缺刻双链断裂,单列缺刻技术难度困难较容易非常容易非常容易商业价格~60000每位点~10000每位点~1000每位点?脱靶效应较轻较轻较严重较轻?编辑技术对比NgAgo-gDNA编辑NgAgo-gDNA是格式嗜盐杆菌(Natronobactricumgrogoryi)ACO蛋白(Argonauto)的简称,其本质是一种核酸内切酶,NgAgo根据指导DNA的定位,可以有效地对基因组目标区域进行编辑。NgAgo-gDNA概述NgAgo是格氏嗜盐碱杆菌(Natronobacteriumgregoryi)AGO蛋白(Argonaute)的简称,其本质是一种核酸内切酶。NgAgo酶根据指导DNA的定位,可以有效地对基因组目标区域进行编辑。NgAgo-gDNA与Crispr-Cas9特点比较NgAgo-gDNACrispr-CAS95'-P-