基因编辑技术产生背景定义及原理分类及比较CRISPR的优点及在植物育种上的应用CRISPR基因编辑技术的一般操作程序docin/sundae_meng全基因组测序技术的不断发展和完善大型基因组注释项目的实现基因革命(基础科学与个性化医疗之间进行转化)将大量数据转化为功能和临床相关知识解决这个问题最核心的是需要有高效、可靠的方法使研究者能够知道基因型如何影响表型利用同源重组机制对基因进行定向失活是为基因功能评估提供信息的有力手段。但是这一技术的应用有几个限制因素,包括遗传工程组件插入目标位点的效率低、筛选过程费时费力、有可能产生不利的突变效应等。RNAi基因靶向敲除技术给研究者提供了快捷、廉价而且可以开展高通量研究的新方法,但是,RNAi的基因敲除效果还不够彻底,每次试验以及每个实验室的试验结果都会有差异,另外还存在不可预知的脱靶情况,所以只能够用于需要暂时抑制基因功能的试验当中。基因编辑技术(近十年出现):可以帮助科研人员对各种细胞和各种生物体内的几乎任意基因进行人工操作《ZFN,TALEN,andCRISPR/Cas-basedmethodsforgenomeengineering》一、基因编辑技术的产生背景docin/sundae_meng2019年3月12日,宾夕法尼亚大学PabloTebas教授团队在新英格兰医学杂志撰文称,他们利用SangamoBioSciences开发的ZFNs基因编辑技术,显著提高了艾滋病患者对艾滋病毒的抵抗能力。1、在不同人种之间,自由“切换”基因编辑技术首次应用于临床。目前SangamoBioSciences基于ZFNs技术治疗艾滋病的方法已经进入临床II期试验。免疫细胞表面的CCR5蛋白是HIV进入免疫细胞的“入口”。而少数北欧人由于CCR5基因“变异”(来源于原始高加索人),具备天然的HIV抵抗力。“要不把患者的CCR5基因都改成高加索人种那种类型吧”!docin/sundae_meng2、“关闭”一个基因,打开生命之门2019年11月5日,WaseemQasim对外宣布,他们利用Cellectis公司经TALENs基因编辑技术改造的UCART19细胞株,成功缓解了Layla的不治之症--急性淋巴细胞性白血病(ALL),造就了世界首例婴儿白血病治疗奇迹,是基因编辑技术有史以来第二次被运用在人体上技术。修改捐赠细胞使其抗癌:蕾拉的生命获救得益于基因工程修改过的血液细胞。捐赠的血液细胞来自美国,科学家总共对其进行了三次修改。科学家们首先在捐赠的血液细胞中添加抗白血病基因,这些基因可编码靶向并杀死癌细胞的蛋白质,其次科学家使用TALENs技术关闭两个基因,关闭第一个基因是为了确保捐赠的细胞不被蕾拉的身体排斥,关闭第二个基因是为了确保捐赠细胞不被治疗药物杀死。opinion.haiwainet/n/2019/1113/c345416-29353992.htmljiemian/article/435551.htmldocin/sundae_meng3、“恢复”受损基因,才能重见光明2019年11月3日,KatrineBosley在剑桥大学召开的EmTech大会上宣布,实验室数据表明,CRISPR基因编辑技术可以用于治疗Lebercongenitalamaurosis(LCA;利伯先天性黑朦病,一种遗传性视力衰退疾病),Editas将在2019年开展CRISPR基因编辑人体实验。Editas宣布的2019年人体实验激动人心之处在于,这有可能是首次体内(invivo)基因编辑试验。这项研究成功的意义在于,将CRISPR基因编辑“工具”装载到病毒体内,再把病毒注射到患处,CRISPR可以自行对患病部位进行基因改造。那么以后治疗Layla那样的白血病,不用分离T细胞了,直接将改造好的病毒注射到骨髓,就直接将基因异常的骨髓修复了,或者是直接整合目标基因加强其战斗力。这样一来,很多大手术就会变成微创手术,带来的好处是难以估量的。Editas的CEOKatrineBosleydocin/sundae_meng二、什么是基因组编辑技术•所谓基因编辑技术,是指对DNA核苷酸序列进行删除和插入等操作,换句话说,基因编辑技术使得人们可以依靠自己的意愿改写DNA这本由脱氧核苷酸书写而成的生命之书。docin/sundae_meng基因编辑技术的原理•构建一个人工内切酶,在预定的基因组位置切断DNA,切断的DNA在被细胞内的DNA修复系统修复过程中会产生突变,从而达到定点改造基因组的目的。•DNA修复系统主要通过两种途径修复DNA双链断裂(double-strandbreak,DSB),即非同源末端连接(Nonhomologousendjoining,NHEJ)和同源重组(homologousrecombination,HR)。通过这两种修复途径,基因组编辑技术可以实现三种基因组改造的目的,即基因敲除,特异突变的引入和定点转基因docin/sundae_meng1)基因敲除:如果想使某个基因的功能丧失,可以在这个基因上产生DSB,NHEJ修复的过程中往往会产生DNA的插入或删除(indel),造成移码突变,从而实现基因敲除。2)特异突变引入:如果想把某个特异的突变引入到基因组上,需要通过同源重组来实现,这时候要提供一个含有特异突变同源模版。正常情况下同源重组效率非常低,而在这个位点产生DSB会极大的提高重组效率,从而实现特异突变的引入。3)定点转基因:与特异突变引入的原理一样,在同源模版中间加入一个转基因,这个转基因在DSB修复过程中会被拷贝到基因组中,从而实现定点转基因。docin/sundae_meng三、基因编辑技术的分类•第一代人工核酸内切酶:锌指核酸内切酶(zincfingerendonuclease,ZFN),锌指是一类能够结合DNA的蛋白质,人类细胞的转录因子中大约有一半含有锌指结构,ZFN是将锌指蛋白与核酸内切酶FokI融合形成的核酸内切酶,利用它可以在各种复杂基因组的特定位置制造DNA的双链切口。•第二代人工核酸内切酶:类转录激活因子效应物核酸酶(transcriptionactivator-likeeffectornuclease,TALEN)的出现在很大程度上替代了ZFN。TALEN可以和ZFN一样对复杂的基因组进行精细的修饰,同时其构建较为简单,特异性更高,因此受到了科研工作者的青睐。2019年,TALEN被《科学》杂志评为十大科学突破之一。•第三代人工核酸内切酶:规律间隔成簇短回文重复序列-Cas蛋白(clusteredregularlyinterspacedshortpalindromicrepeats(CRISPR)/CRISPR-associated(Cas)9),主要是基于细菌的一种获得性免疫系统改造而成,其特点是制作简单、成本低、作用高效。docin/sundae_meng图B:锌指核酸酶二聚体与DNA结合示意图。锌指核酸酶的靶序列含有两个锌指蛋白结合位点,不过这两个位点之间还有一段5~7bp的间隔序列,锌指核酸酶里的FokI酶切结构域就能够切割这段间隔序列。当然,我们也可以设计出只能够识别左侧或者右侧结合位点的锌指蛋白。ZFN:Cys2–His2锌指蛋白图A:一个锌指大约由30个氨基酸组成,形成了一种保守的ββɑ结构。在锌指ɑ螺旋结构表面的那几个氨基酸能够与DNA大沟上的3个碱基结合,不过这种结合的选择性会有所差异。因为有了高度保守的链接序列,我们就可以设计出能够识别9~18个碱基长度的DNA序列。在一段680亿个碱基组成的DNA序列里,18个碱基组成的序列就足以成为一段特异性的序列,所以如果能够设计出含有3种以上的锌指蛋白DNA识别结构域的蛋白,那么就意味着科学家们能够利用锌指蛋白识别出人类基因组里的任意一段DNA序列。docin/sundae_mengTALE蛋白中的DNA结合结构域是由一连串33~35个氨基酸组成的重复结构域组成的,其中每一个结构域都能够识别一对碱基。TALE核酸酶的DNA结合特异性主要由两个高度可变的氨基酸决定,科学家们将这两个关键的氨基酸称作重复可变双氨基酸残基位点(repeat-variabledi-residues,RVD)。与锌指结构域一样,这种TALE重复模块也能够串联起来,识别一长串的DNA序列。TALEN分子比ZFN大得多,因此很难高效导入,科学家们也想出了不少的办法,如金门分子克隆技术(‘GoldenGate’molecularcloning)。TALENdocin/sundae_mengCRISPR/Cas系统CRISPR/Cas系统的作用特性与限制性核酸内切酶相似,它对序列的特异性切割主要依赖于crRNA与Cas蛋白形成的核糖核蛋白复合物识别靶序列上的PAM以及protospacer.根据CRISPR/Cas系统这一特性,将其用于设计人工的核酸内切酶(engineeredendonuclease,EEN),用来对我们感兴趣的基因位点进行修饰.三类CRISPR/Cas系统中TypeⅡ型系统的核糖核蛋白复合物相对简单,除crRNA和tracrRNA外,只有Cas9一个蛋白.目前,产脓链球菌(StreptococcuspyogenesSF370)的TypeⅡ型系统是被改造的最为成功的人工核酸内切酶。docin/sundae_meng其基因座结构可分为三部分:5‘端为tracrRNA基因,中间为一系列Cas蛋白编码基因,包括Cas9、Cas1、Cas2和Csn2,3’端为CRISPR基因座,由启动子区域和众多的间隔序列(spacers)和重复序列(directrepeats)顺序排列组成。CRISPR/Cas的基因座结构docin/sundae_mengCRISPR/Cas的作用机理(分为三个阶段来理解):PhaseⅠPhaseⅡPhaseⅢdocin/sundae_meng噬菌体或是质粒上与间隔序列对应的序列被称为protospacer,通常protospacer的5‘或是3’端延伸几个碱基序列很保守,被称为PAM(protospaceradjacentmotifs),它的长度一般为2~5碱基,一般与protospacer相隔1~4碱基.新间隔序列的获得可能分为三步:首先识别入侵的核酸和扫描外源DNA潜在的PAM,将临近PAM的序列作为候选protospacer;然后在CRISPR基因座的5‘端合成重复序列;最后新的间隔序列整合到两个重复序列之间(图2)。目前只有第一个步骤被证实。第一,CRISPR的高度可变间隔区的获得docin/sundae_meng•第二,CRIPSR基因座的表达(包括转录和转录后的成熟加工):多个研究表明CRISPR基因座首先被转录成前体CRISPRRNA(pre-crRNA),然后在Cas蛋白或是核酸内切酶的作用下被剪切成一些小的RNA单元,这些小RNA即为成熟crRNA,由一个间隔序列和部分重复序列组成,TypeⅡ型CRISPR/Cas系统crRNA的成熟除了需要Cas9和RNaseⅢ参与以外,还需要tracrRNA的指导;docin/sundae_meng第三,是CRISPR/Cas系统活性的发挥或者是对外源遗传物质的干扰:成熟的crRNA与特异的Cas蛋白形成核糖核蛋白复合物,再与外源DNA结合并扫描到外源DNA,寻找其上的靶序列,crRNA的间隔序列与靶序列互补配对,外源DNA在配对的特定位置被核糖核蛋白复合物切割.早期研究认为crRNA的间隔序列(spacer)与外源DNA的靶位点完全互补配对对于切割是必需的,但是后来的研究证明spacer与protospacer部分互补配对时切割也可以发生。docin/sundae_meng2019年ThomasGaj,CharlesA.Gersbach,CarlosF.Barbas.ZFN,TALEN,andCRISPR/Cas-basedmethodsforgenomeengineering.TrendsinBiotechnology,09May2019;D