主要内容•基因修饰简介一•分类及原理二•应用前景三一、基因修饰随着分子生物学技术的发展,越来越多的物种全基因组的测序宣告完成。随之而来的问题是,如何从海量的基因组数据中获得相关基因的功能及应用信息。基因组编辑(Genomeediting)的发展为解决这个问题提供个一种行之有效的方法,成为了解特定基因功能的基础,在2012年被Science评为十大重要科学进展之一。基因修饰原理基因修饰技术的发展为基因功能的研究提供了新的方法,使研究者能够对特定的DNA序列进行人为定向的改变,从而探究其功能,它重新定义了传统生物学研究的界限和范畴。基因修饰的原理:利用核酸酶对DNA双链分子进行切割,形成DNA双链断裂切口(DNAdouble-strandbreak,DSB),然后激活细胞内的非同源末端连接修复机制(nonhomologousendjoining,NHEJ),或者同源重组修复机制(homology-directedrepair,HDR),利用细胞自身的修复机制对DNA进行遗传学修饰。锌指核酸酶(Zinc-fingernucleases,ZFN)转录激活因子效应物核酸酶(Transcriptionactivator-likeeffectornucleases,TALEN)基于成簇的规律间隔的短回文重复序列和Cas蛋白的核酸酶CRISPR/Cas(Clusteredregulatoryinterspacedshortpalindromicrepeat(CRISPR)/Cas-basedRNA-guidedDNAendonucleases)基因修饰技术ZFN、TALEN、CRISPR/Cas=DNA识别域+核酸内切酶二、分类及原理ZFN锌指核糖核酸酶(ZFN)由一个DNA识别域和一个非特异性核酸内切酶构成。DNA识别域是由一系列Cys2-His2锌指蛋白(zinc-fingers)串联组成(一般3~4个),每个锌指单元包括大约30个氨基酸,它们可以借助一个锌离子形成ββα构象。其中的α螺旋可深入到DNA双螺旋的大沟来识别3~4个连续的核苷酸碱基。这样几个锌指串联起来就可以识别更多的核苷酸序列。双链DNA的切割需要FokI内切酶来完成,FokI是来自海床黄杆菌的一种限制性内切酶,只在二聚体状态时才有酶切活性,每个FokI单体与一个锌指蛋白组相连构成一个ZFN,识别特定的位点,当两个识别位点相距恰当的距离时(6~8bp),两个单体ZFN相互作用产生酶切功能,从而达到DNA定点剪切的目的。因此,ZFNs通常是成对使用,每个ZFN分别结合切割位点两侧各一条链上的核苷酸,每个锌指蛋白识别并结合一个特异的三联体碱基。螺旋间连接序列多变区-识别不同的三联体碱基人工设计α螺旋序列图1ZFN三维结构图2ZFN作用机理TALENTALE蛋白是由黄单胞菌进入植物细胞分泌的,能识别并结合特异的DNA序列。天然TALE蛋白DNA结合结构域的核心部分一般由1.5~33.5个基本重复单元(Repeatunit)串联而成,其中每个单元包含34个左右的氨基酸残基。每个重复单元中第12位和13位的氨基酸残基称为重复可变双残基(Repeatvariabledi-residue,RVD),它决定了该单元识别DNA碱基的特异性。常用的RVD包括NI(AsnIle)、HD(HisAsp)、NG(AsnGly)和NN(AsnAsn),分别对应识别碱基A、C、T和G。图3TALE结构序列按照DNA序列将相应TAL单元串联克隆即可获得识别某一特定核酸序列的TALE。将识别特异DNA序列的TALE与内切核酸酶FokI偶联,可构建成剪切特异DNA序列的内切酶TALENs。在实际操作中,需在目标基因的编码区或外显子和内显子的交界处选择两处相邻(间隔13-22bp)的靶序列(一般16-20bp)分别进行TALE识别模块构建。将这两个相邻靶点识别模块(分别)融合克隆到FokI的N-末端,形成真核表达载体,得到TALEN质粒对。将TALEN质粒对共转入细胞,表达融合蛋白,分别与靶位点特异结合。由于两个TALEN融合蛋白中的FokI临近,可以形成二聚体,发挥非特异性内切酶活性,在两个靶位点之间剪切DNA形成DSB,诱发DNA损伤修复机制NHEJ修复DNA,删除或插入了一定数目的碱基,造成移码,形成目标基因敲除突变体。图4TALENs作用原理ZFN与TALEN:–优于TALEN•经验积累多,技术较成熟–逊于TALEN•技术复杂,难度高,被Sigma公司垄断•靶点序列特异性要求比较高缺点:ZFNs和TALENs这两项技术在实施操作过程中技术难度较大、构建组装时间较长。脱靶现象严重,易在细胞中积累造成显著细胞毒性。CRISPR/CasCRISP系统是一种广泛存在于细菌与古细菌中的,由RNA介导的、可遗传的获得性免疫系统。这种免疫系统为宿主细胞提供了对外源DNA(如噬菌体、质粒)的免疫功能。一个典型的CRISPR/Cas基因座由一个编码Cas蛋白的操纵子以及一个重复间隔(repeatspacer)序列组成。重复间隔序列由多个相同的重复序列及穿插其间的间隔序列组成,间隔序列可以特异性地识别外源核酸。根据Cas基因核心元件序列的不同,CRISPR/Cas免疫系统被分为3种类型:Ⅰ型、Ⅱ型和Ⅲ型。Ⅰ型和Ⅲ型CRISPR/Cas免疫系统需要多个Cas蛋白形成复合体切割DNA双链,而Ⅱ型CRISPR/Cas免疫系统只需要一个Cas9蛋白来切割DNA双链,目前Ⅱ型系统CRISPR/Cas9是被改造的最为成功的人工核酸酶。Cas9是由1409个氨基酸组成的多结构域蛋白,含有2个核酸酶结构域:氨基端的RuvC-like结构域及位于蛋白中间位置的HNH核酸酶结构域,分别与目标序列结合切割。1CRISPR-Cas概述Cas:存在于CRISPR位点附近,是一种双链DNA核酸酶,能在guideRNA引导下对靶位点进行切割。它与folk酶功能类似,但是它并不需要形成二聚体才能发挥作用。CRISPR:CRISPR位点通常由短的高度保守的重复序列(repeats)组成,重复序列的长度通常21~48bp,重复序列之间被26~72bp间隔序列(spacer)隔开。CRISPR就是通过这些间隔序列(space)与靶基因进行识别。CRISPR-Cas主要由两部分组成:识别切割图5CRISPR-Cas基本结构2CRISPR/Cas作用过程第一步:pre-crRNA的转录与加工CRISPR转录产生pre-crRNA,之后tracrRNA(trans-activatingcrRNA)与pre-crRNA结合形成tracrRNA-pre-crRNA双链复合物。该复合物在Cas9的存在下,被双链RNA特异的核糖核酸内切酶RNaseIII进行切割产生成熟的crRNA。第二步:CRISPR系统对入侵核酸的切割成熟的crRNA与tracrRNA及Cas9结合形成一个三元的沉默复合物。而后crRNA-tracrRNA-Cas9三元聚合体在crRNA的引导下与识别目的片段上的PAM(protospaceradjacentmotifs),同时特异性的与双链DNA中目的序列进行结合,由Cas9蛋白在原型间隔序列处进行切割。图6CRISPR/Cas作用模式CRISPR/CasgenecrRNA-tracrRNA-Cas9复合物RuvCHNHPAM(protospacer-adjacentmotif)为NGG识别复合物形成目标序列剪切NHEJHNH核酸酶结构域切割与crRNA互补配对的模板链,切割位点位于PAM上游3nt处,RuvC-like结构域对另一条链进行切割,切割位点位于PAM上游3~8nt处。三、CRISPR/Cas应用前景目前可以有人工合成CRISPR相关基因,从而实现有目的对基因进行修饰改造。CRISPR/Cas9系统由一个可诱导的Cas9蛋白和一个人工设计的sgRNA发夹复合体组成。后者由三个结构域组成,分别是一个长20nt的与DNA特异性结合的互补区域、一个长42nt的与Cas9蛋白结合的发夹结构域和一个长40nt源于脓链球菌的转录终止子。图7sgRNA结构图从实际应用的角度来讲,CRISPRs比ZFN、TALENs更容易操作,因为每一对TALENs都需要重新合成,而用于CRISPR的gRNA只需要替换20个核苷酸就行。①只需合成一个sgRNA就能实现对基因的特异性修饰,Cas蛋白不具特异性。②编码sgRNA的序列不超过100bp,因此比构建TALENs和ZFNs更简单方便。③较短的sgRNA序列也避免了超长、高度重复的TALENs编码载体带来的并发症。综合比较,CRISPRs比传统方法具有更高的突变率,可以对多个基因进行多点突变,同时使遗传学研究不再局限于模式生物中,因此可以预见在将来会有很大的应用价值谢谢!欢迎批评指正!