基因组编辑技术的研究进展院所:药物所姓名:周国霖学号:B2015008032摘要:基因组编辑技术是对基因组进行精确定点改造的一项新技术,同时也是研究基因生物功能的一个有力工具。该技术与传统的以同源重组为基础的基因打靶技术相比,即可以实现对基因定点敲除和外源基因定点整合,同时又具有构建时间短、花费成本低、应用范围广等优点。经过数年的发展,目前主要有锌指核酸酶、转录激活子样效应因子核酸酶和规律性重复短回文序列簇与Cas9蛋白三种新型的基因组编辑技术。本文主要综述了这三种技术的结构原理、构建方法以及最新的应用进展。关键词:基因组编辑;锌指核酸酶;转录激活子样效应因子核酸酶;规律性重复短回文序列簇1.背景简介随着生物技术的发展,传统的基因打靶技术以远不能满足科学家们对工作效率的追求。人工核酸内切酶(engineeredendonuclease,EEN)技术的兴起,为基因编辑提供了可行性。现在应用最为广泛的基因编辑技术主要是指锌指核酸酶(zincfingernuclease,ZFN)、类转录激活因子效应物核酸酶(transcriptionactivator1ikeeffectornuclease,TALEN)和规律性间隔的短回文序列重复簇(ClusteredRegularlyInterspacedShortPalindromicRepeats/CRISPR-AssociatedProteins,CRISPR)技术[1]。其中的CRISPR/Cas9技术获得了2015年的科学技术突破奖。这三种技术的共同工作原理都是根据特异性的人工设计在基因组的特定位置造成DNA双键断(DoubleStrandBreaking,DSB),细胞会通过DNA同源重组或者非同源末端连接机制修复双链断裂。在同源序列(外源引入或同源染色体)存在的情况下,外源DNA片段可借此插入断裂序列中,对原来的基因进行敲除或将外源基因插入基因组中而形成所谓的基因敲入,在没有同源序列的情况下,细胞趋向于利用非同源的末端连接进行DNA的修复,由于没有模板可以利用,这种连接容易导致碱基的缺失、增加或改变从而引起突变[2]。下面我们分别详细的介绍以下这三种技术的原理及构建方法。2.锌指核酸酶(ZincFingerNuclease,ZFN)人工核酸酶ZFN是第一代基因编辑技术。其核心设计思想是将2个有特定功能的结构域,即特异性识别模块和功能模块融合,形成具有特定功能的蛋白。ZFN由锌指蛋白(zincfingerprotein,ZFP)和FokI核酸内切酶组成[3]。其中,由锌指蛋白ZFP作为特异性识别模块。锌指(zincfinger,ZF)是一种广泛存在于真核生物中的蛋白基序(motif),锌指蛋白基元的种类及排列方式决定了其DNA序列识别的特异性。ZFP结构域由一系列Cys2/His2锌指蛋白串联组成,每个ZFP大约含30个氨基酸残基,在空间结构上,锌指结构从N端到C端由两个反向的β平行结构和一个α螺旋组成。α螺旋的1、3、6位氨基酸残基分别特异性的结合其识别DNA分子中三个连续的碱基,其α螺旋的1、3、6位上氨基酸残基是不同的,因此将不同的ZFP与不同的DNA序列的结合[4]。FokI核酸内切酶是II型的核酸内切酶的一种,其识别序列和切割序列相距9个核苷酸,并且切割和识别功能分别由酶蛋白的不同结构域完成。锌指核酸酶利用了FokI核酸内切酶的这一特点,在保留它的非特异性酶切割功能结构域的基础上,将其DNA识别结构域用能够识别特定核苷酸序列的一系列锌指结构单元代替,从而组成了根据人们的需要而识别特定DNA序列并进行切割的人工核酸酶。FokI需要形成二聚体才具有酶切活性[5],虽然FokI自身二聚化也能产生对DNA的切割作用,但切割效率低并且容易产生非特异切割,所以在设计ZFN时,通常还需要对FokI进行突变,使之不能形成同源二聚体[6]。每个FokI单体与一个锌指蛋白相连构成一个ZFN,识别特定的位点,当2个识别位点相距6~8bp距离时,2个单体ZFN相互作用产生酶切功能[7](fig.1)。在此特异位点产生1个DNA双链切口(Doublestrandsbreaks,DSB),然后利用同源重组或非同源末端连接修复机制进行切口修复。ZFN这种基因编辑方法取得了广泛的成功,相对传统的同源重组,其效率得到了显著的提高。目前它还存在一些不足之处,一个突出的问题是“脱靶效应”,即核酸酶并没有对特异的目标DNA序列进行识别和切割。出现这种情况的原因在于组成人工核酸酶的各个锌指结构单元之间存在相互影响,也就是说将不同锌指结构单位连接起来后,其DNA识别序列并不是它们单独存在时分别识别的核苷酸序列的简单相加,这种现象被称为上下文效应(Context-dependant)[8]。由于脱靶效应的存在,再加上ZFN制备复杂,成本昂贵,且该技术的专利被掌握在少数商业公司的手里,因此第二代基因编辑技术人工核酸酶—转录激活因子效应物核酸酶(transcriptionactivator-likeeffectornuclease,TALEN)应运而生了。Fig.1ZFN核酸酶结构及其工作原理示意图[9]3.类转录激活因子效应物核酸酶(transcriptionactivator1ikeeffectornuclease,TALEN)转录激活子样效应因子核酸酶TALEN,是既ZFN之后的第二代基因编辑技术。被Science杂志选为2012年年度十大科学突破的新技术。TALEN系统是由转录激活因子样效应物(transcriptionactivatorlikeeffector,TALE)代替ZF作为DNA结合域与FokI酶组合形成。TALE来自于植物黄单胞菌(Xanthomonas),是特异识别DNA序列的基础[10]。TALEN识别模块一般由34个氨基酸组成,其中第12、13位氨基酸高度可变,被称为重复可变的双氨基酸残基(repeatvariablediresidue,RVD)。RVD决定了对特异性核苷酸的识别,其与A、G、C、T有恒定的对应关系,如即NI识别A,NG识别T,HD识别C,NN识别G[11]。第一位氨基酸残基用于稳定空间构象,第二位氨基酸识别核苷酸TALE,通过NH或NK识别G可以减少脱靶效率。设计TALEN时,需在靶位点的编码区选择两处相邻(间隔13-22个碱基)的靶序列(一般16-20bp)来分别构建识别模块。然后,将这2个相邻的靶点识别模块分别融合到FokI的N端,形成真核表达载体,得到一个TALEN质粒[12]。将这个TALEN质粒共转化到细胞中,表达的融合蛋白将分别和靶位点结合,再由二聚体化的FokI对其进行切割,从而完成基因编辑操作(Fig.2)。TALEN技术已成功地在犬、小鼠、人等多种生物中成功的进行了基因组定点编辑。其中以在模式动物斑马鱼中的应用最为突出[13]。与ZEN技术不同,TALEN成功克服了识别序列经常受上下游序列影响的问题,而具有与ZEN相比有更好的活性,无基因序列、细胞、物种限制,实验设计简单准确,成本低,成功率高,使基因操作变得更加简单、方便。Fig.2TALEN结构及组成示意4.规律性间隔的短回文序列重复簇(ClusteredRegularlyInterspacedShortPalindromicRepeats/CRISPR-AssociatedProteins,CRISPR)CRISPR/Cas9基因编辑技术是最近生命科学领域的一个热点话题,该项技术的兴起使基因编辑领域得到的飞跃的发展。CRISPR/Cas9介导的基因组编辑技术源于对细菌与古生菌长期的基础生物学研究。早在1987年,日本的研究人员就发现E.coli中存在一些29bp的重复序列,但他们当时并不清楚这些序列的具体功能[14]。2002年,Jansen等将这些间隔排列的重复序列命名为CRISPR,并且鉴定出了与CRISPR序列位于同一基因簇的CRISPR相关蛋白Cas,同时将CRISPR基因簇分为三个不同的类型(Ⅰ型、Ⅱ型与Ⅲ型)[15]。直至2007年Barrangou等首次用实验证明了嗜热链球菌(Streptococcusthermophilus)Ⅱ型CRISPR系统具有获得性免疫防御功能[16]。随后继续的研究进一步表明CRISPR系统是一种原核生物特有的针对外源性遗传物质的免疫系统,这些外源性遗传物质包括噬菌体或者外源性质粒。在三种不同类型的CRISPR系统中,Ⅱ型CRISPR/Cas9系统最为简单,仅需要核酸酶Cas9、TracrRNA、CrRNA就可启动对特定外源DNA序列的切割[17],该系统被改造成为基因组辑工具。CRISPR/Cas9的基因组编辑技术的基本原理为:首先,TracrRNA与CrRNA形成TracrRNA:CrRNA复合体,Cas9识别并与该复合体结合,在CrRNA的引导下对靶位点进行切割。为了简化操作过程,研究人员依据TracrRNA与CrRNA复合体的结构特征设计了一条singleguideRNA(sgRNA),该sgRNA具备了TracrRNA:CrRNA复合体的功能,能够被Cas9蛋白识别并引导Cas9蛋白结合于靶位点上,从而发挥定点编辑的功能[18](Fig.3)。该技术关键在于设计引导RNA从而实现对特异靶DNA序列的敲除、插入与定点突变等修饰。影响CRISPR/Cas9技术效率的主要因素包括如下几点:首先是引导RNA的选择[19],其次是靶DNA序列的设计,在设计靶DNA时,首先要考虑必须在3′端含有原型间隔序列毗邻区(protospaceradjacentmotif,PAM),PAM序列使得双链RNA复合体与靶序列能够精准的结合,对于Cas9系统有效稳定的发挥作用有着重要的意义。除以上两点之外,我们还要考虑如何将Cas9与sgRNA导入目的细胞中,目前已在不同的生物与细胞中建立起Cas9与sgRNA的导入方法。在人工培养的哺乳细胞中,可通过电穿孔、核转染与脂质体介导的转染等方法将非自主复制的质粒DNA导入细胞中,慢性病毒也可作为载体将Cas9与sgRNA转运到人类或小鼠细胞中[20]。最近来自麻省理工学院的张峰研究员进一步提高了CRISPR/Cas9基因编辑系统的效率,张锋和同事们利用Cas9蛋白的结构知识来减少脱靶的概率,Cas9蛋白含有一个带正电荷的凹槽,负电荷的DNA结合到此处。在明确这一结构特征的基础上,科学家们可预测出用一些中性氨基酸来替代正电荷的氨基酸,相比于“靶向”序列,可以大大减少Cas9与“脱靶”序列的结合。在进行了大量实验后,他们通过改变3个氨基酸将“脱靶编辑”显著减少至无法检测到的水平。研究小组将这种新设计的酶命名为“增强型”化脓性链球Cas9(eSpCas9)[21]。与前二代基因编辑技术相比,CRISPR/Cas9技术设计操作更加简单,业余生物学家在自己的非专业实验室里就可以工作,同时还具有编辑效率高与通用性等优点,因此该技术在生物工程与生物医学领域有着广泛的应用,例如:通过该技术可快速建立基因突变的动物或细胞模型,可作为新的作物育种技术,还可利用基因组编辑技术改造微生物底盘细胞,使其变成能够生产化学品与药品的细胞工厂。Fig.3CRISPR/Cas9的组成及工作原理示意图[22]5.基因编辑技术的发展前景随着基因编辑技术的不断进步,尤其是CRISPR/Cas9技术的兴起,使得基因工程的方便性和准确性大大提高。但随之也引起了一系列相关问题,尤其是伦理学上的争议。今年4月份,来自中山大学的科学家带领其研究团队在Protein&Cell上发表论文,描述利用不能存活的胚胎进行研究,通过CRISPR/Cas9技术来对人类胚胎的基因组进行编辑[23],该篇文章的发表在学术界引起了强烈的反响,甚至有人将此比作开启了潘多拉魔盒。其实在该文发表之前,关于编辑人类生殖细胞的伦理学问题的讨论早就不绝于耳。从理论上来讲,对生殖细胞进行编辑会遗传给后代。目前全球范围内关于对人类生殖细胞进行编辑的法律参差不齐,有些国家严格限制,而有些国家则含糊不清,科