DNA甲基化研究综述ThesummarizeoftheresearchonDNAmethylation郭文媛(生物技术1353227)摘要:DNA甲基化是真核生物表观遗传学中一种重要的基因表达调控方式,是一种酶催化的修饰过程。其是在DNA甲基转移酶催化下,将甲基基团转移到胞嘧啶的5位碳原子上,使之转变成5-甲基胞嘧啶的化学修饰过程。在人类和其他哺乳动物中,此修饰过程通常发生在5'-CpG-'二核苷酸的胞嘧啶上。大量相关研究表明,DNA甲基化与人类疾病密切相关。Abstract:DNAmethylationisanimportantepigeneticregulationofgeneexpressionineukaryotes.Itisakindofenzymecatalysismodificationprocess:referstothechemicalmodificationprocessofDNAmethyltransferasecatalysis,thetransferofmethylgroupsontocytosinecarbonatom5,makingtheminto5-methylcytosine.Inhumansandothermammals,themodificationprocessusuallyoccursin5'CpG-'dinucleotidecytosine.AlargenumberofrelevantstudieshaveshownthatDNAmethylationiscloselyrelatedtohumandiseases.关键词:DNA甲基化;甲基转移酶;表观遗传学;CpG岛;Dnmt1;Dnmt3a;Dnmt3b;基因沉默;DNA甲基化结合蛋白;人类表观基因组计划Keywords:DNAmethylation;Methyltransferase;Epigenetics;CpGisland;Dnmt1;Dnmt3a;Dnmt3b;GeneSilencing;MBD;humanepigenomeproject表观遗传学研究的是不改变DNA的一级结构而改变表型的一种基因表达调控机制,主要包括DNA甲基化、组蛋白修饰、染色体重构、RNA干扰等。DNA甲基化是重要的表观遗传修饰之一,在大多数真核生物中广泛存在。DNA甲基化水平受到环境、疾病、年龄和性别等因素的影响,处于动态的变化过程中。不同的细胞、组织或个体之间,甚至同一细胞或个体的不同发育时期,其DNA甲基化状态和程度都可能存有差异。2003年10月,人类表观基因组计划委员会正式宣布投资和启动人类表观基因组计划(humanepigenomeproject,HEP)。HEP的主要目标是研究人类所有基因在主要组织以及200多种细胞中正常和疾病状态下的甲基化模式,并在基因组水平绘制不同组织正常和疾病状态时的甲基化变异位点图谱[4],本文结合2013年至今DNA甲基化研究文献,综述了DNA甲基化分布特点和与疾病关系等方面的研究情况。1.DNA甲基化1.1DNA甲基化与DNA去甲基化DNA甲基化是表观遗传(Epigenetic)的一种重要表现方式,指在DNA甲基转移酶(DNAmethyltransferase,DMT)的催化下,以s-腺苷甲硫氨酸(SAM)为甲基供体,将甲基转移到特定碱基上的过程。DNA去甲基化也被称为DNA甲基化丢失(lossofDNAmethylation),即甲基基团从胞嘧啶上消失的过程。包含主动去甲基化与被动去甲基化2种模式。1.2DNA甲基化分布DNA甲基化在生物体内的分布并不是随机的,而是呈现一定的规律性。除了一些转录沉默的基因5'端甲基化程度较高以外,大多数基因的5'和3'侧翼区,DNA甲基化程度较低,而在基因内部的甲基化程度较高。在人类胚胎干细胞中,甲基化CpG的密度在转录起始位点附近急剧的下降,从转录起始位点向下游增高至相对稳定的水平,基因内部的高甲基化可能会抑制转录的延伸,并抑制基因内部异常转录的起始。转座子是基因组不稳定性的主要来源,在脊椎动物和植物基因组中,转座子一般是高度甲基化的,转座子甲基化程度的降低会导致转座子表达水平的升高和转座活动的加强。[1]1.3DNA甲基化的序列依赖性DNA甲基化在不同序列组成中分布呈现一定的特点。胞嘧啶的甲基化程度与其临近的核苷酸序列组成有关。ACGT序列中的胞嘧啶甲基化程度最低,GCGG序列中的胞嘧啶发生甲基化的可能性比ACGT高两倍。胞嘧啶碱基一般会出现在甲基化程度较低的CHG位点下游而不是上游。在人类胚胎干细胞中,具体TACAG序列特征的DNA序列更容易发生CHG的甲基化修饰,并且这类甲基化修饰多位于剪切位点附近。【1】1.4DNA甲基化的作用以哺乳动物为代表。1.4.1DNA甲基化调控胚胎的发育对哺乳动物来说,正确的DNA甲基化模式对其生育能力和后代存活率是必不可少的。生殖细胞发育期间,基因组经历了一次几乎完全去甲基化和重新甲基化的过程。这个表观重编程事件发生在胚胎植入前的发育时期,与细胞全能性的重新建立以及印迹基因位点性别特异的甲基化模式的建立有关。精卵结合后,基因组即开始去甲基化,DNA甲基化水平在8细胞期时达到最低水平,在此之后甲基化被迅速重建,在胚泡期(囊胚期)达到体细胞水平。1.4.2DNA甲基化维持遗传物质的稳定研究显示基因本身甲基化可能对剪接有影响。重复区域诸如着丝粒的甲基化对染色体稳定具有重要作用,并且很有可能抑制转座子的表达,因此具有维持基因组稳定性的作用。[5]2.CpG岛与DNA甲基化2.1CpG岛的发现CpG岛最早是由Tykocinski和Max[16]发现并定义的。指包含限制性内切酶HpaⅡ结合位点的小区域,因此也被称为HpaⅡ小片段岛。由于上述定义包含了许多短的重复序列,Takai和Jones[18]将CpG岛进行了重新的定义:长度不小于500bp、GC含量不小于55%、CpG实际含量与期望含量之比不小于0.65。[2]2.2CpG岛甲基化与基因表达的转录起始毫无疑问,位于转录起始位点上的甲基化的CpG岛在DNA组装成核小体后不能启动转录。但是基因沉默和甲基化哪个先发生,这是一直在探讨的问题。Lock等早期的实验清晰地展示了在失活的X染色体上的Hprt基因的甲基化发生在这条染色体失活之后。也就是说,甲基化似乎充当了一把“锁”的功能来强化X相关基因之前的沉默状态。他们认为甲基化转移酶对一种相当短暂的细胞类型的分化是必需的,甲基化在启动沉默而不是加强沉默上似乎具有更大的作用。在癌细胞全基因组范围内的研究表明,被多梳蛋白复合体沉默且含有CpG岛启动子的基因相比其它基因在癌症中更有可能发生甲基化,也就是说,沉默的状态先于甲基化发生。因此,基因沉默先于甲基化看起来好像是一种普遍的机制,但是数据不足以证明。除了CpG岛自身改变之外,组织特异性变化也在他们周围发生。不管怎样,这些变化的意义尚未理解。有证据认为DNA甲基化的时间与甲基化作用能够为表观遗传状态添加额外稳定的水平,出乎意料的是,在有些物种中不需要这些如果蝇和酵母。[5]3甲基化转移酶3.1Dnmt1Dnmt1Dnmt1包含1573个氨基酸,其C端为保守的催化甲基化反应结构域;Dnmt1主要是维持DNA的持续甲基化状态,使DNA分子中未甲基化的那一条子链甲基化,从而保持子链与亲链有完全相同的甲基化形式,因此Dnmt1是一种维持甲基转移酶。[6]3.2Dnm3a和Dnm3bDnmt3Dnmt3a和Dnmt3b属于重新甲基化酶,参与DNA甲基化的从头合成,即对没有甲基化的DNA链进行甲基化;Dnmt3L是一种相关蛋白调节因子,本身不具有DNA甲基化功能,但可调节Dnmt3a和Dnmt3b的活性,其氨基酸序列与Dnmt3a和Dnmt3b极其相似,但在C端区域缺少DNA甲基化转移酶活性所必需的相关物质。[6]4DNA甲基化结合蛋白甲基化信号由甲基化结合蛋白来转译,它们能够特异性识别并结合至甲基化位点通过募集辅阻遏复合物例如组蛋白去乙酰化酶(HistoneDeacetylase,HDAC)等建立沉默的染色质,从而在DNA甲基化和基因沉默中起桥梁作用。目前,哺乳动物中已鉴定出的甲基化结合蛋白有三类,分别是:MBD(Methyl-CpG-BindingDomain)、Kaiso以及SRA(SetandRingfinger-associated)家族。[7]5不同物种DNA甲基化情况5.1哺乳动物在哺乳动物中CpG以两种形式存在:一种分散存在于DNA序列中;另一种呈现高度聚集状态,即CpG岛。在正常组织里,70%~90%分散存在的CpG是被甲基化修饰的,而CpG岛则是非甲基化的。正常情况下,人类基因组非CpG岛序列的CpG二核苷酸相对稀少,并且总是处于甲基化状态,与之相反,人类基因组中大小为100~1000bp左右,富含CpG二核苷酸的CpG岛则总是处于未甲基化状态,而CpG岛常位于转录调控区附近,与56%的人类基因组编码基因相关,因此基因非转录区CpG岛的甲基化状态的研究就显得十分重要。人类基因组序列草图分析结果表明,人类基因组CpG岛约为28890个,大部分染色体每1Mb就有5~15个CpG岛,平均每Mb含10.5个CpG岛,并且CpG岛的数目与基因密度有良好的对应关系。[5]5.2无脊椎动物在无脊椎动物中,DNA甲基化主要发生于基因内部,基因间区大部分未被甲基化,重复序列或转座子区域的甲基化情况在昆虫中几乎不存在。在无脊椎动物中,外显子和内含子的甲基化模式也表现出较大差异,如在牡蛎中,外显子和内含子存在较高的甲基化水平,而在金小蜂中,内含子的甲基化水平却要显著低于外显子。[13]5.3植物研究表明,从基因表达方面研究有利于解释杂种优势的机理,可以利用甲基化手段分析亲本与杂交种之间存在的表型差异。Tsaftaris[19]等人对玉米杂交种和亲本甲基化MSAP分析表明,亲本的甲基化程度明显高于杂交种,由此认为杂种优势可能与DNA甲基化程度降低有关。DNA甲基化还可以解释作物之间的表型独立特性。基因组DNA被甲基化修饰后,影响其对环境的胁迫应答。由于植物的分生组织产生生殖细胞,所以在形成分生组织前的表观遗传可直接传递给后代。非生物的逆境胁迫,如盐,干旱,热,抗生素等,都会引起甲基化水平的改变。[8]6疾病6.1肿瘤全基因组的低甲基化及特定区域的高甲基化被认为是肿瘤细胞中DNA甲基化的主要形式。据目前所知,人类肿瘤的发生与原癌基因的激活及抑癌基因的失活相关,正常情况下,基因组的原癌基因处于抑制状态,而全基因组的低甲基化可使原本处于失活状态下的基因状态发生活化。最新的高分辨率全基因组研究证实,DNA低甲基化与肿瘤中基因组高甲基化同时发生,只是通常在不同的序列上。肿瘤中个别CpG岛的甲基化变化不仅对区域环境,而且对邻近位点具有一个很高的依赖性。如前所述,在整个基因组持续低甲基化的过程中,局部区域的高度甲基化(特别是抑癌基因的启动子)导致抑癌基因的继续沉默,更进一步增加了肿瘤生成的风险。甲基化修饰目前被现代肿瘤学认为是导致原癌基因激活及抑癌基因失活的机制之一。[14]6.2糖尿病最新研究表明2型糖尿病(T2DM)是由遗传因素和环境因素交互作用引起的复杂的多基因遗传病。表观遗传在T2DM的发生中发挥着重要的作用,通过microRNA、DNA甲基化及组蛋白修饰等影响胰岛β细胞的发育和分泌功能,降低机体对胰岛素的敏感性,最终导致T2DM的发生。[9]6.3心血管疾病虽然高血压的发病机制尚未完全阐明,但是证据显示表观遗传学机制是疾病发生过程中将基因型与表型联系起来的纽带。DNA甲基化作为一种常见的表观遗传修饰,与各类心血管疾病相关。[10]6.4老年退行性疾病DNA甲基化维持细胞功能、遗传印记、基因表达的时空特异性中起重要作用。年龄相关的DNA甲基化改变,涉及到老年个体中的代谢性疾病、心血管疾病、肿瘤等增龄性疾病的发生与发展。[12]6.5中枢神经发育大量研究显示DNA甲基化在中枢神经系统(CNS)发育中发挥了重要作