表观遗传学Epigenetics2010/03几十年来,人们一直认为基因决定着生命过程中所需要的各种蛋白质,决定着生命体的表型。但随着研究的不断深入,科研人员也发现一些无法解释的现象:同卵双生的两人具有完全相同的基因组,在同样的环境中长大后,他们在性格、健康等方面会有较大的差异,并不符合经典遗传学理论预期的情况。这说明,在相应的基因碱基序列没有发生变化的情况下,一些生物体的表型却发生了改变。同时还发现,有些特征只是由一个亲本的基因来决定,而源自另一亲本的基因却保持“沉默”。人们对于这样一些现象无法用经典的遗传学理论去加以阐明。提纲•表观遗传学概述•表观遗传修饰•表观基因组学(epigenomics)和人类表观基因组计划•表观遗传相关疾病表观遗传学概述真核基因的表达受细胞核内、外多层次的调节,呈现多级调控:包括遗传调控(geneticregulation)和表观遗传调控(epigeneticregulation)。遗传调控包括基因转录、转录后加工、翻译以及翻译后修饰等环节。表观遗传调控是指转录前基因在染色质水平上的结构调整,它是真核基因组一种独特的调控机制。近年来,有关表观遗传学(epigenetics)研究已愈来愈成为基因表达调控的研究热点之一。表观遗传学(epigenetics)是与遗传学(genetic)相对应的概念。遗传学是指基于基因序列改变所致基因表达水平变化,如基因突变、基因杂合丢失和微卫星不稳定等;而表观遗传学则是指DNA序列不发生变化但基因表达却发生了可遗传的改变。这种改变是细胞内除了遗传信息以外的其它可遗传物质发生的改变,即基因型未发生变化而表型却发生了改变,且这种改变在发育和细胞增殖过程中能稳定传递。Epigenetics这一名词的中文译法有多种,常见有译成“表观遗传学”、“表现遗传学”、“后生遗传学”、“外因遗传学”、“表遗传学”、“外区遗传学”等等。早在1942年的时候,C.H.Waddington就首次提出了Epigenetics一词,并指出表观遗传与遗传是相对的,主要研究基因型和表型的关系。几十年后,霍利迪(R.Holiday)针对Epigenetics提出了更新的系统性论断,也就是人们现在比较统一的认识,即“表观遗传学研究没有DNA序列变化的、可遗传的基因表达改变”。表观遗传学有如下四层含义:(1)可遗传的,即这类改变通过有丝分裂或减数分裂,能在细胞或个体世代间遗传;(2)是基因表达的改变;(3)没有DNA序列的变化或不能用序列变化来解释;(4)它和DNA的改变所不同的是,许多表观遗传的改变是可逆的,这就为疾病的治疗提供了乐观的前景。表观遗传学的兴起和有关研究工作的进展,使人们对基因组的认识又增加了一个新视点:对基因组而言,不仅仅是序列包含遗传信息,而且其修饰也可以记载遗传信息。这种在基因组的水平上研究表观遗传修饰的领域被称为表观基因组学(epigenomics)。表观遗传是指在DNA序列没有发生变异的情况下,基因表达的可遗传的改变。它主要通过对DNA或组蛋白的共价修饰(如DNA甲基化,组蛋白乙酰化),同源性的基因沉默(即一个基因被另一个与其同源的基因所抑制),副突变(paramutation)和亲本印迹,RNA编辑,蛋白异构体引起类似显性遗传等机制而产生的。由此我们可以认为,基因组含有两类遗传信息,一类是传统意义上的遗传信息,即DNA序列所提供的遗传信息,另一类是表观遗传学信息,它提供了何时、何地、以何种方式去应用遗传信息的指令。表观遗传修饰•DNA甲基化(DNAmethylation)•组蛋白修饰(histonemodifications)•染色质重塑(chromatinremodeling)•基因组印记(genomicimprinting)•RNA相关沉默(RNAinterference)•隔离子(insulator)、边界(boulidary)、核区室化(compartment)•副突变(paramutation)•位置效应(positioneffectvariegation)•X染色体剂量补偿(X-chromosomedosecompensation)表观遗传修饰•X染色体失活(Xchromosomeinactivation)•基因组印记(genomicimprinting)•副突变(paramutation)•RNA编辑(RNAEditing)•异染色质的开放•DNA甲基化(DNAmethylation)•组蛋白密码(histonecode)一、X染色体失活在哺乳动物中,雌雄性个体X染色体的数目不同,这类动物需要以一种方式来解决X染色体剂量的差异。在雌性哺乳动物中,两条X染色体有一个是失活的,称为X染色体的剂量补偿(dosagecompensation)。X染色体失活的选择和起始发生在胚胎发育的早期,这个过程被X失活中心(X-inactivationcenter,Xic)所控制,是一种反义转录调控模式。三色猫(又叫做玳瑁猫)是一个很好的例子。雌性的三色猫腹部的毛是白色的,背部和头部的皮毛由桔黄色和黑色斑组成。这种雌猫是一个X-连锁基因杂合体,X-连锁的b基因控制橙色毛皮,其等位基因B是控制黑色的毛皮。带有b基因的X染色体若失活,B基因表达,产生黑色毛斑,若带有B基因的X染色体若失活,b基因表达,则产生橙黄色毛斑。Calicocat这个失活中心存在着X染色体失活特异性转录基因Xist(X-inactive-specifictranscript),当失活的命令下达时,这个基因就会产生一个17kb不翻译的RNA与X染色体结合,引发失活。X失活中心还有“记数”的功能,即保持每个二倍体中仅有一条X染色体有活性,其余全部失活。X染色体的失活状态需要表观遗传修饰如DNA甲基化来维持。这种失活可以通过有丝或减数分裂遗传给后代。X染色体失活是表观遗传学研究的很好范例,它能帮助人们认识基因沉默是如何建立和通过遗传而保持的。今后对于X染色体失活的研究还要特别关注于哪些因素调控了Xic的功能、XistRNA造成沉默的机制和一些像BRCA1的蛋白质在X染色体失活中的作用等问题。X染色体失活机制2005年3月17日,在Nature杂志上发表的一篇文章宣告基本完成对人类X染色体的全面分析。对X染色体的详细测序是英国WellcomeTrustSanger研究中心领导下世界各地多所著名学院超过250位基因组研究人员共同完成的,是人类基因组计划的一部分。新的研究确认了X染色体上有1098个蛋白质编码基因,Y染色体上仅有大约78个基因,这1098个基因中只有54个在Y染色体上有相应功能的等位基因。二、基因组印记高等动物的基因组为两倍体,受精卵从双亲中各继承了一套基因组。每一个常染色体均为双拷贝,父源和母源常染色体基因都能有均等的机会表达或受到抑制,这是孟德尔遗传定律的基本要素。上世纪90年代开始,发现了不符合这个定律的遗传现象。某些基因呈单等位基因表达,即父源与母源的基因拷贝不能同时表达,并且,父源或母源等位基因通过某种特异的基因修饰机制,特异性地抑制另一母源或父源染色体等位基因表达。也就是说,来自双亲的某些等位基因,在子代的表达不同,有些只有父源的基因有转录活性,而母源的同一基因则始终处于沉默状态,另一些基因的情况则相反。这是由于源自某一亲本的等位基因或它所在染色体发生了表观遗传修饰,导致不同亲本来源的两个等位基因在子代细胞中表达不同。在基因组中的这类现象就是基因印记(geneimprinting)或基因组印记(genomicimprinting)。印记基因印记基因(imprintedgenes)是一类基因尽管具有父母双方来源的等位基因,但是后代只转录或表达来自一方(父方或母方)的遗传信息monoallelicexpression),而另一方处于关闭状态(silence)。只表达父方、母方关闭的基因称为母方印记基因,如IGF2(insulin-likegrowthfactor2);只表达母方、父方关闭的基因称为父方印记基因,如H19。印记基因已成为“表观遗传”(epigenetic)理论的重要组成部分。印记基因呈串出现于基因组DNA印记基因有80%是在基因组上呈串(cluster)存在于常染色体(例如位于人的染色体1、5、6、7、11、12、13、14、15、18、19、20)和性染色体(染色体X)上。例如小鼠的7号染色体、人的11号染色体上在1.5mb的DNA区域有6个印记基因被发现。这些成簇的基因被位于同一条链上的顺式作用位点所调控,该位点被称做印记中心(imprintingcenter,IC)。印记基因的存在反映了性别的竞争,从目前发现的印记基因来看,父方对胚胎的贡献是加速其发育,而母方则是限制胚胎发育速度,亲代通过印记基因来影响其下一代,使它们具有性别行为特异性以保证本方基因在遗传中的优势。不仅在细胞周期中失活的X染色体复制慢于有活性的X染色体,而且印记基因具有遗传印记的组织特异性,即这些基因可能在某些组织器官表现印记,而在另一些组织器官表现为表达父母双方。已发现的多数印记基因在人和小鼠两个品种之间是一致的,具有明显的保守性。目前,关于基因印记的研究已成为分子遗传学的一个重要领域。已发现这些基因与机体发育的许多方面有关,如胎儿发育和胎盘生长,细胞分裂和个体行为。因此,正常印记模式的改变在临床上会引起许多疾病。基因印记的机制现在还不完全了解,从到目前为止的研究成果看,与DNA的甲基化,染色质构造的改变,DNA复制时机的变化和非编码RNA的调节作用有关。研究者在植物、昆虫和哺乳动物中都发现了基因组印记现象。印记基因在发育过程中扮演重要的角色,它们一般在染色体上成簇分布。在小鼠和人体中已知有100多种印记基因。等位基因的抑制(allelicrepression)被印记控制区(imprintingcontrolregions,ICRs)所调控,该区域在双亲中的一个等位基因是甲基化的。印记控制区在不同区域中对印记的调控存在差异。在一些区域中,未甲基化的ICR组成一个绝缘子阻止启动子和增强子间的相互作用;在其它区域中,可能有非编码RNA(non-codingRNAs)的参与,这种沉默机制与X染色体失活相似。在基因印记维持的研究中,人们注意到表观印记的反常可能在人体中导致复杂的疾病;一些环境因素,比如食物中的叶酸也会破坏印记。但人们对于这些过程的机理知之甚少。基因组印记的研究促使人们去重新思考遗传学的“中心法则”。人们知道环境可以影响到由遗传因素所决定的表型,“中心法则”向人们阐述了遗传因素的作用原理,但无法说明环境因素作用于基因表达过程的分子机制。基因组印记给了研究者合理的解释:环境变化可以促成基因表观修饰,表观修饰也可能引起基因突变,这种变化可以发生在生殖细胞中,并传递给下一代。这样就很好地解释了环境因素对于遗传的影响过程。我们对“获得性”性状和“返祖”现象可以这样去认识:这些现象可能是因为一组基因,它们的活性已经被表观修饰所抑制了,后来由于一些因素的作用造成它们表观修饰的变化而恢复了活性。与遗传疾病的关系目前已知的大多数印记基因都是与生长和分化有关的基因。由于印记基因是父源或母源单等位基因表达,基因表达产物量在影响该基因功能方面有重要意义。印记基因引起疾病主要表现在两个方面,一是印记等位基因的再活化,即印记丢失(lossofimprinting,LOI);二是印记基因的另一拷贝等位基因异常造成该基因失活,而非印记基因是两等位基因同时失活引起疾病。下列现象出现可怀疑其致病基因为印记基因。①遗传形式和父母的性别有关,例如,胰岛素依赖性糖尿病是父源等位基因为致病基因的时候发病,异常源自母亲等位基因的时候不发病。原因可能是这个致病基因源自父亲的表达,源自母亲的不表达。②父源二体型或母源二体型引起的疾患。例如:西拉综合征(Silver-Russellsyndrome)为7号染色体父源二体型,就是说7号染色体的两条都是源自父亲,无源自母亲的7号染色体。所以,此病可能是由于源自母亲等位基因不能表达,而全无母亲等位基因表