同义替代的遗传效应

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2020/1/42《分子遗传学》分子遗传学教师:刘若余联系电话:0851-3864327,13984812913同义替代的遗传效应DNA序列的改变DNA序列变异类型核苷酸替代——分类核苷酸替代的遗传学效应缺失和插入缺失和插入统称裂缝(gap),因为当一个带有缺失或插入的序列与原序列比较时,两序列中将有一个会出现裂缝.在编码区,如果裂缝事件所涉及的核苷酸不是3的倍数,将造成阅读框架的移动,于是裂缝下游的编码序列将会按错误的相位阅读。后果是产生长度异常的蛋白质。转换(TransitionTs)和颠换(Transversion,Tv)替换是DNA序列最重要的进化方式。按照发生替换的碱基类型可区分转换(TransitionTs)和颠换(Transversion,Tv)两种类型。在DNA进化过程中Ts发生的频率要比Tv高得多。从碱基替换对所编码的多败链功能的影响角度看.替换又可分成同义替换或沉默突变(指并不引起氨基酸取代的替换)、错义替换(能引起氨基酸取代的替换),反无义替换(形成终止密码子的替换)。编码蛋白质的DNA序列在进化过程中上述几类替换的速率差异很大,而且与密码子的位置密切相关。密码子第二位碱基替换都能引起氨基酸取代,第一位碱基替换的95%能引起氨基酸取代,而第三位碱基替换中大约有28%引起氨基酸取代。因而同一密码子不同位置的核苷酸之间替换速率很不相同、密码子第三位比第一、二位碱基的替换速率要高很多,显然这是由于第三位密码子的替换多属于同义替换,约5%的第一位碱基的替换也是同义的,所以第一位碱基替换速率要比第二位高些。密码子不同位点的替代速率同义和非同义替换速率可通过比较同源DNA的同源密码于之间的核苷酸差异来估算,对真核生物的42个基因的分析结果显示,非同义替换速率(0.004—1.41)x10-9,平均0.88x10-9;同义替换速率为每年每位点(1.43一11.77)x10-9,平均为4.65x10-9,因此同义替换速率是另二种替换的5倍。此外在核基因中,尽管许多密码子第三位的替换不改变氨基酸,但仍表现出某类碱基组成的偏向性,这种密码子偏向性(codonprefercneneorbias)随不同基因而变化。一般地,密码子偏向性强度与基因表达速度呈正相关,与核基因的进化速率呈负相关。同义和非同义替换速率基因中不同区域的核苷酸替代的平均速率每一个有意义密码子通过一次核苷酸替换可能突变成9种其他密码子。例如,CCU(pro)可以经历6种非同义替换,变成UCU(Ser),ACU(Thr),GCU(Ala),CUU(Leu),CAU(His),CGU(Arg)以及3种同义的替换,变成CCC,CCA,CCG.由于遗传密码的结构,同义替代主要发生在密码子的第三位上,事实上,第3位上所有可能发生的改变中,大约70%是同义的。相比之下,密码子第2位上的所有替代都是非同义的或无义的,密码子第1位发生的可能替代中,绝大多数是非同义的(96%)。假定在基因组中所有密码子以同一频率出现,且所有核苷酸替代频率是相同的,则同义、非同义和无义替代的百分比大致为25%、71%和4%。遗传密码表由于编码氨基酸的密码子的简并性,同一氨基酸可以使用不同的密码子编码。在20种氨基酸中,除了甲硫氨酸、蛋氨酸只有一个密码子外,其余18种氨基酸中每个氨基酸都有2-6个同义密码子。密码子使用频率如果每个核苷酸位点上的核苷酸替代是随机发生的,则每个位点上4种核苷酸A、T、C和G将以等概率出现。因此,如果无自然选择或无突变基因偏倚的话,则可期望编码同一氨基酸的各个同义密码子以相同的频率出现。例如,缬氨酸由4个密码子GUU、GUC、GUA和GUG编码。这样,检验一个基因中的缬氨酸时,GUU、GUC、GUA和GUG的相对频率将会接近25%。实际上,编码同一个氨基酸的不同同义密码子通常有不同的频率,某些密码子比另一些有更高的使用频率。图1.4指出了大肠杆菌(E.coli)RNA聚合酶中的同义密码子的使用频率(使用次数)。对缬氨酸而言,四个密码子几乎被等同使用,虽然GUU的使用频率比GUC多。但在精氨酸上,CGU和CGC几乎达到专门使用的程度,而CGA、CGG、AGA和AGG差不多没有被使用。这种密码子使用偏倚,一般在原核和真核细胞上都能见到。在生物界,蛋白质编码基因的同义密码子的使用并不随机、也不平均,各种生物体都偏爱使用同义密码子中的某些个别的密码子,而且不同物种、不同生物体的基因在密码子使用上存也在着很大的差异.从原核生物到真核生物,其基因组中同义密码子使用偏性的现象广泛存在,这一现象的产生与诸多因素有关:密码子使用偏倚的原因1、密码子与反密码子的相互作用、tRNA的丰度以及基因转录和翻译的效率。密码子的使用偏性与细胞内的tRNA含量成正相关,与tRNA的解读能力相匹配。特定tRNA的丰度同基因组中编码此tRNA的基因拷贝数相关。2、基因表达的水平。同义密码子的使用与翻译速度及表达量密切相关,高表达的基因的密码子使用偏性远远大于低表达的基因。这可能是高表达的基因要求翻译速度快,从而在密码子的选择上,选择那些与反密码子配对快、分手也快,相应tRNA分子数量多且解读能力高的密码子这些偏好能够有效地翻译密码子,达到优化翻译的效应。3、基因组中的GC含量。基因组中的GC含量高时,密码子的第三位碱基多选择G,C,密码子使用偏性高,反之亦然”。图1.5示出了基因组GC含量变异幅度很大的11种不同的细菌中,基因密码子的第1、2和3位GC含量与其相应的基因组GC含量之间的关系。在第3位上,基因的GC含量几乎接近其相应的基因组GC含量,表明突变压的作用非常强。然而,第2位GC含量与基因组GC含量的线性相关斜率远低于第3位,表明第2位上的突变压作用较次要,其GC含量由于功能制约主要受净化选择所左右。正如推测的那样,在第1位上基因GC含量和基因组GC含量间的相关斜率介于第3和第2值之间。与单细胞生物相反,当从整个基因组来考虑时,人们已了解到动物和植物的GC含量变化范围很窄(Sueoka1962)。特别地,所有脊椎动物的GC含量在40~45%之间。然而,在高等生物的许多基因中,仍可发现密码子用法偏倚。在有些无脊椎动物(如果蝇)中,这种偏倚非常强,很明显,如同在微生物中,这也是同功tRNA相对丰度差异造成的(Shields等1988;Akashi1994;Mariyama和Powell1997)。4、避免使用类似于终止密码子的密码子。终止密码子对编码区碱基的使用起重要限制作用,蛋白质编码区3个密码子位碱基分布具有明显的不对称性,与终止密码子对应的一些单、双核苷酸出现的频率很低,从而影响密码予的使用。5、物种的差别。不同的物种全基因组密码子使用偏性不同。6、氨基酸的保守性。保守位置的氨基酸密码子使用偏性明显高于于非保守位置。7、蛋白质的结构功能。基因密码子的使用与基因编码的蛋白的结构和功能有关。蛋白质折叠方式与mRNA序列之间存在一定的相关性,蛋白质的三级结构与密码子使用概率有密切的关系;在不同物种中,类型相同的基因具有相近的同义密码子使用偏性,对于同一类型的基因由物种引起的同义密码子使用偏性的差异较小。8、内含子的长度。文献指出在某些单细胞生物中密码子的使用偏性与内含子的长度成正相关,而对于多细胞生物则刚好相反。9、内含子数目。除了上述原因外,密码子使用偏性还与重组率、基因密度突变偏性、基因长度氨基酸的组分等有关。密码子偏性的应用1、提高基因的异源表达实验证明,可通过分析密码子使用模式,预测目的基因的最佳宿主;或者应用基因工程手段,为目的基因表达提供最优的密码子使用模式。3种不同的方式,目的都是利用密码子偏性来提高异源基因的表达。2、翻译起始效应mRNA浓度是翻译起始速率的主要影响因素之一,密码子直接影响转录效率,决定mRNA浓度。如单子叶植物在“翻译起始区”的密码子偏性大于“翻译终止区”,暗示“翻译起始区”的密码子使用对提高蛋白翻译的效率和精确性更为重要,因此,通过修饰编码区5′端的DNA序列,来提高蛋白质的表达水平将有望成为可能。3.3影响蛋白质的结构与功能基因的密码子偏性与所编码蛋白质结构域的连接区和二级结构单元的连接区有关、翻译速率在连接区会降低。马建民等通过聚类分析的方法研究发现,哺乳动物MHC基因的密码子偏性与所编码蛋白质的三级结构密切相关,并可通过影响mRNA不同区域的翻译速度,来改变编码蛋白质的空间构象。其研究所选取的蛋白结构单位是蛋白指纹,它在很大程度上也是一种蛋白功能单位,表明密码子偏性与蛋白的功能也存在密切相关。改变密码子使用模式可目的性改变特定蛋白质的结构与功能。基因定位功能密码子的使用模式在细胞核和细胞质遗传物质之间也存在差异,如核基因中的起始密码子只有ATG,而线粒体基因中的起始密码子为ATN;核基因中的终止密码子TGA在线粒体基因中用来编码色氨酸等。因此,可以通过比较密码子的使用模式,来进行真核生物核糖体在细胞内以及未知蛋白基因在基因组的定位。预测进化规律类似的密码子使用模式,预示着物种相近的亲缘关系或生存环境。目前已有研究通过比较密码子偏性的差异程度,来分析物种间的亲缘关系和进化历程。线粒体基因组具有母系遗传、分子结构简单、多态性丰富等优点,是一种重要的分子标记,研究其密码子使用偏好性,可以很好地用于确定动物类群的遗传分化和系统发生关系。密码子使用偏性的度量指标生物信息学发展至今,已经产生了许多度量密码子使用偏性的指标,常用的一些指标包括密码子使用频数fc、密码子使用的绝对频率fre、密码子使用的相对频率RSCU、基因GC含量、scaledX2值、密码子偏爱参数CPP、基因的有效密码子数目Nc、内在密码子偏离指数ICDI、最大可能密码子偏性MCB、基因的密码子适应系数CAI、最佳密码子使用频率Fop和密码子偏爱指数CBI等。上述评价基因密码子使用偏性的指标可以分为两大类。(I)描述单个密码子使用偏性的指标,如密码子使用频数fc、密码子使用的绝对频率frc和相对同义密码子使用频率RSCU等:(II)描述整个基因密码子使用偏性的指标,这类指标又根据有无比较的对象及比较对象的不同分为下述三类:(1)直接描述基因密码子偏性的指标,如密码子第三位置上的GC3及GC3s含量;(2)与同义密码子平均使用相比较,以衡量基因密码子实际使用偏离密码子平均使用的程度,如密码子有效数Nc(theeffectivenumberofcodon)、scaledx2值、密码子偏爱参数CPP(codonpreferenceparameter)和内在密码子偏离指数ICDI(theintrinsiceodondeviationindex)及最大可能密码子偏性MCB(maximum-Likelihoodcodonbias)等:(3)与参考基因(一般为高表达的基因)的密码子用法相比较,度量基因密码子使用接近参考基因密码子用法的程度,如密码子适应指数CAI(thecodonadaptationindex)和最佳密码子使用频率Fop(thefrequencyofoptimalCodons),密码子偏爱指数CBI(thecodonbiasindex)等。密码子使用偏性的度量指标相对同义密码子使用频率(relativesynonymouscodonusage,RSCU),RSCU的定义:以观察到的某一同义密码子的使用次数为分子,以预期的该密码子的出现次数为分母的商。其中预期使用次数为所有同义密码子平均使用时每种出现的次数(Sharp等1986)。对一个给定的氨基酸而言,RSCU为RSCU=Xi/X ̄式中Xi是编码该氨基酸的第i个密码子的观察值,而X ̄则是所有编码该氨基酸的密码子的平均使用此次数,即∑Xi/m,m为编码该氨基酸的同义密码子的数目。参考资料西南大学硕士学位论文果蝇基因组中内含子数目与密码子使用偏性的关系姓名:曹致琦密码子使用频率分析网址:密码子使用频率分析分析前信息输入分析结果

1 / 43
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功