文章编号:100021336(2001)0420271203mRNA孟宪芳周光云(华中科技大学同济医学院细胞生物教研室,武汉430030)收稿日期:2001205217作者简介:孟宪芳(1976)),女,研究生。:mRNA前体;选择性剪接:Q522人类基因组草图已基本完成,预测人类约有35000个编码蛋白质的基因,只是线虫或果蝇的2倍[1]。人类是怎样完成其复杂的生物功能?越来越多的证据表明选择性剪接在扩大蛋白质的多样性中发挥重要作用,并且有助于解释基因数目与生物复杂程度两者的不一致性。选择性剪接能够从一个基因产生多个转录本,从而产生远多于基因数目的蛋白质,完成机体的复杂功能及精细调节。1.mRNA目前根据ESTs分析,在人类35000个基因中大约有40%的基因具有选择性剪接的形式[1]。尽管这个数目让人惊讶,但这个数目可能比实际数目还低。因为首先,EST只是代表了一部分转录本,并不能代表所有蛋白质编码序列和绝大部分基因。并且26%和65%的EST只是mRNA的5c端和3c端,而选择性剪接也可发生编码区,所以利用EST比较可能会遗漏一些选择性剪接事件。其次,许多选择性剪接可能只在特定组织、特定时间、发育的某一阶段和/或特定的生理条件,而目前还不可能建立包括各种时空的EST数据库。由于上述原因,不能根据目前的EST数据库对选择性剪接基因的数目进行正确估计。在今后几年中我们可能发现大部分基因具有不同的剪接形式。2.mRNAmRNA前体选择性剪接的普遍性已被人们普遍接受,那么其生物学意义又在哪里呢?举一例来说明该问题。neurexins是一类存在于脊椎动物中重要的神经肽受体和参与突触形成的粘附分子。根据从鼠和牛的cDNA分析,3个基因可利用不同的启动子和选择性剪接机制产生1000多种neurexin的mRNA。选择性剪接产生的mRNA其编码的蛋白质与配体的结合特异性发生改变,并且neurexin的多态性可能与神经细胞间的联接有关。例如:存在于突触前细胞的B2neurexin与存在于突触后细胞上的neuroligins间的相互作用促使突触的形成。比较有意义的是,只有缺少第20个外显子的mRNA编码的B2neurexin与neuroligins作用[2]。尽管含有外显子20的mRNA编码B2neurexin的功能不确切,但可以推测这二种不同的蛋白质对于决定突触是否形成起着决定性作用。毫无疑问,阐明neurexinmRNA前体选择性剪接机制,将有助于我们深入了解脊椎动物神经系统的发育及功能。现在人们已知道,许多基因的前体mRNA可能有几百种、几千种或上万种选择性剪接的形式。例如:人内耳毛细胞中依赖钙激活的钾离子通道基因slo至少有8个可选择性剪接位点,可能有500个的mRNA,并且这些剪接形式产生的蛋白质都是功能相关的,用来感觉不同频率的声音。3.mRNA由上所述,mRNA前体选择性剪接是广泛存在的,且具有重大生物学意义,研究其选择性剪接的调节机制是一项迫切而艰巨的任务。它的调节是通过hnRNP和SR蛋白家族成员所识别的RNA正性和负性调节信号来实现的,通常在不同的细胞类型和发育的不同阶段进行调节。相互协调的多个mRNA前)271)5生命的化学62001年21卷4期体的选择性剪接,是基因调控表达如神经系统的分化和细胞凋亡的重要组成部分。机体必须对选择性的剪接位点在时空上进行精细调节。由于剪接反应是在剪接体中进行的,mRNA剪接位点的选择是通过剪接体中各种蛋白质的浓度改变或相互作用而实现的,故在此先简单叙述一下剪接体的组装及阐明目前人们对前体mRNA选择性剪接的研究进展。3.1剪接体的组装真核生物基因的大多数外显子长约50~300bp并被内含子分割开。剪接体是由5个snRNP即U1、U2和U4/5/6snRNP(smallnuclearribonucleoproteinparti2cles)以及50~100个蛋白质或多肽组成。剪接体早期组装过程即识别内含子的两端序列是剪接调节的关键步骤。U1snRNP结合到5css(splicesite),SF1(splicingfactor1)结合到分支位置,U2AF(U2auxiliaryfactor)的65kD和35kD亚基分别与多聚嘧啶束和3cAG结合[3]。在高等真核生物中介导U1snRNP同5css结合与U2AF同3css结合,起着/桥0作用的分子是富含丝氨酸2精氨酸SR家族的剪接因子成员。SR蛋白具有独特的模式结构。其N端主要由RNA识别结构域组成,具有结合RNA的能力。其C端有RS结构域,能够与具有RS结构域U2AF的35kD亚基和U1snRNP70kD的蛋白质相互作用,因而能够促进U2AF和U1snRNP与剪接位置结合[4]。SR蛋白结合的RNA序列称为外显子剪接增强子(exonsplicingenhancers,ESEs)。ESEs富含嘌呤,不同的ESEs被不同的SR蛋白结合,ESEs在组成性和选择性剪接中发挥始动作用。3.2信号传导途径调节选择性剪接SR蛋白在选择性剪接中的活性能被核前体mR2NA结合蛋白hnRNPA/B家族的成员拮抗。p382MAP激酶途径使hnRNPA1磷酸化并使其进入胞浆。核内hnRNPA1与SR蛋白之间比值下降影响选择性位点的选择。因此,信号传导途径可通过影响剪接因子亚细胞定位而进行选择性剪接的调节[5]。另外,SR蛋白和其他的具有RS结构域蛋白包括U2AF的65kD亚基和U1的70kD亚基的活性对磷酸化比较敏感,它们在剪接体组装中发挥重要作用[4]。通过PKG2I(cGMP2dependentproteinkinase2I)SF1磷酸化,调节其与U2AF65kD亚基的相互作用[6]。3.3PTB调节选择性剪接选择性剪接还可通过剪接蛋白与多聚嘧啶束竞争性结合而调节剪接。在研究平滑肌A2原肌球蛋白(A2TM)和A2肌动蛋白特异性剪接时发现它们的剪接受多聚嘧啶束结合蛋白(polyrimi2dinetractbindingprotein,PTB)和CUG重复结合蛋白(CUGrepeatbindingprotein,CUG2BP)家族成员调节。以前的研究表明PTB常与U2AF65kD亚基竞争结合多聚嘧啶束抑制剪接(如:外显子遗漏)。但是,PTB有3种异构形式,而通常只分析PTB1。令人惊讶的是PTB1在平滑肌中高表达促使TM含有其应缺失的外显子3,而PTB2和PTB4促使其遗漏。这是基因特异性,因为所有的PTB异构体均促使A2肌动蛋白外显子遗漏。但是,CUG2BP和相关蛋白Etr23对不相容的肌动蛋白的外显子有相反的作用。成纤维细胞生长因子受体2外显子Ób和Óc选择性剪接也受PTB的调节。所有的PTB异构体均可与外显子Ób上游的内含子抑制元件结合,并抑制外显子Ób的剪接[7]。3.4hnRNP调节选择性剪接hnRNP参与剪接位点的选择。例如:SV40病毒的T抗原和t抗原由同一个前体mRNA利用选择性的5css而产生,SR蛋白可变剪接因子(SRproteinalternativesplicingfactor,ASForSF2)过量促使利用近侧的剪接位置。后来这种现象在其他RNAs和SR蛋白中也观察到,人们并试图解释这种现象。在一定的ASF/SF2浓度下U1snRNP只与功能较强的剪接位置结合。因此尽管弱的5css与3css临近也是不能被选择剪接。高浓度的ASF/SF2促使U1snRNP结合所有可能的5css,在这种条件下与3css临近的5css被选择。而hnRNPA1可)272)5生命的化学62001年21卷4期以拮抗SR蛋白的这种作用,导致远侧5css选择的变动。hnRNPA1的这种效应分子机制和其是否与RNA的组装相关目前还不清楚。但可以肯定ASF/SF2与临近的剪接位置结合可以被hnRNPA1阻断。hnRNPA1与一些外显子剪接沉默子(exonsplicingsi2lencers,ESS)结合可阻止利用相近的3css剪接位置。hnRNPA1通过跳跃一个被hnRNPA1包围的外显子调节自身的前体mRNA的剪接[8]。3.5多因素调节选择性剪接hnRNP蛋白与剪接因子之间简单的拮抗作用只是代表了选择性剪接基本机制。实际上组织细胞特异性剪接是由多种因子和调节子通过极其复杂的相互作用而实现的。例如:在哺乳动物神经元中Src基因成熟的mRNA包括18个外显子。至少有6个不同的RNA序列在外显子跳跃或包含过程中具有分割效应。在非神经元细胞中短的外显子的长度和嵌合在外显子中的PTB结合位点对于外显子的跳跃起着非常重要的作用。内含子剪接增强子(intronicsplicingenchancer,ISE)被复合物结合促使神经元细胞中成熟的mRNA包含一个小的外显子。这个复合物由hnRNP蛋白(H和F)和一种含有KH结构域的因子(KH2do2main2containingfactor,KSRP)组成。尽管这些组成成分并不是神经元特异蛋白,但是在神经元细胞的抽提物中与ISE交叉联结却是增加的,表明这种复合物在不同的细胞类型中的稳定性不同从而对RNA进行选择性剪接[9]。当不同的RNA加工过程相互影响时,剪接机制就更复杂。例如:一个特定的mR2NA前体,在甲状腺中编码甲状腺降钙素,而在神经元细胞中形成一种神经多肽即降钙素基因相关肽(calcitonin2gene2relatedpeptide,CGRP),这也是通过选择性剪接而实现的。这个mRNA前体经加工在许多细胞中有外显子4并进行多聚腺苷酰化,而在神经元中外显子4跳跃。在外显子4的下游有一个类似于/零长度0(/zero2length0)外显子(即3css后紧跟一个5css)的ISE。剪接因子与ISE结合阻止外显子4多聚腺苷酰化,导致外显子4跳跃。PTB与ISE元件结合阻止剪接因子在此组装,有利于外显子4多聚腺苷酰化[10]。4.mRNA由上所述可以推测,剪接因子和hnRNP之间的相对浓度及稳定性,可以影响多种RNA的剪接位点的选择及许多基因的细胞特异性剪接。在某些疾病中,它们的比值有可能倒置。目前已发现,某些疾病与mRNA选择性剪接有关。例如:CD44基因编码一种细胞粘附分子,其参与肿瘤细胞的迁移。在肿瘤进展期SR蛋白水平发生变化,并与CD44基因的成熟mRNA含有盒式外显子有关[11]。又如:在DM基因mRNA3c端非翻译区CUG重复数目的增加,将导致进行性肌营养不良。随CUG数目的变化而变化结合于CUG的hn2RNP蛋白,也可能改变其他某些基因的剪接,因此可以解释一些相关的病理变化[12]。5.选择性剪接在增加蛋白质多态性和基因在不同时空表达发挥不同的功能中发挥重要功能。现在一些生物的基因组测序已基本完成,可对其基因数目进行预测,例如:线虫、果蝇及人类的基因数分别为19000、14000和35000,可见生物的复杂程度与基因数目无关。对选择性剪接的研究必有助于阐明细胞、组织和发育的不同阶段基因等表达的调节和生命本质。[1]Lander,ESetal.Nature,2001,409:860)912[2]ScheiffelePetal.Cell,2000,101,657)669[3]MooreMJNatStructBiol,2000,7:14)16[4]TackeRetal.CurrOpinCellBio,1999,358)362[5]VanderHouvenvanOordtWetal.JCellBio,1999,149,307)316[6]WangXetal.EMBOJ,1999,18,4549)4559[7]CarstensRPetal.MolCellsBiol,2000,20,7388)7400[8]DelGatto2KonczakFetal.MolCellBiol,1999,19,251)260[9]ModafferiEFRNA,1999,5,687)706[10]LouHetal.MolCellBiol,1999,19,78)80[11]StickelerEetal.Oncogene,1999,18,357