内含子Contens基本概念内含子的发现内含子的分类内含子的功能内含子的展望内含子(introns)断裂基因(splitgene)外显子(exons)真核生物的结构基因的DNA序列由编码序列和非编码序列两部分组成,编码序列是不连续的,被非编码序列分割开来,称为断裂基因。真核生物细胞DNA中的间插序列。在成熟mRNA中保留下来的基因部分被称为外显子。一.基本概念二.内含子的发现1.法国科学家Chambon的试验输卵管红细胞(卵清蛋白、卵粘蛋白和伴清蛋白)(血红蛋白)分别用酶(EcoR1和HindIII)切成几段卵清蛋白mRNA来制备cDNA探针和以上两片进行southern杂交cDNA序列内并没有EcoRI和HindIII的切点,为什么会出现多条阳性带基因表达不同,但DNA的结构没有差异走电泳2.RichardJ.Roberts、PhillipA.Sharp的试验限制性内切酶EcoRI和HindIII分别消解腺病毒(Hexon)的DNA最大的酶切片段DNA和Hexon的mRNA进行杂交在电镜下可以观察到EcoRI酶切的A片段的3'段可以和上述mRNA形成杂合双链,但在杂合双链的5'端逸出3个单链DNA环,说明它们不能和mRNA完全互补。解释:Hexon基因5'端出现了断裂,即有些区域在mRNA中已被删除了,所以出现了不配对的单链环,而HindIII酶切的A片段是Hexon的3'段区域,不含有这一断裂区域,故不出现单链环。1977年继Sharp和Roberts后相继发现了兔子的b珠蛋白基因(Jeffregs.A.J和R.A.Flavell1977)、鼠的b珠蛋白基因(LederP1978)和卵清蛋白基因(Chamber1977)等的断裂基因。1978年Gilbort创用了内含子(intron)和外显子(exon)两个名词,内含子是指在成熟的mRNA中不出现的序列,exon是指在成熟的mRNA中出现的编码序列。内含子起源有两种假说1.早期内含子理论:内含子与它所在的基因一样古老,在装配第一个这样的基因时,内含子就已存在。2.晚期内含子理论:内含子不是基因原有的,而是在进化的某一过程中通过转座作用插入到连续基因中去的,内含子在较高级的功能基因或在真核生物出现之后才产生。三.内含子的分类根据剪接过程为自发还是要经过剪接体的加工,人们将内含子分为自剪接内含子和剪接体内含子。类型分布GU-AG内含子真核生物细胞核前体mRNAAU-AC内含子真核生物细胞核前体mRNAI型(GroupⅠ)内含子真核生物细胞核前体rRNA细胞器RNA,少数细菌RNAII型(GroupⅡ)内含子细胞器RNA,某些原核RNAIII型(GroupⅢ)内含子细胞器RNA双内含子(Twintron)细胞器RNA前体tRNA内含子真核生物细胞核前体tRNA古细菌内含子不同的RNAⅠ型内含子及其剪接机制1980年代初,发现原生动物四膜虫(Tetruhymenu)的rRNA内含子能够自我剪接(selfsplicing),这一类内含子后被称作Ⅰ型内含子.后来在酵母菌的线粒体rRNA基因中也含有此类内含子.分布:Ⅰ类内含子常分布于低等真核生物的细胞器中,如四膜虫的rRNA;大部分真菌如酵母的mtDNA;植物叶绿体基因的内含子;T4噬菌体的3个基因中也存在Ⅰ类内含子1980年,科学家将四膜虫rRNA基因克隆到质粒中,并与大肠杆菌(E.coli)的RNA聚合酶一起保温,发现转录产物除了有约400nt的rRNA内含子外,还有一些小片段。从凝胶中回收rRNA前体,在无蛋白质的条件下保温培养,单一的rRNA前体依然可形成片段更小的电泳条带,其中移动最快的是39nt的条带,测序发现,它相当于413nt的rRNA内含子中的片段。将四膜虫26SrRNA基因的一部分(第l个外显子303bp+完整的内含子413bp+第2个外显子624bp)克隆到含噬菌体SP6启动子的载体内,再转录该重组质粒,将获得的产物与GTP一起保温,可以得到剪接产物,但缺乏GTP时无剪接反应,证明rRNA前体的确可以进行有GTP参与的自我剪接。发现过程:Ⅰ类内含子的剪接机制自剪接(self-splicing)反应,通过3次连续的转酯反应完成。只是磷酸酯键的直接转移,没有水解,不需能量。第一次转酯反应:是由一个游离的鸟苷或鸟苷酸(GMP,GDP或GTP)启动的。鸟苷酸或鸟苷的3'-OH亲核攻击内含子5'-端剪接点的磷酸二酯键,将G转移到内含子的5'-端,同时切割内含子与上游外显子之间的磷酸二酯键,在上游外显子末端产生新的3'-OH。第二次转酯反应:上游外显子3'-OH攻击内含子3'-端剪接点的磷酸二酯键,将上游外显子和下游外显子连接起来,并释放线性的内含子。两次转酯反应是连续的,即外显子连接和线性内含子的释放同时进行。因此,实验不能得到游离的上游外显子和下游外显子。第三次转酯反应:是线性内含子的环化,发生在已切除的内含子片段中,内含子的3‘-OH攻击其5’-端附近的第15和第16核苷酸之间的磷酸二酯键,形成环状RNA,环状RNA随即又被切割生成线状RNA。II型内含子及其剪接机制II型内含子主要存在于某些真核生物的线粒体和叶绿体rRNA基因中,也具有催化功能,能够完成自我剪接.分布:在酵母mtRNA,细胞色素氧化酶的a亚基、b亚基,玉米mtRNA、tRNA以及真核mRNA前体中。Ⅱ类内含子的剪接和Ⅰ类内含子不同,II型内含子是由内含子靠近3'-端的腺苷酸2'-羟基攻击5'-磷酸基启动剪接过程,经过两次转酯反应连接两个外显子,并切除形成套索结构的内含子在II型内含子剪接过程中,首先由内含子靠近3'-端d6结构中的分支点保守序列上A的2'-OH向5'-剪接位点的磷酸二酯键发动亲核攻击,形成外显子1的3'-OH,内含子5'-端的磷酸基与分支点A的2'-OH基形成2',5'-磷酸二酯键,产生套索结构,完成第一次转酯反应。接着,外显子1的3'-OH亲核攻击3'-剪接位点,切断3'-剪接位点的磷酸二酯键,并形成外显子1与外显子2之间的3',5'-磷酸二酯键,完成第二次转酯反应。经过两次转酯反应,两个外显子被连接在一起,并释放含有套索结构的内含子。四.内含子的功能Gilbort(1978年)指出:断裂基因的存在可能有两种意义:(1)有利于储存较多的遗传信息,如SV40的T和t蛋白;(2)有利于变异和进化,若在交界序列处发生突变,就可能影响正常的剪切方式从而使蛋白的结构发生较大的变化。1.有的内含子可编码内切酶酵母的细胞色素b基因含有3个外显子(417bp,14bp和100bp)和两个内含子(765bp和1240bp)。酵母w蛋白内含子的归巢(Homing)。2.内含子对基因表达的调控2.1正调控例子三水稻OsBP-73基因的启动子序列驱动GUS基因在转基因水稻中表达时,需要基因内含子的参与,内含子序列具有增强基因表达的作用,但该内含子序列自身并不具备启动子活性。例子二人的β_globin基因是一个高度依赖内含子的基因,在缺乏剪接时,其成熟mRNA的量以及翻译的利用率显著下降。例子四猪的MyHC(MyosinHeavyChain)基因内含子中还有一个重要的调控元件,可以调控转录的起始增强基因的表达。例子一谢先芝等发现番茄蛋白酶抑制剂Ⅱ基因的内含子TPI对报告基因gusA表达活性具有明显的增强效应。2.2负调控Bornstein等在研究人胶原蛋白A基因的表达调控时发现第一个内含子内有一段274bp的反向重复序列A274可阻碍基因的转录,A274的作用具有方向性,仅当其3’端处于胶原蛋白基因启动子下游时才表现阻碍,对胶原蛋白基因的启动子引入突变后,A274这一阻碍作用消失了。2.3双向调控人血小板生成素(TPO)基因的内含子Ⅰ中存在7个非生理性起始密码子,干扰了核糖体对TPOmRNA生理性AUG的识别,抑制了TPO的有效翻译,因此在正常生理情况下,TPO的表达总是低水平。宁云山等的研究发现,人TPO基因组中内含子Ⅴ能显著增强TPO的表达水平,提示其可能含有特殊的序列结构,以应答当机体在受到一些外界刺激需要提高TPO的表达水平时,其在转录和翻译水平上提高TPO的表达量,以适应机体的需要。3.提高进化速率内含子增加了基因的长度,提高了基因间的重组频率。重组易发生在外显子之间的内含子之中,这样可形成蛋白结构域的新组合,而减少在外显子上发生重组,若发生这样的重组可能导致蛋白质功能的破坏,内含子的存在提高了有效重组。蛋白质的三维结构与内含子和外显子的分布有密切的相关性。在进化中,外显子是稳定的,内含子的序列和长度是迅速随机突变的。由于在内含子的存在在保留原有蛋白的同时,可产生一种新的蛋白,具有进化优势。王宁等(1999)认为内含子序列像外显子序列一样可以提供有用的物种进化信息,能够用来进行近亲缘关系物种的进化分析。李利等(2007)利用南江黄羊为研究材料,首次测定出山羊FSHβ基因内含子Ⅰ序列,在NCBI中用BLAST搜索,找到7个其他物种的相应序列,分别用几种方法构建了系统发育树,所得的拓扑结构一致,而且自举检验值都较大(大于63),说明系统发育树的可靠性较高,试验结果反映出物种间的进化关系与传统分类学结果一致。4.在物种进化中的应用相对于外显子,大部分内含子不含有功能元件,所承受的选择压力就比较小,因此内含子序列的变异要多于编码序列,现已有人利用内含子多态性开发分子标记。内含子长度多态性标记就是新近发展起来的分子标记,能够直接反映基因本身的信息,可以应用于基因定位研究(Wang等,2008)。已有研究将内含子长度多态性标记应用于水稻遗传图谱构建、单片段替换系群体构建、种质资源遗传多样性研究和亚洲栽培稻进化的研究(赵向前等,2008;赵建亚等,2009),但是到目前为止,内含子长度多态性标记还未进入大规模开发利用阶段,仅局限于少数几个物种上(Wang等,2008)。有人也在尝试开发内含子单核苷酸多态性标记,但至今未见研究和开发的报道。5.内含子多态性的应用利用内含子独特的序列长度特征,可以提高基因组分析的准确性。①通过分析内含子长度,可以对基因组测序与基因注释的质量进行监控。内含子长度不受三联体密码长度必须为3的整数倍的限制,且3n、3n+1和3n+2三者预期出现的频率相近。因此,当对基因注释的结果进行检验时,假设注释的内含子中3种相位类型的长度分布出现了明显的偏好,则提示内含子注释可能存在较多的错误。②利用内含子的位置在物种间通常较为保守,尤其在近缘物种间表现的更为突出,物种间进化距离越远,同源基因间的序列相似性就越低,可以进行序列比对,能提高序列比对的可靠性(陈兵等,2010)。此外,内含子受到的选择压力比较小,变异程度要高于编码序列,这样在计算中性突变速率时内含子比外显子更加方便(Hoffman等,2007)。6.进行基因组分析尽管转基因技术已经得到广泛的应用,但是如何有效地调控目的基因的表达及目的基因的特异性表达制约着该技术的进一步发展。目前已经有人将内含子引入转基因系统以调控目的基因的表达,房浩霞等(2008)研究表明鸡卵清蛋白基因第1内含子对外源基因在鸡输卵管细胞中的表达具有明显的促进作用。Palmiter等(1991)用转基因小鼠模型进行的试验表明,内含子能提高转基因的高效表达,尤其是第1内含子。水稻5-烯醇丙酮莽草酸-3-磷酸合酶基因的第1内含子能有效地促进外源基因的表达(徐军望等,2003)。7.应用内含子促进外源基因的表达五.内含子的展望目前大量的研究揭示出内含子在转录及基因表达调控中具有重要的生物学功能,具体研究方向为:顺式作用元件通过什么方式调控基因的表达等。内含子是如何剪接的;内含子还有哪些功能;有些内含子含有增强子、启动子或其它顺式调控元件对基因的表达起调控作用;内含子必将成为基因功能和表达研究的一个重要途径。基于对内含子的认识,我们可以利用内含子构建新的转基因表达系统,促进转基因技术的发展;在医学方面,由于有些内含子的错误剪接会引起疾病,我们若是了解了具体机制,还可以治疗一些遗传疾病;随着各种生物测序的完成