第十章.基因功能的研究方法(一)一、计算机预测基因功能二、实验确认基因功能1.基因失活是功能分析的主要手段1.1基因敲除(Geneknock-out)1.2基因敲除的技术路线1.3基因敲除的主要应用领域及国内外研究进展1.4基因失活的表型效应有时不易分辨2.转座子突变库的构建2.1插入序列2.2实验步骤3.内含子归巢突变4.基因的超表达用于功能检测5.反义RNA5.1反义RNA的分类和作用机制5.2ticRNA(transcriptioninhibitorycomplementaryRNA)5.3反义RNA的功能5.3.1调控细菌基因的表达5.3.2噬菌体溶菌/溶源状态的控制5.3.3IS10转位作用的抑制5.4人工合成构建反义RNA5.5使反义RNA分子稳定的方法三、其他的基因功能研究方法1.噬菌体展示(phagedisplay)2.酵母双杂交(yeasttwo-hybridization)2.1概念2.2实验步骤2.3利用酵母双杂交发现新的蛋白质和蛋白质的新功能2.4利用酵母双杂交在细胞体内研究抗原和抗体的相互作用2.5利用酵母双杂交筛选药物的作用位点以及药物对蛋白质之间相互作用的影响2.6利用酵母双杂交建立基因组蛋白连锁图(GenomeProteinLinkageMap)3.开放读框顺序标签(open-reading-framesequencetags,OSTs)确认DNA顺序中的基因序列后,下一个问题就是探知其功能,这是基因组研究的一个难度很大的领域。一些已完成测序的基因组顺序分析表明,我们所了解的基因组内容比真实的情况少的多。如大肠杆菌与啤酒酵母,在未开始基因组测序前已经完成了大量常规的遗传学分析,当时遗传学家认为这2种生物的大多数基因已经通过突变鉴定,但实际上还有很多空白。大肠杆菌编码蛋白质的4288个基因中,以往知道的只有1853个,仅占43%。至于啤酒酵母,所知更少,仅为30%。一、计算机预测基因功能计算机预测基因功能的依据仍然是同源性比较。同源基因都有1个共同的祖先基因,他们之间有许多相似的顺序。同源基因可以分为2类:种间同源基因或直系基因(orthologousgene)这是指不同物种之间的同源基因,它们来自物种分隔之前的同一祖先。种内同源基因或平行基因(paralogousgene)同一种生物内部的同源基因,它们常常是多基因家族的不同成员,其共同的祖先基因可能存在于物种形成之后,也可能出现于物种形成之前。同源基因一般不会有完全一致的核苷酸顺序,因为这两个基因在出现后独立的发生随机突变,但它们有相似的顺序组成,大部分未突变的核苷酸位置是相同的。当一个新的基因序列被确认后,根据同源性可从数据库中查找已知顺序的同源基因。根据进化的相关性可从已知的同源基因推测新基因的功能。根据同源性预测基因时必需注意以下几点:1.一般认为aa的一致性或相似性在25%以上可视为同源基因;2.同源性与相似性的含义不同,如aa顺序的80%的相似性不能称为同源性。3.一致性常指同一位置同一aa在整个多肽序列中所占的比例,而相似性除一致性aa外还包括可取代aa的成员,因此相似性aa的比例总是高于一致性aa。同源性分析可以给出整个基因或某一区段功能的信息同源查询除了直接比较DNA顺序外,还可将DNA顺序翻译为aa顺序。由于组成蛋白质的aa有20多种,而DNA核苷酸只有4种,因此aa顺序的差异要比核苷酸的差异大的多。以aa顺序进行同源性比较的结果更为准确,也更加可行。已有许多软件可用于这项分析,常用的是BLAST。研究者只要将资料以正确格式的电子邮件发送到DNA资料库BLAST服务站,很快就会得到回音。有时在2个无明显亲缘关系的基因之间会出现局部相似的区段。这种情况表明,2个无亲缘关系的蛋白质可能具有相似的功能,相似的顺序是功能的核心区域。虽然基因本身无共同的祖先,但其功能域却有共同的起源。它们都是古老祖先的后裔,在进化中一方面发生独立突变,另一方面又因基因组重排成为新基因的组成部分。例如信号传导蛋白,这类蛋白质一般都有2个基本的功能域,即接受信号的功能域和传达信号的激酶域。二、实验确认基因功能同源性分析并非万灵药方,对许多新基因的功能分析还必需依赖其他的实验手段进行补充,并将同源性研究的结果进一步外延。如何确定一个基因的功能是基因组计划中最困难的问题之一。大多数分子生物学家认为现有的技术与策略对于从基因组测序所获得的大量未知基因的功能研究是远远不够的。基因的功能是一个过程,是从基因到表型的一系列反应。传统的遗传分析是从表型出发最终到达基因;现在的基因功能研究是从基因出发直接推导表型。因此必须寻找一系列的实验方法来鉴别与目标基因相关的表型。1.基因失活是功能分析的主要手段传统的遗传分析主要借助突变型研究表型变异的遗传基础,利用紫外线诱导及化学试剂处理可使生物群体产生突变个体,也可从自然的群体中发现突变体。经遗传分析将突变基因定位,然后观察这一突变体是否与改变的表型对应。在此基础上采用分子生物学方法进一步分离与克隆目标基因。所谓定位克隆就是根据与突变位点连锁的分子标记,然后通过物理图寻找靶位点。上述传统遗传学分析的原理同样可用来设计从基因到表型的研究。如果我们能找到某种方法,根据待测基因的顺序使生物体内该基因失活,亦可鉴别由此产生的表型变异。1.1基因敲除(Geneknock-out)概念:基因敲除除可中止某一基因的表达外,还包括引入新基因及引入定点突变。即可以是用突变基因或其它基因敲除相应的正常基因,也可以用正常基因敲除相应的突变基因。基因敲除是80年代后半期应用DNA同源重组原理发展起来的一门新技术。80年代初,胚胎干细胞(ES细胞)分离和体外培养的成功奠定了基因敲除的技术基础。1985年,首次证实的哺乳动物细胞中同源重组的存在奠定了基因敲除的理论基础。到1987年,Thompsson首次建立了完整的ES细胞基因敲除的小鼠模型。此后的几年中,基因敲除技术得到了进一步的发展和完善。1.2基因敲除的技术路线如下:①构建重组基因载体;②用电穿孔、显微注射等方法把重组DNA转入受体细胞核内;③用选择培养基筛选已击中的细胞;④将击中细胞转入胚胎使其生长成为转基因动物,对转基因动物进行形态观察及分子生物学检测。Note:基因敲除的靶细胞目前最常用的是小鼠ES细胞。基因敲除的技术路线虽不复杂,但由于高等真核细胞内外源DNA与靶细胞DNA序列自然发生同源重组的机率非常低,约为百万分之一,要把基因敲除成功的细胞筛选出来是一件非常困难的工作。因此,同源重组的筛选和检测就成了基因敲除技术所要解决的关键问题。目前已有多种筛选方法,其中1988年犹它大学的Capecchi教授的研究组发展的正负双向选择系统适用范围宽且效率较高。1.3基因敲除主要应用领域及国内外研究进展基因敲除的应用领域主要有:①建立人类疾病的转基因动物模型,为医学研究提供材料;②改造动物基因型,鉴定新基因和/或其新功能;③治疗遗传病;④改造生物、培育新的生物品种。ES细胞基因敲除途径建立转基因小鼠技术的成熟,首次使体外精细的基因操作与小鼠的整个生长发育和生命过程得到了直接的结合,为探讨高等动物基因组结构和功能提供了有效的方法。由基因敲除技术产生出的特殊小鼠已经对哺乳类生物学的各领域,包括发育生物学、癌生物学、免疫学、神经生物学和人类遗传学产生了极大影响。理论上,基因敲除可适用于任何能产生ES细胞的物种,将来可在小鼠基因敲除成熟的基础上开展其它实验动物的基因敲除工作。①建立人类疾病的转基因动物模型,为医学研究提供材料基因敲除小鼠是研究疾病的发生机理、分子基础及诊断治疗的重要实验材料。如1989年囊性纤维化病(CF)的致病基因(CFTR)被成功地克隆;1992年成功建立了CFTR基因的基因敲除的CF小鼠模型,为CF基因治疗提供了很好的动物模型,得以顺利通过了基因治疗的动物试验;于1993年开始临床试验并获得成功。②改造动物基因型,鉴定新基因和/或其新功能,研究发育生物学深入研究基因敲除小鼠在胚胎发育及生命各期的表现,可以得到详细的有关该基因在生长发育中的作用,为研究基因的功能和生物效应提供模式。例如,目前人类基因组研究多由新基因序列的筛选检测入手,进而用基因敲除法在小鼠上观察该基因缺失引起的表型变化。目前已报道了多种学习、记忆以及LTP、LTD有缺陷的基因敲除动物,发现多种基因在学习、记忆的形成过程中必不可少。③治疗遗传病这包括去除多余基因或修饰改造原有异常基因以达到治疗的目的。③改造生物、培育新的生物品种细菌的基因工程技术是本世纪分子生物学史上的一个重大突破,而基因敲除技术则可能是遗传工程中的另一重大飞跃。这项新技术在基础理论研究及实际应用中都将有着广阔的应用前景。1.4基因失活的表型效应有时不易分辨通过上述种种方法得到的携带失活基因的品系与个体后,下一步工作就是检测突变体表型以便指认未知基因的具体功能。这一步也会遇到难题,生物表型范畴很广。即使单细胞的酵母,要确认一个未知基因对表型的贡献,也可列出很长的一串名单。至于高等生物,因其某些表型具有难以捉摸的综合性,区分其准确的功能更加棘手。2.转座子突变库构建转座子标签法又称基因标签(genetagging),通过构建插入突变库系统,分离与克隆功能基因与调控顺序。这一策略主要依据以下技术:植物体细胞全能性;已经建立了一套成熟的转基因系统,使外源基因在转基因植株中成功表达。植物中有许多转座子系统,它们的转座机制已经清楚,通过转座子的随机插入可获得大量的突变型,根据插入的转座子序列合成探针,可分离被破坏的位点,并分析它们的组成。转座子可以发生回复突变,从插入的座位脱离,使突变系重现野生型表型。目前应用的最成功的是玉米的Ac-Ds转座因子系统。基因标签突变库的工作原理如下:玉米色粒调控元件Ac-Ds系统:第9染色体C基因:色素合成基因。Ac基因:自主移动的调节因子,4.5kb,5个exon,编码转座酶。Ds基因:非自主移动的受体因子,0.5-4.0kb,与Ac有同源序列,插入引起色素不能合成。2.1插入序列(insertionsequence,IS)仅含有转座酶基因的简单转移序列。长度多在700-1500bp左右。由末端反向重复序列(IR),转座酶基因组成。插入基因组中时,在靶位上生成正向重复序列(DR)常见的IS结构。IS长度末端IR靶位DR插入选择IS1768239随机IS213274195热点IS4142818(12)AAAN20TTTIS51195164热点IS101329229TNAGCNIS50153199热点2.2实验步骤将Ac因子转座酶的编码基因与组成型启动子如35S构建成嵌合基因表达载体,由于除去了转座因子两侧的反向重复顺序,转座酶的编码基因不能自我转座。这一表达载体转化细胞获得的再生植株为A(sAc)。外显子捕获载体构建:在转座子的边界顺序与标记基因之间插入内含子剪接受体顺序,将它们转化细胞获得再生植株B。③将植株A和植株B杂交,在转座酶的作用下来自植株B的转座子可以切离与转座。当它们插入到某一外显子中时,基因转录加工后可能获得含正确读框的mRNA。根据突变表型与标记基因的共分离筛选转化无性系,通过自交可得到纯合的不含转座酶基因的插入突变系。④增强子捕获载体将核心启动子TATA盒框与标记基因编码顺序连接,然后在其两侧安装转座子边界,转化细胞获得再生植株C。将植株A与植株C杂交,在转座酶的作用下来自植株C的转座子可以转移到增强子下游启动标记基因表达。采取类似4的方法分离纯合的插入突变系,进一步检测增强子的组织特异性表达场所。上述方法用于拟南芥的基因打靶(genetargeting)取得了很好的效果,并已应用于水稻,玉米等作物的功能基因分离。但它们也有2点不利之处:①插入突变往往是隐性的,必须建立自交的F2代群体才能找到突变株系;②植物基因组有大量的冗沉基因,它们可取代突变基因的功能,很多突变的效果不易鉴定。改进方法为采用功能增益突变路