1解读基因组序列2在基因组序列中定位基因通过序列筛查定位基因基因并非是核苷酸的随机排列,而是具有明显特征。这些特征决定了一段序列是否是一个基因,而非编码DNA不具备这样的特征。开放阅读框[openreadingframe,0RF]是结构基因的正常核苷酸序列,从起始密码子(ATG)到终止密码子(TAA、TGA或TAG)的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。双链DNA分子有6个阅读框,每条链都按5’到3’的方向阅读,根据起始核苷酸不同,每条链有3个可读框。3•成功寻找ORF的关键在于终止子在DNA序列中出现的频率。•在随机DNA序列中,每个终止子出现的频率将平均每43=64bp出现一次。随机排列的DNA不会有许多长度超过50个密码子的ORF,而实际上,大多数基因长度大于50个密码子。大肠杆菌基因平均长度:317个密码子酿酒酵母基因平均长度:483个密码子人类基因平均长度:450个密码子•最简单的ORF扫描方式是将100个密码子作为假定基因长度的下限,并记录所有大于此值的ORF。4ORF扫描是细菌基因组基因定位的有效方法。此序列包含2个真基因—lacZ和lacY,用直线表示。真基因比假ORF(波浪线)长得多。5单一ORF扫描对高等真核生物DNA效果不佳•真核生物基因之间有较大的间隔区,假ORF出现的可能性增大。•真核生物的基因存在内含子,在基因DNA序列中没有连续的ORF。将阅读框和内含子一起连续扫描往往会造成ORF提前终止。6内含子使ORF扫描复杂化图示含一个内含子的短基因的核苷酸序列,紧邻其下的氨基酸序列是正确的翻译,其中内含子被去除,氨基酸序列被分为两部分。再下面一行是不考虑内含子而得到的翻译序列,结果氨基酸序列在内含子中出现了终止。7•三项改良1、密码子偏倚生物有时更加偏爱地使用一个或者一组密码子的现象。这是在进化过程中基因复制的差异所产生的结果。如人类基因中,亮氨酸大多被CUG编码,缬氨酸多由GUG编码。82、外显子-内含子边界外显子/内含子边界符合的GT-AG规则3、上游调控序列9基因定位的实验技术•种属间印记相关生物的同源基因有相似序列而非编码DNA通常差异很大。如果一个物种的DNA片段与相关物种DNA有同源性,即表明此段DNA含有一个基因。11重物玻璃板吸水纸滤纸NC滤膜凝胶滤纸支持物转移缓冲液图虹吸法转膜装置示意图12准确定位外显子-内含子边界外显子捕获用于确定基因组DNA表达区域的一项技术。将拟检测基因组序列克隆在特异性表达载体所含两个外显子之间的一个内含子中进行表达。如果该基因组片段中包含有一个外显子,表达产生的信使核糖核酸(mRNA)长短会发生变化,能够被检测出来。13确定单个基因的功能利用计算机分析基因的功能同源性搜索的基础是相关基因有相似的序列,因此可以通过与其他物种中已知序列的相关基因进行序列相似性比较来发现新基因。同源性反映了进化关系:同源基因有共同的进化祖先,基因之间序列相似。直源基因(orthologousgene):不同种属生物间的同源基因旁源基因(paralogousgene):存在于同种生物中,常是多基因家族的成员14同源分析可以提供整个基因或基因片段的功能信息两个核苷酸序列有76%相同,用星号表示,可以作为序列同源的证据。然而,当翻译成氨基酸序列时,只有28%相同,说明核苷酸水平的相似性是偶然的。通常同源性搜索前先将核苷酸序列转换成氨基酸序列。15Tudor结构域果蝇tudor蛋白的结构含有10个拷贝的tudor结构域。此结构域也存在于果蝇homeless蛋白和人A-激酶锚定蛋白中,除含有tudor结构域外,这些蛋白并不相似,但每种蛋白活性都与RNA有关。16同源性分析中酵母基因组计划中的应用已鉴定的基因通过同源性分析鉴定的基因可疑的阅读框单一孤儿基因孤儿家族未确定的成员17通过实验分析确定基因功能•通过基因失活进行功能分析•同源重组可以灭活特定基因表型基因型目的基因的染色体DNA与载体携带的破坏基因重组,结果目的基因失活。18缺失框包括抗性基因和其前面在酵母中表达所需的启动子序列以及两侧的限制性位点。目的基因的首尾两侧插入限制性位点中,将载体导入酵母细胞中。载体上的基因片段与染色体目的基因之间重组,使后者失活。发生基因破坏的细胞可以鉴定,因为它们表达抗生素抗性基因,可以在含抗生素的琼脂糖培养基中生长。缺失框19基因敲除小鼠20非同源重组的基因失活转座子标记(transposontagging):利用转座元件插入目的基因使其失活使用重组DNA技术将一种可被半乳糖诱导的启动子序列装入酵母基因组Tyl元件上游。当半乳糖缺乏时,Tyl元件不被转录而保持沉默。当细胞被转移到含有半乳糖的培养基上,启动子被激活,Tyl元件被转录以起动转座过程。21RNA干扰(RNAinterference)用于目的基因失活与靶基因同源的双链RNA诱导的特异转录后基因沉默现象。其作用机制是双链RNA被特异的核酸酶降解,产生干扰小RNA(siRNA),这些siRNA与同源的靶RNA互补结合,特异性酶降解靶RNA,从而抑制、下调基因表达。22基因过表达也可用来研究基因功能对载体的要求:1、松弛型载体;2、具有高活性启动子通过基因过表达进行功能分析,目的是确定过表达的基因对转基因小鼠表型是否有影响。因此将目的基因cDNA插入带有高活性启动子的载体中,此启动子指导复制目的基因在小鼠肝细胞中表达。23基因功能的深入研究定点诱变可以用来探索基因的具体功能