生物信息学-第6章-表达序列标签

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第6章表达序列标签ExpressedSequenceTags(EST)一、表达序列与表达序列标签什么是表达序列?基因组表达为mRNA的序列中心法则EST的获得技术路线克隆区域5‘测序位置3’测序位置表达序列标签(expressedsequencetag,EST)从已建好的cDNA库中随机取出一个克隆,从5′末端或3′末端对插入的cDNA片段进行一轮单向自动测序,所获得的约60-500bp的一段cDNA序列。一、表达序列标签二、EST数据分析方法随机挑取克隆进行5′或3′端测序序列前处理聚类和拼接基因注释及功能分类后续分析去除低质量的序列(如使用Phred)应用BLAST、RepeatMasker或Crossmatch屏蔽数据组中不属于表达的基因的赝象序列(artifactualsequences)●载体序列()●重复序列(RepBase,)●污染序列(如核糖体RNA、细菌或其他物种的基因组DNA等)去除其中的嵌合克隆(一)序列前处理EST数据预处理流程聚类目的:将来自同一个基因或同一个转录本的具有重叠部分(over-lapping)的ESTs整合至单一的簇(cluster)中聚类作用:●产生较长的一致性序列(contigs),用于注释●降低数据的冗余,纠正错误数据。●可以用于检测选择性剪切。(二)ESTs的聚类(三)序列注释和分析序列注释后续分析三、EST的用途基因识别基因表达谱的构建发现新基因SNP(singlenucleotidepolymorphism)发现电子PCR克隆(一)ESTs与基因识别在同一物种中搜寻基因家族的新成员(paralogs)在不同物种间搜寻功能相同的基因(orthologs)已知基因的不同剪切模式的搜寻使用合适的比对参数,大于90%的已经注释的基因都能在EST库中检测到。(二)ESTs与基因表达谱的构建表达量比较分析:不同组织或发育阶段基因表达量比较EST来源于不同的组织,那么就可以对不同来源的基因表达进行比较(三)ESTs与新基因预测由于EST来源于cDNA,因此每一条EST均代表了文库建立时所采样品特定发育时期和生理状态下的一个基因的部分序列。(四)ESTs与SNP位点预测来自不同个体的冗余的ESTs可用于发现基因组中转录区域存在的SNPs。应注意区别真正的SNPs和由于测序错误而引起的本身不存在的SNPs。解决这一问题可以通过:●提高ESTs分析的准确性。●对所发现的SNPs进行实验验证。(五)电子PCR克隆电子PCR克隆,指利用已经有的片段进行全长基因序列的分析。5353四、EST数据的不足ESTs很短,没有给出完整的表达序列;低丰度表达基因不易获得;由于只是一轮测序结果,出错率达2%~5%;有时有载体序列和核外mRNA来源的cDNA污染或是基因组DNA的污染;有时出现镶嵌克隆;序列的冗余,导致所需要处理的数据量很大。五、常用的EST数据库数据库名称网址说明dbEST综合UniGene综合GeneIndices综合(一)dbEST(databaseofEST)Genbank的一部分63,236,621条数据(20091016)描述:向dbEST提交数据按格式编辑数据通过E-mail提交更新数据(二)UniGene数据库Genbank的一部分一条纪录为一个genecluster简介(三)GeneIndices数据库TheInstituteofGenomicResearchDatabase中的一个子库简介数据构成42类动物47类植物15类原生生物10类真菌

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功