示例生物信息学分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

目录1序列信息提取..................................................................................................................................................................................................22GeneOntology(GO)功能注释............................................................................................................................................................22.1序列比对(BLAST).............................................................................................................................................................................22.2GO功能条目提取(Mapping).......................................................................................................................................................22.3功能注释(Annotation)...................................................................................................................................................................32.4补充注释(Annotationaugmentation).....................................................................................................................................32.5GO功能注释统计..................................................................................................................................................................................33KEGG通路注释...............................................................................................................................................................................................4References................................................................................................................................................................................................................611序列信息提取原始数据中质谱鉴定到的无冗余蛋白质共计45个,所鉴定到的蛋白质序列信息批量提取自NCBI数据库,其中8个蛋白信息已从数据库中删除,共计提取到37个蛋白的序列信息,以FASTA格式保存(sequence.fasta)。2GeneOntology(GO)功能注释基因本体(GeneOntology)是一个标准化的基因功能分类体系,提供了一套动态更新的标准化词汇表,并以此从三个方面描述生物体中基因和基因产物的属性:参与的生物过程(BiologicalProcess),分子功能(MolecularFunction)和细胞组分(CellularComponent)1。2.1序列比对(BLAST)我们利用本地化序列比对软件NCBIBLAST+(ncbi-blast-2.2.28+-win32.ext)将鉴定到的蛋白质与NCBInr数据库中的蛋白质序列进行比对。根据相似性原理,所得的同源蛋白的功能信息可以用于目标蛋白的功能注释。我们仅保留排名前10条且E-value≤1e-3的比对序列进行后续的分析(GO.xlsx表中sheetTopBlastHits)。所得的比对相似性范围为61-100%,其中大部分目标蛋白序列的比对相似性为96%或以上(图1)。图1序列比对相似性分布2.2GO功能条目提取(Mapping)BlastGO2是一个用于基因/蛋白质功能注释和数据分析的应用软件。我们利用Blast2GO(Version2.7.2)中的Mapping功能对所有鉴定到的蛋白的比对序列所关联的GO功能条目进行提取,共提取到与其中34个鉴定到的蛋白序列(91.9%)相关的164条GO功能条目。22.3功能注释(Annotation)在功能注释(Annotation)过程中,Blast2GO通过综合考量目标序列和比对序列的相似性、GO条目来源的可靠度,以及GO有向无环图的结构,将Mapping过程中提取的GO功能条目中符合条件的条目注释给目标蛋白。本项目中,共33条蛋白序列被103条GO功能条目注释,平均GO层次为6.243(图2)。图2GO层次分布P:BiologicalProcess,F:MolecularFunction,C:CellularComponents2.4补充注释(Annotationaugmentation)功能注释(Annotation)过程中,对于有比对序列却没有注释信息的目标蛋白序列,我们适当放宽了注释条件,使更多的目标蛋白序列可以获得功能注释信息。对于剩余的其他通过序列比对仍然无法获得注释信息的目标蛋白序列,以及没有比对序列的目标蛋白序列,我们通过InterProScan3在EBI数据库中搜索匹配的保守蛋白质motif,并将motif的功能注释信息注释给目标蛋白序列。之后我们利用Blast2GO中的ANNEX模块对注释信息进行了进一步的补充,并在不同GO类别之间建立联系,提高注释的准确性。经过补充注释,最终的注释统计结果为:共35条蛋白序列被135条GO功能条目注释。2.5GO功能注释统计GO功能注释结果统计见GO.xlsx,包括protein2GO,GO2protein,GOLevel2等信息(图3)。3图3GOlevel2统计3KEGG通路注释在生物体中,蛋白质并不独立行使其功能,而是不同蛋白质相互协调完成一系列生化反应以行使其生物学功能。因此,通路分析有助于更系统、全面地了解细胞的生物学过程、性状或疾病的发生机理、药物作用机制,等等。KEGG4是常用于通路研究的数据库之一。我们针对挑选出的差异表达蛋白质进行KEGG通路注释,分析并确定差异表达蛋白质参与的最主要的代谢和信号转导途径。我们利用KAAS(KEGGAutomaticAnnotationServer)将目标蛋白序列与KEGGGENES数据库中的Insects蛋白序列进行比对,通过同源/相似蛋白的KO号注释到相关KEGG通路上。本项目中,我们共提取到与26个差异蛋白序相关的70条KEGG信号/代谢通路。统计结果见kegg.xlsx,所有注释通路图保存在map文件夹中,图中差异蛋白质以绿色高亮标注(图4)。4图4KEGG信号通路注释示例5References1.Ashburner,M.,etal.,Geneontology:toolfortheunificationofbiology.TheGeneOntologyConsortium.NatGenet,2000.25(1):p.25-9.2.Gotz,S.,etal.,High-throughputfunctionalannotationanddataminingwiththeBlast2GOsuite.NucleicAcidsRes,2008.36(10):p.3420-35.3.Quevillon,E.,etal.,InterProScan:proteindomainsidentifier.NucleicAcidsRes,2005.33(WebServerissue):p.W116-20.4.Kanehisa,M.,etal.,KEGGforintegrationandinterpretationoflarge-scalemoleculardatasets.NucleicAcidsRes,2012.40(Databaseissue):p.D109-14.6

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功