生物信息学之软件分析平台

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

生物信息学之软件分析平台报告人:苏晓峰制作:一班E队集体(孟志刚、苗猛猛、孙豹、邹良平、徐明、张怡、苏晓峰、张健飞、王金辉)一、生物信息学生物信息学(Bioinformatics):是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。生物信息学网站内含有丰富的资源,我们这里着重对里面的生物学软件分析平台进行讲解,进入ABC主页后,可在其右侧打开Tools,里面有好多的软件包,在此我们以EMBOSSexplore为例进行演示:EMBOSSexplore的应用1.对输入信息的加工分析2.对基因的分析3.对蛋白质的氨基酸序列性质的分析4.对蛋白质的氨基酸序列或核酸的核苷酸序列的相似性分析5.对蛋白质一级结构的分析6.对蛋白质二级结构的分析7.对蛋白质三级结构的分析8.对蛋白质进行酶学分析9.对多个序列之间进化关系上的分析10.其他软件功能1.对输入信息的加工分析coderet可以把输入的信息进行整合加工,再以更直观的形式表现出来。输入的时候要把其基因的说明信息等都要输入,而不能只输入核苷酸或氨基酸序列,否则只输出序列的个数,没有意义。以NCBI中的NM_000517为例进行操作:•Seqretsplit其可以把一起输入的多个核酸或氨基酸序列进行拆分,便于我们的操作,这样可以节省时间。•Human-HBA_HUMANHemoglobinalpha-Homosapiens(Human).•MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR•Mouse-HBA_MOUSEHemoglobinalpha-Musmusculus(Mouse).•MVLSGEDKSNIKAAWGKIGGHGAEYGAEALERMFASFPTTKTYFPHFDVSHGSAQVKGHGKKVADALASAAGHLDDLPGALSALSDLHAHKLRVDPVNFKLLSHCLLVTLASHHPADFTPAVHASLDKFLASVSTVLTSKYR•Dolphin-HBA_TURTRHemoglobinalpha-Tursiopstruncatus(Atlanticbottle-noseddolphin).•MVLSPADKTNVKGTWSKIGNHSAEYGAEALERMFINFPSTKTYFSHFDLGHGSAQIKGHGKKVADALTKAVGHIDNLPDALSELSDLHAHKLRVDPVNFKLLSHCLLVTLALHLPADFTPSVHASLDKFLASVSTVLTSKYR•Chicken-HBA_CHICKHemoglobinalpha-A-Gallusgallus(Chicken).•MVLSAADKNNVKGIFTKIAGHAEEYGAETLERMFTTYPPTKTYFPHFDLSHGSAQIKGHGKKVVAALIEAANHIDDIAGTLSKLSDLHAHKLRVDPVNFKLLGQCFLVVVAIHHPAALTPEVHASLDKFLCAVGTVLTAKYR•Snake-HBA_DRYCEHemoglobinalpha-A-Drymarchoncoraiserebennus(Texasindigosnake).•MVLTEEDKSRVRAAWGPVSKNAELYGAETLTRLFTAYPATKTYFHHFDLSPGSSNLKTHGKKVIDAITEAVNNLDDVAGALSKLSDLHAQKLRVDPVNFKLLGHCLEVTIAAHNGGPLKPEVILSLDKFLCLVAKTLVSRYR•Frog-HBA1_XENLAHemoglobinsubunitalpha-1-Xenopuslaevis(Africanclawedfrog).•MLLSADDKKHIKAIMPAIAAHGDKFGGEALYRMFIVNPKTKTYFPSFDFHHNSKQISAHGKKVVDALNEASNHLDNIAGSMSKLSDLHAYDLRVDPGNFPLLAHNILVVVAMNFPKQFDPATHKALDKFLATVSTVLTSKYR•Goldfish-HBA_CARAUHemoglobinalpha-Carassiusauratus(Goldfish).•MSLSDKDKAVVKALWAKIGSRADEIGAEALGRMLTVYPQTKTYFSHWSDLSPGSGPVKKHGKTIMGAVGDAVSKIDDLVGALSALSELHAFKLRIDPANFKILAHNVIVVIGMLFPGDFTPEVHMSVDKFFQNLALALSEKYR以下我们以此基因为例进行一系列的操作:•ATGGCACAGTCAGTGCTGGTACCGCCAGGACCTGACAGCTTCCGCTTCTTTACCAGGGAATCCCTTGCTGCTATTGAACAACGCATTGCAGAAGAGAAAGCTAAGAGACCCAAACAGGAACGCAAGGATGAGGATGATGAAAATGGCCCAAAGCCAAACAGTGACTTGGAAGCAGGAAAATCTCTTCCATTTATTTATGGAGACATTCCTCCAGAGATGGTGTCAGTGCCCCTGGAGGATCTGGACCCCTACTATATCAATAAGAAAACGTTTATAGTATTGAATAAAGGGAAAGCAATCTCTCGATTCAGTGCCACCCCTGCCCTTTACATTTTAACTCCCTTCAACCCTATTAGAAAATTAGCTATTAAGATTTTGGTACATTCTTTATTCAATATGCTCATTATGTGCACGATTCTTACCAACTGTGTATTTATGACCATGAGTAACCCTCCAGACTGGACAAAGAATGTGGAGTATACCTTTACAGGAATTTATACTTTTGAATCACTTATTAAAATACTTGCAAGGGGCTTTTGTTTAGAAGATTTCACATTTTT2.对基因的分析•plotorf用图形的形式来预测它的开放阅读框。可对你输入的序列进行分析,由于其仅仅是对其预测,所以把其可能的形式都以图形的形式表现出来,以防有所疏漏。注:输入的形式为核酸序列,不必加入其它信息。•Showorf是把我们输入的核酸序列翻译成蛋白质的氨基酸序列。其有6种方式可以选择R1、R2、R3、F1、F2和F3等6种方式可对它所翻译出来的序列方式进行预测。注:R为reverse,F为forward。其为从正向或反向第几个核苷酸序列进行翻译。chips依据某个特定的基因序列计算密码子偏爱性,计算结果为一个Nc值,该值越低,则密码子偏爱性越高,反之则越低。此序列的Nc值为:•cpgplot以图形文件和表格文件的形式表示核酸序列中CpG分布特征。由于CpG是基因组中高表达区域的特征,因此可以用来预测某个基因在基因组中的表达水平。dan计算DNA、RNA序列的熔点温度。该软件可用于southernblot、northernblot探针以及PCR引物的TM值的计算。geecee计算核苷酸的GC含量。输入所要计算的核苷酸序列,程序运行后可以得到G+C的百分含量。输入此序列为:Wordcount在DNA序列中计算一定长度的连续序列在DNA序列中出现个数。可以选择相同序列的核苷酸个数,也可以选择×的显示。3.对蛋白质的氨基酸序列性质的分析•以下以此氨基酸序列为例进行一系列的操作:•MAQSVLVPPGPDSFRFFTRESLAAIEQRIAEEKAKRPKQERKDEDDENGPKPNSDLEAGKSLPFIYGDIPPEMVSVPLEDLDPYYINKKTFIVLNKGKAISRFSATPALYILTPFNPIRKLAIKILVHSLFNMLIMCTILTNCVFMTMSNPPDWTKNVEYTFTGIYTFESLIKILARGFCLEDFTF•pepinfo能以图形方式显示蛋白质序列中各种不同性质的氨基酸残基的含量(较小R残基的氨基酸、小R残基的氨基酸、脂肪族的氨基酸、芳香族的氨基酸、带电荷的氨基酸、不带电荷的氨基酸、氨基酸对水的亲和程度等),能够输出两张不同的图。•iep计算蛋白的等电点。输入的是蛋白序列,以EBI数据库中laci_ecoli为例,得出pH、Bound、Charge等结果。4.对核酸的核苷酸序列或蛋白质的氨基酸序列的相似性分析dottup是两条序列精确匹配的作图方法,这个程序的执行方式是在给定序列长度(wordsize)下逐一比对,即在水平轴和竖直轴上的两个序列,将每个序列的每个残基同另一个序列的全部残基比较,有相同的残基就在图表中用“点”作为标记,否则就空白。当两个序列有相同的区域出现的时候,很多点相连接就形成斜线,显示出序列比对。F1AREALFRIENDISAFRIENDINNEEDF2AFRIENDINNEEDISAFRIENDINDEED其中X轴为F1序列,Y轴为F2序列。(Wordsize5)从这张分析图中我们可以知道:F1AREALFRIENDISAFRIENDINNEEDF2AFRIENDINNEEDISAFRIENDINDEED和F1AREALFRIENDISAFRIENDINNEEDF2AFRIENDINNEEDISAFRIENDINDEED和F1AREALFRIENDISAFRIENDINNEEDF2AFRIENDINNEEDISAFRIENDINDEED和F1AREALFRIENDISAFRIENDINNEEDF2AFRIENDINNEEDISAFRIENDINDEED•WaterDNA或蛋白质的局部比对软件,在比对后给出两序列的相同性,相似性,gap以及分数。•我们以这两条氨基酸序列为例进行操作:•MVLSGEDKSNIKAAWGKIGGHGAEYGAEALERMFASFPTTKTYFPHFDVSHGSAQVKGHGKKVADALASAAGHLDDLPGALSALSDLHAHKLRVDPVNFKLLSHCLLVTLASHHPADFTPAVHASLDKFLASVSTVLTSKYR•MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAHLPAEFTPAVHASLDKFLASVSTVLTSKYR5.对蛋白质一级结构的分析MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR•Pepstats蛋白质的统计,可以在该程序中得到一条蛋白质的各个残基的统计量。6.对蛋白质二级结构的分析•我们以这条氨基酸序列为例进行操作:•MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVLTSKYR•garnier预测蛋白的二级结构。输入蛋白序列从而进行预测。以EBI数据库中的amic_pseae序列为例,程序运行得出了helix、sheet、turns、coil等序列位点。•sigcleave在真核生物中,信号肽介

1 / 64
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功