ExPASy使用初探—以斑头雁血红蛋白为例组长:任娇组员:申立平孔寅飞李东旭2009.03.18工作分工•a2任姣:斑头雁的物种介绍,ExPASy介绍,整理全组的工作,查漏补缺,编辑全文。•b1申立平:对斑头雁血红蛋白研究背景包括现阶段的进展做一个详尽的介绍。•a1孔寅飞:尽可能多的运用ExPASy的各种工具对该蛋白的DNA序列进行分析。•b2李东旭:尽可能多的运用ExPASy的各种工具对该蛋白的蛋白质序列进行分析。ExPASy简介•ExPASy是ExpertProteinAnalysisSystem的缩写,即为专业蛋白质分析系统。ExPASy由瑞士生物信息学研究所维护(SwissInstituteofBioinformatics),提供从序列(Swiss-Prot)到结构(Swiss-Model),以及2-DPAGE等蛋白质操作相关的全套服务。ExPASy汇总的蛋白质组学在线实用分析工具包,涉及蛋白分类、翻译、结构预测、相似检索、序列比对等等。ExPASyProteomicstools•[Proteinidentificationandcharacterization](MS相关)•[DNA-Protein]•[Similaritysearches]•[Sequencealignment]•[Patternandprofilesearches](domain/motif相关)•[Post-translationalmodificationprediction]•[Topologyprediction](定位,跨膜相关)•[Primarystructureanalysis]•[Secondarystructureprediction]•[Tertiarystructure]•[Phylogeneticanalysis](进化相关)•[Biologicaltextanalysis](序列相关)(结构相关)第一部分斑头雁背景知识介绍•AnserindicusLatham,世界上飞的最高的鸟类•别名:白头雁•英文名:Bar-headedGoose•斑头雁,雁形目,鸭科,雁属。大雁的一种,因头上有两条黑色条斑而得名。它体形如鹅,重约2500-3500克,长着桔红色嘴巴、黑色嘴唇、桔红色腿脚,灰褐色的羽翅,虹膜-褐色;嘴-鹅黄,嘴尖黑;脚-橙黄。飞行高度可达8000米以上,每日飞行300到500公里,是鸟类飞行的一级运动员。基本知识:灰雁是斑头雁的近亲,生活在欧洲和亚洲大陆。栖息于湖泊、河滩水域地带。它们却不能承受缺氧环境。所以怀疑可能是斑头雁的血红蛋白和灰雁的血红蛋白结构有所不同,从而导致它结合氧的能力不同。斑头雁血红蛋白研究背景及进展:•1979年BraunitzerG,OberthürW.比对了灰雁和鸡的血红蛋白的α链和β链,发现灰雁的氨基酸序列相对于鸡的有差异,证明血红蛋白确实存在突变,为上面的对斑头雁的推测奠定了依据。•1980年BlackCP,TenneySM做了一个研究工作,把斑头雁和北京鸭(体型和斑头雁相当,但生长在地面,不能飞的鸟类)的耐低氧能力做了一个比较,发现当把二者都置在高空中时,斑头雁没有明显的动作变化,但北京鸭的结合氧的能力却没有增强。•1982年,OberthürW,BraunitzerG,WürdingerI.等人把斑头雁和灰雁的血红蛋白氨基酸序列进行了分析,,其中斑头雁α链119位Ala在灰雁中变成了Pro,而斑头雁β链125位Asp变成了Glu,这两个氨基酸都在血红蛋白α链和β链的结合处。并试图解释了此变化造成斑头雁结合氧能力强的原因。•1993年,WeberRE,等人将人的血红蛋白进行了类似斑头雁血红蛋白的突变,发现,突变后的血红蛋白确实能够增强和氧的结合能力。•1999年北京大学ZhangJ,HuaZ.等人解析了斑头雁的血红蛋白晶体结构,证明了斑头雁的高结合氧能力确实是和Pro变为Ala有关。斑头雁血红蛋白研究背景及进展:通过近二三十年的对斑头雁血红蛋白的研究,现在已经清楚的了解了斑头雁血红蛋白的结构,以及由于结构的变化而导致斑头雁结合氧能力增强能在海拔9000多米飞翔的原因。斑头雁血红蛋白的研究也成为一个比较有代表性的例子,为其它近亲物种由于结构变异引起的功能差异奠定了很好的基础与参考。第二部分斑头雁血红蛋白的蛋白质分析(一)蛋白序列基本特征分析•ProtParamtool•ComputepI/Mw•PeptideCutter•PeptideMass•Isotopident1.ProtParamtool:蛋白质的氨基酸组成、分子量、PI等基本特征的分析。将斑头雁的血红蛋白序列输入该工具中,可以得到如下结果:Numberofaminoacids:142Molecularweight:15467.8TheoreticalpI:8.54Aminoacidcomposition:Ala(A)1913.4%Arg(R)32.1%Asn(N)32.1%Asp(D)74.9%……Totalnumberofnegativelychargedresidues(Asp+Glu):13Totalnumberofpositivelychargedresidues(Arg+Lys):15Atomiccomposition:CarbonC702HydrogenH1102NitrogenN190OxygenO196SulfurS4Formula:C702H1102N190O196S4Totalnumberofatoms:2194Extinctioncoefficients/Estimatedhalf-life/Instabilityindex/Aliphaticindex该软件的分析结果包括了蛋白的氨基酸组成、原子组成、分子量、半衰期、等电点等全面的基本信息。2.ComputepI/Mw:通过与UniProtKnowledgebase中蛋白的比较计算目的蛋白的理论分子量与等电点。以斑头雁的血红蛋白为例,结果如下:该软件分析结果只能得到蛋白质分子量和理论等电点的信息,但是与上面的分析结果是一致的。3.PeptideCutter:蛋白质酶切分析以斑头雁的血红蛋白为例,参数设置:有多种酶可供选择,此例中选择Trypsin;Trypsin和Chymotrypsin酶还可以选择酶切效率,此例中选择酶切最低效率为100%;结果可以表格形式、图谱形式等显示,此例中选择以表格形式显示;选择酶切最低效率为90%时:4.PeptideMass:蛋白酶切得到的肽段的分子量计算(也可以包含翻译后修饰)以斑头雁的血红蛋白为例,参数设置:选择Trypsin作酶解分析;Cysteines在蛋白预处理过程中的处理方法也可以进行选择,此例中选择“nothing(inreducedform)”;也可以对“missedcleavages”进行设置,此例中设置为“0”;还可以对肽段的显示方式进行选择,包括显示内容和顺序,此例中选择显示500Da的肽段,并按其大小顺序排列;结果如下:与PeptideCutter比较分析:PeptideMass所得的结果较直观,并且以表格形式集中显示出所得酶切肽段的分子量、氨基酸序列及肽段在整个蛋白中的位置,而且还可以对“missedcleavages”进行设置。另外,酶切肽段的显示方式也比PeptideCutter更加完善。5.Isotopident:用来估测蛋白或肽段或多聚核苷酸链中的同位素分布情况,还可以计算出该蛋白或肽段的单一同位素峰的分子量以及自然情况下最有可能存在的同位素分布组合并计算出其分子量。这在质谱数据分析中很有用。以斑头雁的血红蛋白为例,结果如下:(二)ProteinDNA•ReverseTranslate•Genewise1.ReverseTranslate:用来从蛋白质序列推测DNA序列,可以用来对还不知道基因序列的已知蛋白进行引物设计。以斑头雁的血红蛋白分析为例,参数设置:采用defaultcodonusagetable,结果如下:reversetranslationofUntitledtoa426basesequenceofmostlikelycodons.atggtgctgagcgcggcggataaaaccaacgtgaaaggcgtgtttagcaaaattagcggccatgcggaagaatatggcgcggaaaccctggaacgcatgtttaccgcgtatccgcagaccaaaacctattttccgcattttgatctgcagcatggcagcgcgcagattaaagcgcatggcaaaaaagtggtggcggcgctggtggaagcggtgaaccatattgatgatattgcgggcgcgctgagcaaactgagcgatctgcatgcgcagaaactgcgcgtggatccggtgaactttaaatttctgggccattgctttctggtggtggtggcgattcatcatccgagcgcgctgaccgcggaagtgcatgcgagcctggataaatttctgtgcgcggtgggcaccgtgctgaccgcgaaatatcgcreversetranslationofUntitledtoa426basesequenceofconsensuscodons.atggtnytnwsngcngcngayaaracnaaygtnaarggngtnttywsnaarathwsnggncaygcngargartayggngcngaracnytngarmgnatgttyacngcntayccncaracnaaracntayttyccncayttygayytncarcayggnwsngcncarathaargcncayggnaaraargtngtngcngcnytngtngargcngtnaaycayathgaygayathgcnggngcnytnwsnaarytnwsngayytncaygcncaraarytnmgngtngayccngtnaayttyaarttyytnggncaytgyttyytngtngtngtngcnathcaycayccnwsngcnytnacngcngargtncaygcnwsnytngayaarttyytntgygcngtnggnacngtnytnacngcnaartaymgn同时它还给出了,每个氨基酸所对应的密码子的每个位置的核苷酸的出现概率,如下:Graphofbaseprobabilities:……3_L_firstg0.00a0.00TTTTTTTTTTTTTTTTTTTTTTTTTTT0.26CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC0.743_L_secondg0.00a0.00TTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT1.00C0.003_L_thirdgggggggggggggggggggggggggggggggggggggggggggggggggggggggggggggg0.62aaaaaaaaaaaaaaaaaa0.17TTTTTTTTTTT0.11CCCCCCCCCCC0.10……该软件除了可以选择所使用的密码子的优点外,还具有在结果显示每个氨基酸所对应的密码子的每个位置的核苷酸的出现概率的优点。2.Genewise:可以将一个蛋白序列与某一个基因组DNA序列进行比较,适合寻找还不知道基因的蛋白的同源基因。将斑头雁的血红蛋白序列与与Rat的血红蛋白基因的CDs序列进行比对,得到如下结果:(三)蛋白序列比对•BLAST•Fasta3•MPsrch1.BLAST:用来寻找蛋白的同源序列,再根据同源蛋白的已知信息来推测未知蛋白