05-蛋白质结构与功能分析-2014-2

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

Chapter5AnalysisandPredictionofProteinStructureandFunction——PartTwo5.3.1蛋白质二级结构的分析预测基于蛋白质分子的氨基酸序列来精确地预测其二级结构是一件十分困难的工作。迄今为止,对蛋白质二级结构的预测的可靠性还不高。但是,随着方法的改进,预测的平均准确度已可达到64%~75%。目前已经发展了各种各样的方法来进行蛋白质二级结构的预测,其预测原理及准确度也各不相同。5.3蛋白质空间结构的分析预测预测蛋白质二级结构的算法可分为三类:①统计/经验算法:如基于经验统计规则的MLRC法和基于信息论算法的GOR法。②物理化学算法:如基于蛋白质结构的物理化学原理的PREDATOR法和DSC法。③机器学习算法:如基于神经网络算法的HNN法和PHD法。在NPS@系统中,提供了12种不同的预测方法来进行蛋白质二级结构的预测。蛋白质二级结构的预测方法1.SOPM——自优化预测法;2.SOPMA——结合序列对比的自优化预测法;3.HNN——树状神经网络预测法;4.MLRC——多变量线性回归组合预测法;5.DPM——双重预测法;6.DSC——蛋白质二级结构分类判别预测法;7.GOR1——一种基于信息论的二级结构预测法(第一版);8.GOR3——GOR的第三版;9.GORⅣ——GOR的第四版;10.PHD——一种基于神经网络的预测法;11.PREDATOR——一种基于氨基酸序列的预测法;12.SIMPA96——一种基于序列同源性的预测法。此外,用户还可以随意组合采用几种不同的预测方法,进行多重对比一致性预测,从而大大提高了预测的准确性。在NPS@系统中,蛋白质二级结构的预测结果以不同的颜色和符号来表示:Alphahelix(Hh)-螺旋310helix(Gg)310-螺旋Pihelix(Ii)-螺旋Betabridge(Bb)-折叠桥Extendedstrand(Ee)伸展链(-折叠)Betaturn(Tt)-转角Bendregion(Ss)弯折区Randomcoil(Cc)无规卷曲Ambigousstates(?)不确定状态NPS@系统蛋白质二级结构综合分析预测实例1.输入网址=/NPSA/npsa_seccons.html2.选择分析预测模型——MLRC、DSC、PHD;3.粘贴待分析的蛋白质序列——Hemoglobinsubunitalpha;4.点击“SUBMIT”提交序列,等待结果显示。预测序列预测结果总结综合预测预测方法蛋白质二级结构分析预测的其他网络资源程序名称网址APSSP://gor.bb.iastate.edu/cdmPSIPRED://distill.ucd.ie/porterJpred3://://bmerc-://protinfo.compbio.washington.edu/psicsi/SECPRED://scratch.proteomics.ics.uci.edu/5.3.2蛋白质三级结构的分析预测具有相似三级结构的蛋白质,通常具有相似的功能,典型的例子就是酶分子的活性中心。因此,通过预测蛋白质分子的三级结构,可以大致推知该蛋白质分子的功能。目前用于蛋白质三级结构预测与建模的方法主要有三类:比较建模法(同源建模法)折叠识别建模法(串线建模法、反向折叠法)从头预测建模法5.3.2.1比较建模法比较建模法(同源建模法,homologymodeling)根据已知三级结构的同源蛋白质中保守的部份,搭建出未知蛋白质三级结构的骨架。该法是目前最为成熟的三级结构预测方法。比较建模法的原理是基于在进化过程中蛋白质三级结构的保守性远大于序列的保守性,当两个蛋白质的序列同源性高于35%时,一般情况下它们的三级结构基本相同。这样,当一个或多个同源蛋白质的结构已知时,就可以成功地进行三级结构的建模。比较建模的基本过程包括:①目标蛋白序列与同源蛋白模板序列比对匹配;②根据匹配结果,确定同源蛋白的结构保守区及相应的框架结构;③目标蛋白结构保守区的主链建模;④目标蛋白结构变异区的主链建模;⑤目标蛋白侧链的安装和优化;⑥对建模结构进行总体优化和评估。常用蛋白质三级结构比较建模预测程序SWISS-MODEL是由瑞士生物信息研究所开发蛋白质三级结构预测程序,该程序采用比较建模法进行蛋白质结构的预测,可以对目标序列进行自动比对、自动选择模板并自动建模。蛋白质结构预测建模的结果通过网页输出浏览。(1)SWISS-MODEL预测程序SWISS-MODEL蛋白质三级结构分析实例1.打开网页:=show_workspace&userid=USERID&token=TOKEN新版网址:输入邮箱地址进行注册,获取密码并登录。输入邮箱地址,点击“Login”,获取登录密码3.在“Modelling”菜单栏下选择“AutomatedMode”。4.输入建模名称和蛋白质序列,点击提交。输入建模名称输入蛋白质序列或AC号5.等待结果返回。说明:分析预测过程可能耗时较长,可待分析完成后再登录查看。登录界面SWISS-MODEL的输出结果NPS@系统中提供的Geno3D蛋白质建模自动服务程序,采用的也是比较建模法。=/GENO3D/geno3d_home.html(2)Geno3D预测程序Geno3D蛋白质三级结构预测与建模的步骤如下:①使用PSI-BLAST程序鉴定与已知三级结构的蛋白质同源的蛋白质;②通过一个十分方便的界面,向用户提供所有可供选择的模板;③将待检索序列与模板序列进行对比;④提取待检索序列与模板序列之间相应原子的几何学限定(二面角和距离);⑤使用距离几何法构建蛋白质的三维结构;⑥将结果通过e-mail发送给用户。用户可通过邮件中提供的超链接,下载相关的结果文件(包括“MOLECULAR3DMODELS”和“OUTPUTDATAANALYSIS”两类文件)。⑦对于*.pdb类文件,用户可用Rasmol软件打开并显示蛋白质分子的三维结构。5.3.2.2折叠识别建模法在没有已知三级结构的同源蛋白存在的情况下,可采用折叠识别建模法(threadingmodeling)预测蛋白质的三级结构。折叠识别建模法的基本原理是:1.首先假定蛋白质折叠的类型是有限的;2.然后以已知蛋白质的折叠子为模板,寻找并确定给定的氨基酸残基序列可能采取的折叠类型,即折叠识别;3.最后对一系列可能采取的折叠结构进行计分,分数最高者为最可能的三级结构。采用“折叠识别建模法”的蛋白质三级结构预测软件是“Phyre2”。PHYRE2蛋白质三级结构分析实例1.打开网页:=index2.输入邮箱地址和蛋白质序列。3.点击“PhyreSearch”进行提交。4.等待结果返回(通常耗时较长)。预测分析结果包括:①“Summary”②“Sequenceanalysis”③“Secondarystructureanddisorderprediction”④“Domainanalysis”⑤“Detailedtemplateinformation”5.3.2.3从头预测建模法从头预测建模法根据蛋白质的氨基酸序列来预测蛋白质的空间结构,即二级结构和三级结构。从理论上来说,这是一种最为理想的预测方法,也是蛋白质结构预测的最终目标。但现在来看所有的预测方法都不能完全达到这一要求。从头预测建模法的基本原理是蛋白质的天然构象是对应其自由能最低时的结构。但这种方法受到两方面的困扰:①难以找到一个能严格区分蛋白质天然构象与非天然构象的能量函数;②蛋白质在势能面上存在着极多的局部极小点,缺少一种有效的全局优化算法。5.4蛋白质抗原表位的分析预测在特异性的抗原-抗体结合反应中,常将抗原分子中参与结合反应的部位称为抗原表位(epitope),即抗原决定簇。抗原表位可按照与抗原受体细胞结合的不同而分为B淋巴细胞抗原表位和T淋巴细胞抗原表位。5.4.1B淋巴细胞抗原表位的分析预测目前认为,蛋白质分子中的一段氨基酸序列能否作为抗原表位而诱导B淋巴细胞产生特异的抗体,其决定因素主要是:①是否位于蛋白质分子的表面;②是否具有与特异抗体结合的空间位置;③表面基团的活动度或柔韧性。目前认可的预测方案主要有:①亲水性方案;②表面可及性方案;③柔韧性方案;④抗原性方案;⑤二级结构预测方案;⑥抗原指数方案。5.4.2T淋巴细胞抗原表位的分析预测抗原表位多肽可与有核细胞表面的组织相容性复合体Ⅰ(MHCⅠ)类分子结合形成肽-MHC复合物,然后被T细胞受体识别,将抗原递呈给CD8+T细胞。因此,T细胞抗原表位分析预测就是分析预测多肽片段与MHCⅠ类分子的结合能力。常用的分析预测方法包括:简单基序法、扩展基序法、矩阵法、人工神经网络法和基于分子模拟的表位预测法等。考核作业题(第八次)自行在UNIPROT蛋白质数据库内检索并选择一段蛋白质序列,完成下列分析,写出分析报告并附原始分析数据(10分)。①自行选择一种方法,分析预测该蛋白质序列的二级结构。②自行选择一种方法,分析预测该蛋白质序列的三级结构。请将作业的电子文档发送至:lihong7188@126.com

1 / 42
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功