蛋白酶体酶切位点预测的研究进展

pandorahugo
1 ℃
2019-12-16

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

[文章编号100028861(2004)0120078203蛋白酶体酶切位点预测的研究进展黄健,游自立(电子科技大学生命科学与技术学院,四川成都610054)[摘要]蛋白酶体负责生成羧基末端正确的Tc表位或其前体。它对抗原的酶切作用,既可能产生、形成又可能破坏、摧毁Tc表位。目前,已经有几种基于互联网的蛋白酶体酶切位点预测工具“;虚拟酶切”已经越来越广泛地应用于Tc表位的筛选、确定与疫苗研究中。[关键词]蛋白酶体;酶切基序;人工神经网络[中图分类号]R392[文献标识码]APredictionofproteasomalcleavagesHUANGJian,YOUZi2li(SchoolofLifeScienceandTechnology,UniversityofElectronicScienceandTechnologyofChina,Chengdu610054,China)[Abstract]ProteasomesareresponsibleforgeneratingtheCterminiofcytotoxicTcellepitopes.ThecytotoxicTcellepitopesorcorre2spondingprogenitorscanbeproducedordestroyedbythepeptidaseactivitiesofproteasome.Atpresent,thereareseveralweb2basedtoolsthatcanbeusedforpredictingproteasomalcleavages.MoreandmoreextensivelyisVirtualProteasomalDigestionusedinmapingandfiltrationofcytotoxicTcellepitopesandthedesignofvaccines.[Keywords]Proteasome;Cleavagemotif;Artificialneuralnetwork蛋白酶体(Proteasome)是一类具有广泛酶解活性的巨大多蛋白酶复合体,多以20S及26S形式存在于细胞质和细胞核中。蛋白酶体是众多细胞内蛋白质降解转化的回收站,影响广泛,涉及细胞周期控制、转录因子激活、抗原递呈1。蛋白酶体对抗原的酶切作用,既可能产生形成又可能破坏摧毁Tc表位。因此,对蛋白酶体酶切位点进行预测具有重要意义。本文对其基础、方法及应用研究进展进行了综述。基后的肽键。β2亚基主要与蛋白酶体的胰蛋白酶样活性有关,能够识别蛋白质或多肽底物中的碱性氨基酸残基,并切断该残基后的肽键。β1亚基主要与蛋白酶体的PGPH(肽2谷氨酰2肽水解活性)样蛋白水解酶活性有关,能够识别蛋白质或多肽底物中的酸性氨基酸残基,并切断该残基后的肽键。上述亚基的活性位点并非各行其事。研究发现:多肽底物与糜蛋白酶样位点结合时,另2个位点的活性增强;而当肽与另外2个位点结合时,糜蛋白酶样位点的活性下降,提示底物一般先由糜蛋白酶样活性位点切割,接着再由其它位点切割,直到产生足以释放的小寡肽。在脊椎动物中,IFN2γ诱导产生β1i(LMP2)、β5i(LMP7)、β2i(MECL1)分别置换β1、β5、β2后形成免疫蛋白酶体。各种蛋白酶体对抗原的酶切处理虽然可能直接形成Tc表位,但更多时候只负责生成羧基末端正确的Tc表位前体;氨基端往往还要经过内质网或胞浆内1蛋白酶体酶切位点预测的基础26S蛋白酶体由具有酶解活性的核心(20S蛋白酶体)与19S的帽状复合物装配形成;PA28等调节因子也能与20S蛋白酶体结合。20S蛋白酶体是由4个7价环共28个亚单位(α7β7β7α7)堆叠形成的桶状复合物。其中,2个外环各由7个α亚基堆叠而成,所形成的2个空腔控制着底物的进出;2个内环分别由7个β亚基堆叠形成,它们组成一个空腔,空腔内侧为催化活性位点所在。2个内环的β1亚基、β2亚基、β5亚基具有蛋白水解酶活性,活性位点为上述亚基氨基端的1-4氨肽酶的进一步修剪。2蛋白酶体酶切位点预测的方法目前,预测蛋白酶体酶切位点的方法可分为基序法和人工神经网络2类。所谓基序,就是蛋白质一级结构所具有的苏氨酸1-4。β5亚基主要与蛋白酶体的糜蛋白酶样活性有关,能够识别蛋白质或多肽底物中大的疏水性氨基酸残基,并切断该残2-4一些特定序列特征。大量的研究表明,蛋白酶体对抗原的酶切处理并不是随机的,而是有一定模式和选择性的。对大量酶切片段的统计分析表明:蛋白酶体对抗原的处理除了与酶切位点(P1)有关外,还与其两侧序列(Pk...P2P1|P1’P2’...Pm’)有关;酶切位点及其两侧氨基酸残基序列的特征即是所谓的酶切基序(Cleavagemotifs)。人工神经网络(Artificialneuralnetwork,ANN)是现代计算机科学与神经科学结合的产物,它通过硬件或软件实现对神经元及其网络的[收稿日期]2003-06-26;[修回日期]2003-09-27[基金项目]电子科技大学引进人才科研启动基金资助项目(YO2002010901001)[作者简介]黄健(1973-),男,四川成都市人,副教授,博士,主要从事免疫信息学的研究。Tel:(028)83200461;E2mail:hj@uestc.edu.cn模拟,具有联想、学习、模式识别功能,适于处理和识别各种非线性序列信息。ANN通常由多个形式神经元(NeuronsΠNodes)组成一层(Layer)或多层(如含输入、隐藏、输出三层)网络结构,在免疫信息学中有着广泛的应用。一个构建合理,经过蛋白酶体酶切实验数据或已有数据库数据充分“训练”的神经网络,可学习并识别隐含在大量数据中的规律,并可将这一规律广泛用于对蛋白酶体酶切位点作出判断。Holzhutter等5根据文献资料中的酶切数据,通过对肽键酶切概率与其两侧残基侧链物理化学属性(体积与转移能)的相关性进行回归分析,推导出10个特异性酶切基序(Cleavage2determiningaminoacidsmotifs,CDAAMs,图1)。这些CDAAMs具有2到4个“锚”位点,位于P8到P6’窗口范围内;用于酶切位点预测时,对原有数据的准确再现率可达93%,对未纳入推导的一个多肽的酶切位点预测准确率达80%。他们进一步通过20S蛋白酶体酶切20到40个残基多肽底物的实验,用微分方程建立了从特定底物产生某一酶切片段概率的动力学模型;余一法检验显示,正确预测率约80%,假阳性率低于10%6。Holzhutter等在上述2项研究的基础上编写了FragPredict程序,建立了相应的Web服务器(http:ΠΠ),能预测蛋白酶体在抗原各位置进行酶切的概率及酶切生成某一片段的概率;对于后一功能,抗原片段长度最好不超过40个氨基酸残基。ⅠⅡⅢⅣⅤⅥⅦⅧⅨⅩs)s)x)小体积残基;m)中体积残基;b)大体积残基;h)疏水性残基;p)极性残基;x)任意残基Smallvolume;m)Medium2sizedvolume;b)Bulky(largevolume);h)Hydrophobic;p)Polar;Nospecificpropertyrequired,butaresiduemustbepresentinthisposition图110种蛋白酶体酶切基序Fig1Tencleavage2determiningaminoacidsmotifsKuttler等利用酵母和人20S蛋白酶体的体外酶切实验数据,以进化算法训练了一个单层人工神经网络;仅考虑酶切位点两侧共10个氨基酸残基(P6到P4’),该网络对原有训练数据的重现率就可达98%～100%7。他们建立了一个名为PAProC(PredictionAlgorithmforProteasomalCleavages)的Web服务器(http:ΠΠ),提供免费的蛋白酶体酶切位指标来表示预测方法的性能。敏感性即真阳性率,能准确预测出羧基末端(即酶切位点)的百分率;特异性即真阴性率,能准确预测出非酶切位点(即除了羧基末端以外的其它区域,没有主要的酶切位点)的百分率;相关系数是综合考虑敏感性与特异性时,预测方法整体性能的反映。Saxova等的测试结果见表1和表2。表1现行方法性能比较(根据MHC2Ⅰ天然配体)Tab1Performanceofavailablemethods(basedonneturalMHCclassⅠligands)点预测服务8。目前,PAProC可对人类20S蛋白酶体、野生型及突变型酵母20S蛋白酶体的酶切位点进行预测。Kesmir等9建立了一个具有单隐含层的前馈型人工神经网络,用20S蛋白酶体的体外酶切数据及来自SYFPEITHI数据库的MHC2Ⅰ类分子配体数据进行训练;结果,该人工神经网络能准确预测65%的蛋白酶体酶切位点和85%的非酶切位点。由于他们在训练中引入了MHC2Ⅰ类分子配体数据,其中包含有体内实验与免疫蛋白酶体信息,所以预测结果反映了免疫蛋白酶体与组成性蛋白酶体的综合特异性。在此研究基础上,他们建立了一个名为NetChop的Web服务器(http:ΠΠΠ),提供免费的蛋白MethodNSensitivityΠ(%)SpecificityΠ(%)CCPAProCFragPredictNetChop1.0NetChop2.021723123123145.683.539.873.630.016.546.342.4-0.250.00-0.140.16N)NumberofnaturalMHCligandstested表2Tab2现行方法性能比较(根据体外实验结果)Performanceofavailablemethods(basedoninvitrodeg2radationstudies)酶体酶切位点预测服务。目前,NetChop有1.0和2.0两个版本,训练NetChop2.0的数据集是1.0版本的3倍。最近,Saxova等10用已知的Tc表位和文献报道的蛋白酶体酶切数据,对上述3种蛋白酶体酶切位点预测程序的性能进行了比较测试(用于测试的数据已预先去除了曾用于训练PAProC和NetChop的数据)。该研究用敏感性(Sensitivity)、特异性(Specificity)、相关系数(Correlationcoefficient,CC)等3个MethodSensitivityΠ(%)SpecificityΠ(%)CCPAProCFragPredictNetChop1.0NetChop2.046.472.134.457.464.741.491.476.40.100.120.310.32P8P7P6P5P4P3P2P1P1’P2’P3’P4’P5’P6’xxbsPhpGHKmhCEmRSWxxLMWYxbDGIWxhCNxHTYmmALFVWbFQpproachtowardstheidentificationofcleavage2determiningaminoacidmotifsofthe20SproteasomeJ.JMolBiol,1999,286(4):1251-1265.HolzhutterHG,KloetzelPM.Akineticmodelofvertebrate20Sproteasomeaccountingforthegenerationofmajorproteo2lyticfragmentsfromoligomericpeptidesubstratesJ.Bio2physJ,2000,79(3):1196-1205.KuttlerC,NussbaumAK,DickTP,etal.AnalgorithmforthepredictionofproteasomalcleavagesJ.JMolBiol,2000,298(3):417-429.Nussb