第十讲蛋白质二级结构预测中心法则(thecentraldogma)蛋白质结构蛋白质功能转录翻译?翻译细胞质核糖体氨基酸折叠密码(foldingcode)又称“第二遗传密码”,蛋白质的氨基酸序列与其三维空间结构间的关系。破译折叠密码:从蛋白质的一级结构得到立体结构,即可直接从基因推测其编码蛋白质所对应的生物学功能。破解折叠密码被列为“21世纪的生物学”的重要课题。在生物学研究中,分子的结构是最重要的数据它提供很多信息,包括生物分子的功能、作用机制、进化历史等如何获得蛋白质结构….-Gly-Ala-Glu-Phe-….?解决方法一:实验测定….-Gly-Ala-Glu-Phe-….X-射线晶体衍射核磁共振电镜技术?•20世纪60年代解析一个蛋白质结构可以获得诺贝尔奖;•20世纪70年代解析一个蛋白质结构则可成为轰动世界的新闻;•20世纪80年代解析一个蛋白质结构则可申请到教授的职位;•20世纪90年代解析一个蛋白质结构通常可以获得博士学位;蛋白质结构解析的发展YearLaureatePrizeRationale1914MaxvonLauePhysicsForhisdiscoveryofthediffractionofX-raysbycrystals,[118]animportantstepinthedevelopmentofX-rayspectroscopy.1915WilliamHenryBraggWilliamLawrenceBraggPhysicsFortheirservicesintheanalysisofcrystalstructurebymeansofX-rays,[119]1962MaxF.PerutzJohnC.KendrewChemistryfortheirstudiesofthestructuresofglobularproteins[120]1962JamesDeweyWatsonFrancisHarryComptonCrickMauriceHughFrederickWilkinsMedicineFortheirdiscoveriesconcerningthemolecularstructureofnucleicacidsanditssignificanceforinformationtransferinlivingmaterial[121]1964DorothyHodgkinChemistryForherdeterminationsbyX-raytechniquesofthestructuresofimportantbiochemicalsubstances[122]1972StanfordMooreWilliamH.SteinChemistryFortheircontributiontotheunderstandingoftheconnectionbetweenchemicalstructureandcatalyticactivityoftheactivecentreoftheribonucleasemolecule[123]1976WilliamN.LipscombChemistryForhisstudiesonthestructureofboranesilluminatingproblemsofchemicalbonding[124]1985JeromeKarleHerbertA.HauptmanChemistryFortheiroutstandingachievementsindevelopingdirectmethodsforthedeterminationofcrystalstructures[125]1988JohannDeisenhoferHartmutMichelRobertHuberChemistryFortheirdeterminationofthethree-dimensionalstructureofaphotosyntheticreactioncentre[126]1997JohnE.WalkerChemistryFortheirelucidationoftheenzymaticmechanismunderlyingthesynthesisofadenosinetriphosphate(ATP)[127]2003RoderickMacKinnonPeterAgreChemistryFordiscoveriesconcerningchannelsincellmembranes[...]forstructuralandmechanisticstudiesofionchannels[128]2006RogerD.KornbergChemistryForhisstudiesofthemolecularbasisofeukaryotictranscription[129]2009AdaE.YonathThomasA.SteitzVenkatramanRamakrishnanChemistryForstudiesofthestructureandfunctionoftheribosome[130]2012BrianKobilkaRobertLefkowitzChemistryForstudiesofG-protein-coupledreceptors[131]X射线晶体学全解析的第一个蛋白质结构--肌红蛋白2005年,线粒体膜蛋白复合物2精细结构X射线衍射测定蛋白和核酸精细结构,为新药设计提供了全新方向中国科学家研制抗癌新药首获瑞典爱明诺夫奖2016.03Lastupdate:TuesdayMar01,2016at4PMPST数量大技术难度高瓶颈实验测定蛋白质结构三维结构数据与一维序列数据在量上增长速度严重不协调解决方法二:结构预测….-Gly-Ala-Glu-Phe-….蛋白质结构预测:指从蛋白质的氨基酸序列预测出其三维空间结构。Levinthal悖论(Levinthal'sParadox)一个100个氨基酸组成的肽链的折叠:假设:三种可能构象/氨基酸残基3100种不同构象;即使:10-13秒(0.1皮秒)/可能构想,(一皮秒:十亿分之一秒的千分之一)5x1034秒,or1027年(宇宙年龄1010年)CyrusLevinthal(1996):美国分子生物学家蛋白质结构预测的理论基础:Anfinsen理论(Anfinsen'sdogma)ChristianBoehmerAnfinsen,Jr.(1916–1995)美国生物化学家,1972诺贝尔化学奖获得者蛋白质序列含有蛋白质折叠的全部信息!凡人改变世界?Folding@home:(始于2000年10月)分布式蛋白质折叠计算,它是众多分布式计算项目之一,也是最出名、普及最广泛的之一。它所凝聚的志愿者计算能力,比肩世界最快的超级计算机“天河二号”。Intel、Google、NVIDIA、AMD(前ATI)、索尼、苹果、戴尔等厂商形成了一个支持Folding@home项目发展的同盟。蛋白质结构的层次与结构预测初级结构(primarystructure)-螺旋(-helix)-折叠(-pleatedsheet)二级结构(secondarystructure)四级结构(quaternarystructure)三级结构(tertiarystructure)SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology)蛋白质的二级结构预测判断每一段中心的残基是否处于-螺旋、-折叠(或其它状态)的二级结构态。1.经验参数法(Chou-Fasman方法)由Chou和Fasman在70年代提出来。通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子(P(ɑ-helix)、P(β-sheet)),进而利用这些倾向性因子预测蛋白质的二级结构。理论依据:每种氨基酸出现在各种二级结构中倾向或者频率是不同的。例如:谷氨酸(Glu,E):-螺旋(√)缬氨酸(Val,V):-折叠(√)脯氨酸(Pro,P):-螺旋(X)氨基酸残基的构象倾向性因子定义:Pi=Ai/Ti(i=,β,c,t)i表示构象态:如螺旋、β折叠、转角、无规卷曲等;Ti是所有被统计残基处于构象态i的比例;Ai是第A种残基处于构象态i的比例;Pi大于1.0表示该残基倾向于形成二级结构构象i,小于1.0则表示倾向于形成其它构象。四个转角参数,f(i)、f(i+1)、f(i+2)和f(i+3)。这四个参数分别对应于每种残基出现在转角第一、第二、第三和第四位的频率(例如,脯氨酸约有30%出现在转角的第二位,然而出现在第三位的几率不足4%)。Chou-Fasman参数基本思想是在序列中寻找规则二级结构的成核位点和终止位点。扫描输入的氨基酸序列,发现可能成为特定二级结构成核区域的短序列,然后对于成核区域进行扩展,不断扩大成核区域,直到倾向性因子小于某个阈值(1.0)为止。成核区延伸延伸ɑ-螺旋Chou-Fasman参数法预测二级结构的经验规则氨基酸残基(i)α螺旋规则(ii)β折叠规则(iii)转角规则(iv)重叠规则经验规则(i)α螺旋规则沿蛋白质序列寻找α螺旋核–相邻的6个残基中如果有至少4个残基倾向于形成α螺旋,则认为是螺旋核。从螺旋核向两端延伸–直至四肽片段的α螺旋倾向性因子的平均值{P}1.0为止。将螺旋两端各去掉3个残基–剩余部分若长于6个残基,而且{P}1.03,则预测为螺旋。(ii)β折叠规则–相邻6个残基中若有4个倾向于形成β折叠,则认为是折叠核。–折叠核向两端延伸直至4个残基的平均折叠倾向性因子{P}1.0。–若延伸后的片段的{P}1.05,则预测为β折叠。在实际运用中有50-60%的准确率,虽然有文章宣称能达到更高的准确率(数据集受限)(iii)β-转角规则•转角的模型为四肽组合模型,要考虑每个位置上残基的组合概率,即特定残基在四肽模型中各个位置的概率。在计算过程中,对于从第i个残基开始的连续4个残基的片段,将上述概率相乘,根据计算结果判断是否是转角。•如果f(i)×f(i+1)×f(i+2)×f(i+3)大于7.5×10-5,四肽片段Pt的平均值大于100,并且Pt的均值同时大于P的均值以及P的均值,则可以预测这样连续的4个残基形成转角。2.基于氨基酸疏水性的预测方法α螺旋的两亲特特征:螺旋的一侧通常处于蛋白质的疏水核心,另一侧则常处于亲水表面,因此,α-螺旋中亲疏水氨基酸残基的出现位置也就有一定的规律性,亲水残基多出现在亲水侧面,而疏水残基则多出现在疏水侧面,反映在序列上就是一些特征的亲疏水残基间隔模式。脂肪族疏水性氨基酸极性或带负电氨基酸带正电氨基酸432151432α-螺旋的两亲特特征与结构预测基于氨基酸疏水性的预测α螺旋的形成规律:在一段序列中发现第i、i+3、i+4位(如1、4、5)是疏水残基时,这一片段就被预测为α螺旋;当发现第i、i+1、i+4位(如7,8,11)为疏水残基时,这一片段也被预测为α螺旋。基于氨基酸疏水性的预测β折叠的形成规律:对于β折叠,也存在着一些特征的亲疏水残基间隔模式,埋藏的β折叠通常由连续的疏水残基组成,一侧暴露的β折叠则通常具有亲水-疏水的两残基重复模式。原则上,通过在序列中搜寻特殊的亲疏水残基间隔模式,就可以预测α螺旋和β折叠。将待预测的片段与数据库中已知二级结构的片段进行相似性比较,根据相似性得分以及数据库中的构象态,构建出待预测片段的二级结构。该方法对数据库中同源序列的存在非常敏感,若数据库中有相似性大于30%的序列,则预测准确率可大大上升。3.基于多重序列比对的方法(同源法)已知二级结构的氨基酸片段T=T的二级结构为(H代表-螺旋):HHHHH待预测二级结构的氨基酸片段U=序列比对:T=U=将T的构象态赋予U相似序列→相似结构4.综合方法多个程序同时预测