第七章蛋白质性质和结构分析主要内容:为什么要进行蛋白质性质和结构的预测?蛋白质一级结构分析蛋白质二级结构分析蛋白质三级结构分析蛋白质的跨膜区段分析保守结构域的分析本章重点难点:蛋白质化学性质和结构预测分析的基本方法。为什么要进行蛋白质性质、结构的预测!蛋白质虽然是线性排列的氨基酸组成,但是只有折叠成特定的空间结构才能具有相应的活性和生物学功能。了解蛋白质的空间结构有利于认识蛋白质的功能,有利于认识其功能是如何执行的,所以认识蛋白质的结构对于生物学研究是非常重要的。蛋白质序列增长非常快,结构信息增长非常慢。目前,获取蛋白质结构信息一般用X晶体衍射法、核磁共振等——耗时、耗人力、技术需求高。X晶体衍射法:研究蛋白质结构最有效的方法,精度非常高,缺点是晶体难培养,测定周期长。核磁共振可直接测定蛋白质在溶液中的构象,但样品需求量大,纯度要求高,测定蛋白质的分子量不能超过20000。要想尽快弄清生命活动的规律,不能等待蛋白质测定的实验结果,要发展蛋白质结构的理论分析方法。蛋白质结构预测可以帮助我们理解蛋白质的功能和作用机制。因为许多药物选择性地结合靶蛋白,蛋白质结构的知识可以帮助我们设计合理的药物。蛋白质结构预测基础——序列决定结构:蛋白质可以自发地折叠成它们的天然结构,特别是结构简单的蛋白质小分子。蛋白质预测现状:不同的方法采用不同的算法,得到的结果可能不同一种方法可能对某个特定实例很合适,而对另一个可能完全不对。总体上看,预测准确率有待提高,但预测结果仍然能提供许多结构信息,尤其是对一个结构未知的蛋白质。预测方法中,假定蛋白质的二级结构主要是由邻近碱基间短程相互作用所决定的蛋白质预测准确度不高的原因:现有的预测方法无法考虑氨基酸残基间的长程相互作用。已知的蛋白质晶体结构数据还不够多。序列相似的蛋白质具有相似的三维结构不同蛋白质中相同的结构域(domain)具有相似的功能分析蛋白质的功能许多生物信息学网站具有分析蛋白质性质和结构的软件一级结构:氨基酸的排列顺序二级结构:主要由氢键维系的结构(α-helix、β-sheet等)三级结构:二级结构进一步折叠形成的结构域ExPASy(ExpertProteinAnalysisSystem)SwissInstituteofBioinformatics(SIB)的分析工具蛋白质序列分析蛋白质性质分析蛋白质结构分析2-DPAGE(polyacrylamidegelelectrophoresis)分析(一)分析蛋白质的一级结构一级结构:蛋白质的氨基酸序列分析内容蛋白质的氨基酸组成等电点(pI)分子量(molecularweight,Mw)疏水性(hydrophobicity)其它1.分析蛋白质的pI、Mw、氨基酸组成ExPASy主页选择Primarystructureanalysis在“Primarystructureanalysis”栏目选择“ProtParam”分析软件在ProtParam主页()粘贴序列进行分析蛋白质的pI、Mw、氨基酸组成、消光系数、半衰期、稳定系数等2.分析蛋白质的疏水性ExPASy主页选择Primarystructureanalysis在“Primarystructureanalysis”栏目选择“ProtScale”分析软件在ProtScale主页()粘贴序列、选择分析方法蛋白质的亲水和疏水性分析结果,有图形显示的分析结果(亲水用负值表示、疏水用正值表示)3.分析蛋白质的重复序列(模块)在“Primarystructureanalysis”栏目选择“REP”分析软件在REP主页(~andrade/papers/rep/search.html)粘贴序列,点击“Searchforrepeats”分析结果XA26-LRR(leucine-rich-repeat)LxxLxxLxxLxLxxNxLxGxIPxx(二)分析蛋白质的二级结构二级结构:主要是氢键维持的结构-螺旋(-helix)弯(turn)-折叠(-sheet)strandsheet襻(loop)(三)分析蛋白质的三级结构1.根据已知蛋白质结构推测未知蛋白质结构BLAST检索在蛋白质结构数据库(PDB)中检索同源蛋白质的结构ExPASy主页选择tertiarystructuretools2.通过分子建模(molecularmodeling)分析蛋白质三维结构分析复杂适用于专业人员在“tertiarystructureprediction”栏目选择一个分析工具,email服务(四)分析膜蛋白质膜蛋白种类膜镶嵌蛋白质膜附着蛋白质膜蛋白的跨膜区一般形成-螺旋膜附着蛋白质的形成形成膜镶嵌蛋白质内质网腔中的部分蛋白被剪切与膜脂分子(如GPI,糖基磷脂酰肌醇)连接跨膜区滞留在脂质双层中预测蛋白质的跨膜区ExPASy主页选择Post-translationalmodificationandtopologyprediction在“Topologyprediction”栏目选择“SOSUI”分析工具在SOSUI主页选择分“SOSUI()”分析软件在SOSUI:Submitaproteinsequence网页粘贴序列分析结果其它分析软件DAS:分析原核生物蛋白质的跨膜结构Tmpred:分析蛋白质的跨膜结构和在膜上的方向(五)分析蛋白质的翻译后修饰1.分析信号肽及其剪切位点信号肽序列的特征20-35个氨基酸富含疏水氨基酸的片段至少有一个带正电荷的氨基酸2.分析糖链连接点糖链连接方式O-连接:丝氨酸、苏氨酸、羟赖氨酸的羟基N-连接:天门冬酰氨的酰氨基(六)分析蛋白质的亚细胞定位线粒体蛋白质内质网蛋白质高尔基复合体蛋白质溶酶体蛋白质过氧化物酶体蛋白质细胞核蛋白质ExPASy主页选择Post-translationalmodificationandtopologyprediction在“Topologyprediction”栏目选择“PSORT”软件分析蛋白质在细胞中的定位在PSORT网页()选择分析方法,如选择PSORTforplantsequence点击“PSORTPrediction”,选择物种,粘贴序列分析结果对大麦Mlo基因(Z83834)编码的蛋白质进行相关分析。(七)上机操作