第十章蛋白质结构分析AnalysisofProteinStructure哈尔滨医科大学陈丽娜本章重点、难点重点:使用蛋白质结构数据库分析蛋白质结构及可视化、蛋白质结构预测方法、基于蛋白质结构的功能预测方法难点:蛋白质的三维结构预测及基于结构的蛋白质功能预测软件的使用、蛋白质高级结构特征的识别和指认第一节引言Introduction一、诺贝尔奖与蛋白质结构分析1914年诺贝尔物理学奖,劳厄(M.vonLaue)发现晶体中的X射线衍射现象1915年诺贝尔物理学奖,布拉格父子用X射线对晶体结构的研究1936年诺贝尔化学奖,德拜(P.J.W.Debye)用X射线衍射技术探明分子中原子的排列与结合形式1944年诺贝尔物理学奖,拉比(I.I.Rabi)发明核磁共振法1958年诺贝尔化学奖,桑格(F.Sanger)分离和测定一种蛋白质--胰岛素的氨基酸结构1962年诺贝尔化学奖,佩鲁茨(M.F.Perutz)和肯德鲁(J.C.Kendrew)用X射线衍射技术测定肌红蛋白和血红蛋白的原子排列1964年诺贝尔化学奖,霍奇金(D.C.Hodgkin)测定维生素B12等复杂晶体的结构1972年诺贝尔化学奖,安芬森(C.B.Anfinsen)、莫尔(S.Moore)和斯坦(W.H.Stein)对核糖核酸酶的三维结构及其124个氨基酸顺序的研究1982年诺贝尔化学奖,克卢格(A.Klug)将X射线衍射技术与电子显微技术结合发明显微影象重组技术,以及在结构分子生物学方面的研究1985年诺贝尔化学奖,豪普特曼(H.A.Haupt-man)和卡尔(J.Karlc)开发了用于X射线衍射确定物质晶体结构的直接计算法1991年诺贝尔化学奖,恩斯特(R.Ernst)发明了傅立叶变换核磁共振分光法和二维核磁共振技术2002年诺贝尔化学奖,库尔特·维特里希“发明了利用核磁共振技术测定溶液中生物大分子三维结构的方法”二、蛋白质高级结构信息1.二级结构(secondarystructure)2.超二级结构(supersecondarystructure)3.三级结构(tertiarystructure)4.四级结构(quaternarystructure)三、蛋白质结构分析的主要目标1.建立研究蛋白质结构信息发掘与预测的方法;2.研究参与生命活动过程的蛋白质的物理性质、空间架构、功能片段和相互作用;3.探索基于蛋白质结构表征蛋白质的生物学意义;4.得到新的预测性的知识。第二节蛋白质的高级结构AdvancedStructuresofProtein一、蛋白质的高级结构特征(一)二级结构的主要类型和特征蛋白质的二级结构是指多肽链主链骨架盘绕折叠而形成的构象,借氢键维系。主要分为α螺旋、β折叠、β转角及无规卷曲等类型。1.α螺旋(αhelix)的结构特征为:(1)主链骨架围绕中心轴盘绕形成右手螺旋;(2)螺旋每上升一圈是3.6个氨基酸残基,螺距为0.54nm;(3)相邻螺旋圈之间形成许多氢键;(4)侧链基团位于螺旋的外侧。2.β折叠(βsheets)的结构特征为:(1)若干条肽链或肽段平行或反平行排列成片;(2)所有肽键的C=O和N—H形成链间氢键;(3)侧链基团分别交替位于片层的上、下方。人细胞珠蛋白(2DC3.pdb)的第121到140位残基对应的a-螺旋侧面和顶部(N端)视图β折叠示意图a.反平行和平行的多个β折叠链形成一个完整β折叠结构的氢键示意图;b.来自人pi型谷胱甘肽-S-转硫酶中单个亚基中连续主链的部分β折叠结构(2DGQ.pdb)侧面视图,可见转角(turn);c.来自人pi型谷胱甘肽-S-转硫酶一个亚基中连续主链的部分β折叠结构顶部视图,可见转角(turn);d.来自人信号传递蛋白SMAD4(1DD1.pdb)的一个亚基中部分β折叠结构顶部视图,可见到大的环区(loop)。多肽链180°回折部分,通常由四个氨基酸残基构成,借1.4残基之间形成的氢键维系。3.β转角的结构特征为:a.人谷胱甘肽-S-转硫酶pi第56到59位残基的β转角连接了来自相同主链的两段β折叠链,片层末端残基显示为粗枝状,β转角中Gly和Asp显示为细线,转角区域内第一个Asp的α羰基氧与其后第三位α氨基成氢键(3DGQ.pdb);b.来自人细胞珠蛋白(2DC3.pdb)的两段α螺旋由β转角连接,用粗树枝状显示了两段螺旋末端的脯氨酸。β转角及其连接的β折叠链和α螺旋4.无规卷曲的结构特征为:无规卷曲的特点为在主链骨架上无规则盘绕,其构象状态仍遵循物理化学原理,但波动性较大,对温度变化敏感;实验测定三级结构时往往无法识别无规卷曲(缺失其座标),即使有座标则其温度因子也较高。无规卷曲同Ω环的区分主要是其长度和其形状的波动性。(二)超二级结构的主要类型和特征超二级结构(supersecondarystructure)指位于同一主链的多个二级结构组装形成的特定组装体,可直接作为三级结构的或结构域的组成单元,是从蛋白质二级结构形成三级结构的一个过渡结构形式,也称为立体结构形成的模体。(1)β转角或Ω环等连接连续四个α螺旋形成的四α螺旋捆;(2)中部固定位置含有亮氨酸及其他疏水侧链氨基酸残基、在螺旋两端含有强亲水侧链氨基酸的α螺旋组成的亮氨酸拉链(Leucinezipper);(3)一条主链中相邻七个两亲α螺旋通过过度结构形成的七次穿膜螺旋组;(4)连续主链中两段α螺旋连接三段β折叠链形成的Rossmann折叠;(5)β转角连接a螺旋构成的a-螺旋-β转角-α螺旋;(6)Ω环连接α螺旋构成的α螺旋-Ω环-α螺旋等。(7)β-折叠都为超二级结构。超二级结构的主要类型:三级结构(proteintertiarystructure),即蛋白质分子处于它的天然折叠状态的三维构象,它是在二级结构的基础上进一步盘绕,折叠形成的。蛋白质三级结构的稳定主要靠氨基酸侧链之间的疏水相互作用,氢键、二硫键、范德华力和静电作用维持。不同类型的蛋白质尽管局部结构分解后具有很高的相似性,但是由于其含辅助因子的全部共价相连原子空间的相对位置,即其二级结构的组装(assembly)模式存在着差异,在三级结构层面不同的蛋白质将体现各自整体的结构特征。(三)三级结构的主要类型和特征1.水溶性蛋白质三级结构的基本特征a.飘带显示全α螺旋人血清白蛋白单体三级结构,结构略微松散(2T2Z.pdb);b.飘带显示全α螺旋人血清白蛋白单体三级结构,树枝状显示氨基酸侧链,结构明显紧密;c.飘带显示全β折叠人晶状体蛋白三级结构,结构略微松散(2JDF.pdb),全蓝色的树枝状结构为配体;d.飘带显示全β折叠人晶状体蛋白的三级结构,树枝状显示氨基酸侧链,结构非常紧密,全蓝色的树枝状结构为配体。2.膜蛋白三级结构的基本特征a~c.细菌视紫红质蛋白,结晶时结合了大量脂类(2BRD.pdb);d.人淋巴细胞激活抗原CD98(2DH2.pdb);e.鸡β1-肾上腺素受体,七螺旋跨膜蛋白(2VT4.Pdb)并结合有其配体;f.大肠杆菌NANC离子通道蛋白(2WJR.pdb)。3.蛋白质三级结构中二级结构的折叠和组装按二级结构组装模式对蛋白质进行分类对解析蛋白质高级结构形成规律和预测蛋白质功能有重要帮助。蛋白质二级结构组装模式主要是全α螺旋、全β折叠、α螺旋/β折叠,还有少量α螺旋+β折叠类。全a-螺旋蛋白质人血清白蛋白(上图a,b)和细菌视紫红质(下图a-c)全β-折叠蛋白质人晶状体蛋白(上图c,d)和大肠杆菌NANC离子通道蛋白(下图f)a-螺旋/β-折叠蛋白质细胞表面标志蛋白CD98(图d)及糖酵解的绝大多数酶蛋白(图a)a-螺旋+β-折叠类蛋白质人TBP与双螺旋DNA复合物(1CDW.pdb)有独立三级结构的单元通过非共价键聚集成的非共价复合物称为四级结构,其所含独立三级结构单位为亚基(subunit)。形成四级结构全部依靠非共价键相互作用,且来自不同亚基的二级结构间可发生强的相互作用以稳定四级结构,如生成跨亚基的更大β折叠结构或α螺旋聚集体;其中,氢键、疏水相互作用和静电作用是主要维持力。为了形成稳定的四级结构,必然要求相互作用的任两个蛋白质间在空间外形互补以增加接触面且理化性质互补。这些特征也是预测蛋白质间相互作用时有用的辅助判据。(四)四级结构的主要类型和特征PBO-1蛋白质呈现的对称结构偶数亚基形成的四级结构具有较高的对称性二、蛋白质高级结构中二级结构的测定与指认蛋白质二级结构词典(dictionaryofsecondarystructuresofproteins,DSSP)来自模式识别技术,其仅依据主链肽键基团的坐标判断主链肽键基团间是否形成氢键,计算氢键能量低于-0.5kcal/mol则有氢键形成,用于搜索α螺旋和β片层结构是否存在。STRIDE程序用特殊方法判定主链肽键之间的氢键是否存在并用二面角参数辅助识别指认二级结构。三、蛋白质结构域与家族分类(一)蛋白质结构域结构域是构成蛋白质亚基的紧密球状区域,为介于二级与三级结构之间的一种结构层次;是蛋白质中可以具有独立三级结构的部分,通常由一个基因外显子编码,并可具有特定的功能。最常见的结构域约含有100~200个氨基酸残基,一般至少40个、多的可至400个以上;对于一个较大球状蛋白质分子来说,往往由两个或两个以上相对独立的三维实体缔合而成三维结构体。(二)蛋白质家族分类目前建立在结构域基础上的蛋白质家族数据库有PROSITE、PRINTS、Pfam、SMART、SWISS、PROT、ProDom和BLOCKS等,每个蛋白质结构数据库运用不同的原理来识别结构相似的蛋白质超家族;将它们结合起来可以更准确地归类蛋白质家族和描绘结构域。InterPro数据库,是联合PROSITE、PRINTS、Pfam和ProDom四个独立完整的蛋白质结构域数据库组成站点,它是将蛋白质的结构域和功能位点加以统一建立的数据库资源。四、蛋白质高级结构的实验解析方法蛋白质结构实验分析主要有三大技术平台(一)X-衍射蛋白质晶体结构分析(二)核磁共振波谱分析(三)冷冻电镜技术(一)蛋白质晶体结构X-衍射分析摸索蛋白质结晶条件、快速处理晶体结构数据和减少差错是目前蛋白质晶体结构分析的两大难题或瓶颈。是目前分辨率最高的结构测定方法,高通量晶体结构分析中的几大重要环节是:数据处理与分析、重原子的定位、密度修饰、分子替换、图形整合、模型加工和确认。晶体结构分析的常用软件有SOLVE,RESOLVE等。(二)核磁共振波谱分析利用核磁共振原理,检测分子质量小于60kμ的蛋白质,通过对其核磁共振谱线特征参数的测定来分析蛋白质的结构与性质,就是将原始资料利用傅里叶变换转换为不同的峰值,然后采集各种不同的峰组成图谱,并利用生物信息学方法筛选出具有特定结构特征的图谱。常用NMRPipe和SPARKY软件处理这些过程,使用XEASY,DYANA和GARANT等软件分析侧链或骨架结构。与X-衍射晶体分析技术相比较,NMR技术在蛋白质结构测定的速度上、和研究的对象上都存在一定的限制,成本太高,步骤繁多。但其无需制备晶体标本,可在溶液中直接测定,也可进行固相测定,因此利用NMR法使得某些无法获得晶体结构的蛋白质或非液相蛋白质(如膜蛋白)的结构测定成为可能。相对而言,NMR技术更适合小分子质量以及水溶性较好培养晶体困难的蛋白质结构的分析,对于蛋白质折叠、局部动力学或构象分析、蛋白-蛋白相互作用,NMR更体现其优越性。X-衍射晶体分析技术和NMR技术的比较(三)冷冻电子显微镜技术采用高压快速液氮冷冻方法使样品包埋在玻璃态的水环境中,使我们能够观察到生物大分子在天然状态下的结构;同时冷冻的速度极快,把细胞在其生理活动的某些特定时刻固定下来,显示此时的结构特点,进而可通过不同功能状态的瞬时构象变化来研究生物分子的功能。冷冻电镜获得的是处于天然状态下未经染色的分子的二维投影像。将样品进行不同角度的倾斜所获得的数据进行综合分析,并依据样品的不同特性使用不同的重构技术获得分子的结构,在此基础上观察多种成分的图像变化,追踪生物大分子的装