第五章蛋白质结构分析第一节引言一、诺贝尔奖与蛋白质结构分析1962年诺贝尔化学奖,佩鲁茨(M.F.Perutz)和肯德鲁(J.C.Kendrew)用X射线衍射技术测定肌红蛋白和血红蛋白的原子排列1982年诺贝尔化学奖,克卢格(A.Klug)将X射线衍射技术与电子显微技术结合发明显微影象重组技术,研究结构分子生物学2002年,美国科学家约翰·芬恩、日本科学家田中耕一(质谱分析)和瑞士科学家库尔特·维特里希(核磁共振)发明了对生物大分子进行识别和结构分析的方法。二、蛋白质高级结构信息1.二级结构(secondarystructure)2.超二级结构(supersecondarystructure)3.三级结构(tertiarystructure)4.四级结构(quaternarystructure)三、蛋白质结构分析的主要目标1.建立研究蛋白质结构信息发掘与预测的方法;2.研究参与生命活动过程的蛋白质的物理性质、空间架构、功能片段和相互作用;3.探索基于蛋白质结构表征蛋白质的生物学意义;4.得到新的预测性的知识。第二节蛋白质的高级结构一、蛋白质的高级结构特征(一)二级结构的主要类型和特征蛋白质的二级结构是指多肽链主链骨架盘绕折叠而形成的构象,借氢键维系。主要分为α螺旋、β折叠、β转角及无规卷曲等类型。1.α螺旋(αhelix)的结构特征为:(1)主链骨架围绕中心轴盘绕形成右手螺旋;(2)螺旋每上升一圈是3.6个氨基酸残基,螺距为0.54nm;(3)相邻螺旋圈之间形成许多氢键;(4)侧链基团位于螺旋的外侧。2.β折叠(βsheets)的结构特征为:(1)若干条肽链或肽段平行或反平行排列成片;(2)所有肽键的C=O和N—H形成链间氢键;(3)侧链基团分别交替位于片层的上、下方。人细胞珠蛋白(2DC3.pdb)的第121到140位残基对应的a-螺旋侧面和顶部(N端)视图β折叠示意图a.反平行和平行的多个β折叠链形成一个完整β折叠结构的氢键示意图;b.来自人pi型谷胱甘肽-S-转硫酶中单个亚基中连续主链的部分β折叠结构(2DGQ.pdb)侧面视图,可见转角(turn);c.来自人pi型谷胱甘肽-S-转硫酶一个亚基中连续主链的部分β折叠结构顶部视图,可见转角(turn);d.来自人信号传递蛋白SMAD4(1DD1.pdb)的一个亚基中部分β折叠结构顶部视图,可见到大的环区(loop)。多肽链180°回折部分,通常由四个氨基酸残基构成,借1.4残基之间形成的氢键维系。3.β转角的结构特征为:a.人谷胱甘肽-S-转硫酶pi第56到59位残基的β转角连接了来自相同主链的两段β折叠链,片层末端残基显示为粗枝状,β转角中Gly和Asp显示为细线,转角区域内第一个Asp的α羰基氧与其后第三位α氨基成氢键(3DGQ.pdb);b.来自人细胞珠蛋白(2DC3.pdb)的两段α螺旋由β转角连接,用粗树枝状显示了两段螺旋末端的脯氨酸。β转角及其连接的β折叠链和α螺旋4.无规卷曲的结构特征为:无规卷曲的特点为在主链骨架上无规则盘绕,其构象状态仍遵循物理化学原理,但波动性较大,对温度变化敏感;实验测定三级结构时往往无法识别无规卷曲(缺失其座标),即使有座标则其温度因子也较高。无规卷曲同Ω环的区分主要是其长度和其形状的波动性。(二)超二级结构的主要类型和特征超二级结构(supersecondarystructure)指位于同一主链的多个二级结构组装形成的特定组装体,可直接作为三级结构的或结构域的组成单元,是从蛋白质二级结构形成三级结构的一个过渡结构形式,也称为立体结构形成的模体。(1)β转角或Ω环等连接连续四个α螺旋形成的四α螺旋捆;(2)中部固定位置含有亮氨酸及其他疏水侧链氨基酸残基、在螺旋两端含有强亲水侧链氨基酸的α螺旋组成的亮氨酸拉链(Leucinezipper);(3)一条主链中相邻七个两亲α螺旋通过过度结构形成的七次穿膜螺旋组;(4)连续主链中两段α螺旋连接三段β折叠链形成的Rossmann折叠;(5)β转角连接a螺旋构成的a-螺旋-β转角-α螺旋;(6)Ω环连接α螺旋构成的α螺旋-Ω环-α螺旋等。(7)β-折叠都为超二级结构。超二级结构的主要类型:三级结构(proteintertiarystructure),即蛋白质分子处于它的天然折叠状态的三维构象,它是在二级结构的基础上进一步盘绕,折叠形成的。蛋白质三级结构的稳定主要靠氨基酸侧链之间的疏水相互作用,氢键、二硫键、范德华力和静电作用维持。不同类型的蛋白质尽管局部结构分解后具有很高的相似性,但是由于其含辅助因子的全部共价相连原子空间的相对位置,即其二级结构的组装(assembly)模式存在着差异,在三级结构层面不同的蛋白质将体现各自整体的结构特征。(三)三级结构的主要类型和特征蛋白质三级结构中二级结构的折叠和组装按二级结构组装模式对蛋白质进行分类对解析蛋白质高级结构形成规律和预测蛋白质功能有重要帮助。蛋白质二级结构组装模式主要是全α螺旋、全β折叠、α螺旋/β折叠,还有少量α螺旋+β折叠类。全a-螺旋蛋白质人血清白蛋白(上图a,b)和细菌视紫红质(下图a-c)全β-折叠蛋白质人晶状体蛋白(上图c,d)和大肠杆菌NANC离子通道蛋白(下图f)a-螺旋/β-折叠蛋白质细胞表面标志蛋白CD98(图d)及糖酵解的绝大多数酶蛋白(图a)a-螺旋+β-折叠类蛋白质人TBP与双螺旋DNA复合物(1CDW.pdb)有独立三级结构的单元通过非共价键聚集成的非共价复合物称为四级结构,其所含独立三级结构单位为亚基(subunit)。形成四级结构全部依靠非共价键相互作用,且来自不同亚基的二级结构间可发生强的相互作用以稳定四级结构,如生成跨亚基的更大β折叠结构或α螺旋聚集体;其中,氢键、疏水相互作用和静电作用是主要维持力。为了形成稳定的四级结构,必然要求相互作用的任两个蛋白质间在空间外形互补以增加接触面且理化性质互补。这些特征也是预测蛋白质间相互作用时有用的辅助判据。(四)四级结构的主要类型和特征PBO-1蛋白质呈现的对称结构偶数亚基形成的四级结构具有较高的对称性二、蛋白质结构域与家族分类(一)蛋白质结构域结构域是构成蛋白质亚基的紧密球状区域,为介于二级与三级结构之间的一种结构层次;是蛋白质中可以具有独立三级结构的部分,通常由一个基因外显子编码,并可具有特定的功能。最常见的结构域约含有100~200个氨基酸残基,一般至少40个、多的可至400个以上;对于一个较大球状蛋白质分子来说,往往由两个或两个以上相对独立的三维实体缔合而成三维结构体。(二)蛋白质家族分类目前建立在结构域基础上的蛋白质家族数据库有PROSITE、PRINTS、Pfam、SMART、SWISS、PROT、ProDom和BLOCKS等,每个蛋白质结构数据库运用不同的原理来识别结构相似的蛋白质超家族;将它们结合起来可以更准确地归类蛋白质家族和描绘结构域。InterPro数据库,是联合PROSITE、PRINTS、Pfam和ProDom四个独立完整的蛋白质结构域数据库组成站点,它是将蛋白质的结构域和功能位点加以统一建立的数据库资源。三、蛋白质高级结构的实验解析方法蛋白质结构实验分析主要有三大技术平台(一)X-衍射蛋白质晶体结构分析(二)核磁共振波谱分析(三)冷冻电镜技术(一)蛋白质晶体结构X-衍射分析摸索蛋白质结晶条件、快速处理晶体结构数据和减少差错是目前蛋白质晶体结构分析的两大难题或瓶颈。是目前分辨率最高的结构测定方法,高通量晶体结构分析中的几大重要环节是:数据处理与分析、重原子的定位、密度修饰、分子替换、图形整合、模型加工和确认。晶体结构分析的常用软件有SOLVE,RESOLVE等。(二)核磁共振波谱分析利用核磁共振原理,检测分子质量小于60kd的蛋白质,通过对其核磁共振谱线特征参数的测定来分析蛋白质的结构与性质,就是将原始资料利用傅里叶变换转换为不同的峰值,然后采集各种不同的峰组成图谱,并利用生物信息学方法筛选出具有特定结构特征的图谱。常用NMRPipe和SPARKY软件处理这些过程,使用XEASY,DYANA和GARANT等软件分析侧链或骨架结构。与X-衍射晶体分析技术相比较,NMR技术在蛋白质结构测定的速度上、和研究的对象上都存在一定的限制,成本太高,步骤繁多。但其无需制备晶体标本,可在溶液中直接测定,也可进行固相测定,因此利用NMR法使得某些无法获得晶体结构的蛋白质或非液相蛋白质(如膜蛋白)的结构测定成为可能。相对而言,NMR技术更适合小分子质量以及水溶性较好培养晶体困难的蛋白质结构的分析,对于蛋白质折叠、局部动力学或构象分析、蛋白-蛋白相互作用,NMR更体现其优越性。X-衍射晶体分析技术和NMR技术的比较(三)冷冻电子显微镜技术采用高压快速液氮冷冻方法使样品包埋在玻璃态的水环境中,使我们能够观察到生物大分子在天然状态下的结构;同时冷冻的速度极快,把细胞在其生理活动的某些特定时刻固定下来,显示此时的结构特点,进而可通过不同功能状态的瞬时构象变化来研究生物分子的功能。冷冻电镜获得的是处于天然状态下未经染色的分子的二维投影像。将样品进行不同角度的倾斜所获得的数据进行综合分析,并依据样品的不同特性使用不同的重构技术获得分子的结构,在此基础上观察多种成分的图像变化,追踪生物大分子的装配及其动力学过程。由冷冻电镜技术所获得的蛋白质三维结构与X射线晶体技术非常相似,而且其信噪比非常低,并适合于内在膜蛋白的分析。其独特优势为:可以用不同的方法对均一的(如膜蛋白的二维晶体,二十面体对称的病毒等对称结构)和不均一的(如核糖体等)样品进行三维结构重构,同时,冷冻电子显微镜是唯一的能研究小到蛋白质、蛋白质复合物,大到细胞器甚至整个细胞的方法。冷冻电子显微镜技术与X衍射晶体结构分析方法比较四、蛋白质结构的可视化可视化分析蛋白质的高级结构,有利于从原子间相互作用的层次理解生命活动过程的信息控制机制,更加有效地揭示分子在完成其功能过程中的演化情况,了解蛋白质分子结构和各种微观性质与宏观性质之间的定量关系。只要安装蛋白质分子图形学软件,并获得所需蛋白质结构数据,配以商业软件或免费的小分子图形设计系统,就可开展结构生物信息学的探索性工作。蛋白质可视化免费软件PymolPymol是强大的分子图形显示和基本特征测定系统Pymol可在寻找链接下载,Pymol启动后显示双界面,对分子操作的常用命令界面,多种分析功能界面。1.图形界面左上侧列出主要的可操作对象并分成几个层次,包括所选对象、蛋白质、整体等;2.每个层次的对象有五种主要操作:动作(A:action)、显示(S:Show)、隐藏(H:hide)、标记(L:Label)、上色(C:Color)。3.Dispaly下拉菜单中可显示蛋白质中每条肽链的序列和非蛋白质成分,鼠标左键单击序列选中特殊待操作的残基可同时显示对象所在位置;还可设置背景(论文中这类图一般用白色背景,而报告中常用黑色背景以增加视觉效果);4.Wizard中有对分子常用性质测定模块,包括距离、电荷等以及尝试进行蛋白质分子改造的功能。蛋白质图形操作和性质测定第三节蛋白质结构数据库一、蛋白质三维结构数据库PBDPDB数据库收录条目一览表实验方法分子类型总数蛋白质核酸蛋白/核酸复合物其他X-射线衍射48225116822161751626NMR699386915068018电镜17116650252其他1305510150总数55519205824363360046以人类泪液载脂蛋白为例,具体介绍下其在PDB数据库中结构检索和可视化过程第一步:输入关键字“HUMANTEARLIPOCALIN”第二步:选择人类泪液载脂蛋白1XKI第三步:点击BiologyAssembly面板展示其结构图第四步:1XKI结构展示图二、蛋白质结构分类数据库SCOPSCOP(structuralclassificationofprotein)数据库是一个包含已有结构的蛋白质分类数据库,依据不同蛋白质的氨基酸组成的相似性及三级结构,详细描述已知结