蛋白质结构——探询生命秘密的钥匙北京大学化学与分子工程学院00810002杨奕00810044许文馨00810062蔡雯倩00810144江蔚曦目录摘要一序言摘要本文由蛋白质结构的发现开始,综述了部分不同的蛋白质结构测定方法、蛋白质结构预测方法并对蛋白质设计的概念进行了描述。一序言20世纪末爆发的疯牛病一度使全球所有人人心惶惶,造成如此巨大的影响的疯牛病的起因究竟是什么呢?经解剖病牛的脑发现,病牛中枢神经系统的脑灰质部分形成海绵状空泡,脑干灰质两侧呈对称性病变,神经纤维网有中等数量的不连续的卵形和球形空洞,神经细胞肿胀成气球状,细胞质变窄,另外,还有明显的神经细胞变性及坏死。其致病原称“朊毒体”、“朊病毒”,朊病毒是小团的蛋白质。利用正常细胞中氨基酸排列顺序一致的蛋白进行复制,是不同于细菌和病毒的生物形式,没有(不利用)DNA或RNA进行复制,目前并无针对性治疗。由于其结构简单之特性,朊毒体的复制传播都较细菌、病毒更快。现在有一种较为生物医学界所同意的猜测是,由于朊病毒自身采用β-折叠结构,从热力学上讲,β-折叠较α-螺旋更为稳定,一旦有一个朊蛋白进入牛的脑内,它便会产生诱导效应使牛的脑蛋白由原来的α-螺旋慢慢变为朊病毒的β-折叠,等到牛脑中的脑蛋白完全变为β-折叠后,牛的脑子就变成海绵状体,即感染了疯牛病。这也就解释了为什么疯牛病的潜伏期长。[REF]人们不禁要问,为什么只是蛋白质的折叠形式不一样就会产生如此巨大的差异,那么就要从蛋白质的结构开始了解了。二蛋白质结构概述蛋白质是一类有复杂结构的有机大分子,由氨基酸分子呈线性排列所形成,相邻氨基酸残基的羧基和氨基通过形成肽键连接在一起。蛋白质的氨基酸序列是由对应基因所编码。除了遗传密码所编码的20种“标准”氨基酸,在蛋白质中,某些氨基酸残基还可以被翻译后修饰而发生化学结构的变化,从而对蛋白质进行激活或调控。多个蛋白质可以一起,往往是通过结合在一起形成稳定的蛋白质复合物,发挥某一特定功能。[REF]由于蛋白质的特殊性,早在18世纪,AntoineFourcroy和其他一些研究者就已经发现蛋白质是一类独特的生物分子,他们发现用酸处理一些分子能够使其凝结或絮凝。当时他们注意到的例子有来自蛋清、血液、血清白蛋白、纤维素和小麦面筋里的蛋白质。荷兰化学家GerhardusJohannesMulder对一般的蛋白质进行元素分析发现几乎所有的蛋白质都有相同的实验公式。用“蛋白质”这一名词来描述这类分子是由Mulder的合作者JönsJakobBerzelius于1838年提出。Mulder随后鉴定出蛋白质的降解产物,并发现其中含有为氨基酸的亮氨酸,并且得到了它(非常接近正确值)的分子量,表明了氨基酸是蛋白质的一种基本组成单位,并由此最终确定了蛋白质的一级结构。蛋白质的一级结构是指多肽链的氨基酸残基的排列顺序,包括二硫键的位置,也是蛋白质最基本的结构。它是由基因上遗传密码的排列顺序所决定的,各种氨基酸按遗传密码的顺序通过肽键连接起来。每一种蛋白质分子都有自己特有的氨基酸的组成和排列顺序,由这种氨基酸排列顺序决定它的特定的空间结构,也就是蛋白质的一级结构决定了蛋白质的二级三级等高级结构。著名化学家LinusPauling在1951年成功地预测了基于氢键的规则蛋白质二级结构,而这一构想最早是由WilliamAstbury于1933年提出。随后,WalterKauzman在总结自己对变性的研究成果和之前KajLinderstrom-Lang的研究工作的基础上,提出了蛋白质折叠是由疏水相互作用所介导的。至此,蛋白质的二级结构的神秘面纱已经慢慢被揭开了。图1.肽键平面结构示意图图2.蛋白质的一级结构图3.α-螺旋中的氢键现在所公认的蛋白质的二级结构,是指多肽链本身通过氢键沿一定方向折叠,盘旋而形成的构象。二级结构研究多肽链中主链原子在各局部空间的排列分布状况,而不涉及各R侧链的空间排布。在所有已测定的蛋白质的二级结构形式主要是α-螺旋(α-helix)、β-折叠(β-sheet),大约占到所有蛋白质二级结构形式的40%~70%,除此之外还有β-转角(β-turn,或称β-发夹结构),β-突起(β-bugle)和无规卷曲(randomcoil)等。图4.反平行的β-折叠蛋白质的一级结构中的肽键不能自由旋转而成平面结构,但是此平面结构两侧的与α碳原子相连的单键可以自由旋转。经过盘旋、折叠可形成α-螺旋和β-折叠结构。而稳定二级结构的主要因素是氢键。绝大多数蛋白质以右手α-螺旋形式存在,20世纪时人工合成了左手α-螺旋结构的蛋白质分子,天然蛋白质均为右手α-螺旋。而蛋白质的三级结构,是指多肽链在二级结构的基础上,主链构象和侧链构象相互作用而进一步盘曲折叠形成高级结构。具有三级结构的蛋白质分子含有多种二级结构单元,具有明显的折叠层次。而且,三级蛋白多为球形结构(globularprotein),少数三级蛋白也有纤维状蛋白质(fibrousprotein),如丝心蛋白。蛋白质中的多肽主链通过氢键形成二级结构,多肽侧链通过非共价键形成微区,包括亲水区和疏水区,亲水区多位于分子表面,故球形蛋白质水溶性较好,疏水区从位于分子内部,它们相互作用形成一个致密的疏水核,这对稳定蛋白质的构象有十分重要的作用,而且这些疏水区域常常是蛋白质分子的功能部位或活性中心,作为与辅酶/基或底物结合位点。图5.典型的蛋白质三级结构使三级结构保持稳定的因素有多方面的,包括共价键类型的二硫键,次级键类型的氢键、盐键和疏水作用,还有如离子键,范德华力等的其他作用力。其中疏水作用是最主要的因素。对于细胞外周蛋白,二硫键起到了关键的稳定作用;而对于细胞内蛋白质,则很少出现二硫键,因为原生质中是还原环境,不利于二硫键的形成。[REF]由两个或两个以上的亚基借次级键联结成的更复杂的结构,称为蛋白质的四级结构。即蛋白质的四级结构是建立在亚基间的立体排布,亚基间的相互作用上的。只由一条多肽链构成,或由两条以上多肽链通过共价键连接而成的蛋白质,都不是具有四级结构。亚基间的聚合力,即形成四级结构并使之保持稳定也是依赖于盐键、氢键、疏水键作用和范德瓦力。但以前两者为主。图6.肌红蛋白的四级结构现在把蛋白质分子内的四种结构作一比较,结果如下表所示。表1.蛋白质四级结构的比较概念特点结构中的作用力一级结构指蛋白质分子中多肽链的氨基酸残基排列顺序。 一级结构是由基因上遗传密码的排列顺序决定的。 肽键主要是共价键,还有二硫键。 二级结构指多肽链中主链原子在各局部空间的排列分布状况,而不涉及各R侧链的空间排布。 主要形式包括α-螺旋结构、β-折叠和β-转角等。基本单位是肽键平面或称酰胺平面。 稳定二级结构的主要因素是氢键。另外还有肽键。 三级结构是指上述蛋白质的α-螺旋、β-折叠以及线状等二级结构受侧链和各主链构象单元间的相互作用,从而进一步卷曲、折叠成具有一定规律性的三度空间结构。 三级结构包括每一条肽链内全部二级结构的总和及所有侧基原子的空间排布和它们相互作用的关系。 除了主键肽键外,还有副键,如氢键、盐键、疏水键和二硫键等以及范德瓦力的作用。 四级结构是指由两条以上具有独立三级结构的多肽链通过非共价键相互结合而成一定空间结构的聚合体。 四级结构中每条具有独立三级结构的多肽链称为亚基。 非共价键。其中亚基中有盐键、氢键、疏水键作用和范德瓦力。但以前两者为主。 三从氨基酸到球蛋白——蛋白质结构的获得从1838年确定蛋白质是由氨基酸构成开始,对于这种神奇的化合物,人们开始了孜孜不倦的探索。由于蛋白质的一级结构是所有关于蛋白质研究的基础,人类花费了大量的时间来找到一种准确方法确定氨基酸残基的排列顺序。最终找到得一种准确性合乎要求的方法,蛋白质顺序分析,其基本操作是:一、应用化学裂解法和蛋白酶水解法将多肽链专一性裂解;二、逐一测定每个纯化的小肽段的顺序;三、根据肽段氨基酸顺序中的重叠区确定小肽段的排列次序;四、完成整条多肽链的顺序分析。随后,Edman液相自动顺序分析仪和固相顺序分析仪以及气相色谱-质谱(GC-MS)等方法的相继出现。使结构分析的速度也显著加快。至今已完成近千种蛋白质的一级结构分析。而到了现代,尽管蛋白质顺序分析已经自动化,但仍然耗时、复杂并且昂贵。重组DNA技术出现后,人们可以从cDNA或基因序列直接推导出蛋白质的氨基酸顺序,速度快且经济,已成为最常用的测定蛋白质氨基酸残基序列的方法。[REF]蛋白质的高级结构测定在一段时间内和氨基酸测序的工作并肩进行。1926年,JamesB.Sumner揭示尿素酶是蛋白质,首次证明了酶是蛋白质。[REF]第一个被测序的蛋白质是胰岛素,由FrederickSanger完成,他也因此获得1958年度的诺贝尔化学奖(forhisworkonthestructureofproteins,especiallythatofinsulin)。首先被解析的蛋白质结构包括血红蛋白和肌红蛋白的结构,所用方法为X射线晶体学[REF];该工作由MaxFerdinandPerutz和JohnCowderyKendrew于1958年分别完成,他们也因此获得1962年度的诺贝尔化学奖(fortheirstudiesofthestructuresofglobularproteins)。2.1X射线晶体衍射分析(X-rayCrystallography)伦琴五十年前发现的X射线为蛋白质结构的解析提供了一个全新的方法,第一个蛋白质结构由此确定,到现在,X射线晶体衍射认为高级结构测定中的重要方法,它主要包括以下五个步骤:晶体培养。晶体培养作为蛋白质晶体结构测定分析的关键步骤,是因为蛋白质最终的测定精度依赖于晶体所能达到的衍射分辨率,所以晶体培养的目标是获得具有强衍射能力的晶体用于分析。数据收集和处理。一般来讲,实验中得到的数据不一定都是正确的,可能有系统误差的呢改革中因素影响数据精度。而对于蛋白质晶体衍射,获得中等大小的晶胞的一套高分辨率数据,至少要收集几万个衍射强度数据,再经过专门的数据处理程序包处理,给出这一套数据的各种统计结果,以判断数据质量的好坏。测定相位。用X射线衍射测定蛋白质分子的晶体结构的核心问题是解决每个衍射点的相位。对小分子的蛋白质可以利用Patterson函数计算出晶胞中原子的位置(Patterson函数是反映同一晶胞中分子间或不同晶胞中原子间各向量峰关系的函数)。但是大分子不可能利用这种方法,只能利用其他方法如同晶置换法才能确定相位了。电子密度图的计算和解释。对于一个已经测定了每个衍射点的相位的蛋白质分子,再加上已经收集到的每个衍射点的结构振幅,就可计算出电子密度图。由于蛋白质分子结构的复杂性,它的电子密度图随着分辨率的不同,从图上能识别出的结构层次也不同。但是至此,我们就已经可以得到蛋白质分子的粗略的结构模型了。结构模型修正。但是从电子密度图上建立的蛋白质分子结构模型毕竟是比较粗糙的,需要进一步精化,最后进行结构模型的修正可以得到更加精确的蛋白质分子结构了。可是由于分子在晶体中往往是被锁定于某一状态,所得到的分子晶体模型往往是分子处于基态或不同构象的平均结构,而蛋白质分子行使生物功能时多处在激发态或过渡态,所以X射线晶体衍射技术很难捕捉到分子的动态信息。2.2核磁共振法(Nuclearmagneticresonance(NMR))核磁矩不为零的核在外磁场的作用下,核自旋能级发生Zeeman分裂(原子的光谱线在外磁场中出现分裂且分裂为等距的三条谱线的现象),共振吸收某一特定频率的射频(RF)辐射,这一物理过程就是核磁共振。[REF]质子的共振频率与其结构(化学环境)有关。HNMR在高分辨率下,吸收峰产生化学位移和裂分,由有机化合物的核磁共振图,可获得质子所处化学环境的信息,从而确定化合物结构。在蛋白质的结构测定中选择蛋白质分子中的质子作为测量对象,连续测定所有相邻的两个质子之间的距离和方位,这些数据经计算机处理后就可形成蛋白质分子的三维结构图。NMR方法具有高分辨率,仅次于X射线晶体衍射技术。但是比X射线有优势的方面是可以在