123第九章反常散射在确定蛋白质相角及绝对构型中的应用9.1.简介反常散射已经不是一个新话题了,我们在第七章就已经介绍过。在第七章中我们了解到一个原子的反常散射是因为它的电子不能被视为一个完全自由的电子。这种效应跟波长有关,但是一般情况下,重原子比周期表中上面几行的轻原子效应要强。如果重原子在蛋白质结构中存在,反常散射的结果就是衍射点hkl的强度和它的Bijvoet点对lkh不再相等。在第七章中,这种效应和同晶置换差值法结合,被用于搜索重原子的位置以及它们的位置修正。在本章中,会告诉你反常散射信息如何用于确定蛋白质衍射点的相角和蛋白质结构的绝对构型。而且还将讨论在多波长反常散射法中如何利用反常散射信息确定蛋白质的相角。9.2.反常散射法确定蛋白质相角原则上讲,重原子反常散射对确定蛋白质相角的作用和同晶置换一样重要。如图9.1可以得到很好的解释。图中所示的三个半径分别为FP,FPH(+)和FPH(-)的圆;(+)(-)分别代表Bijvoet衍射点对。FP圆的圆心为O。FPH(+)的圆心在矢量-FH(+)的末端,FPH(-)的圆心在矢量-FH(-)的末端。FP圆和FPH(+)圆的交叉点是1和2表示两个可能的蛋白质相角。另外两个可能的相角在FP圆和FPH(-)圆的交叉点’1和’2。母体蛋白的衍射点(hkl)和(lkh)有相反的相角(4.11节),相角的正确选择是衍射点(hkl)为1和衍射点(lkh)为’1。图9.2用更简单的方法加以说明。在图上矢量-FH(-)用相反相角画出(以水平轴为对称的镜像)。这时假如数据没有误差的话,正确的相角就在三个圆环FP,FPH(+)和FPH(-)的交点上。这个结论是原则上可以用一个重原子同晶衍生物结合反常散射来解决蛋白质相角问题(SIRAS)。图9.1124图9.29.3.反常散射法改进蛋白质相角在同晶置换法中,对每个衍射点都能够获得一条蛋白质相角的概率曲线:Piso()。假如从反常散射数据得到的信息也能表达为概率曲线Pano(),那么这些信息很容易和Piso()曲线结合。该联合概率应为:P()=Piso()×Pano()。可以通过如下方法实现:obsPHPH)()(PHFF在7.9.节中,它从等式7.28推得)sin(2)()(HPHHPHPHFffFF或)sin(2)()(HPHHHPHPHFkFFF(9.1)这里HHFFffkPHcalc必须被表达为蛋白质相角αp的函数。在图7.12的三角形ABE中,正弦定理给出PHPHPHPH)sin()(sinFF或)sin()(sinPHPHPHPHFF125)sin(2)sin(2PHPHHPHPHHcalcFkFFkFPH理想情况下ΔPHcalc=ΔPHobs。实际上对每个衍射点calcobsano)(PHPH它与蛋白质相角αp有关。该误差可与同晶置换法中的蛋白质相角三角形中的闭合误差ε相比。假设误差分布满足高斯分布:22anoano)(2)(exp)(ENP(9.2)N'是归一化常数,(E’)2是ε的方均值。因为反常散射的数据也来自同一晶体,不同晶不会导致)()(PHPHFF值有误差。因此尽管这些差别很小,但)()(PHPHFF的误差比PHPHFF误差要小,E’比E也小很多,可以取为E/3。公式9.2现在可与Piso(α)结合(等式7.36)。反常散射数据和正确套的同晶数据结合时要小心,也就是说,给出正确蛋白质绝对构型(参见下一节)的电子密度的数据不要与错误的数据相合并。如果多对同晶置换法包括反常散射信息,就被称为MIRAS法。需要强调的是,在收集反常散射数据时,应该十分小心,因为Bijvoet点对之间的强度差很小,一般收集Bijvoet点对的数据时,在时间上要紧接着,以避免实验误差。9.4.怎样确定绝对构型如果没有反常散射,同晶置换方法或者得到正确构型的蛋白质结构或它的对映体的结构(镜像)。如果电子密度的分辨率足够高的话,就可以看到氨基酸残基的C(α)的构型。氨基酸残基是L-构型,构型是耷正确很容易检查。如果在电子密度图中出现α螺旋,正确的蛋白质构型α螺旋应该呈现右手螺旋。然而,蛋白质的绝对构型还可以从Bijvoet点对二者之间强度差中直接获得。这将在此讨论。图9.1和9.2中描述的是重原子位置放置正确且|FPH(+)||FPH(-)|的情况。图9.3描述的是正确选择的一组轴,|FPH(+)||FPH(-)|的情况,但重原子位置选择是不正确的。因为从差值Patterson函数图中选取了两个同等可能的中心对称相关的位置中的错误位置(参见7.6节)。结果导致矢量FH(+),-FH(+),FH(-),-FH(-)对水平轴产生反映。这导致圆FPH(+)和FPH(-)绕FP圆中心O旋转2ω的角度。通常得到不正确的Fp相角与正确值差2ω。如果反常散射信息同两个同晶置换数据中的每一个结相合,其正确结合给出的蛋白质电子密度图优于从不正确结合得到的电子密度图。126图9.3另外一种确定绝对构型的方法如下,采用带反常散射的单对同晶置换法(SIRAS),如前面所描述,两套相角对应于两套中心对称相关的两套重原子位置。由这两套蛋白质相角计算出第二个重原子衍生物PH(2)的差值Fourier图,:1.振幅PHPH(2)FF及一套SIRAS相角及;2.振幅PHPH(2)FF及另一套SIRAS相角。用正确相角(正确重原子位置)计算得到的差值Fourier图将出现最高峰。这样就可以确认得到正确的绝对构型。一种相对更简单的采用反常散射法确定绝对构型的方法叙述如下。根据公式9.1,HF可以用下式表达:)()()sin(2PHPHHPHHFFkF(9.3)|FPH(+)|和|FPH(-)|是观察值,)(HPH能从没有反常散射的同晶置换数据得到。|FH|用公式9.3计算得到一个正值。如果是重原子套的倒反映像被选取了,H和PH以及)(HPH的值就会是正确值的相反数,获得的|FH|就成了负值。假如|FH|是用重原子贡献相对强的衍射点计算的,这就更容易选择了。这也可以用所有衍射点计算Fourier图,|FH|振幅用公式(9.3)计算,相角值早同晶置换法得到。如果重原子位置选择正确,就会在相应的重原子位置上得到值为正的峰。如果重原子位置选反了,相应的位置就会得到值为负的峰。在计算Fourier图时所采用的系数为:HPHPHHPHHHexp)()()sin(2expiFFkiF另外一种方法采用系数:PHPHPHexp)()(21iFF127在该表达式中(与公式7.29相比):)sin(1)()(21HPHHPHPHFkFF(9.1)其中)(HPH的符号正确或者错误决定了Fourier图在相应的重原子位置的峰是正还是为负。9.5.多波长反常散射(MAD)图9.4如果蛋白质分子中有反常散射原子,则能利用Bijvoet点对强度|Fh(+)|2和|Fh(-)|2之间的差值测定蛋白质相角。在多波长法中利用了反常散射对波长的依赖关系。这种方法的原理很早就有,直到可调同步辐射光源的产生才使得这种方法在蛋白质结构测定中成为技术上行得通的方法。Hendrickson和他的同事(Hendrickson等,1988;KrishnaMurphy等,1988)首先考虑了这一方法的优点,并采用这种方法解得蛋白质结构(见Guass等,1988)。当然,蛋白中应该包含产生足够强的反常散射信号的元素。因此,元素周期表上部几行的元素是不合适的。Hendrickson证明对不大于150个残基的蛋白中存在一个Se元素(原子序列34)对于成功地用MAD法解析结构已经足够(Hendrickson等,1990;Leathy等,1992);然而,主要还是取决于收集到衍射数据的质量。Se原子越多,蛋白质分子当然可以更大。一种往蛋白质分子中引入Se原子的方法是以Se-甲硫氨酸底物代替含甲硫氨酸的底物生长微生物。运用该方法的条件是谨慎选择各种波长使Bijvoet点对之间强度差最佳,也使在被选各波长衍射之间的强度差最佳。这里讨论最常见的只有一种反常散射原子的情况。这一讨论是基于Karle对问题的处理(参见Karle,1980),它的优点是结构中所有原子的非反常散射与同波长有关的部分分开。每个反常散射原子都有原子散射因子fifff0(7.8节)。图9.4中FB是非反常散射原子贡献的结构因子,FA是反常散射原子的非反常散射部分对结构因子的贡献,FAB=FB+FA是完整的非反常散射部分。反常散射贡献的结构因子是aFFA0A0ffiffφBA是FAB的相角,φA是矢量FA的相角,φa是矢量a的相角。Δφ=φBA+(180°–φa)=(180°+(φBA–φa))。把|F(h)|写成|F|,应用余弦定理:cos2BA22BA2aFaFF128和2A20222)()(Ffffa2A20222BA2)()(FfffFF)cos(cos2BAABA0aFFff)cos(sin2BAABA0aFFffφa=φA+δ;cos(φBA–φa)=cos(φBA–φa–δ)因为φBA与φA和波长λ无关,而δ取决于λ,余弦可被分割成cos(φBA–φa)cosδ+sin(φBA–φa)sinδ2A20222BA2)()(FfffFF)sin(sin)cos(cossin2)sin(cossin)cos(cos2ABA2ABAABA0ABAABA2ABA0FFffFFff把cos(φBA–φA)项和sin(φBA–φA)项归并在一起,得到2A20222BA2)()(FfffFF)sin(sin2cossin2)cos(cossin2cos2ABA200ABAABA020ABAffffFFffffFF因为000cossincosffffff和000sinsincosffffff我们最终得到)sin()cos(ABAABABABA2A2BA2rqFFFpFF129这里2022fffp,02ffq,02ffrp,q和r是λ的函数可从原子吸收系数推得。Friedel点对的|F|2值不同,但可以实验测定。未知量是|FBA|,|FA|和(φBA-φA),它们都与λ无关,除了(φBA-φA)的符号外,对Friedel点对来说,这三个量是相等的。因此,一个λ值对应的数据套给出两套计算这三个量的公式,原则上说,在两个不同波长的测量已经足够用于测出每个衍射点的|FBA|,|FA|和(φBA-φA)了。要计算蛋白质的电子密度图还需要φBA。这可从解A-结构来获得,也就是说从用|F|2作系数的Patterson图中确定反常散射原子,或用直接法确定反常散射原子。从A-结构可以计算出φA,从而与已知的(φBA-φA)值解得φBA。Terwilliger(1994a)指出|FA|的估计值高得不可信。他引入|FA|期望值的概率函数,并且与MAD信息结合,他得到了|FA|的加权平均值作为改进的|FA|的值。而且他把色散差)()(jiFFF看作同晶置换信息。(Terwilliger,1994b)。因为在计算A-结构时,反常散射没有被考虑,得到的是真实结构或对映体结构。解决这个问题的方法是计算两个结构的φA值。于是得到两个φBA值和两套蛋白质电子密度图,在其中选择最好的图。这种方法的好处是不同晶在这里不产生影响