目录1引言………………………………………………………………………………………………12蛋白质测定的基本步骤…………………………………………………………………………23结晶………………………………………………………………………………………………44数据收集…………………………………………………………………………………………75相位测定…………………………………………………………………………………………116相位改善及扩展………………………………………………………………………………157电子密度图的解释……………………………………………………………………………168修正……………………………………………………………………………………………179相关的信息……………………………………………………………………………………19参考文献…………………………………………………………………………………………191.引言蛋白质及其复合物、组装体完整的三维结构的测定是研究生命活动中分子结构与功能关系,揭示生命现象的物理化学本质的科学基础。蛋白质及其复合物晶体的X-射线衍射是研究生物大分子三维精细结构的最主要的手段之一。在人类基因组全序列测定顺利完成和“后基因组时代”(Post-genomeera)到来之际,生命科学的中心任务是揭示基因组的功能,并在此基础上阐明遗传、发育、进化、功能调控等基本生物学问题,以及进一步解决与医学、环境保护、农业密切相关的问题。由于基因的功能最终总是通过其表达产物-蛋白质来实现的,因此,要了解基因组全部功能活动(包括正常的和异常的),最终也必须回到蛋白质分子上来。目前,我们还不可能只用基因组DNA的一维序列预测生命活动的机理(mechanism)和途径(pathway),也难于仅用基因的信息去解释疾病发生与发展的分子机理。显然,在人类基因组测序完成之后的时代,在有关生命活动整合知识的指导下,以蛋白质及其复合物、组装体为主体的生物大分子的精细三维结构及其在分子、亚细胞、细胞和整体水平上的生物学功能的研究是生命科学的重大前沿课题,也是当前生物学领域中最具有挑战性的任务之一,在后基因组时代生物学发展中处于战略性的关键地位。蛋白质晶体学是一门十分活跃的边缘学科,60年-1997年之间已经有12名蛋白质晶体学家荣获诺贝尔奖。蛋白质晶体学不仅与生物学、医学有着密切联系,它的发展也需要物理学、化学数学等学科以及计算机科学作为它的基础。蛋白质晶体学也是一门发展很快的年轻学科。从1934年Bernal得到胃蛋白酶单晶衍射照片算起,也仅有66年的历史。但无论从结构测定的方法还是从结构测定所用的仪器都有了飞跃的发展。多对同晶重原子置换法(MIR)的提出,使蛋白质晶体结构分析在方法上有了重大的突破;以后又有了分子置换法(MR);由于可变波长的同步辐射加速器的应用,近年来又发展了多波长反常散射法(MAD)。随着科学技术的发展,高速大容量计算机的出现,在衍射数据的收集方法上经历了一个否定之否定螺旋式上升的发展。从最初的有层线屏的底片法,到以后有计算机控制的逐点收集的衍射仪法,到目前有各种形式的面探测器,大大加快了衍射数据收集的速度。X-射线光源的强度也有了极大的提高,第三代同步辐射加速器,结合Laue法的应用,使晶体学出现了一个崭新的领域,研究时间分辨的动态晶体学。因此,以一章的篇幅,把蛋白质晶体学作一个全面完整的介绍,那是很困难的。牛津大学Stuart教授是国际上最著名的结构生物学家之一,笔者聆听过他在牛津大学的“蛋白质晶体学讲座”,他以他多年来在该研究领域成功的经验、独特的手笔介绍了该领域的基础本概念和最新方法。正因为如此,并征得他本人同意,本讲义将他的讲稿为主,而不另写(也因为限于笔者的水平)。希望读者建立起对蛋白质晶体学这门发展中的学科的正确的、国际规范化的全新的概念,为此,本讲义还将附加中英文专业术语解释;同时了解当前最新的研究方法,特别是在实际应用中的经验和特别需要注意的问题,这一点与其它同类书籍有着很大的不同,这不但对于正在从事生物大分子晶体结构测定的研究人员也具有极其重要的参考价值,同时可以作为其他相关学科对蛋白质晶体学有兴趣的本科生、研究生和科研人员的入门书。此外,蛋白质结晶学是一个专业跨度较大,同时专业性又非常强的领域,因此,本讲义仅仅是试图让大家建立起对蛋白质结晶学这门学科的正确的概念,同时也概括了当前研究中最新的方法以及必要的基本原则。更详细的参考书、有关结构解析的程序包、网页地址、有关国际组织及数据库的分类在讲义的最后部分中列出。2蛋白质结构测定的基本步骤X射线晶体学可在原子或接近原子的水平上分析蛋白质的精细三维结构。3?以上分辨率的蛋白质精细结构可提供丰富的信息,如特定原子的位置,它们之间的相互关系(如氢键等),溶剂的亲和性及分子内柔性的变化等。目前,应用X射线晶体学技术可以测定分子量达到107D级的全病毒.和2.5x106D级的核糖体。其关键在于是否能够获得高度有序的蛋白质晶体X射线晶体学研究通常采用的X射线波长与化学键键长相当,也与晶体内的原子间距离相应,约为1?左右。一个晶体包括上亿个有序排列的基本单元(如一个蛋白质分子);在晶体的所有重复单元中,每个原子的核外电子对X射线散射的波形是可以叠加的。散射可通过傅立叶综合计算重复单元(蛋白质等)的电子密度图。然而电子密度图的计算必须得到散射光束的振幅(可直接测量)和它们的相位(不能直接测量,因而存在相位问题)。蛋白质结构测定主要包括以下几个过程:第一步结晶:需要通过大量的条件筛选和优化以使蛋白质分子间的弱相互作用促使蛋白质分子形成高度有序的晶体而不是随机聚合形成沉淀。这就要求溶液中的蛋白质处于过饱和状态,并只形成少数的成核中心,使晶体能持续地慢慢地生长成大单晶。第二步数据收集:通常利用(单波长)X射线光束照射在一定角度范围内旋转的蛋白质晶体,同时记录晶体对X-光散射的强度。这些强度可转换为结构测定中的结构因子的振幅(|Fhkl|).此外,在Laue法中,晶体通常保持静止而使用连续X光波长(白光)收集数据第三步相角的测定:结构因子的振幅(|Fhkl|)及相角(?hkl)是物理上相对独立的量。由于结构因子相角的全部信息在收集数据时丢失,因此必须通过其它途径来得到它们的数值。除结晶外,相角的测定在结构分析中仍然是一个问题最多的部分。第四步相角的改进(优化):电子密度图的质量及其后的可解释性主要决定于相角的准确性。有的情况下采用晶胞中不对称单元中的等同部分(例如,一个以上的等同分子)的电子密度平均,有可能大大地改善误差较大的起始相角。第五步电子密度图的解释:相位确定后,可开始计算电子密度图.若从电子密度图能跟踪出肽链走向和分辨出二级结构(如基于高分辨率的数据,通常这意味着衍射数据的分辨率至少达到3.5?),则可能推出多肽链的三维折叠方式。进而根据氨基酸序列,就可能构建出原子坐标形式的蛋白质结构模型.。第六步修正:考虑到已建立的立体化学资料(如键长,键角等)的限制,根据X射线衍射数据对初始的蛋白质分子模型进行修正。3结晶蛋白质结晶技术的综述请参看参考书5-7。通常只需要毫克级的均一的蛋白纯品(通常纯度至少超过95%)便可进行蛋白质结晶研究。最初的条件实验一般需要1-2mg,但最终得到解析出蛋白质结构所需的数据,可能需要几毫克或更多的蛋白质样品。在摸索晶体生长条件时应考虑分子生物学家或蛋白质化学家所提示的溶液中影响蛋白质稳定性及构象的各种因素;尽量避免蛋白质样品的反复冻融,已经证明许多蛋白冷冻干燥处理后对结晶不利;使用5-50mg/ml甚至更高浓度的蛋白质溶液,一般来说,浓度越高,效果越好,至少起始时是如此。不过也有浓度为2mg/ml蛋白质结晶的先例;过滤蛋白质溶液,缓冲液等,清洁任何玻璃或塑料表面上的尘粒(光学商店清洁镜头的除尘器效果很好),以最大限度地减少成核中心的数量。摸索蛋白质结晶条件最常用的方法是应用汽相扩散技术的悬滴法(图1a).因为此法不但可节省样品而且可有效利用储存空间。此法是使任何挥发性的组分在小液滴和大样品池间达到平衡,使蛋白质液滴中沉淀剂及蛋白质的浓度逐渐增加,达到过饱和状态,最终析出晶体。晶体生长的基本装置是Linbro多孔组织培养板及用二甲基二氯硅烷硅化后的玻片或塑料盖玻片。悬滴法长晶体包括以下四个步骤:第一步,在作结晶实验之前,最好对蛋白质样品进行离心,以除去不溶解的蛋白和杂质,以减少不必要的成核中心,此外,对蛋白质样品进行超滤,也是值得推荐的。第二步,采用“吹气法”除去培养晶体用的组织培养板和盖玻片上可能带有的灰尘。第三步,在组织培养板的孔中加入0.2-0.5ml经过超滤的含沉淀剂及添加剂的缓冲液,作为池液,孔边缘涂上真空脂。第四步,吸1ul或2ul池液放到硅化后的盖玻片上,加等体积蛋白溶液至此池液上(这个体积比将决定平衡后的蛋白质浓度),混合均匀,应避免气泡出现。第五步,翻转盖玻片盖在孔上,检查密封是否良好。上述方法中步骤2和4目前己可在自动化仪器中进行(8),但是,绝大部分拥有该仪器的实验室最终还是乐意采用手工方法。起始的条件实验常在感兴趣的区域(通常低于沉淀蛋白所需的浓度)进行,然后再进行实验条件的优化。一般的,蛋白质晶体生长所需的硫酸胺等沉淀剂浓度在理想浓度的1%或2%偏差范围内,但对于不同分子量的聚乙醇胺(PEG)则可宽松一些。晶体在数小时至数月后出现。通常,微晶可用作晶种以长出合用的晶体(9)。汽相扩散法的另一种形式是坐滴法(图1c),坐滴中含池液和蛋白溶液各1-2ul。此方法对于以下情况非常适用:即使用非离子去垢剂作为添加剂表面张力较低时;或用PEG或乙醇作为沉淀剂(由于凝结等问题,悬滴体积趋于增大)时;反向扩散导致液滴增大时;或结晶条件已确定,需要大量晶体时。除汽相扩散技术外,微量透析法(DialysisbuttonsfromCambridgeRepetitionEngineers)和微量批处理法(DouglasInstrumentsLtd)也是值得了解的。.由于多种因素的影响,蛋白质结晶仍是一门艺术。表1列出了一些目前经常用到的进行蛋白质结晶的基本条件和思路。硫酸胺,二甲基-2,4-戊烷二醇(MPD)及PEG4000是初次结晶时经常使用的沉淀剂,在参考书7中列出了用这些沉淀剂进行的一些研究项目,表1中列出的很多方案在参考书5-7中都有介绍。应用不完全因子法筛选实验条件的子集合方法目前在几个实验室经常使用(HamptonResearch)(10)。动态光散射法目前已被发展用于监测潜在的结晶条件,可以作为摸索结晶条件的辅助工具(11)。当单独的蛋白质不能结晶时,往往能与其抗体(Fab片断)以及其他生物大分子共结晶(12)。非离子去垢剂可辅助几个完整膜蛋白的结晶而大大拓宽了晶体学的研究领域(13,14)。糖基化位点较多的蛋白也需要特殊考虑,一个方法是使用神经氨酸酶的处理方法以降低糖基化水平。最近有建议使用甘油作为辅助溶剂以帮助柔性较大的蛋白结晶(15)。然而分子内的高柔性常常迫使人们使用截去蛋白的N端或C端(柔性过大的部分)以后再进行结晶。在初次出现晶体时,往往需要回答以下两个问题:1.是盐晶体吗?盐晶体通常具有很高的双折射和很高的密度,硬玻璃样的外表,因而易于区分;用衍射来鉴定,它在高分辨率下(通常6?下什么也没有)只有少数几个很强的衍射点。2.其次是它们能给出有用的衍射吗?遗憾的是宏观观察时很有序的(甚至是双折射)的真正蛋白质晶体可能在微观上仍不够有序而不能衍射,或只能达到较低的分辨率(低于4?),形成多晶或双晶的晶体当然是无法使用的。根据我们的经验,添加剂如β-正辛基?-D-吡喃型葡糖(苷)甙(β-octylglucoside)可能有助于消除孪晶的问题(16)。表1:结晶实验中的常用条件和思路沉淀剂盐:硫酸胺,甲酸胺,柠檬酸钠PEG:400,4000,3000,6000,8000,20000有机溶剂:MPD,乙醇(4?C,很难避免其蒸发)混合物:PEG+0.5-1MLiCl或NaCl,盐+2-4%有机溶剂添加剂0.2