§7.4分子对接分子对接方法在药物设计中取得巨大的成功,已经成为基于结构药物设计的最重要的方法之一分子对接的最初思想起源于FisherE提出的“锁和钥匙模型”。即受体与配体的相互识别首要条件是空间结构的匹配配体受体复合物受体-配体的锁和钥匙模型Ohboy!Whataperfectmatch这类方法首先要建立大量化合物(例如几十至上百万个化合物)的三维结构数据库,然后将库中的分子逐一与靶标分子进行“对接”(docking),通过不断优化小分子化合物的位置(取向)以及分子内部柔性键的二面角(构象),寻找小分子化合物与靶标大分子作用的最佳构象,计算其相互作用及结合能。在库中所有分子均完成了对接计算之后,即可从中找出与靶标分子结合的最佳分子(前50名或前100名)分子对接的基本原理药物与受体的结合强度取决于结合的自由能变化G结合=H结合-TS结合=-RTlnKi大部分的分子对接法忽略了全部的熵效应,而在焓效应也只考虑配体与受体的相互作用能,即:Einteraction=Evdw+Eelectrostatic+Eh-bond§7.4.1分子对接的基本方法(一)刚性的分子对接方法这种方法是最初的分子对接的方法,在对接中,小分子和蛋白质两种都保持刚性。(1)基于最大团搜索的方法(Clique-SearchBasedApproaches)对接两个刚性分子可以理解为分子在空间的匹配问题,这种匹配可以是一种形状上的互补或相互作用。如氢键受体与氢键给体的互补。搜索在三维空间中有效的条件下的最大匹配受体的活性位点配体有效匹配的距离图集受体-配体的示意图,字母代表特征部分如氢键等,相应的有效匹配的图集如右,三个环性顶点组织的三角形为这个图集的一个最大团(clique)Dock对接程序中刚性对接的算法就是基于这种思想Dock利用球集来表示受体活性位点和配体的形状一系列的球集填充在受体活性位点的表面,这些球集代表能被配体占据的体积。配体可以用球集表示或者用自己的原子表示,在Dock程序中,四个有效匹配的对应点被考虑,先考虑配体中第一个球集与活性位点的球集的匹配,第二个点则满足∆d≤ε,其中∆d为第二个匹配点中配体和受体的球心与第一个点球心的距离,第三个点又必需满足与前两个球心的距离限制,以上过程一直进行到找不到更多匹配点为止。(2)基于几何哈希技术“geometrichashing”的方法第一部分中,几何哈希表从被对接的一个配体或一系列配体中构建。哈希矩阵含有配体名字和能调整配体在空间方向的参考框架。第二部分即识别阶段,蛋白质的特征用来识别哈希矩阵,每一次匹配表示蛋白质的特征与哈希矩阵中已定义好方位的配体相匹配,具有大量匹配信息的哈希矩阵代表着具有几个吻合特征的配体和方位(3)基于poseclustering的方法这种方法与几何哈希的方法相类似,也是一种基于模式识别的方法。在LUDI模型中,如图所示,对每一个作用基团,定义作用中心和作用表面。受体的作用表面近似地用离散的点表示,和对应的配体的中心目标点相匹配。三个氢键受体的作用表面Poseclustering算法中的作用点(二)柔性对接的方法(1)构象的系综方法Flexibase用来储存小分子库中每个分子的一系列不同构象,用距离几何和能量最小化的方法产生构象,每个分子根据rmsd的差异选择25个系列构象。每个构象采用FLOG刚性对接的方法进行对接。(2)片段的方法片断的方法是处理小分子柔性的最通用的方法,配体分割成一些小的片断,这些片断可以认为是刚性构象或一个小的构象系综。一般,有两种方法来处理:第一种方法是把一个片段放入受体的作用位点,然后加上余下的片段,这种方法称为连续构建“incrementalconstruction”.第二种方法把所有或一部分片段独立地放入受体的作用位点,再重新连接至到构成一个完整的配体分子,这种策略称为“放置&加”“place&join”第一个连续构建的算法是Kuntz发展的Dock程序,首先,一个单独的锚碎片通过手工选择对接进受体的活性结合位点,并且考虑了氢键的作用。其次这个锚的优势位置主要包含有有大量匹配氢键对,高打分值,和低相似性。接着,一种回溯的算法(backtrackingalgorithm)用来搜索整个配体在结合位点的非重叠放置空间,在当前位置加上一个碎片后,优化的方法用来减少立体的张力和改善氢键的几何构型。最后的位置通过过滤,优化和基于力场的方法来打分评价。FlexX也是一个基于连续构建算法的对接程序(3)遗传算法和进化规划遗传算法开始应用到分子对接技术,其特点为:第一步,一个称为染色体的线性表示符能够描述构型的所有自由度,找到这个染色体描述符是算法中最困难的一步。第二步,确定一个一个类似如打分函数的目标函数。著名的GOLD软件包括了这种算法(4)基于分子模拟的方法模拟退火的方法,Autodock程序就采用了这种方法分子动力学的方法MonteCarlo模拟,一种统计力学的方法,这种算法中最重要的两部分是自由度的描述和能量的评价,合适的自由度描述可以避免较高能量的构象,用键角、扭曲角等内座标来描述配体的柔性比用笛卡儿空间的三维座标描述要强,同样,能量的评价也是最耗时,这一步时间必须足够的长。评价:打分函数每一个对接的算术都会采用平衡了时效和精确度的简单自由能预测方法,现在的打分函数主要包括三种:基于经验的回归参数的方法;基于分子力场的方法和基于知识的方法、基于知识的打分函数。(1)基于力场的方法只考虑热焓对能量的贡献,不考虑熵的影响,一般情况下,采用标准力场的非键作用能如真空静电和范德华作用能用作打分函数,如DOCK程序中采用AMBER的能量函数:ligirecjijjibijijaijijDrqqrBrAE11332(2)基于经验的打分函数基于经验的打分函数用多元回归的方法拟合各种物理参数对结合自由能的贡献,如FlexX程序中采用下列函数,所采用的方程包括,配体旋转键的个数、氢键、离子键,疏水和芳香环的堆积作用,以及亲水作用。这种方法能快速直接地估算结合自由能,(3)基于知识的打分函数最初应用于蛋白质结构预测,打分函数用统计力学的方法得自蛋白质-配体的复合物结构,结合自由能用函数为分子间距离的平均能的加和来计算。基于知识的打分函数是一种比较有前途的方法§7.4.3虚拟筛选的具体流程包括4个步骤:受体模型的建立;小分子库的产生;计算机筛选和命中化合物的后处理。第一步,受体模型的建立:蛋白质结构的准备是虚拟筛选的重要一步。虚拟筛选的蛋白靶标的结构可以从PDB库()中直接下载使用也可以通过和家族中同源蛋白的序列、结构信息比较,同源模建而得1)大分子结构获取2)接着是结合位点的描述,选择合适的配体结合口袋对分子对接至关重要一种是直接从配体-受体复合物结构中抽出;选择口袋有两种方式:如果没有复合物结构,则需要根据生物功能如结合、突变等实验信息来手动选择结合部位第二步,建立小分子数据库二维结构用结构转换程序如CORINA、CONCORD实现三维结构的转化。建好的三维结构加氢加电荷后,便可以用于对接程序。第三步,对接和打分,这一步是虚拟筛选的核心步骤。对接操作就是把每个小分子放到受体蛋白的配体结合位点,优化配体构像和位置,使之与受体有最佳的结合作用,给最佳结合构象打分,对所有化合物根据打分排序,然后从化合物库中挑出打分最高的小分子。最后一步是命中化合物的后处理通过计算分子的类药性质ADME/T(吸收absorption、器官分布distribution、体内代谢metabolism、排泄excretion和毒性toxicity)性质的估算,排除那些不具有类药性质的分子。可以利用一些经验规则如“五规则”等,快速排除那些不适合进一步药物开发的分子。通过以上四步处理,大部分分子从化合物库中剔除,形成一个合理大小的化合物库,仅对这些适合成药的化合物或购买、或合成、或分离得到,然后再进行实际的生物测试。对接方法尚需解决的问题:•分子的柔性•溶剂化效应•打分函数§7.4.4分子对接的应用靶标靶标分类靶标结构小分子库大小所用方法抑制剂活性M实验数据AmpC-lactamseHydrolaseX-ray200kNWUDOCK26X-ray复合物BCR-ABLKinaseX-ray200kDOCK25细胞的抑制活性实验AnthraxEFAdenylylcyclaseX-ray200kNWUDOCK20酶动力学实验IMPDHDehydrogrnaseX-ray3500kFlexX30酶动力学实验CaseinkinaseIIKinaseHomology400kDOCK0.08抑制活性、构效关系K+通道IonchannelHomology50kDOCK10细胞的抑制活性实验ThyroidhomonereceptorNuclearreceptorHomology250kICM0.75抑制活性实验CDK2KinaseX-ray50kLIDAEUS2X-ray复合物TGFRKKinaseX-ray200kCatalyst0.005X-ray复合物cyclophilinImmunophilinX-rayUnity/FlexX6细胞的抑制活性实验tRNAguaninetransglycoslaseX-ray800kUnity/FlexX0.25酶动力学实验PfDHFRReductaseHomology230kCatalyst/DOCK0.9酶动力学实验-AmylaseHydrolaseX-ray200kUnity/FlexXNMR,SPR,层析(一)配体对CDK2,CDK4激酶选择性的研究细胞周期蛋白依赖性蛋白激酶(cyclin-dependentkinases,CDKs)是一类Ser/Thr蛋白激酶,直接参与调控细胞分裂周期,顾名思义,CDK只在周期蛋白Cyclin活化下才能工作.现在已经发现了13种CDK蛋白激酶和25种周期蛋白Cyclin,但它们具体的生物功能还不十分明了。其中CDK2、CDK5、CDK6已经解析出晶体结构,但CDKs的一级序列存在高的同源性,它们之间一级序列的高同源性暗示了三维结构的相似性CDK1、CDK2、CDK4、CDK6是基于CDKs结构化学治疗癌症的主要靶标。至今为止,文献报告的CDKs抑制剂有多种尽管化合物结构各异,但所有CDKs的小分子抑制剂有一些共同的特点:(1)一般小的分子量(600);(2)平面、疏水性的多环化合物;(3)主要通过和ATP竞争来占据酶的ATP结合口袋;(4)主要通过疏水和氢键作用和酶结合;(5)配体与CDK2作用时,一般与Leu83和Glu81形成氢键。NU6102(6-cyclohexylmethyl-2-(4’-sulfamoylanilino)purine)是第一个基于活化状态的CDK2-cyclinA复合物结构的高效的小分子抑制剂。实验表明NU6102对CDK2和CDK4有着不同的选择活性,对CDK2有一个较高的亲和力Ki=6nM,但是对CDK4的亲和力比较低Ki=1600nM,为了解释这种选择性差异的起源SH2NOONHNNHNNO小分子NU6102的结构CDK2-NU6102的作用模式图解决思路:采用同源模建、分子对接、分子动力学模拟和自由能计算来阐明配体和激酶的作用机理。由于CDK4的三维结构还没有解析出来,所以我们通过序列联配、同源模建的方法得到CDK4的结构,在通过分子对接的方法得到NU6102-CDK4的复合物结构。CDK2和CDK4的序列联配,序列同源性45.6%通过分子对接得到CDK4-NU6102的作用模式通过CDK4-NU6102复合物和CDK2-NU6102复合物结构对比,可以很清楚地看到造成NU6102亲和力差别的主要原因是在CDK2-NU6102复合物中,Asp86位起了一个很重要的识别作用,它与配体的磺胺基形成了两个稳定的氢键,并且通过能量分解的方法也可以得到导致配体活性差异主要识别基团在