第十章药物设计的基本方法——分子对接内容分子对接简介分子对接法的基本原理分子对接软件DockAutoDockCADD基于结构方法分类10.1引言分子对接就是两个或多个分子之间通过几何匹配和能量匹配而相互识别的过程。分子对接在酶学研究以及药物设计中具有十分重要的意义。在酶激活剂、酶抑制剂与酶相互作用以及药物分子产生药理反应的过程中,小分子(通常意义上的Ligand)与靶酶(通常意义上的Receptor)相互互结合,首先就需要两个分子充分接近,采取合适的取向,使两者在必要的部位相互契合,发生相互作用,继而通过适当的构象调整,得到一个稳定的复合物构象。通过分子对接确定复合物中两个分子正确的相对位置和取向,研究两个分子的构象,特别是底物构象在形成复合物过程中的变化,是确定酶激活剂、抑制剂作用机制以及药物作用机制,设计新药的基础。大肠杆菌乙酰辅酶A羧化酶肉桂醛在药物设计中,分子对接方法主要用来从小分子数据库中搜寻与受体生物大分子有较好亲和力的小分子,进行药理测试,从中发现新的先导化合物。优点:小分子配体来自现有化合物数据库或制药公司自己的数据库,合成路线比较成熟;分子对接方法从整体上考虑受体与配体结合的效果加速先导化合物的发现进程。10.2分子对接法的基本原理配体与受体的结合过程是一个很复杂的过程,涉及到配体和受体的去溶剂化、配体和受体(主要是活性位点处的残基)的构象变化以及配体与受体之间的相互作用。配体与受体的结合强弱取决于结合过程的自由能变化:lnbindingdGRTK结合自由能也可以表示成:bindingbindingbindingGHTS大部分的分子对接法忽略了全部的熵效应,而在焓效应中也只考虑配体与受体的相互作用能配体与受体的相互作用:bondHticelectrostavdweractionEEEEint其中氢键采用的形式和力场有关配体与受体的相互作用:分子对接计算是把配体分子放在受体活性位点的位置,然后按照几何互补、能量互补、化学环境互补的原则来实时评价配体与受体相互作用的好坏,并找到两个分子之间最佳的结合模式。分子对接最初思想起源于FisherE.的“锁和钥匙模型”,认为“锁”和“钥匙”的相识别的首要条件是他们在空间形状上要互相匹配配体和受体分子之间的识别要比“锁和钥匙”模型复杂的多:1.配体和受体分子的构象是变化的,而不是刚性的,配体和受体在对接过程中互相适应对方,从而达到更完美的匹配;2.其次,分子对接不但要满足空间形状的匹配,还要满足能量的匹配。配体和受体之间的通过底物分子与靶酶分子能否结合以及结合的强度最终是由形成此复合物过程的结合自由能变化ΔGbind所决定的。互补性(complementarity)和预组织(pre-organization)是决定分子对接过程的两个重要原则,前者决定识别过程的选择性,而后者决定识别过理的结合能力。互补性包括空间结构的互补性和电学性质的互补性。1958年Koshland提出了分子识别过程中的诱导契合(inducedfit)概念,指出配体与受体相互结合时,受体将采取一个能同底物达到最佳结合的构象。分子对接方法根据不同的简化程度可以大致分为以下三类:(1)刚性对接;研究体系的构象不发生变化(2)半柔性对接;研究体系尤其是配体的构象允许在一定的范围内变化(3)柔性对接;研究体系的构象基本上是可以自由变化的刚性对接适合考察比较大的体系,比如蛋白质和蛋白质以及蛋白质和核酸之间的相互作用,他计算较为简单,原理也相对简单,主要是考虑构象之间的契合程度。半柔性对接适合于处理小分子和大分子之间的对接。在对接过程中,小分子的构象一般是可以变化的,但大分子则是刚性的。由于小分子相对较小,因此在一定程度考察柔性的基础上,还可以保持较高的计算效率,在药物设计尤其在基于分子数据库的虚拟筛选过程中,一般采用半柔性的分子对接方法。柔性对接方法一般用于精确考察分子之间的识别情况,由于在计算过程中体系的构象是可以变化的,因此柔性对接在提高了对接准确性的同时却需要耗费较长的计算时间。分子对接的目的:找到底物分子和受体分子的最佳结合位置找到最佳的结合位置评价对接分子之间的结合强度构象搜索方法按照分子对接程序寻找配体与受体结合构象方法的差异,可以分为三种:1、局部优化法2、深度搜寻法3、全局优化法局部优化法:不对配体和受体进行构象搜寻,只是对初始构象进行优化,得到配体与受体结合的一个局部最优构象;深度搜寻法:采用深度优先搜寻法或广度优先搜寻法,通过有限的步骤,找到一个相对较好的局部最优结合构象。全局优化法:在进行构象搜寻时,利用模拟退火算法或遗传算法,寻找配体与受体的全局最优结合构象。对接类型对接方法类型对接方法Flexible-LigandDocking柔性配体对接Systematic系统方法Conformational构象Fragmentation片段生长Database数据库Random/stochastic随机方法MonteCarlo(MC)蒙特卡罗Geneticalgorithm(GA)遗传算法TabuSearch禁忌搜索Simulationmethods模拟方法Moleculardynamics(MD)分子动力学Energyminimization能量最小化Flexible-ProteinDocking柔性蛋白对接Moleculardynamics(MD)分子模拟MonteCarlo(MC)蒙特卡罗Rotamerlibraries旋转异构体库Protein-ensemblegrids蛋白集合栅格Soft-receptormodeling软受体建模表1:常用的分子对接方法10.3分子对接软件表2:有代表性的分子对接软件名称优化方法评价函数速度DOCK片断生长分子力场、表面匹配得分、化学环境匹配得分快AutoDock遗传算法半经验自由能评价函数一般ICM-Docking随机全局优化半经验自由能评价函数快GOLD遗传算法半经验自由能评价函数快FlexX片断生长半经验自由能评价函数快Affinity蒙特卡罗/分子力学/分子动力学分子力场慢ZDock&RDock几何匹配/分子动力学CAPRI*/分子力场慢FlexiDock遗传算法分子力场慢eHiTS系统搜索半经验自由能评价函数快Hex几何匹配CAPRI*快分子对接软件——最常用的分子对接软件被引次数统计10.4DOCK基本情况第一个分子对接程序。由加利福尼亚州立大学旧金山分校Kuntz小组于1982年开发。目前版本为DOCK6.610.4.1基本原理10.4.1.1形状匹配受体与配体的原子之间的距离大于其范德华半径之和;配体中能形成氢键的原子,都有一个受体的氮原子或氧原子在其0.35nm范围之内所有的配体原子都在受体的结合位点内Dock利用球形集合来表示受体活性位点以及配体的形状。对于受体,程序产生一个球集,使之填充受体分子表面的口袋。如果配体与受体匹配较好的话,配体的球集应该能较好地填充受体的球集。10.4.1.2匹配算法大分子配体的对接时间计算时间较长;在复合物结构中,由于配体的大部分表面不会参与相互作用。因此,将表面分成不同的部分,每一部分分别进行匹配,这一过程称为分簇(cluster).也就是说采取了“分而治之”的匹配算法。10.4.1.3基于经验势能函数的评价函数Dock中引入经验势能函数做为评价函数。优点:预先对受体原子的作用进行加和,并存入网格文件中,计算能力增大,对接结果精确。Dock采用分子力学方法,并基于Amber力场参数。力场中的非键作用只包含静电作用和范德华作用,氢键作为静电作用处理。10.4.2柔性对接Dock4.0之前的版本没有考虑配体的柔性。之后的版本,增加了配体和受体的柔性,大大改善对接结果。考虑配体分子的柔性确定刚性片段柔性搜寻1.确定刚性片段柔性分子可以看成由刚性片段组成;刚性片段中的原子由不能旋转的键连接;相邻的刚性片段由可以旋转的键连接。环的处理确定可旋转的键2.柔性搜寻Dock有两种柔性搜寻方法:一种是锚优先搜寻(anchor-firstsearch)一种是同时搜寻(simultaneoussearch)a.锚优先搜寻1)对接锚片段2)加一个刚性片段,先内后外先大后小3)构象搜寻,得到NcNt个构象4)根据构象能量差异按照一定标准,选取Nc个构象5)回到第2步,不断加锚,直到所有的锚片段都对接过,跳过5,得到对接构象。b.同时搜寻先进行构象搜寻,然后将搜寻得到的构象分别对接到受体的结合位点中。根据参数设置不同,可以进行系统搜寻或随机搜寻。10.5AutoDockAutoDock是TheScrippsResearchInstitute的OIson科研小组使用C语言开发的分子对接软件包,目前最新的版本为4.2。AutoDock是一个软件包,其中主要包含AutoGrid和AutoDock两个程序。其中AutoGrid主要负责格点中相关能量的计算,而AutoDock则负责构象搜索及评价。10.5.1评价函数A.3.0以前的版本采用经验势函数为评价函数B.3.0版本开始采用经验结合自由能为评价函数A.经验势能函数AutoDock的经验势能函数包括三项:静电作用、范德华作用和氢键作用。力场采用Amber力场根据热力学定律,离解过程的自由能变化和焓的变化:实验测定的自由能与离解常数:GHTS0lndGGRTKB.经验结合自由能当体系达到平衡时,自由能等于00lndGRTK配体-受体结合的热力学配体-受体结合的热力学过程药物与受体存在与体液环境中,与周围的水分子存在溶剂化作用。对接过程中的去溶剂化效应Autodock的经验结合自由能评价函数:,,,,1261210,,()()()ijijijIJvdwhbondijijijijijijACDBGGGEtrrrr,()ijelectortorsolijijijqqGGNGrrAutoDock在早期版本中使用的是模拟退火算法(SimulatedAnnealingAlgorithm)来寻找配体与受体最佳的结合位置状态,而从3.0版本开始使用一种改良的遗传算法,即拉马克遗传算法(LamarckianGeneticAlgorithm,LGA)。测试结果表明,LGA比传统的遗传算法和模拟退火具有更高的效率。在LGA方法中,作者把遗传算法和局部搜索(Localsearch)结合在一起,遗传算法用于全局搜索,而局部搜索用于能量优化。10.5.2柔性搜寻方法a.模拟退火算法1.指定结合位点随机地差生配体的一个构象2.随机改变配体的位置、取向,产生了一个新的构象,并比较两者与受体的结合能如果新的构象能低于原来的,则接受新构象3.如果能量高于原来的,则降低温度,在新温度下重复步骤24.在同一初始条件下反复进行多次b.遗传算法模仿生物的遗传和进化,对多极值优化问题的解群进行选择、杂交和突变操作,使得解群不断优化,直至收敛于全局最优解或近似全局最优解。AutoDock优点1.同时考虑配体的柔性和蛋白质结合部位侧链的柔性2.网格计算,加快计算网格计算和dock的区别:Dock中,格点上保存的不是能量,而是受体上原子作用加和;Autodock中,格点上保存的是探针原子和受体之间的相互作用能。AutoDock格点作用能计算通过AutoDock程序包中的Autogrid程序完成,格点计算包括三部分:范德华作用、氢键作用和库伦作用对于范德华相互作用的计算,每个格点上保存的范德华能量的值的数目与要对接的配体上的原子类型的数目一样。如果一个配件中含有C、O和H三种原子类型,那么在每个格点上就需要用三个探针原子来计算探针原子与受体之间的范德华相互作用值。当配体和受体进行分子对接时,配体中某个原子和受体之间的相互作用能通过周围8个格点上的这种原子类型为探针的格点值用内插法得到。静电相互作用的计算采用了一个静电势格点,在格点上储存