刀片集群在分子对接药物设计中的应用摘要在现代药物设计中,计算机模拟是一种重要的方法,使用高性能计算机辅助药物设计得到了广泛应用,其总体趋势是计算精度越来越高,与实验结合日趋紧密。分子对接是指两个或多个分子通过几何匹配和能量匹配相互识别的过程,在药物设计中有十分重要的意义。分子对接对高性能计算机有较高的要求,对于大规模的高性能计算机而言,刀片集群是一种理想的选择。曙光刀片集群系统是分子对接药物设计应用的合适平台,刀片集群可以较好满足分子对接应用的性能需求,而且更加符合现代高性能并行计算机的发展趋势和用户使用要求,可以为用户带来全面的提升和收益。曙光刀片集群系统与众多分子对接软件有着良好的兼容性。经过实际测试,多种分子对接软件可以在曙光刀片集群系统上获得优异的性能。1.计算机辅助药物设计发展概况1894年,EmilFischer提出了药物作用的“锁钥原理”,即药物作用于体内特定部位,有如钥匙与锁的关系一样。这一思想虽然比较简单粗糙,但是其基本思路至今仍然富有活力和价值。自20世纪60年代以来,经过不断探索和努力,现代药物设计的策略和方法已经大为丰富,基本可以分成两大类:间接药物设计和直接药物设计。一,间接药物设计间接药物设计从一组(如几十个)小分子化合物的结构和生物活性数据出发,研究其结构与活性关系的规律,在此基础上预测新化合物的生物活性(药效)和进行高活性分子的结构设计。在药物设计研究的早期(20世纪60-80年代),人们对于药物作用的靶标分子大多缺乏了解,只能从药物小分子化合物的结构和活性出发,去归纳和认识药物分子的构-效关系,因此间接药物设计成为这一时期药物设计研究的主要方法。定量构效关系(QuantitativeStructure-ActivityRelationship,QSAR)是一种重要的间接药物设计方法。最早的QSAR方法由Hansch于1962年提出。它对一组小分子化合物的理化参数和生物活性数据进行线性回归,拟合各项系数,得到反映化合物构—效关系的方程,可用于预测新化合物的生物活性,设计具有更高活性的药物分子。稍后出现的此类方法还有FreeWilson分析方法等。后来的Hansch和FreeWilson模型都没有考虑化合物的空间结构,因此被称为2D-QSAR方法。从20世纪70年代末期至90年代前半期,各种在化合物三维结构基础上进行QSAR研究的方法,即3D-QSAR方法逐步发展起来,较重要的方法有:距离几何(DistanceGeometry),比较分子力场分析(CoMFA),比较分子相似性指数分析(CoMSIA)。其中,CoMFA方法应用较广,它采用化合物周围的静电场、范德华力场、氢键场和疏水场等的空间分布作为化合物结构描述变量,通过数学方法建立化合物的生物活性与化合物周围上述各力场空间分布之间关系的模型。根据这一模型和相应的计算机处理,显示出应当如何进行结构的改造,以提高化合物的生物活性。除了2D和3DQSAR方法之外,药效基团模型方法也是一种重要的间接药物设计方法。药效基团通常是指那些可以与受体结合位点形成氢键相互作用、静电相互作用、范德华相互作用和疏水相互作用的原子或官能团以及它们之间特定的空间排列方式。对一组具有生物活性的化合物进行化学结构的分析和比较,找出其共同的特征结构,即可建立药效基团的模型。得到药效基团模型后,即可以此为提问结构的模板,搜寻现有的小分子数据库,“筛选”出符合药效基团要求的其他分子,进行药理测试。二,直接药物设计直接药物设计以药物作用的对象(靶标生物大分子)的三维结构为基础,研究小分子与受体的相互作用,设计出从空间形状和化学性质两方面都能很好地与靶标分子“结合口袋”相匹配的药物分子。这种方法就象根据“锁”的形状来配“钥匙”一样,因此被称为直接药物设计方法。随着细胞生物学、分子生物学和结构生物学的发展,越来越多的药物作用靶标分子(蛋白质、核酸、酶、离子通道…)被分离、鉴定,其三维结构被阐明,为直接药物设计方法的应用提供了有利的条件。进入90年代以来,直接药物设计已逐渐成为药物设计研究的主要方法,可以分为全新药物设计(denovodrugdesign)和数据库搜寻(或称分子对接,docking)两类。全新药物设计这类方法是根据靶标分子与药物分子相结合的活性部位(“结合口袋”)的几何形状和化学特征,设计出与其相匹配的具有新颖结构的药物分子。实现全新药物设计的方法,目前主要有两种。一种方法称为碎片连接法,该方法首先根据靶标分子活性部位的特征,在其“结合口袋”空腔中的相应位点上放置若干与靶标分子相匹配的基团或原子,然后用合适的连接片段(linker)将其连接成一个完整的分子。另一种方法称为碎片生长法,该方法首先从靶标分子的结合空腔的一端开始,逐渐“延伸”药物分子的结构。在“延伸”过程中,每一步都要对其延伸的片段(基团或原子)的种类及其方位进行计算比较,选择最优的结果,再向下一步延伸,直至完成。分子对接(Docking)这类方法首先要建立大量化合物(例如几十至上百万个化合物)的三维结构数据库,然后将库中的分子逐一与靶标分子进行“对接”(docking),通过不断优化小分子化合物的位置(取向)以及分子内部柔性键的二面角(构象),寻找小分子化合物与靶标大分子作用的最佳构象,计算其相互作用及结合能。在库中所有分子均完成了对接计算之后,即可从中找出与靶标分子结合的最佳分子(前50名或前100名)。这类方法虽然计算量较大,但库中分子一般均是现存的已知化合物,可以方便地购得,至少其合成方法已知,因而可以较快地进行后续的药理测试,实际上这种方法就是在计算机上对几十万、上百万化合物通过分子对接的理论计算进行一次模拟“筛选”。只要库中的化合物具有足够大的分子多样性,从中搜寻出理想的分子结构就是可能的。自1982年加州大学旧金山分校的Kuntz发展了第一个Dock程序后,这一方法已得到广泛应用,并取得了很大的成功。2.分子对接及典型软件2.1.分子对接方法分子对接是指两个或多个分子通过几何匹配和能量匹配相互识别的过程,在药物设计中有十分重要的意义。药物分子在产生药效的过程中,需要与靶酶相互结合,这就要求两个分子要充分接近并采取合适的取向以使二者在必要的部位相互契合,发生相互作用,继而通过适当的构象调整,得到一个稳定的复合物构象。通过分子对接确定复合物中两个分子正确的相对位置和取向,研究两个分子的构象特别是底物构象在形成复合物过程的变化是确定药物作用机制,设计新药的基础。分子对接计算把配体分子放在受体活性位点的位置,然后按照几何互补、能量互补以及化学环境互补的原则来评价药物和受体相互作用的好坏,并找出两个分子之间最佳的结合模式。由于分子对接考虑了受体结构的信息以及受体和药物分子之间的相互作用信息,因此从原理上讲,它比仅仅从配体结构出发的药物设计方法更加合理。同时,分子对接筛选的化合物库往往采用的是商用数据库,比如可用化合物数据库(ACD)、剑桥晶体结构数据库(CSD)、世界药物索引(WDL)、药用化合物数据库(CMC)以及可用化合物搜索数据库(ACDSC)等等,因此筛选出来的化合物都为已知化合物,而且相当大一部份可以通过购买得到,这为科研提供了很大的方便,近年来,随着计算机技术的发展、靶酶晶体结构的快速增长以及商用小分子数据库的不断更新,分子对接在药物设计中取得了巨大成功,已经成为基于结构药物分子设计中最为重要的方法。分子对接的最初思想源自于“锁和钥匙”的模型,即“一把钥匙开一把锁”。不过分子对接,也就是药物分子和靶酶分子间的识别要比“钥匙和锁”的模型要复杂的多,首先表现在药物分子和靶酶分子是柔性的,这样就要求在对接过程中要相互适应以达到最佳匹配;再者,分子对接不仅要满足空间形状的匹配,还要满足能量的匹配,底物分子与靶酶分子能否结合以及结合的强度最终是由形成此复合物过程的结合自由能的变化值决定。互补性和预组织是决定分子对接过程的两个重要原则,前者决定识别过程的选择性,而后者决定识别过程的键和能力。互补性包括空间结构的互补性和电学性质的互补性。受体和底物分子在识别之前将受体中容纳底物的环境组织的愈好,其溶剂化能力就越低,则它们的识别效果愈佳,形成的复合物越稳定,这就是分子识别的预组织原则。分子对接的种类主要包括:刚体对接:指在对接过程中,研究体系的构象不发生变化。适合考察比较大的体系,如蛋白质和蛋白质间以及蛋白质和核酸之间的对接。半柔性对接:指在对接过程中,研究体系尤其是配体的构象允许在一定的范围内变化。适合处理大分子和小分子间的对接,对接过程中,小分子的构象一般是可以变化的,但大分子是刚性的。柔性对接:指在对接过程中,研究体系的构象基本上可以自由变化的。一般用于精确考虑分子间的识别情况。由于计算过程中体系的构象可以变化,所以计算耗费最大。目前已经有多个分子对接软件得到广泛应用,包括:DOCK,AUTODOCK,FIexX,Affinity,GOLD等。各个软件各有所长,在实际使用中可互补,当使用一个软件对接结果不好时,可以尝试换另外一个软件,可能取得较高的效果。2.2.分子对接典型软件2.2.1.DOCKDOCK是Kuntz研究小组发展的分子对接程序,可能是目前应用最为广泛的分子对接程序之一。软件免费,在2006年12月发布了6.1版本。DOCK可以自动地模拟配体分子在受体活性位点的作用情况,并把理论预测最佳的方式记录下来。而且该方法能够对配体的三维结构数据库进行自动搜索,因此被广泛应用于基于受体结构的数据库搜索的药物设计中,并取得了巨大的成功。用DOCK进行药物设计以及数据库的搜索基本上可以分为下面几个步骤:配体和受体相互作用位点的确定;评分系统的生成;DOCK计算;DOCK结果的处理与分析。活性位点的确定和表达是DOCK最重要的特点之一。活性位点特征的确定对于DOCK是非常重要的,因为配体分子和受体相互作用过程的模拟主要就是参考几何位点的几何特征进行的。在DOCK程序中,活性位点的确定通过sphgen程序来完成。DOCK软件包中sphgen程序生成受体表面所有的凹陷的负像,并对这些负像进行聚类分析。在DOCK程序中,表面点采用了Richards提出的模型。在这些表面点的基础上,采用sphgen程序生成了负像,它实际上由一些与分子表面点相切的圆球叠加而成。在生成负像的基础上,就可以进行配体分子和活性口袋之间的匹配。配体也采用一组球集来表示,和负像不同的是,配体所用的球集表示配体所占的空间区域。如果配体分子能和活性口袋形成比较好的匹配,那么配体的球集一定能和活性口袋中的负像形成好的叠合。配体分子和负像之间的匹配原则是基于配体和受体之间球集的内坐标的比较。按照匹配原则得到了配体和受体之间的匹配情况之后,就要通过合理的得分函数来选择最优的结果。DOCK提供了多种得分函数来评价配体和受体之间的结合情况,包括原子接触得分以及能量得分。DOCK进行分子对接时,配体分子可以是柔性的。对于柔性的分子,其键长和键角保持不变,但可旋转二面角是可以发生变化的。在DOCK中,柔性分子的构象变化通过下面的操作实现:首先是刚性片断的确定,然后是构象搜索。构象搜索采用两种方法:一种是锚优先搜索(anchor-firstsearch),第二种方法是同时搜索(simultaneoussearch)。2.2.2.AUTODOCKAUTODOCK是Scripps的Olson科研小组开发的分子对接软件包,AUTODOCK采用模拟退火和遗传算法来寻找受体和配体最佳的结合位置,用半经验的自由能计算方法来评价受体和配体之间的匹配情况。软件免费,2007年发布了Version4。在AUTODOCK中,配体和受体之间结合能力采用能量匹配来评价。在1.0和2.0版本的软件中,能量匹配得分采用简单的基于AMBER力场的非键相互作用能。非键相互作用来自于三部分的贡献:范得华相互作用,氢键相互作用,以及静电相互作用。在3.0版中,AUTODOCK提供了半经验的自由能计算方法来评价配体和受体之间的能量匹配。在最早的AUTODOCK版本中,