药物分子设计前沿摘要:近些年来,各种各样的新型疾病依次出现。因此,寻找可以治愈这些疾病的药物对人们来说至关重要。随着计算机技术的高速发展,运用计算机进行新药的模拟实验已经成为一种新的方法。本文就对这些方法做一个总的综述来介绍这些方法在新药设计过程中的应用过程。计算机辅助药物设计方法(CADD)是药物分子设计的基础。从2O世纪6O年代构效关系方法(QSAR)提出以后.经过40多年的努力和探索,CADD方法已经发展成为一门完善和新兴的研究领域。计算机辅助药物设计是应用量子力学、分子动力学、构效关系等基础理论数据研究药物对酶、受体等作用的药效模型,从而达到药物设计之目的。计算机辅助药物设计方法(CADD)大体可以分为三类:基于小分子的药物分子设计方法、基于受体结构的药物分子设计方法、计算组合方法。计算机辅助药物设计是研究与开发新药的一种崭新技术,它大大加快了新药设计的速度,节省了创创新药工作的人力和物力,使药物学家能够以理论作指导,有目的地开发新药。关键词:药物分子设计计算机模拟分子模拟活性位点分析法ABSTRACT:Inthosepastyears,avarietyofnewdiseaseswereappeared.So,it’svaryessentialforustofindthedrugsthatcancurethesediseases.Andwiththefastdevelopmentofcomputertechnology,theapplyingofcomputerinthesimulationsofthesenewdrugshasbecomeanewmethod.Inthispaper,Iwilldrawageneraloverviewofthosemethodstointroducetheapplicationsinthedesignprocessofthenewdrugs.ThemethodofComputerAidedDrugDesign(℃ADD)wasthebasis0fdrugsmoleculedesignwhichwasproposedin1960.Duringthelast40years,theCADDmethodhasbeenwidelyappliedasaburgeoningandpotentialresearcharea.TheaimofCADDistodesigndrugaccordingtothepharmacodynamicmodelbetweenthedrugsandtheenzymeorreceptorwhichisappliedthequantummechanics.moleculardynamics,andquantitativestructure—activityrelationship.TheCADDincludesthreemethods:methodbasingontheligand,methodbasingonthereceptor,andcombinatorialchemistrymethod.TheCADDisanewtechnologytoresearchdrugwhichcanacceleratethespeedofdrugdesign,economizethemanpowerandmaterialresources.KEYWORDS:Drugmoleculardesign;computersimulation;molecularsimulation;activesiteanalysis引言传统药物设计从总体上来讲,缺乏成熟完善的发现途径,具有很大的盲目性,一般平均要筛选10000种以上的化合物才能得到一种新药,因此开发效率很低。随着计算机技术及计算化学、分子生物学和药物化学的发展,药物设计进入了理性阶段,其中药物分子设计是目前新药发现的主要方向。它是依据生物化学、酶学、分子生物学以及遗传学等生命科学的研究成果,针对这些基础研究中所揭示的包括酶、受体、离子通道及核酸等潜在的药物设计靶点,并参考其它类源性配体或天然产物的化学结构特征,设计出合理的药物分子。运用计算机模拟来进行新药的分子结构设计主要有三种方法:分子对接设计、遗传算法以及计算机辅助分子设计方法(CAMD)。一分子对接与药物设计1原理以及分类分子对接的原理是互补匹配原理,就是将配体分子放置于受体的活性位点处,寻找其合理的取向和构象。在分子对接过程中要特别注意考虑的问题有配体与受体如何匹配,如何确定最佳匹配,如何实现最佳匹配。其中根据分子对接在药物设计中的用途可将分子对接分为两类,一类是细致对接,它主要用于改造或设计配体分子,对精度要求较高,如考虑较多的分子柔性、溶剂作用等,有时还需要对亲和性作出估计,对速度的要求不很严格,一次对接计算机通常是在几个小时内完成;另一类是粗略对接,它主要用于对化合物数据库的筛选,从中找出可能与受体结合的化合物,对于速度的要求较高,对接时计算机必须以很快的速度完成对单个小分子的对接,因此导致对接精度不高。根据对接时计算量的简化程度可以将分子对接分为刚性对接、半柔性对接和柔性对接。刚性对接是指在对接过程中,研究体系的构象不发生变化,只考虑配体分子在受体活性位点处的位置和取向,适合用于考察比较大的体系,计算较为粗略,原理较为简单;半柔性对接是指在对接过程中,研究体系尤其是配体的构象允许在一定程度内变化,比如考虑配体的可旋转键的变化等,适合用于处理小分子和大分子之间的对接,其中小分子的构象可以发生变化而大分子则不可以,其计算效率较高;柔性对接是指在对接过程中,同时考虑受体和配体的柔性信息,即研究体系的构象基本是可以自由变化的,一般用于精确考察分子之间的识别情况,但是需要耗费较长的计算时间。根据对接时配体分子的结构可分为两种,一种是整体分子对接方法,是指运用一种特定搜索算法考察配体分子在受体结合部位的能谱,并找出对应于给定评分函数的最优结合方式,其中有代表性的软件有DOCK3.5,Autodock;另一种是基于片段的分子对接方法,是将配体分子视为若干个结构片段的集合,先将其中一个或数个基本片段放入受体结合口袋,然后在活性部位构建分子的其余部分,最终得到理论上最优的结合方式,其中有代表性的软件是DOCK4,DOCK5,FlexX。基于片段的分子对接方法通常较整体分子对接方法快。2适用领域分子对接使用的领域有全新药物设计、虚拟筛选、为虚拟筛选构建组合库、分子识别等。分子对接用于全新的药物设计时,其目的是针对特定的生物活性大分子设计出与之具有较好结合亲和力的小分子药物,因此关键是对接结果的精度,对接的时效性指标可列居其次;分子对接是虚拟筛选的核心技术;组合化学和高通量筛选是近年来迅速发展起来的先导物发现与优化的方法。但如何提高所构建组合库的有效性和多样性仍是当前组合化学发展的一大难题。采用分子对接筛选虚拟组合库的策略是解决这一问题的重要途径。3成功实例[1]Kuntz等利用DOCK程序研究HIV-1蛋白酶体系,根据分子相似性对剑桥晶体数据库进行搜寻,得到bromperidol及其同系物氟哌啶醇(haloperid01)的结构,以及氟哌啶醇的硫缩酮衍生物溴哌啶醇(thioketal);[2]DesJarlais利用改进版DOCK程序(target-DOCK)搜寻HIV-1蛋白酶抑制剂发现了HIV-1蛋白酶环亚砜类抑制剂;[3]Shoichct对胸苷酸合成酶进行DOCK搜寻,发现了舒利苯酮(sulibenzone)和酚百里酚酞(phenolthymolphthalein)的结构;[4]Bodian用DOCK程序进一步搜索到在体内有抗病毒活性的先导化合物的类似物;[5]Ring利用DOCK程序针对血吸虫丝氨酸蛋白酶和疟原虫半胱氨酸蛋白酶的三维结构进行数据库搜寻,发现有两个化合物对血吸虫丝氨酸蛋白酶活性达10umol/L,有一个化合物对疟原虫半胱氨酸蛋白酶活性也达10umo/L,被用于测定抗寄生虫药理活性。利用DOCK程序产生的结合模型作进一步结构改造,有一个化合物阻断疟原虫传染或在红细胞中成熟IC50=150nmo/L;[6]Jefferson医学院的研究人员利用DOCK3.5程序,考察150000个有机分子与T细胞表面CD4受体结合部位相互作用,考虑了形状上互补和电荷的相互作用,筛选出41个化合物,进一步通过生物学实验,成功地确定了其中3个结合活性较好的化合物,发展成为候选药物分子;[7]Chen等利用DOCK4.0对NCI数据库进行了计算机筛选,对初筛结果进行更充分构象搜索和能量优化的二次筛选,寻找到对HIV整合酶有较强抑制活性的新型结构的化合物;[8]中国医学科学院药物研究所利用构效关系分析方法和分子对接方法开发的环氧合酶-2抑制剂已经进入临床前研究;4发展方向分子对接技术在运用了这些年后,已经有了一定的发展方向,这些发展方向有柔性对接、溶剂化效应、并行计算和反向对接等几个方面。二遗传算法1原理遗传算法(geneticalgorithm,GA)是模拟达尔文的遗传选择和自然淘汰的生物进化过程的计算模型。它的思想源于生物遗传学和适者生存的自然规律,是具有“生存+检测”的迭代过程的搜索算法。我们习惯上把Holland1975年提出的GA称为传统的GA。遗传算法以一种群体中的所有个体为对象,并利用随机化技术指导对一个被编码的参数空间进行高效搜索。把待求解问题表示成串(或称染色体或个体),一般为二进制或整数码串。多个染色体构成一群串(或称种群),并将它们置于问题的求解环境中。根据适者生存的原则,从中选出适应环境的串进行复制,且通过选择(selection)、交叉(C~SSOVeF)和变异(mutation)操作去繁衍它们的后代。经过一代代地不断变化,收敛到一个最适应环境的种群上,即所求问题的最优解集。在传统的遗传算法中,选择、交叉和变异构成了最基本的遗传操作;参数编码、初始群体的设定、适应度函数的设计、遗传操作设计、控制参数设定5个要素则组成了遗传算法的核心内容。2基本步骤(1)编码:GA在进行搜索之前先将解空间的解数据表示成遗传空间的基因型串结构数据,这些串结构数据的不同组合便构成了不同的点。目前,最常用的编码方式为二进制码。(2)产生初始的种群:一般由计算机随机产生N个初始字符串,每个串结构数据称为一个个体,多个个体就构成了一个种群。GA以这个串结构数据作为初始点开始迭代优化过程。(3)适应性函数值评估检测:适应性函数表明个体或解的优劣性,根据适应性函数的计算值,可以很好地控制个体生存的机会,以体现适者生存的自然法则。(4)选择:选择的目的是为了从当前群体中选出优良的个体,使它们有机会作为父代来繁衍下一代。选择依据的原则是适应性大的个体为下一代贡献一个或多个后代的概率大。(5)交叉操作:交叉操作是遗传算法中最主要的遗传操作。对于依照复制原则被选中的个体,如果采用的是单点交叉的操作,则通过随机原则选择位置i(1≤i≤n),交换两个字符串位置左边(或右边)的部分,产生两个新的个体,这两个新个体分别包含了其父辈的特征。目的在于通过产生新的基因组合,形成新的个体。(6)变异:变异首先在群体中随机选择一个个体,对于选中的个体以一定的概率随机地改变串结构数据中某个串的值。同生物界一样,GA中变异发生的概率很低,通常取值在0.001—0.01之间。变异为新个体的产生提供了机会。当二进制码串某个位置选定为突变位点时,该位从1变为0或从0变为1。3在药物设计中的应用目前,遗传算法已经成为计算机辅助药物分子设计中应用最为广泛的优化方法之一,其在计算机辅助药物分子设计中的应用主要包括以下几个方面。(1)二维定量构效关系(2D-QSAR)QSAR就是通过一些数理统计方法建立起一系列化合物的生理活性或某种性质与其物理化学性质之间的定量关系。在传统的2D-QSAR研究中,多重线性回归是最为常用的统计方法。在建立多重线性回归模型的时候,怎样选择合适的参数一直是定量构效关系研究中的一个难题。研究表明,遗传算法是一种