1QSAR1什么是QSAR?(Q)SAR是一种借助分子理化性质参数或结构参数,以数学和统计学手段定量研究有机小分子与生物大分子相互作用、有机小分子在生物体内吸收、分布、代谢、排泄等生理相关性质的方法。预测化合物的生理活性或某些性质,等等。该方法起始于药物设计领域,通过研究生物活性和理化参数之间的相关性预测新化学物质的活性,指导新药和杀虫剂的合成。在环境化学领域,QSAR可用来预测化学品在环境中的暴露水平,同时又可对其生物活性作出评价。这种方法广泛应用于药物、农药、化学毒剂等生物活性分子的合理设计,在早期的药物设计中,定量构效关系方法占据主导地位,90年代以来随着计算机计算能力的提高和众多生物大分子三维结构的准确测定,基于结构的药物设计逐渐取代了定量构效关系在药物设计领域的主导地位,但QSAR在药学研究中仍然发挥着非常重要的作用。2QSAR研究现状与需求2.1研究现状经济合作与发展组织(OrganizationforEconomicCooperationandDevelopment,OECD)OECD围绕化学品的安全性问题,开展了(Q)SAR技术的应用研究。2004年11月,OECD提出了验证(Q)SARs模型的原则,围绕(Q)SARs在现有和新化学品管理中的应用,组织开展了案例研究。涉及的国家包括澳大利亚、加拿大、捷克共和国、丹麦、德国、意大利、日本、荷兰、美国、英国和欧盟委员会。欧盟委员会(EuropeanCommission)联合研究中心(JointResearchCentre,JRC)和欧洲化学品管理署(EuropeanChemicalsAgency,ECHA)是欧盟负责有害化学品风险评价的核心官方机构,负责实施REACH法规的技术支持,近年来围绕(Q)SAR技术的开发和应用,开展了大量的研究工作,涉及(Q)SAR技术在不同目标层面上的应用。美国环境保护局(U.S.EnvironmentalProtectionAgency,USEPA)2002年,USEPA在国会的要求下加强了计算毒理学的研究工作,核心是开发和验证用于化学品筛选和确定优先污染物的非动物试验方法,主要是(Q)SAR方法在USEPA专门成立了国家计算毒理学研究中心(NationalCenterforComputationalToxicology,NCCT)。22.2法规需求中国新化学物质申报指南申报数据质量要求中估算与引用数据一节,在无法进行实际测试的特殊情况下,允许采用国际通用的估算方法,如结构活性定量估算(QSAR,QuantitativeStructureActivityRelationships)、交叉参照(Read-Acorss)以及查阅引用权威性文献等方法获得数据,同时应充分说明理由、方法或数据来源、依据等。欧盟REACH法规1907/2006(EC)中的附录XI中,针对附录VII到附录X中规定的不同年产量的生产和进口的化学品的测试方法要求,明确规定欧盟REACH法规要求的化学品注册信息可来源于定量结构-活性关系方法((Q)SAR)。其中总则第(40)条尤其强调规定“欧盟委员会、成员国、产业界以及其他利益相关方面应继续致力于在国际和国家层面上替代动物试验方法的研究和使用,包括计算机方法…”。联合国GHS指南的“第四部分环境危害”的“4.1.2物质分类标准”中明确规定“如果没有实验数据,那么可在分类过程中使用有效的水生毒性定量结构活性关系(QSARs)和logKow。并在“附件9水生环境危害指导”中,“A9.6QSAR的使用”专门对QSARs的使用做出了明确和详细的规定。3发展历史定量构效关系是在传统构效关系的基础上,结合物理化学中常用的经验方程的数学方法出现的,其理论历史可以追溯到1868年提出的Crum-Brown方程,该方程认为化合物的生理活性可以用化学结构的函数来表示,但是并未建立明确的函数模型。最早的可以实施的定量构效关系方法是美国波蒙拿学院的Hansch在1962年提出的Hansch方程。Hansch方程脱胎于1935年英国物理化学家哈密顿提出的哈密顿方程以及改进的塔夫托方程。哈密顿方程是一个计算取代苯甲酸解离常数的经验方程,这个方程将取代苯甲酸解离常数的对数值与取代基团的电性参数建立了线性关系,塔夫托方程是在哈密顿方程的基础上改进形成的计算脂肪族酯类化合物水解反应速率常数的经验方程,它将速率常数的对数与电性参数和立体参数建立了线性关系。Hansch方程在形式上与哈密顿方程和塔夫托方程非常接近,以生理活性物质的半数有效量作为活性参数,以分子的电性参数、立体参数和疏水参数作为线性回归分析的变量,随后,Hansch和日本访问学者藤田稔夫等人一道改进了Hansch方程的数学模型,引入了指示变量、抛物线模型和双线性模型等修正,使得方程的预测能力有所提高。3几乎在Hansch方法发表的同时,Free等人发表了Free-Wilson方法,这种方法直接以分子结构作为变量对生理活性进行回归分析。其在药物化学中的应用范围远不如Hansch方法广泛。Hansch方法、Free-Wilson方法等方法均是将分子作为一个整体考虑其性质,并不能细致地反应分子的三维结构与生理活性之间的关系,因而又被称作二维定量构效关系。二维定量构效关系出现之后,在药物化学领域产生了很大影响,人们对构效关系的认识从传统的定性水平上升到定量水平。定量的结构活性关系也在一定程度上揭示了药物分子与生物大分子结合的模式。在Hansch方法的指导下,人们成功地设计了诺氟沙星等喹诺酮类抗菌药。由于二维定量不能精确描述分子三维结构与生理活性之间的关系,1980年代前后人们开始探讨基于分子构象的三维定量构效关系的可行性。1979年,Crippen提出“距离几何学的3D-QSAR”;1980年hopfinger等人提出“分子形状分析方法”;1988年Cramer等人提出了“比较分子场方法”(CoMFA)。比较分子场方法一经提出便席卷药物设计领域,成为应用最广泛的基于定量构效关系的药物设计方法;1990年代,又出现了在比较分子场方法基础上改进的“比较分子相似性方法”以及在“距离几何学的3D-QSAR”基础上发展的“虚拟受体方法”等新的三维定量构效关系方法,但是老牌的CoMFA依然是使用最广泛的定量构效关系方法。4常用(Q)SAR方法4.1二维定量构效关系方法(2D-(Q)SAR)二维定量构效关系方法是将分子整体的结构性质作为参数,对分子生理活性进行回归分析,建立化学结构与生理活性相关性模型的一种模型设计方法。二维定量构效关系方法是将分子整体的结构性质作为参数,对分子生理活性进行回归分析,建立化学结构与生理活性相关性模型的一种药物设计方法,常见的二维定量构效关系方法有Hansch方法、Free-Wilson方法、分子连接性方法等,最为著名和应用最广泛的是Hansch方法。Hansch方法用疏水性、电性、立体性等化合物的结构参数与生物活性相关,建立QSAR方程,由于所有的参数都与系统的自由能相关,故Hansch方法又称为线性自由能相关(Linerfreeenergyrelationships,LFER)线性模型:lg1/C=algP+bσ+cEs+…+constant4抛物线模型:lg1/C=a(lgP)2+blgP+cσ+…+constant统计方法:最小二乘法(PLS)相关理化参数(1)活性参数活性参数是构成二维定量构效关系的要素之一,人们根据研究的体系选择不同的活性参数,常见的活性参数有:半数有效量、半数有效浓度、半数抑菌浓度、半数致死量、最小抑菌浓度等,所有活性参数均必须采用物质的量作为计量单位,以便消除分子量的影响,从而真实地反应分子水平的生理活性。为了获得较好的数学模型,活性参数在二维定量构效关系中一般取负对数后进行统计分析。(2)结构参数结构参数是构成定量构效关系的另一大要素,常见的结构参数有:疏水参数、电性参数、立体参数、几何参数、拓扑参数、理化性质参数以及纯粹的结构参数等。疏水参数:药物在体内吸收和分布的过程与其疏水性密切相关,因而疏水性是影响药物生理活性的一个重要性质,在二维定量构效关系中采用的疏水参数最常见的是脂水分配系数,其定义为分子在正辛醇与水中分配的比例,对于分子母环上的取代基,脂水分配系数的对数值具有加和性,可以通过简单的代数计算获得某一取代结构的疏水参数。电性参数:二维定量构效关系中的电性参数直接继承了哈密顿公式和塔夫托公式中的电性参数的定义,用以表征取代基团对分子整体电子分配的影响,其数值对于取代基也具有加和性。立体参数:立体参数可以表征分子内部由于各个基团相互作用对药效构象产生的影响以及对药物和生物大分子结合模式产生的影响,常用的立体参数有塔夫托立体参数、摩尔折射率、范德华半径等。几何参数:几何参数是与分子构象相关的立体参数,因为这类参数常常在定量构效关系中占据一定地位,故而将其与立体参数分割考虑,常见的几何参数有分子表面积、溶剂可及化表面积、分子体积、多维立体参数等。拓扑参数:在分子连接性方法中使用的结构参数,拓扑参数根据分子的拓扑结构将各个原子编码,用形成的代码来表征分子结构。理化性质参数:偶极矩、分子光谱数据、前线轨道能级、酸碱解离常数等理化性质参数有时也用做结构参数参予定量构效关系研究。5纯粹的结构参数:在Free-Wilson方法中,使用纯粹的结构参数,这种参数以某一特定结构的分子为参考标准,依照结构母环上功能基团的有无对分子结构进行编码,进行回归分析,为每一个功能基团计算出回归系数,从而获得定量构效关系模型。4.2三维定量构效关系方法(3D-(Q)SAR)与2D-(Q)SAR比较,3D-(Q)SAR方法在物理化学上的意义更为明确,能间接反映化合物分子和靶点之间的非键相互作用特征。三维定量构效关系(3D-QSAR)是引入了分子三维结构信息进行定量构效关系研究的方法。这种方法间接地反映了分子与生物大分子相互作用过程中两者之间的非键相互作用特征,相对于二维定量构效关系有更加明确的物理意义和更丰富的信息量。(1)3D-QSAR的基本原理主要是利用数学模式对药物的化学结构信息(如各种取代基参数,拓扑指数以及量子化学与分子力学计算参数)与其生物活性之间的关系进行定量分析,找出结构与活性间的量变规律,然后根据这种规律及未知化合物的结构预测未知化合物的性能。它建筑在以下观念上:(1)分子的形状在一定程度上影响其生物活性,分子的活性构象是研究3D-QSAR的关键;(2)药物分子与受体之间的相互作用是借助可逆的、非共价结合的弱作用力实现的,如静电引力、疏水作用、氢键、范德华引力等。由于3D-QSAR直接反映药物分子与受体三维空间上的互补性,更准确表达了药物与受体之间的相互作用,因此,近十多年来3D-QSAR方法得到了迅速的发展。(2)3D-QSAR研究方法比较分子场(CoMFA)法、假设活性网格法(HASL)、比较分子矩分析法(CoMMA)、比较分子相似性指数分析法(CoMSIA)、距离几何学三位定量构效关系(DG3D-QSAR)、分子形状分析(MSA)、虚拟受体(FR)等方法等。分子形状分析(MSA)方法分子形状分析(MSA)方法认为柔性分子有多种构象,每种构象可视为一种形状,药物的活性与这些形状对受体的活性部位的适应能力有关。Koehler等人就利用MSA法对利什曼原虫二氢叶酸还原酶(DHFR)抑制剂的三嗪类化合物进行了三维定量构效关系分析,成功建立了3D-QSAR方程;MSA法的缺点也是很明显的:由于该法仅仅只是在2D-QSAR的基础上引入了重叠体积等参数作为变量,而且这些参数的物理意义并不是很明确,所以它只能看作一种初级的3D-QSAR6研究。距离几何学三维定量构效关系(DG3D-QSAR)距离几何学三维定量构效关系(DG3D-QSAR)严格来讲是一种介于二维和三维之间的QSAR方法。这种方法将药物分子划分为若干功能区块定义药物分子活性位点,计算低能构象时各个活性位点之间的距离,形成距离矩阵;同时定义受体分子的结合位点,获得结合位点的距离矩阵,通过活性