环境有机污染物的结构-性质-活性(上)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

环境有机污染物的结构-性质与活性(上)南京大学环境学院2003.10.16有机污染化学专题之四Outlines结构-性质/活性关系概论结构-性质/活性关系模型的构建有机污染物的分子结构表征结构-活性关系研究的主要方法结构-活性关系研究发展的主要方向第一节结构-性质/活性关系概论结构-性质/活性关系的含义结构-性质/活性关系的工作原理结构-性质/活性关系的功能结构-性质/活性关系的发展历程结构-性质/活性关系的发展特点(1)结构-性质/活性的含义结构-性质/活性关系(Structure-Activity/PropertiesRelationship),是指对化学品的分子结构与性质或活性之间关系的研究,可以分为定性结构-性质/活性关系(SAR)和定量结构-性质/活性关系,即QSAR。环境科学中的结构-活性关系研究是有机污染化学和生态毒理学中的一个前沿领域,是化学品环境风险评价的重要组成部分和值得信赖的重要手段之一。结构-性质-活性的含义结构:有机物的分子结构,通常用参数化的形式定量地表达。分子结构参数,分子结构描述符等。性质:包括污染物的理化性质例如污染物的水溶解度、疏水性、挥发性、熔点、沸点、极性等理化性质,以及表征污染物在不同介质之间的吸附、分配、迁移以及降解、水解、光解等环境行为的特性。因此可以概括为有机污染物环境行为或某种性质。性质的双重角色生物活性指污染物对不同生物物种和不同层次的测试终点的生态毒性和健康效应指标。例如污染物对微生物和水生生物的急性毒性、亚急性毒性、生长抑制毒性、酶抑制毒性等,对高等生物和人类的急性毒性、三致毒性(致癌性、致畸性和致突变性)、内分泌干扰活性(生殖和遗传毒性、免疫毒性、生长发育毒性、内分泌干扰、神经毒性等),对生物组织水平、细胞水平乃至于分子水平的损伤等。结构-性质-活性的含义(2)QSAR的工作原理分子是构成物质的基础单位,化合物内部分子结构特征及分子间的组合方式等结构信息决定了化合物所表现的性质。将化合物的生物活性归因于化学结构的影响是QSAR研究的理论基础。分子结构性质与活性分子结构变化性质与活性的变化通过研究化合物的分子结构与其性质、活性之间的定量关系,应用数学方法,建立起结构-性质/活性关系模型,从而对已进入环境的污染物及尚未投入使用的新化合物的相关性质/活性进行预测、评价和筛选。这是结构活-性关系技术的工作原理。xfYxfY利用模型的预测能力对其它未知化合物的相关性质/活性进行预测,在效应评价和暴露评价中弥补缺失的数据,对环境有机化学品进行筛选和评价;根据模型的组成与形式,确定影响性质/活性的主要结构因素,结合已有的化学、生物学知识,探求有机污染物的环境过程机制和生态效应机理。根据所阐明的结构-活性关系结果,为设计高效、低毒无害的新型环境友好化学品指明方向。(3)结构-活性关系的功能(4)结构-活性关系的发展历程早在19世纪,就有人开始设法建立化合物的生物活性和结构之间的关系,这些研究者认为可以根据某些通用的规则,从化合物的化学结构探测活性。20世纪初,人们普遍将化合物的生物效应与其物理性质如溶解度、表面张力和分配系数等联系起来,这些都属于结构-活性关系的范畴.结构-活性关系的研究最初作为定量药物设计的一个研究分支领域,是为了适应合理设计生物活性分子的需要而发展起来的,它对于设计和筛选生物活性显著的药物,以及阐明药物的作用机理等均具有指导作用。开创性的工作始于本世纪30年代Hammett等人的研究.Taft等人在50年代,Hansch等人在60年代,为有机物定量结构—性质—活性相关研究做出了重要的贡献Hansch等借助于计算机技术建立的结构-活性关系表达式,标志着QSAR时代的开始。此后,QSAR在理论上日益得到发展,同时在各个领域的应用范围日益广泛,国内外在这方面的研究很活跃;70年代以来,由于对进入环境中的大量有机化学品的生态风险评价的需要,QSAR开始在环境科学中得到应用,并得到了迅猛的发展;1993年,专业杂志SARandQSARinEnvironmentalResearch在法国创刊.并且世界各地已经开始有众多的环境科学家从事有机污染物的QSAR及QSPR的研究,每年有大量的科研论文发表。(5)QSAR的发展特点综合性:化学(环境化学、化学信息学、量子化学、图论、物理化学等),生物学(细胞生物学、分子生物学、毒理学、生态学等),数学(统计学、应用数学、数学模拟等),计算机科学(计算机图形学、分子模拟、人工智能等).理论性:体现在QSAR模型的建立不仅能够起到高效的预测作用,还能够根据模型的形式和组成,从参数的物理意义,提供理论上和机理上的信息,从而为探索有机污染物的环境行为规律和生态效应机理提供指导.微观性:90年代以后,随着量子化学、三维分子模拟和计算机图形学等在QSAR中的应用,随着效应指标体系的日益精确,暴露评价方法的日益完善,人们更注重定量模型的理论性和微观性,希望能够从本质上、从微观层次揭示和描述化学品的生物活性机制智能化:由于化合物的结构的多样性以及生物效应作用过程和机理的复杂性,要在化合物的结构因素与生物活性之间建立满意的运算关系必须借助于多变量分析方法和计算机的自适应功能。因此多变量统计方法、人工智能、遗传算法等善于处理复杂问题等高级建模方法越来越多地应用于结构-活性关系研究。促进QSAR研究向智能化发展。程序化与系统化:结构-活性关系模型的建立,往往基于对大量化合物的众多参数的分析,从中筛选出对生物活性具有显著影响的变量,开发了大型的集成化的软件、专家系统。例如专家系统MULTICASE系统能够自动采集结构描述符、自动选择参数、自动建立QSAR模型并进行预测、自动提出对有机污染物的生态风险管理意见等。实用性:由于QSAR可以对化学品的暴露水平和生态效应作出评价,为化学品危险性评价提供了一种快速、简便、实用的途径和筛选工具。各国政府越来越重视QSAR的评价和预测功能,美国EPA在化学品评价中承认并接受QSAR的预测数据和结果。其次,通过QSAR可以发现并确定对化合物活性起关键作用的结构因素,因而对定向合成高效低毒的新化合物具有指导意义。第二节QSAR模型的构建测试集系列化合物的选择性质/活性数据的获得分子结构描述QSAR模型构建QSAR模型的评价、验证QSAR模型的应用建立QSAR/QSPR模型确定化合物结构与活性之间的关系需要借助于数学、统计学和计算机科学的方法,并与这些学科的发展密切相关选择结构描述符化学结构的表达对成功建立QSAR/QSPR模型有举足轻重的作用获取性质/活性数据数据的精确性决定了QSAR/QSPR模型的准确性定量结构与活性的关系确定研究对象环境中典型有机污染物结构活性关系研究总体思路有机污染物性质/活性分子结构描述统计分析方法QSAR模型模型验证与修正模型应用(1)确定研究对象确定所要研究的对象,即环境中典型的有机污染物根据一定的统计标准和结构标准选择一系列化合物,构成QSAR模型建立的训练集。测试集化合物选择的条件是统计上的随机性和代表性,结构上的代表性、多样性和全面性,以及性质/活性数据的可获得性。(2)性质/活性数据的获得针对测试集中的系列化合物,收集所关注的理化性质/生物活性数据。数据收集的途径主要有三种:科学文献的查阅、收集,活性/性质数据库中获取以及实验室中测试。活性/性质数据必须要准确、可靠、标准化,另外毒性实验终点本身也应该具有显著的毒理学和生态学意义,并且容易进行机理上的解释。一般数据具有两种:连续性响应数据(如急性毒性LC50、辛醇/水分配系数等)和非连续性响应数据(如致癌性数据阳性/阴性等)。(3)分子结构描述对于测试集化合物,首先应用分子模拟方法,构建正确的二维或三维分子结构,采用构象分析、分子力学等方法获得最优化的构象,进行分子结构计算,获取分子的结构信息。(以量子化学参数为例)分子结构描述符的范畴包括理化性质参数例如辛醇/水分配系数,摩尔折射率等,一维分子组成参数例如碳原子数目、氢给体数目、分子量、平均原子极化率、平均原子范德化体积等,二维分子结构参数例如拓扑学参数、分子碎片常数等,以及三维分子结构参数例如三维分子力场参数、分子量子相似性参数、分子形状参数、分子电子结构参数等。(4)QSAR模型构建应用特征变量筛选方法筛选包含丰富结构信息的描述符;应用统计方法或其他建模方法将训练集有机化合物的性质/活性数据与分子结构参数数据联系起来,建立QSAR模型;常用的统计分析方法有回归分析方法,偏最小二乘分析、因子分析、主成分分析、聚类分析等,其中多元回归分析是目前应用最多的方法。近来人工神经网络和遗传算法等高级建模方法也得到了越来越多的关注和应用。y=-0.5786x-32.697R2=0.68534567891011-78-74-70-66-62Electrostatic+LossArea(kcal/mol)ZAPObservedPIC50模型的拟合优度检验拟合参数:r2或r2adj:回归系数的平方或自由度校正的r2,代表所解释的方差P-显著性水平F-检验值标准估计误差(SE)等。比较:真实值与拟合值(计算值)之间残差的大小如果大于2倍的标准偏差,为离群值如果小于2倍的标准偏差,可以接受(5)QSAR模型的评价、验证PredictedlogKow5.55.04.54.03.53.02.52.01.55.55.04.54.03.53.02.52.01.5-量化参数(QC)模型-logKow=5.6256-7.4768qH++0.8049Elumo+0.0088R2adj=0.97,SE=0.097,F=127.6,p=0.0000,n=132221yyyyqpredNyySEPpred2模型的稳健性:交叉验证(Cross-validation)两种方式:Leave-one-out;Leave-more-out。这样得到一个交叉验证的r2,即q2和一个标准预测误差(SEP),用来评价模型的稳健性。交叉验证的程序剔除m个样本有放回地抽取n-m个样本重新构造模型计算模型估计值利用这些估计值的变异性作为原始估计值变异性的估计值获取抽样变异性、置信区间、偏倚度等信息,并对分布未知的统计量进行推断量化模型在逐一删除检验时相关系数的变化情况量化模型在逐一删除检验时变异系数的变化情况0.940.960.98112345678910111213R200.010.020.0312345678910111213CVNo9:2-NH2-1-n-SO3HNo10:5-NH2-2-n-SO3HNo11:7-NH2-4-OH-2-n-SO3H有机污染物训练组测试组QSAR模型预测LOO交叉验证非交叉验证LNO交叉验证模型的预测能力检验—外部数据验证只有具有统计上的显著性、稳健的和具有高度预测能力的模型才能用来进行预测、评价和筛选,才有可能用来揭示有机污染物的活性机理和过程机制。(6)QSAR模型的应用一是利用模型的预测能力对其它未知化合物的相关性质/活性进行预测,在效应评价和暴露评价中弥补缺失的数据,对环境有机化学品进行筛选和评价;另一方面的应用是根据模型的组成与形式,结合已有的化学、生物学知识,探求有机污染物的环境过程机制和生态效应机理。另外还可以根据所阐明的结构-活性关系结果,为设计高效、低毒无害的新型环境友好化学品指明方向。第三节分子结构表征分子结构的表征,即化合物分子结构的参数化,把污染物的平面或空间立体结构表达为数值等计算机可以处理的信息.这是建立QSAR模型的关键步骤之一,理想的分子结构参数能够准确、完整地表达影响生物活性的结构信息,因此选取足够而合适的分子结构参数,对于QSAR模型的建立至关重要。分子结构的表示常用的分子结构参数1.分子结构的表示A元素组成:C,HB分子式:CnH2n+2C具体分子式:

1 / 73
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功