第十一章-化学结构的表示与可视化

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十一章化学结构的表示与可视化西安理工大学刘广钧Email:chenliu@xaut.edu.cn第十一章化学结构的表示与可视化化学结构即广义的分子结构与化学反应过程,包括:静态的分子与超分子结构、高分子与生物大分子结构、分子聚集态和晶体结构;化学反应过程与过渡态。对化学结构数值表示的研究随着化学信息计算机处理的需求而迅速发展起来。本章不包括化学反应信息表示和处理的相关内容。第十一章化学结构的表示与可视化分子结构指分子的拓扑结构和几何结构。考虑化学拓扑结构信息主要是由于以下几方面的原因:对数百万种已知化合物结构信息用计算机进行标引、存储、检索和管理;关联化学结构与化合物性质,用作分子设计的结构参数;合成路线的最优设计;药物设计领域用于生物大分子与药物分子在三维局域结构匹配检索;进行辅助结构自动解析。第十一章化学结构的表示与可视化分子拓扑结构表示有:线性表达式、矩阵指数和图形表示。化学中常用的有机分子结构式是有机分子拓扑结构的图形表示。基因中核酸的排列(连接)顺序和蛋白质的一级结构也是拓扑结构。2000年世界重大科技事件之一的“人类基因组计划”就是测定一位白人青年男子的基因中核酸的排列顺序。第十一章化学结构的表示与可视化化学信息、分子拓扑结构信息的图形表示(有机分子结构的二维与三维表示以及有机反应的计算机表示方法)是计算机图形学在化学信息领域的重要应用,是现代化学结构信息存储与检索和化学反应分析与设计的基础。化学结构图形检索技术已经在ISI公司的ChemistryServer、英国剑桥的ChemFinder等一些著名的化学文献和结构数据库中得到应用。第十一章化学结构的表示与可视化分子的几何结构通过X射线和中子衍射等实验方法得到。著名的剑桥晶体数据库CSD(CambridgeStructuralDatabase)登录了近20万个分子(或晶体)的三维结构数据。分子的三维结构数据格式有许多,例如蛋白质数据库PDB所采用的数据格式应用于大多数分子三维结构可视化软件中,量子化学计算程序Gauss和MOPAC的数据格式也为一些分子图形软件所接受。第十一章化学结构的表示与可视化常见的有机分子结构式绘图软件有ChemWindow、ChemDraw(ChemOffice)、ISISDraw、WIMP95等等。具有显示分子和晶体三维结构功能的软件也有很多,一般都附在分子计算与模拟、晶体设计等软件中,例如Chem3D(ChemOffice)、Alchemy、WebLabviewer、HyperChem、CaRlneCrystallography、MacMolecule、Chem-X、RAS、SYBYL、InsightII(Biosym)、Cerius2等等。第十一章化学结构的表示与可视化本章介绍Windows平台上的有机分子(拓扑)结构式绘图软件ChemWindow和三维分子结构可视软件WebLabViewerPro。第十一章化学结构的表示与可视化第一节分子拓扑结构的矩阵表示与矩阵指数第二节分子拓扑结构的线性标记方法第三节有机分子结构式绘图软件ChemWindow第四节分子几何结构的表示第五节三维分子结构显示软件WebLabViewerPro1分子拓扑结构的矩阵表示与矩阵指数所谓拓扑结构是指构成化学物质的原子以及原子间的连接关系,不是指键长和键角等细节。利用化学结构式所具有的拓扑性质,把二维结构图中的非氢原子当作结点(Node),把相连的化学键当作拓扑图形的边(Edge),可以构造出适合于计算机表征的拓扑方法。分子拓扑结构的矩阵表示与矩阵指数分子的拓扑指标有三类,分别为基于图论的距离矩阵邻接矩阵多项式拓扑指标。邻接矩阵(AdjacencyMatrix)L方矩阵L的维数等于分子中的原子个数N。例如表示己烷的邻接矩阵L为6×6。在分子中若原子i与j相邻接(i与j之间有化学键相连),则矩阵元lij和lji为1(双键为2,三键为3),否则为0。不同的原子标记会得到不同的邻接矩阵。下例是表示分子的一种标记顺序及其邻接矩阵。邻接矩阵(AdjacencyMatrix)L例11-1:邻接矩阵(AdjacencyMatrix)L原子i的邻接度,即成键数,,上例中各原子的邻接度分别为[1,3,3,1,1,1],邻接矩阵指数c=。上例中,c=(1×3)-1/2+(3×3)-1/2+(1×3)-1/2+(1×3)-1/2+(1×3)-1/2=2.6427。距离矩阵(DistanceMatrix)D距离矩阵所表示的是原子间的距离关系,而非邻接关系。矩阵D的维数等于分子中的原子个数N。矩阵元dij等于连接原子i和j之间的最小化学键的个数,dij=dji。当原子i和j属于不同的分子时距离dij为无穷大。距离矩阵(DistanceMatrix)D例11-1的分子的距离矩阵为距离矩阵(DistanceMatrix)D原子i的距离和为例11-1中各原子的距离和分别为距离分布gn是分子中距离为dn的次数,上例,距离矩阵(DistanceMatrix)D平均距离矩阵指数例11-1:D=[(5×12+6×22+4×32)/(5+6+4)]1/2=2.08。几平均距离和连通指数,式中的i和j是相邻(有一化学键相连)原子,对烷烃而言q是化学键数,m是环数,n为原子数,m=q-n+1。距离矩阵(DistanceMatrix)D在例11-1中,q=5,n=6,m=0,J=5×[(11×7)-1/2+(7×7)-1/2+(11×7)-1/2+(11×7)-1/2+(11×7)-1/2]=2.993。关联矩阵(IncidentMatrix)B关联矩阵B的行数等于分子中的原子数,列数为化学键的个数。当第i个原子与第j个化学键相接时,矩阵元bij=1,否则bij=0。例11-2:5个原子和6个化学键的分子,环矩阵(CycleMatrix)C用矩阵的列表示边(化学键),矩阵的行表示环。当第j个化学键包含在第i个环时,则cij=1,否则cij=0。如例11-2中,2分子拓扑结构的线性标记方法化学工作者习惯用语言描述化合物,如下图根据需要可以取名为:3-羧基对氨基苯磺酸(3-carboxysulfanilicacid);分子拓扑结构的线性标记方法5-磺基邻氨基苯甲酸(5-sulfoanthranilicacid);2-氨基-5-磺基苯甲酸(2-amino-5-sulfobenzoicacid);2-羧基-4-磺基苯胺(2-carboxy-4-sulfoaniline);4-氨基-5-羧基苯磺酸(4-amino-5-carboxybenzenesulfonicacid)等等。分子拓扑结构的线性标记方法这样一种化合物多种名称有时是很方便的,但是这样一种化合物多种名称(相当于同义词或非唯一表示、多项对应表示nonunique)的语言描述对标引化合物却很不方便,即在作标引时必须把化合物所能考虑到的名称全部列出来。分子拓扑结构的线性标记方法在化学商品取名时还会出现另一种相反的多义表示即多元对应(ambiguous)情况,如下图叫香豆素(Coumarin)的化合物有两种结构。分子拓扑结构的线性标记方法结构式和化学名称适用于依靠视觉和听觉传递信息。适合计算机对化合物全结构和子结构检索、标引的化学拓扑结构表示方法应该具有一种化合物只有一种标记(唯一性uniqueness)和一种标记只对应一种结构(单义性unambiguity)的特点,以及具备可以重新构造该结构的逻辑联系。一个实用的线性标记方法,还要适合人工处理,不随化学结构增大而使处理的复杂性和工作量成指数增加。分子拓扑结构的线性标记方法所谓化学结构的线性标记(LinearNotationSystems),实际上就是按一定逻辑规则排列的一维字母、数字链。传统的系统命名法也是一种化合物拓扑结构的线性表示。有机化合物的IUPAC标记法IUPAC标记法与有机化合物的IUPAC体系命名规则相似,骨架结构优先于取代基,环系骨架优先于非环系骨架,杂环优先于碳环。X表示取代基(OOH);EQa表示醛基氧;EQ表示酮基氧;Q表示单键氧(如:-OH,-O-);有机化合物的IUPAC标记法Br、F、I等单原子用元素符号表示,Cl和O分别用Ch和Q表示;SH、NH2、SiH3省略H后用元素符号表示;O型基团,如IO、I2O、NO、NO2、PO、PO2、SO、SO2等用相应的化学符号表示;其它取代基在X、EQa、EQ、Q后按顺序A,B,…,0,1,2,…标记。有机化合物的IUPAC标记法例11-3:有机化合物的IUPAC标记法非环系:将最长的碳链作为主链,按主链、侧链、不饱和键、取代基的顺序标记;侧链标记从大的开始,不饱和键按E(双键)、Y(三键)的顺序标记;从主链的一端到另一端给每个原子编号,标记侧链按顺序,并用()括起来,括号中第一个数字为与主链相连的支链原子编号;有机化合物的IUPAC标记法当侧链与主链之间以不饱和键结合时,侧链符号之前写上不饱和符号;基团“”:按字母顺序标记成EX;Y或Y;EX,C算在碳链里;醚、仲胺、叔胺等化合物,在碳骨架中插入了不同的杂原子,使用复合标记法。标记顺序是:主要骨架标记,冒号,冒号后第一个数字为杂原子在主链上的位置,杂原子标记,斜杠(/),次要骨架标记。有机化合物的IUPAC标记法酯基用X表示,如果主要骨架在C一边,则X与后面的次要骨架间加一斜杠(/);如果主要骨架在O一边,则用复合标记法:X与次要骨架前加斜杠(/)(见下例)。有机化合物的IUPAC标记法例11-4:有机化合物的IUPAC标记法.有机化合物的IUPAC标记法.有机化合物的IUPAC标记法环系:优先标记环状结构部分;饱和烃环在符号A的后面加环的原子数;环上原子的编号从小到大按取代基CQN;复合标记与非环系相同;含有最大共轭双键数的环用B表示,B后面是环的原子数;有机化合物的IUPAC标记法B环经氢化所成环,用B以及表示氢化的符号H来表示;取代时,饱和碳原子数只增加1个时,用隐含氢符号h表示;环上饱和原子数多于剩余的双键数时,用饱和烃符号A和双键符号E标记;杂环在相应的碳环后面加Z,以及杂原子符号和位置;有机化合物的IUPAC标记法例11-5:有机化合物的IUPAC标记法.有机化合物的IUPAC标记法.WLN(威斯韦塞尔)线性标记法IUPAC标记法优先考虑骨架结构,WLN则把取代基作为重点。IUPAC只标记碳链的全长和支链的位置而不考虑碳链中的叔、季碳原子;WLN不使用位置编号,它规定叔、季碳原子的符号和按顺序对每个原子符号化。WLN将骨架原子链分解为直链的集合;WLN(威斯韦塞尔)线性标记法数字表示未支化饱和碳链的长度,如“1”表示-CH3、-CH2-、-CH=等,“2”表示-C2H5、-C2H4-、-CH2-CH=等;按顺序表示每个直链,最长的分支为主链,各分支间用“&”符号连接;大多数元素的原子用其元素符号表示,如H、B、F、I、S、P,H一般隐含不写;E、G表示Br和Cl;WLN(威斯韦塞尔)线性标记法某些双元素符号如Si、Fe表示成-SI-和-Fe-;叔C:Y;季C:X;:V;-OH:Q;伯N(-NH2):Z;仲N(-NH-、=NH):M;WLN(威斯韦塞尔)线性标记法叔N:N;季N(与四个非氢原子相连,如):K;-NO2和-SO2-中的非线型二氧:W;X、Y、N、K为支化符号;从图形式作标记:从图形式中选支化符号最多、标记符号数最多的符号链作主链;WLN(威斯韦塞尔)线性标记法41个有意义字符的顺序为:空格、R、&、-、/、0、1、…、A、B、…、P、Q、S、T、…、Y、Z、*。最终位置原则:不对称分子的编码,按字符顺序,结构式两端的符号居后的优先;以-E、-F、-G、-H、-I、-J、-Q、-W、-Z结尾时不加“&”;WLN(威斯韦塞尔)线性标记法U和

1 / 133
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功