第一章-绪论(化学信息学相关概念)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

化学信息和化学信息学自从化学学科出现以来,信息的记载、组织与交流对化学学科的发展起了重要的作用,同时也成为化学学科的一个重要组成部分。这是因为化学实验的记录资料具有长远的时间意义。在化学学科中,化学家根据百年以前的记录资料从事科学研究的例子并不罕见。另外,化学物质结构的记录与检索需要建立独特的记录系统。随着计算机技术的发展,化学家必须建立自己的信息表示、记录与管理系统,以适应时代的要求。化学信息化学信息可分为两大组成部分:化学物质的化学信息:利用科学的原理和方法通过测量得到的化学成分的相关信息,如物质的物理、化学性质,物质中各成分的定性、定量以及结构信息,分子间的相互作用信息,化学反应的信息等。媒体形式的化学信息:化学信息的记录形式,如图书、期刊、专刊、专利、数据库以及音像资料等,通过化学信息的传播使化学家们共享测量的原理、方法及测量结果。化学信息学是近年来发展起来的新学科,它的产生与发展是基于化学信息量指数般增长,特别是组合化学及高通量筛选的迅速发展。化学信息学的产生与发展是与药物研究与开发息息相关的,但它的应用却覆盖化学学科的各个领域,如农业化学、分析化学、合成化学、物理化学等。近年来,国际上已出版与化学信息学有关的杂志,出现众多的化学信息学公司,许多大学纷纷开设化学信息学课程,培养化学信息学人才。1.1化学信息学的起源及历史1.1.1信息学的起源上世纪40年代,以申农(C.E.Shannon)《通讯的数学理论》、维纳(N.Weiner)《控制论—动物和机器中的通讯与控制问题》问世为标志,信息论诞生了,它是科学发展史上的里程碑,其伟大贡献和深远影响是前所未有的。1959年,美国宾夕法尼亚大学莫尔电子工程学院首先应用了“信息科学”的概念,这一概念既包括了信息理论又包括了信息技术。出现了:以计算机为代表的“计算机信息科学”;以文献处理自动化为代表的“图书馆信息科学”和以申农通讯信号计量理论为核心的“全信息信息科学”。三者的共同特征是:仅研究特定领域中的某些信息,对其它领域中的信息不予充分的关注与考虑。上世纪60年代初,以申农信息论为基础的信息科学得到了一定的发展,新概念和新理论不断涌现。20世纪80年代以来,在申农原有信息论的基础上分别在模糊信息、概率与非概率信息、语法信息、语义信息、语用信息等方面做了大量的工作。在此基础上,人们提出了广义信息论。1982年美国普林斯顿大学的马克卢普(F.Mchlup)在美国聚集了当时不同信息研究领域的众多学者发起了一个信息的多学科交叉的研究运动,信息理论的研究开始向其它科学领域渗透和扩展,诞生了40多种部门信息学,并发表了继申农、维纳之后的又一本经典著作《信息研究:学科之间的通讯》。1994年,德国一批学者又发起了一个新的交叉信息科学的研究运动,开拓了部门信息学的一些新领域。虽然,研究的范围更加广泛,但是,并没有做出实质性的评论与创新性的理论。90年代后期,部门信息学得到了蓬勃的发展,除了增加了新成员,而且,关涉到了自然科学和社会科学的众多前沿问题。其中较有影响的部门学科是:生物信息学,物理信息学,还有经济信息学,人类信息学等等。据统计目前大概已有50余种部门信息学。1.1.2化学信息学的起源与历史20世纪60年代以来,计算机与化学结合形成了计算机化学。经过近40年的发展,计算机化学几乎在化学的每一分支领域都获得了丰硕的成果,计算机已成为化学研究的重要工具之一。20世纪80年代以来,Internet飞速发展,逐步成为各种信息资源传递的重要载体,包括基于WWW的化学信息网站、化学信息数据库、远程化学教学等内容的化学信息网络化趋势也日趋形成。化学与internet成为一个非常活跃、进展惊人的新兴交叉领域。随着计算机化学的不断发展和化学信息网络化的不断普及,一个崭新的化学分支学科—“化学信息学(Chemoinfiormatics)”应运而生。“化学信息学”首次出现于1987年诺贝尔化学奖获得者J.M.Lehn教授的获奖报告中。J.M.Lehn在研究复杂分子的反应过程中发现分子具有自组织、自识别的化学智能反应现象,识别的概念包含着信息的展示、传递、鉴别和响应等过程,这就是化学信息学研究的开始。化学界的专家学者们正试图以新的方式和方法建立化学信息周期表。国外一些大学开设了化学信息学课程并确定为研究生的研究方向,从事研究、管理和开发化学信息的团体、机构和公司也相继出现。美国化学会化学信息分会和图书馆协会在Indiana大学成立了化学信息教学资料交换中心(TheClearinghouseforChemicalInformationInstructionalMaterials(CCIIM)),负责收集、发布和分发化学信息源。美国化学会还设立了化学信息教育委员会(AmericanChemicalSocietyDivisionofChemicalInformationEducationCommittee)。美国、欧洲、澳大利亚的很多大学开设了化学信息学类的课程。在国内,化学教学指导委员会已将化学信息学列入化学教学的基本内容,北京大学化学学院已设置课程并编写了讲义,南京大学、复旦大学及我校等高校也相继开设了该课程。1.2化学信息学的概念及研究内容1.2.1化学信息学的概念1987年J.M.Lehn教授首次提出化学信息学的概念以后并没有进一步深入研究这一概念的本质,但我们可以看出,当时化学信息的内在含义应为分子间的相互作用或相互识别的有关信息,而化学信息学应为研究分子间相互作用实质或识别机理的一个学科,主要目的是为解释超分子的形成过程提供依据。目前化学信息学的内容更加强调了化学文献、化学信息数据库、特别是Internet中的化学资源等内容。化学信息学还没有统一的被广泛接受的定义及英文名称。目前最通用的为Chemoinformatics及Chemicalinformatics。也有用Cheminformatics,Chemiinformatics。也有人把ChemicalinformationScience及MolecularInformatics称为化学信息学。与化学信息学有关的术语有chemi-informatics,chemometrics,computationalchemistry,chemicalinformatics,chemicalinformationmanagement/science,和cheminformatics等等。美国印第安那大学(IndianaUniversity)在国际上最早在化学图书馆科学的基础上开设化学信息课程及培养化学信息学研究生,他们把化学信息学定义为:化学信息学包括从利用传统的图书馆科学方法组织化学信息到利用现代计算机技术产生、存储、检索及可视化化学信息。定义1:FrankBrown于1998年把化学信息学定义为:应用信息技术和信息处理方法已成为药物发现过程中的一个很重要的部分,化学信息学实际上是一种信息源的混合体。把各种化学数据转化为信息,把信息提升为知识,其主要目的是在药物先导化合物的发现及组织过程变得更有效。这个定义太偏重于药物化学,事实上,化学信息学在其他领域如农业化学也有广泛的应用。(“Theuseofinformationtechnologyandmanagementhasbecomeacriticalpartofthedrugdiscoveryprocess.Chemoinformaticsisthemixingofthoseinformationresourcestotransformdataintoinformationandinformationintoknowledgefortheintendedpurposeofmakingbetterdecisionsfasterintheareaofdrugleadidentificationandorganization”F.Brown,AnnualReportsinMedicinalChemistry,33,375-384(1998))定义2:M.Hann和R.Green认为化学信息学是处理化学老问题的一种新名称(“Chemoinformatics-anewnameforanoldproblem”,CurrentOpinioninChemicalBiology,3,379-383(1999))。定义3:GregParis在1999年8月的ACS会议上提出了一个更一般性的定义,他认为:化学信息学是个一般的术语,它包括化学信息的设计、建立、组织、管理、检索、分析、判别、可视化及使用。(“Chem(o)informaticsisagenerictermthatencompassesthedesign,creation,organization,management,retrieval,analysis,dissemination,visualizationanduseofchemicalinformation”G.Paris(August1999ACSmeeting))。定义4:将计算机技术应用到化学中的一门组合技术,利用统计模型、计算和分析科学来理解化学数据的重要性(“Chemoinformaticsistheapplicationofcomputertechnologytochemistry;acombinationoftechniquesandmodelsinstatistical,computational,andanalyticalsciencestounderstandthesignificanceofchemicaldata.”)。定义5:“化学信息学是近几年发展起来的一个新的化学分支,它利用计算机和计算机网络技术,对化学信息进行表示、管理、分析、模拟和传播,以实现化学信息的提取、转化与共享,揭示化学信息的内在实质与内在联系,促进化学学科的知识创新。”化学信息学是化学学科的分支学科,其研究对象和研究目的均属于化学的学科领域。它的研究手段为计算机技术和计算机网络技术,研究内容则包括如何利用计算机和计算机网络技术对化学信息进行表示、管理、分析、模拟和传播等。同时,化学信息学的目的是为了实现化学信息的提取、转化以及化学家之间的资源共享,从而为促进化学学科的发展与知识创新做出贡献。1.2.2化学信息学的研究内容(1)化学信息的组织、管理、检索和使用:化学信息可分为与传媒有关的信息(如文献、图书资料、网络信息等)及与物质有关的信息(各种实验数据,包括化学反应有关数据,谱学数据,X射线晶体学数据,化学与物理性质数据,毒性及生物活性数据,与环境有关的数据等)。化学信息的形式包括:文字、符号、数字、形貌、图形及表格等。这些化学信息最主要的组织、管理形式是形成数据库。最早的化学数据库是各种谱学数据库及剑桥晶体结构数据库。目前最完善的化学信息系统是MDL系统、Beilstein系统及CA系统。据统计目前化学信息中58%已经组织为各种数据库系统,但其中只有12%可以相互转换,而化学信息常常是需要结合使用的,要完成一项化学研究工作需要调用多种有关的数据库。化学信息学的重要内容之一是如何实现化学信息间的关联及转化。化学信息的管理、检索及使用包括化学信息的快速有效的检索及推理、判断。主要涉及人工智能方法,最重要的是化学专家系统。一个专家系统包括化学知识信息处理,化学知识利用系统、知识的推理能力及咨询解释能力。20世纪60年代开发的化学专家系统DENDRAL系统是最早的专家系统。目前已有多种化学专家系统用于不同的目的,如图谱解析专家系统、反应路线设计专家系统等。(2)分子结构的编码、描述、三维结构的构建:巨大数目分子结构编码及三维结构模型的构建及各种形式的结构表达,并能快速连接到合成路线,谱学数据,纯化技术等是化学信息学的基础工作。(3)化学信息的加工、处理及深化:化学信息的加工处理包括数据的预处理,回归分析,主成分分析,偏最小二乘,信号分析,模式识别,神经网络,遗传算法,模糊及随机算法

1 / 46
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功