化学数据交流和化学软件使用WuXiPharmaTechCo.,Ltd1/20化学数据交流和化学软件使用说明1.化学数据文件格式2.ISIS/Base软件介绍及其使用详解1)软件介绍2)建立数据库3)修改数据库定义4)输入数据5)数据交换I)SDF文件II)Excel文件III)Table(txt)文件6)数据检索7)对象(Object)管理8)插件工具(Add-in)使用3.ISISforExcel20004.其他化学软件介绍孙传涛2003-12-27化学数据交流和化学软件使用WuXiPharmaTechCo.,Ltd2/20S.0.ISIS/Base软件简介ISIS/Base是MDL®公司的化学数据库软件。当前最高版本是2.5,我们公司所使用的是2.4版。其上可以安装SARTable(构效关系表),AutoNom(自动命名)等插件工具(Add-in)(对它们的介绍见后文),前者可将数据库中的数据导出到Excel表格,可用于构效关系研究、与其他应用程序进行数据交换;后者可用来自动命名库中的全部结构。图1为ISIS/Base界面。在“对象选择板”上并列着四个按钮:Forms,Query,Browse和Update。它们的意义和功能分别如下:1)Forms:设计人与数据库打交道的界面2)Query:输入查询数据进行检索3)Browse:浏览检索结果(即数据库中的数据),见图1.14)Update:数据更新,包括记录的添加、删除和修改注:考虑到数据和系统安全的问题,公司内部的计算机用户对大部分系统文件和目录没有修改的权限,但本软件要求对部分文件和目录可以改写,否则一些功能不能实现,比如Add-in使用(如输出到Excel表格文件、自动命名)、设置保存等,我们可以要求IT部门修改这些目录和文件的权限,图1.1Browse界面数据浏览按钮到第一个记录上一个记录到指定记录下一个记录最后一个记录输出到Excel表格文件自动命名插件当前纪录顺序号Menu(菜单)导航/工具板对象(Object)选择板Forms区库中全部记录数目检索范围图1ISIS/Base界面对象选择板:选择Forms/Query/Browse/Update界面检索域:显示记录的检索范围导航/工具板:察看或定位记录(Query、Browse和Update)、提供绘制工具(Forms)Forms区:用户与数据库打交道的界面,通过这个界面更新、显示记录TransfertoDraw化学数据交流和化学软件使用WuXiPharmaTechCo.,Ltd3/20因为它们对整个系统的安全和稳定性通常并无有害影响,这些文件和目录分别是:ISISBASE软件的安装目录,比如“C:\ProgramFiles\ISIS2.4”WINNT下的3个ini文件:ISISAIHP.INI,ISISAIM.INI和ISISSAR.INI。S.1.化学数据文件格式单机版化学结构数据库.DB:MDLISIS/Base数据库此种格式只能使用ISIS/Base软件打开和操作,而且不能远程(Remote)操作。四种标准的化学结构数据文件格式:.MOL:MDLmol文件(单个结构).RXN:单个反应(一个反应只能有一个试剂和一个产物).SD或.SDF:结构数据文件(包含一系列结构).RD:反应数据文件(包含一系列反应)此四种格式都是文本文件,可用文本编辑器如Notepad、写字板等打开和编辑,mol文件则可以由ISIS/Draw或ChemDraw等多数化学软件编辑和保存,是一种标准的存储化学结构的格式。每一种文件都有自己固定的数据标志,比如MOL文件,用于记录一个化学结构(不包括格式、文本,此化学结构中可有多个结构片断),以“MEND”字符串加一回车换行符作为结束标志。SD文件如果包含化学结构,则在每条记录的最前部输出,格式完全同MOL文本,随后是其他各项数据。数据项名(FieldName)以“”起始,以“”结束(有时后面紧接着圆括号扩起来的ID号),下一行直到下一个数据项名之前是其数据内容,这是我们最关心的东西。如果数据库中某一数据项没有数据,则此项不会输出。每条记录以“$$$$”字符串加一回车换行符作为结束标志。其他格式:.cdx,.cdxml:ChemDraw软件支持的文件,容纳的信息非常多而且全面.doc,.pdf:可容纳信息相当多,但对于化学结构和数据处理常常让人叹气.XLS:MicrosoftExcel电子表格文件.txt:以“Tab”(制表符)键为分隔符的表格(Table)文件.txt文件就是一般的文本文件,只不过有个特别的格式:存放各个数据项(Field,或Excel电子表格中的Column),每列数据项之间以制表符分隔。此时我们称之为“表格(Table)”文件。它不能够存储化学结构,但处理和交流其他数据则很方便,也是很通用的格式。我们平时最为常用的是DB、SDF和txt文件格式,它们可以非常容易的被其他程序(如化学计算软件)操作,也是大多数化学、制药公司进行化学结构和相关数据交流的最主要格式,尤其是SD文件,如果用于化学计算,则必不可少。本说明手册主要涉及到此三种文件格式。我们此处所说的“操作”常常指“批量操作”,不是对一个化学结构及其数据,而是一批结构和数据。对于单个结构和数据的保存和交流,可以使用任意格式。化学数据交流和化学软件使用WuXiPharmaTechCo.,Ltd4/20S.2.建立数据库(NewDatabase)S.2.1.建立一个完全新的空数据库1)定义数据库的组织结构(definition)点击菜单FileNewDatabase,输入文件名,然后向库中添加各个数据项定义(FieldName)(如图2所示),以构成数据库的数据组织结构和方式(即用于存放数据的“容器”)。一般要求各数据项应当按照其本身的性质决定赋予哪种数据类型,比如数字一般用整数(Integer)或实数型(Real),文本使用固定长度文本(FixedText)或不定长文本(VariableText),化学结构则使用Structure类型。这样便于以后的数据交流和处理。注意:化学结构(Structure)必须赋予一个外部名称(ExternalName),*structure,(图2中红线框起来的部分)才能将结构导出(Export)到SD文件或者从SD文件导入(Import)。除此以外的其他各项最好不要填ExternalName,将其空着。建议:我们为数据项取名时,应遵循“简短、达意”的原则。俟全部定义完成之后,点击“Save”按钮,即可保存。如果希望添加、修改或删除其中的某项定义,参见S.3.节。2)设计交互界面(Form),图3创建数据库之后还不能马上向库中加入新的数据,必须建立一个可以与数据库打交道的界面(Interface,Form)。在“对象选择板”上点“Forms”进入Forms界面,设计、绘制表单(Form)。Box和Table用于容纳数据(可以是库中的数据,亦可以是它们经过运算后的结果),前者只能容纳一条数据,后者可以是一个记录的全部子记录,或者数据库中的全部数据。每个Box有两项组成:标题(Label)和对应数据项名称(FieldName),前者可以任意填写,但应该达意;后者则必须是对应的FieldName。双击Box或Table时则可以定制,包括数据对应、格式、结Label图2创建数据库,定义数据项添加新的数据项(Field)修改已有的数据项名称、类型、外部名称等删除已有的数据项Parent:Root数据项名称(FieldName)用于定长文本(FixedText)化学数据交流和化学软件使用WuXiPharmaTechCo.,Ltd5/20构显示方式等。请尽量设计的美观、专业和方便使用。然后保存,点击菜单FileSaveForm或SaveFormAs…,这样就能够通过这个界面在数据库中查询、浏览和更新数据。如果希望将此Form保存到外部文件,用于定制其他数据库的Form,点击菜单FileExport(导出)Form,填入文件名即可。如果希望使用已有的Form作为模版,则点击菜单FileImport(导入)Form,然后双击各个Box进行定制,完成后不要忘记SaveForm(菜单FileSaveForm)。S.2.2以已经存在的数据库为模板,建立一个空的数据库(与已存在的数据库组织结构完全相同,但不含数据)。首先打开模板数据库(其数据项已定义好),然后点击菜单FileNewDatabase,此时出现的创建数据库对话框中显示出模板数据库的数据项定义,在此处可以按照自己的要求修改、添加或删除数据项定义。进入Forms,可以重新设计一个Form,也可以从模板数据库或其他数据库中加载一个Form,方法是:首先从模板数据库导出Form文件,然后在这个库中将其导入,并在使用数据库之前保存此Form(参见上一节)。重要建议:a)建立了一个空的数据库之后,最好在向其输入数据之前做一copy以备将来再次使用;b)每次修改数据库时,不论是数据项定义还是数据的操作,比如删、改、导入数据(尤其是批量的导入数据时),如果不能有100%的把握不出错误,则在动手之前先将原数据库备份(做一个copy),待操作完成并复查无误后方可删除。切记:ISIS/Base中的所有数据操作不可恢复或undo,需精神集中和小心才可避免无法挽回的错误。数据库可以重建,但数据不是任何时候都能再找回的。图3.建立FormLabel,可以随便改写,但应达意FieldName,必须与库中的对应FieldName完全相同,不能随便改动文本(Text)选择Box没有Label,只有FieldName绘制Box绘制Table画线输入文本(Text)工具栏化学数据交流和化学软件使用WuXiPharmaTechCo.,Ltd6/20S.3.修改数据库的数据项定义比如向库中添加、删除数据项或修改名称、外部名称(ExternalName)和父结构(Parent)。进入Browse界面,点击菜单DatabaseEditDefinition…,弹出“EditDatabaseDefinition”对话框,从中可对各数据项定义进行修改、增加或删除。如果只修改外部名称,则可点击菜单DatabaseViewDefinition…,点击按钮“ModifyExternalName…”。如果一个数据库不能输出化学结构,则需要修改这一项。注意:不能修改已存在的数据项的数据类型(Type)。但如果数据库刚建好,还未有数据更新,则数据类型(Type)可以修改(重新选择后点击Edit按钮),否则必须先删除此项,保存后再进入此界面,重新输入FieldName和选择Type后,点击“Add”按钮即可。S.4.输入数据(添加记录)首先进入Update界面。除了第一条记录,添加新的记录时,必须点击菜单EditNewRecord,或者按快捷键CtrlK,然后输入数据。输入结构时需要注意,如果库中已经有这个结构,则会出现重复结构(duplicatestructure)的提示,此时可以不输入或者检查是否输入错误。数据库中的重复结构将会给后续的数据处理带来很大的麻烦;当然如果事先的规则允许库中有重复结构不在此列。输入化学结构时,双击“Structure”Box(或者点击ISIS/Base左上角的“TransfertoDraw”按钮)打开ISIS/Draw应用程序,画完结构后,点击ISIS/Draw左上角的“ISIS/BaseTransfer”按钮,即可退回数据库并更新结构。亦可从其他应用程序中(比如ChemDraw等)向ISIS/Base粘贴已画好的结构。建议:1.输入数据时,要注意数据的规整性,比如,在文本类型的数据中,尽量避免空格、回车换行、制表符(TAB)等字符,区分横线(减号)和下划线。数据如果不规整,将会给以后的检索和数据处理带来意想不到的问题。2.输入化学结构时,需要注意一些官能团简称(AtomAlias,SuperAtom或Grou