第三章计算机在药物研究中的应用计算机在新药开发中的应用计算机在中药方剂研究中的应用药物信息数据库的建设一、计算机在新药开发中的应用高新技术的发展,为寻找新药提供了新的技术方法国际药品市场竞争的日趋激化对大量化合物进行筛选,发现具有生物活性的先导化合物是研究开发新药的源头1、新药发现的途径(1)临床发现即在临床治疗学中依靠经验积累发现新药虽然有很大的偶然性(serendipity),但对新药研究常常有很大的推动作用。举例:抗焦虑剂丁螺环酮的临床发现,为选择性抗焦虑剂的发展提供了新的方向和领域。(2)新药筛选通过化合物活性筛选而获得具有生物活性的先导化合物,是创新药物研究的基础。低耗、高效率筛选出新药是问题的核心,其目标是缩短新药发现的过程。传统的或经典的药物筛选不适于高效率筛选大量化合物,尤其不适于微量化合物的筛选。国际上创新药物研究的特点生命科学前沿技术如基因组学、蛋白质组学、生物芯片、转基因动物、生物信息学等与药物研究紧密结合。新兴学科渗入到新药的发现和前期研究中,出现了一些新的研究领域。化学、物理学、结构生物学、计算机和信息科学等学科与药物研究的交叉、渗透与结合日益加强。创新药物研究的发展趋势药物作用新靶标的发现治疗药物的作用靶点共483个预测2010年药物作用的靶标分子可增加到5000种。新的筛选模型和筛选技术的研究药物筛选模型从传统的整体动物、器官和组织水平发展到细胞和分子水平出现了高通量筛选的新技术结构生物学、生物信息学和药物分子设计结构生物学利用X射线衍射晶体学方法、多维核磁共振方法和电镜技术测定生物大分子的三维结构,为从原子和分子结构水平上研究生物大分子的结构与功能的关系、生物大分子-大分子和生物小分子-小分子间的相互作用奠定基础。生物信息学是一门关于生物信息的获取、处理、存储、传播、分析和解释等方面的学科。计算机辅助药物设计利用各种计算方法对化合物数据库进行“筛选”,可以大大减少工作量与成本,加快新药发现步伐。计算化学(ComputationalChemistry)通过采用分子对接、构效关系、分子类药性和多样性、虚拟筛选等方法进行计算机辅助药物设计,可为化学家提供大量可合成的、可开发成药物的几率高的化合物结构。一旦找到行之有效的先导化合物以后,还必须花费大量的时间来对先导化合物进行结构优化,合成取代基种类和位置各异的许多类似化合物,以便找到药效最佳、副作用最小的目标药物分子。所设计的化合物的生物活性在筛选模型中得到确认,可以利用计算化学方法对此先导药物分子作进一步的结构优化和设计组合化学并行合成技术基于起始反应原料的指定组合,可以一次合成数百至数千个预期化合物。而且,通过借助组合合成仪,可以连续、自动完成反应、分离、纯化等过程,从而大大缩短了药物开发的周期。组合化学在有机合成领域中的应用正显得越来越重要。2、高通量药物筛选活性数据的计算机处理技术传统的药物筛选方法是采用药理学的实验方法分子水平和细胞水平的实验方法(或称筛选模型)是实现高通量药物筛选的技术基础自动化操作系统(药物筛选机器人)是由计算机控制的全自动实验室操作设备。明确药物作用的靶分子结构,借助计算机,通过有机化学、量子化学及立体化学计算,找出最佳的与靶分子结合的药物分子结构。每100000个新化合物可能有5个进入临床研究,最终只有1个成为新药。高通量药物筛选的数据处理特点对药物活性的筛选在大规模的水平上进行的,筛选的化合物数以千万计真正实现一药多筛。同一化合物不同模型筛选的活性数据以及由同一模型不同化合物的活性数据归纳出的结构活性关系可以为药物的发现提供极有价值的信息。在高通量药物筛选中,通过活性数据处理过程确定化合物的药物活性,并为基于信息的药物发现过程准备准确、丰富的资料。高通量药物筛选活性计算方法的选择原始数据调用以一个微孔板为一个数据单位,不同微孔板数据的分布格式和数量不同,最常见的是96孔板。计算过程的实现计算程序的调整化合物和筛选模型数据的调用样品数据库筛选模型数据库生物活性数据库3、计算机辅助药物设计(CADD)CADD的主要目的是利用统计学和分子模型化技术来指导新的先导结构的设计或发现越来越多的靶标分子的三维分子结构被测定并成为药物开发的新靶标。通过采用分子对接、构效关系、分子类药性和多样性、虚拟筛选等方法进行计算机辅助药物设计,可提供大量可合成的、可开发成药物的几率高的化合物结构。利用计算化学方法对此先导药物分子作进一步的结构优化和设计分子模型化采用数据库技术及模型化方法实现2D/3D分子结构信息计算机化的产生、表达和存取;进行QSAR/QSPR方法研究;研制支持新药创制、新材料开发的实用型软件工具。已经完成和正在开展的科研项目如下:受体模型基于线杂交面变异的遗传算法发现新先导的药效团搜索软件用于先导结构优化的中药化学数据库=10026举例中国科学院上海药物所利用InsightII分子模拟软件所提供的生物信息学方法,对SARS病毒的3CL蛋白水解酶的同源性进行了分析,进而利用InsightII软件对3CL蛋白水解酶的三维结构进行了成功的同源建模,并根据所模建的三维结构对3CL蛋白水解酶的活性位点进行分析,获得了作为抗SARS药物作用靶点的3CL蛋白水解酶的详细信息,为下一步进行抗SARS药物的虚拟筛选,尽快找到有效药物打下坚实的基础。之后,上海药物所利用药物虚拟筛选技术发现的抗SARS活性的潜在药物,证明了利用InsightII所模建的3CL蛋白水解酶的三维结构的合理性及所预测活性位点的正确性。在成功地锁定了抗SARS病毒药物的作用靶点并揭示了SARS病毒感染途径和作用机理之后,组成了包括数十万个化合物的抗SARS药物虚拟筛选数据系统,并利用这一系统在拥有64个CPU的SGI超级计算服务器上,针对SARS病毒靶点和作用机理进行了大规模的抗SARS药物的虚拟筛选,找到了上百个具有潜在抗SARS活性的化合物。经过DDDC专家的认真分析和实验验证,在不到一个月的时间里,发现了19个有抗SARS活性的潜在药物。二、计算机在中药方剂研究中的应用1.聚类分析法分析中药成分选取合适的方法去提取药材的特征数据,以多维特征空间表达出来,再把中成药样本所得数据投影到这个特征空间上,根据点群的分布进行归类。方法:在同一萃取及气相色谱条件下,观察所得不同药材会得到不同特征色谱图,其数据结构可满足聚类分析的要求。分析程序如下:把有m个色谱峰的目标药材色谱图表达于一个m维特征空间,然后把能与药材色谱峰配对的中成药色谱峰投影到这m维特征空间上,配对的准则是看中成药色谱峰的保留时间是否介于某目标药材色谱峰的保留时间加减1%的范围内。如此重复分析不同的中成药样本,按所得投影点群的分布,判断哪些样本含有这目标药材成分。2、中药三维结构重建多目标的三维表面重建技术,实现了中药材的多种显微结构在同一场景中的结构重建和显示,从而获得对重建对象的各种组织的立体结构及其相互关系的直观、形象的认识。1)硬件配置中药材的连续截面图象由Genius扫描仪进行数字化并输入计算机;PC586微计算机进行预处理并把图象数据传输给SGI工作站;重建物体的三维显示基于SGI三维图形工作站实现。2)软件实现为了从中药材的截面图象序列重建其三维组织结构,必须进行数据预处理、多目标识别、表面逼近、三维显示4个步骤。数据预处理:把两两相邻的一组原始截面图象处理成满足重建要求的一组数字图象。多目标识别:把同一目标分散在不同截面上的各个轮廓识别出来并一一匹配。三维表面生成:三维表面生成是指从截面图象输入到建立三维线框模型的过程三维显示:三维显示实际是在二维屏幕上显示三维物体的投影,而投影中包含了被人眼感知的深度信息。3、中药复方的计算机模拟研究中药复方的特点是多靶酶、多靶点及多种组分起作用。在中药复方的制作过程中也伴随着复杂的物理和化学变化,可能形成各种复合物。复方组分间的相互作用组分同溶剂的相互作用组分同多种靶酶的相互作用多种组分同一种靶酶的相互作用组分间形成的复合物同靶酶的相互作用溶剂对这些相互作用的影响北大九源药物分子设计系统(PUJYDDS)——用于中药复方研究的基于分子间相互作用的计算机系统,包括:草药成分三维结构数据库受体三维结构数据库代谢库具有生物活性数据的化合物数据库(MDDR)为核心的知识库系统以分子对接(包括软对接、柔性对接及组合对接)为核心的分子间相互作用计算机模块三、药物信息数据库的开发1.植物活性数据库植物中的活性成分是植物产生疗效的物质基础。植物来源的药物约占全部药物的1/3;全世界3/4人口的医药保健依靠植物;美国1/3处方药来自植物。只有明确其活性成分或有效部位(群),才能对中药进行有效的提取、纯化、质控、制成现代化制剂。天津药物研究院在科技部生命中心支持下,收集、整理了1982年以来分散在各书刊上的植物活性成分,建立了动态型的数据库。本库现收录植物活性成分3222个。每个成分由14项数据(中文名、英文名、异名、化学物质名、CAS登录号、结构图形、分子式、分子量、化学分类、植物来源、物化性状、生物活性、专利状况及参考文献)、22个相关字段、1000余字符组成(且中、英文并录)。根据数据的特点,由一个主库和七个子库组成,通过CAS号关联,用户可以通过CAS号查到全部信息,也可以单途径或任意组合的多途径检索所需信息。2、中药有效成分三维结构数据库的开发和研究各类结构数据库已成为新药开发的必备工具,各大制药公司都非常重视结构数据库的开发和研究。开发中药有效成分三维结构数据库对于中医药现代化的研究,从分子水平出发去研究中药以及中药新药的开发都具有非常重要的意义开发了包含6500个中药有效成分的二维结构数据库(3D—MSDT,3DMolecularStructureDatabaseofTraditionalChineseDrug),并配套开发了数据库检索和维护系统以及二维和三维分子显示系统。整个数据库系统既可单独运行,也可和PKUDDS实现无缝连结。中药有效成分的相关数据主要从报道的文献中采集。文献的范围包括重要的有关中草药有效成分的中医药典籍以及十余种与中药有关的中文杂志。中药植物的不同用药部位所包含的有效成分分子结构、异名、化学名、物理性状、植物来源、药理药效、文献出处等等。对所有的结构,同时提供了二维结构和三维结构。1)3D-MSDT的后端支持和前端开发3D-MSDT的后端支持选用关系数据库模型进行数据的描述和管理,具体的数据库管理支持系统则选用SQLSever。DrugStruDB库用于存放中草药有效成分的所有结构有关的信息DrugPropDB库用于存放中草药有效成分的所有与结构无关的性质信息DrugNameDB库用于存放中草药有效成分的化合物名称信息;分子的三维结构,以mol文件格式储存;2)数据库的检索系统结构性质的简单检索中草药有效成分库中进行的名称、分子式、活性等简单字符串匹配检索;数据库查询语言SQL查询设计了友好的用户界面,使用户不用了解SQL语言就可以按照自己的需要进行检索。子结构匹配检索带有初步药效团搜索色彩的子结构匹配检索。关键是匹配的速度。侧重于算法的选择和实现。偏序理论的回溯算法子结构匹配中,对于mol文件格式采用了自己的邻接表描述方式将得到的每一个邻接表直接以数组的二进制形式的内存映像存人数据库子结构检索的输入是采用mo1文件描述子结构作为检索算法的输入。思考题:1、查阅资料,阐述虚拟人技术的原理和用途以及目前的状况。2、综述计算机在药物研究中的主要应用。3、查资料,了解CADD技术的技术基础。