第十章基于化学基因组学的药物设计1上世纪中叶,科学家通过实验证明DNA是遗传物质;随后DNA双螺旋结构、中心法则等一系列研究成果的提出,遗传信息的携带者——基因——成为人类生命科学研究的重点。而人类基因组计划的顺利完成,使人类第一次在分子水平上全面认识了自己,从此开始了后基因组时代。2本章将从化学信息学入手,重点对研究“从基因到药物”转变的化学基因组学技术进行论述。化学生命科学3内容提要第一节化学信息学第二节生物信息学第三节化学基因组学与药物设计4第一节化学信息学一、化学信息学的基本定义二、化学数据的分析和化学数据库的创建三、先导化合物的发现与结构优化四、类药先导物的筛选与ADMET5化学信息学是化学科学的一门新的、交叉领域的分支学科,它的产生与发展是基于化学信息量指数般增长,特别是组合化学及高通量筛选的迅速发展。化学信息学的产生与发展是与药物研究与开发息息相关的,但它的应用却覆盖了化学学科的各个领域。对化学信息学的研究也成为热门方向之一。6一、化学信息学的基本定义化学数据的使用和管理以及计算机在化学计算中的应用与在化学中引进信息概念的早期研究是密不可分的。GergParis认为:化学信息学是一个一般的术语,它包括化学信息的设计、建立、组织、管理、检索、分析、判别、可视化及使用。7关于化学信息学的定义及研究领域,目前国内外的学者尚存在争议。化学信息学利用计算机及其网络技术:对化学信息进行表述、管理、分析、模拟和传播;实现化学信息的提取、转化与共享;揭示化学信息的内在实质与内在联系的学科。8ADMET药物的吸收、分布、代谢、排谢、毒性经历了多年的发展,化学信息学已经取得了巨大的成就:为化学家们提供了许多必备的工具(化学数据库、化学制图软件);从传统的研究领域(合成设计、结构解析、定量构效关系的研究),逐步扩展到一些新的领域,(虚拟组合化学、虚拟筛选、ADMET、全新药物设计)。9二、化学数据的分析和化学数据库的创建2.1化学数据的分析化学信息学是为解决化学领域中大量数据处理和信息提取任务而结合其他相关学科所形成的一门新兴学科。这门新兴学科是在化学计量学和计算化学的基础上演化和发展起来的,并吸收和融合了许多学科的精华。10化学计量学运用数学、统计学、计算机技术以及其他相关学科的理论与方法,优化化学量测过程,并从化学量测数据中最大限度的提取有用的化学信息。11QSARquantitativestructure-activityrelationships一种借助分子的理化性质参数或结构参数,以数学和统计学手段定量研究有机小分子与生物大分子相互作用、有机小分子在生物体内吸收、分布、代谢、排泄、毒性等生理相关性质的方法。12计算化学是应化学数据定量分析的需要而产生的,它为化学信息学提供数据计算和信息解析工具。一般而言,计算化学需要满足两个基本要求:①准确求解问题;②快速求解问题。132.2化学数据库的创建化学信息可分为与传媒有关的信息及与物质有关的信息。化学信息的形式包括:文字、符号、数字、形貌、图形及表格等。这些化学信息最主要的组织、管理形式是形成数据库。化学数据库的创建包括化学信息的创建、存储和展示。14随着人类进入后基因组时代,化学信息学得到了飞速的发展,各种化学信息数据库的创建也有很大发展。世界上许多著名的公司都建立了化学信息系统和化学数据库。中国科学院化学部也建有专门的化学数据库。近年来,我国也非常重视中药数据库的建立和完善,并取得了初步的成果。15数据库a.分子文库计划(美国国家健康研究院)b.小分子生物活性数据库(哈佛大学)c.蛋白质结构信息集成检索数据库d.药物数据库、药物与天然产物数据库(中科院上海有机所)e.世界药物索引16f.致癌性数据库g.化合物结构数据库h.化学反应数据库i.毒性化合物数据库(中科院上海有机所)j.中药化学数据库(中科院过程工程研究所)17*ACS数据库(http:pubs.acs.org)中与药物化学或合成有关的杂志JournalofAmericanChemistrySocietyJournalofMedicinalChemistryJournalofOrganicChemistryOrganicLettersOrganicProcessResearch&DevelopmentJournalofNaturalProducts18*ELSEVIER数据库(http:)中与药物化学或合成有关的杂志Bioorganic&MedicinalchemistryBioorganic&MedicinalChemistryLettersEuropeanJournalofMedicinalChemistryTetrahedronTetrahedronLettersTetrahedron:Asymmetry19*JohnWiley(http:)数据库中与与药物化学或合成有关的杂志AngewandteChemieInternationalEditionEuropeanJournalofOrganicChemistry*RSC()数据库中与与药物化学或合成有关的杂志ChemicalCommunicationGreenChemistryNewJournalofChemistryOrganic&BiomolecularChemistry20*万方数据、维普中文科技期刊、CNKI中国期刊全文数据库中部分与药物化学或合成有关的杂志中国药物化学杂志药学学报中国药科大学学报沈阳药科大学学报有机化学化学学报高等学校化学学报中国医药工业杂志化学试剂化学世界中国化学(ChineseJournalofChemistry)中国化学快报(ChineseChemistryLetters)合成化学中国新药杂志中国现代应用药学杂志中国药学杂志21三、先导化合物的发现与结构优化化学信息学在先导化合物的产生和优化方面扮演者重要角色。化合物库的设计、定量构效关系、计算化学、分/混组合化学、平行合成以及进一步的虚拟筛选都发挥了其应有的作用。22根据化合物库的来源不同,可将发现先导化合物的方法分为以下四种:1.大范围、多品种的随机筛选发现先导化合物;2.通过主题库的筛选发现先导化合物;3.基于已有知识进行的定向筛选发现先导化合物;4.运用虚拟合成和虚拟筛选发现先导化合物。23在实践中,从化合物库发现新颖的先导化合物并非只用上述一种方法,而多数是综合运用某些方法。随着人类基因组、蛋白质组合生物芯片等研究的进展,必将发现更多的疾病相关基因,在针对这些靶标进行高通量筛选之前,必须首先具有结构多样性、高品质、大范围的化合物库可供筛选,这是高通量筛选技术的关键,是发现有价值先导物的源泉。24四、化学信息学与先导化合物的筛选——类药先导物的筛选与ADMET随着药物研发新技术的应用,新药研发的进程不断加快。然而现代开发新药的要求也在不断提高,特别是要想发现那些能满足不断提高审批要求的、具有足够疗效的、选择性和ADMET性质理想的药物,已变得越来越困难了。25许多药物研发项目的失败主要是由于候选药物在人体的临床试验阶段被淘汰,由此造成了人力、物力和财力的巨大浪费。药物研发失败率较高的原因1.商业性(5%);2.动物实验毒性过大(11%);3.药效不够(30%);4.人体副作用过大(10%);5.药物ADMET性质不佳(39%)。26如今的药物筛选过程中,受体与药物的亲和力已不再是唯一要考虑的参数。由于进行ADMET研究的困难性,要求我们从以前基于筛选的方法转为基于知识的化合物选择与优化模式。此外,应把ADMET放在新药筛选和发现阶段进行研究,对候选化合物进行ADMET综合评价,预测和完善化合物的最佳结构,从而有效地解决失败率较高这一问题。27①非类药化合物剔除法Lajiness根据计算的分子性质的计算值和分子中可能存在的反应活性子结构和毒性子结构来区分类药(drug-like)和非类药(non-drug-like)化合物。并提出了一套排除非类药化合物的标准。先导化合物发现的预测方法28非类药特征I.分子中存在“非类药”元素,如过渡金属元素II.相对分子质量小于100或大于1000III.碳原子总数小于3IV.分子中无氮原子、氧原子或硫原子V.分子中存在一个或多个预先确定的毒性或反应活性子结构。29②Lipinski规则小分子、口服吸收好的药物,满足I.分子量小于500(5*100)II.氢键供体数目小于5(5*1)III.氢键受体数目小于10(5*2)IV.logP小于5(5*1)上述规则仅适用于被动转运的情况,对于主动转运药物,例如抗生素、抗真菌药、维生素、强心苷不适用。3031③分子水溶性预测水溶性是药物透过生物膜,进入血液循环的保证。logS表示,S代表一定温度下,饱和水溶液的浓度,单位mol/L。85%的药物其logS在-1至-5之间其余大部分小于-6少数药物大于-1,极性很大的分子,如糖和小分子肽。32④其他预测方法许多计算方法已应用于ADMET的特性的预测,其中最常用的方法包括基础统计学、构效关系以及更加智能化的研究途径,如遗传运算法则和神经网络。33第二节生物信息学34基因蛋白质药物小分子先导化合物生物信息学化学信息学35生物信息学的概念生物信息学将计算机科学和数学应用于生物大分子信息的获取、加工、存储、分类、检索与分析,以达到理解这些生物大分子信息的生物学意义的交叉学科。生物信息学主要是研究两种生物大分子,即DNA和蛋白质分子。36生物信息学的研究目标和任务测序支持序列分析蛋白质的结构分析和预测分子间相互作用生物多样性的度量基因组比较在药物研发方面的应用开发软件工具37第三节化学基因组学与药物设计38人类基因组计划的完成以及后续功能基因组、结构基因组和蛋白质组计划的实施,深刻地改变了药物研究开发的思路和策略,形成了新药研究的新模式——从基因到药物。化学基因组学作为后基因组学时代的新技术,是基因组学与药物发现之间的桥梁和纽带。39化学基因组学技术整合了组合化学、高通量筛选、基因组学、蛋白质组学、生物信息学、化学信息学、药物化学等领域的相关技术:采用具有生物活性的化学小分子配体作为探针,研究与人类疾病密切相关的基因、蛋白质的生物功能,同时为新药开发提供靶蛋白以及具有高亲和性的药物先导化合物。40主要内容一、化学基因组学发现和确证药物及其靶标二、化学基因组学的关键技术1.化合物库——组合化学2.高通量筛选三、化学基因组学的技术平台简介41一、化学基因组学发现和确证药物及其靶标药品的研发是一个高风险、高投入的过程。一般认为一个全新药物的研发需要10~15年的时间,耗资约10亿~15亿美元。药物作用靶标的探测与验证是新药发现阶段中的重点和难点,已成为当今创新药物研究激烈竞争的焦点。42西咪替丁的发现历程19641966196819701972197419761978项目启动第一个先导化合物甲硫嘧啶西咪替丁英国上市咪丁硫脲I期临床美国上市HNNSHNHNNN431.功能基因组时代快速积累了大量的化学和生物学信息,药物开发需解决的三个关键问题:I.确定基因/蛋白质间的相互联系与功能关系,分离调控同一信号通路的基因/蛋白质;II.确定引发特定疾病的关键基因/蛋白质;III.确定可以干预疾病进程的小分子或基因/蛋白质。442.化学基因组学的研究方法I.正向化学基因组学利用小分子化合物作为探针来干扰细胞的功能,由于小分子可以激活/灭活许多蛋白质,诱导细胞出现表型变异,因此能够在整体细胞上观察到基因和蛋白质表达水平的变化,从而识别出活性小分子和生物靶标。452.化学基因组学的研究方法II.反向化学基因组学从已经被确证的新颖蛋白靶标开始,筛选与其相