分子模拟与药物设计药物设计研究蛋白质与小分子药物之间的相互作用药物设计基于配体的药物设计QSARwithCoMFA可以建立分子性质(包括生物活性)与它们结构之间相关的统计学与图形化模型。这些模型可用于预测新化合物的性质或活性。定量构效关系(QSARs)将分子的化学性质或生物活性与它的结构相关以便设计出活性更好的新化合物凝血酶抑制剂的CoMSIA分子场等势图(左:立体场,绿色有利黄色不利;右:疏水场,蓝色有利红色不利)药物设计基于配体的药物设计叠合一系列分子从而共享出体现生物活性的公共模式,生长出相应的药效团假设采用先进的遗传算法和多元化的打分函数,考虑分子能量、立体相似性和药效位点重合,同时还考虑构象的柔性,不确定的立体化学性质,可变的环结构药物设计基于受体的药物设计高通量虚拟筛选大量化合物数据库的筛选是一项昂贵费时的任务。计算高通量筛选可以增加筛选数据集中合适化合物的占有率并且能降低先导物发现的成本打分函数是一个蛋白-配体原子表面距离的非线性函数的线性组合。蛋白-配体相互作用包括立体作用、极性作用、熵和溶剂化作用。药物设计基于受体的药物设计同源模建是一个根据模板蛋白将一级序列转成3D结构的技术总称,包括了threading和homology两种人类Xa因子的晶体结构(PDBID:2BOK,橙色)与同源模建结构(白色)的比较分子动力学Gromacs介绍主要内容:Gromacs简介Gromacs原理Gromacs运算步骤Gromacs结果分析GROMACSFastFlexibleFreeLysozymeinWaterRMSD什么是分子模拟分子模拟是在分子模型的基础上用计算机做实验,“计算机实验”通过模拟微观粒子的运动来计算宏观性质温度压力黏度传递性质表面张力....分子间的作用模型牛顿力学量子力学统计力学等分子模拟的双重性质分子模拟具有理论和实验的双重性质分子模拟不能完全取代实验理论实验模拟理论的正确性模拟参数的正确性模拟方法的选择理论的更新•模拟分子在特定环境下一定时间内的构象能量变化趋势;•分子动力学模拟是根据分子力学性质建立的适用于生化体系,聚合物,金属或非金属材料的力场和牛顿的运动力学原理发展出来的计算方法;•分子力场(forcefield)中的各项参数,包括键长,键角,电荷分布等都可以通过量子化学计算得到;•与量化计算相比,分子力学在速度方面具有明显的优势;•最早出现在上世纪70年代;分子动力学模拟的基本原理势能模型分子动力学对势能函数的依赖性:所有从分子动力学计算出来得到的宏观性质最终都取决于势能模型分子动力学的核心:牛顿运动方程势能(位能)模型:()()Urfr=iiFtrm22i=1,2,3,…N简单分子的势能模型rUr例:甲烷,某些惰性气体质点处理Ur方阱模型Ur阶梯模型复杂分子的势能模型键的振动键角扭矩分子内部各原子(基团)之间的范德华力、静电力一般要计算1-4(相隔超过两个键的原子或基团对)15432复杂分子的势能模型qqq分子之间的范德华力分子之间的静电力例子:丙烷CCCHHHHHHHH10根键长作用18个键角作用8个扭矩作用27个范德华力作用27个静电作用分子动力学程序的一般步骤初始化能量优化平衡数据产出避免局部分子重叠,并不是动力学模拟根据所有分子的当前坐标计算个分子的受力(位能函数)根据受力更新分子的坐标在此过程中收集用来计算宏观性质的有关信息读入模型参数,模拟控制参数初始能量优化方法去除某些可能存在的原子重叠去除某些严重扭曲的键长、键角、扭矩等方法最速下降法牛顿拉夫森方法其他一般优化几千到几万步分子模拟的体系分类和方法•简单小型体系•大型(复杂)体系和并行计算简单小型体系气体的模拟小分子体系,不需要复杂的势能模型几百到几千个分子,分子分布稀疏,大部分是短程作用一般用一台微机就可以处理,计算时间几分钟~几小时简单的液体,不涉及太多的界面性质小分子体系,势能模型不是很复杂几百个分子,可能涉及到静电作用,可能需要长程校正用微机也可以处理,计算时间一般几小时~几天大型(复杂)体系和并行算法必要性体系越来越大模拟时间越来越长解决办法制造更快的处理器并行计算机例子:~50000原子的生物体系,1ns模拟单个处理器:~12天16个并行处理器:~1天或者MPIMessagePassingInterface90年代初制定和完善的一套并行语法支持Fortran,C,C++简单易学几种常见的分子动力学软件NAMDAMBERCHARMMTINKERLAMMPSDL-POLYGROMACSGROMACS主要针对生物体系,也适当照顾一般化学体系优点算法好,计算效率高界面友好维护服务好免费软件缺点兼容性不好力场SelecttheForceField:From'/usr/local/gromacs/share/gromacs/top':1:AMBER03forcefield(Duanetal.,J.Comp.Chem.24,1999-2012,2003)2:AMBER94forcefield(Cornelletal.,JACS117,5179-5197,1995)3:AMBER96forcefield(Kollmanetal.,Acc.Chem.Res.29,461-469,1996)4:AMBER99forcefield(Wangetal.,J.Comp.Chem.21,1049-1074,2000)5:AMBER99SBforcefield(Hornaketal.,Proteins65,712-725,2006)6:AMBER99SB-ILDNforcefield(Lindorff-Larsenetal.,Proteins78,1950-58,2010)7:AMBERGSforcefield(Garcia&Sanbonmatsu,PNAS99,2782-2787,2002)8:CHARMM27all-atomforcefield(withCMAP)-version2.0Gromacs立场9:GROMOS9643a1forcefield10:GROMOS9643a2forcefield(improvedalkanedihedrals)11:GROMOS9645a3forcefield(SchulerJCC2001221205)12:GROMOS9653a5forcefield(JCC2004vol25pag1656)13:GROMOS9653a6forcefield(JCC2004vol25pag1656)14:OPLS-AA/Lall-atomforcefield(2001aminoaciddihedrals)15:[DEPRECATED]Encadall-atomforcefield,usingfullsolventcharges16:[DEPRECATED]Encadall-atomforcefield,usingscaled-downvacuumcharges17:[DEPRECATED]Gromacsforcefield(seemanual)18:[DEPRECATED]GromacsforcefieldwithhydrogensforNMRGROMACS运算流程pdb2gmx-f1AKI.pdb-o1AKI_processed.gro-waterspce-f蛋白质名称-o坐标–water水分子类型StepOne:PreparetheTopologyGROMACS运算流程#include“oplsaa.ff/forcefield.itp“立场文件;Namenrexcl包含的分子名称Protein_A3[atoms]每个原子的坐标、电荷、质量、类型信息;nrtyperesnrresidueatomcgnrchargemasstypeBchargeBmassB;residue1LYSrtpLYSHq+2.01opls_2871LYSN1-0.314.0067;qtot-0.32opls_2901LYSH110.331.008;qtot0.033opls_2901LYSH210.331.008;qtot0.364opls_2901LYSH310.331.008;qtot0.695opls_293B1LYSCA10.2512.011;qtot0.94StepTwo:ExaminetheTopologyGROMACS运算流程StepThree:DefiningtheUnitCell&AddingSolvent1.Definetheboxdimensionsusingeditconf.2.Filltheboxwithwaterusinggenbox.editconf-f1AKI_processed.gro-o1AKI_newbox.gro-c-d1.0-btcubic-c居中–d盒子边缘离质心的距离–bt盒子类型genbox-cp1AKI_newbox.gro-csspc216.gro-o1AKI_solv.gro-ptopol.top-cs水分子类型GROMACS运算流程StepFour:AddingIonsgrompp-fions.mdp-c1AKI_solv.gro-ptopol.top-oions.tpr-f输入mdp文件–o生成tpr文件mdp即moleculedynamicsparameter文件,起控制动力学模拟过程的作用genion-sions.tpr-o1AKI_solv_ions.gro-ptopol.top-pnameNA-nnameCL-nn8-pname阳离子类型–nname阴离子类型–nn离子数目GROMACS运算流程StepFive:EnergyMinimizationgrompp-fminim.mdp-c1AKI_solv_ions.gro-ptopol.top-oem.tprmdrun-v-deffnmem-v输出每步的运算信息–deffnm定义输出文件的名称em.log:EM过程的记录文件em.edr:二进制能量文件em.trr:二进制轨迹文件em.gro:能量最小化后的结构GROMACS运算流程StepFive:EnergyMinimization能量分析:g_energy-fem.edr-opotential.xvgGROMACS运算流程StepSix:Equilibration目的:1.使蛋白质分子周围的溶剂和离子达到平衡状态,防止整个体系坍塌;2.先等温使得溶剂分子达到既定的模拟温度;3.再等压使得整个体系的密度达到均衡一致;grompp-fnvt.mdp-cem.gro-ptopol.top-onvt.tpr(等温恒容过程)mdrun-deffnmnvtg_energy-fnvt.edrGROMACS运算流程StepSix:Equilibrationgrompp-fnpt.mdp-cnvt.gro-tnvt.cpt-ptopol.top-onpt.tpr(等温恒压过程)mdrun-deffnmnptg_energy-fnpt.edr-opressure.xvg(分析压力)g_energy-fnpt.edr-odensity.xvg(分析密度)GROMACS运算流程StepEight:ProductionMDgrompp-fmd.mdp-cnpt.gro-tnpt.cpt-ptopol.top-omd_0_1.tprmdrun-deffnmmd_0_1mdrun-deffnmmd_0_1mpirun-npXmdrun_mpi-deffnmmd_0_1(并行)GROMACS运算流程StepNine:Analysistrjconv-smd_0_1.tpr-fmd_0_1.xtc-omd_0_1_noPBC.xtc-pbcmol-urcompact-p