GROMACS教程第一步:准备拓扑一些GROMACS基础知识随着版本5.0的GROMACS的发布,所有的工具本质上是二进制名为“gmx”的模块。这与以前的版本不同,其中每个工具都被调用为自己的命令。在5.0中,这仍然通过符号链接工作,但是在将来版本中将会消失,所以昀好习惯于新的做事方式。要获取有关任何GROMACS模块的帮助信息,您可以调用以下任一命令:gmxhelp(module)或者gmx(module)-h其中(module)被您想要发出的命令的实际名称所替代。信息将打印到终端,包括可用的算法,选项,所需的文件格式,已知的错误和限制等。对于GROMACS的新用户,调用常用命令的帮助信息是了解每个命令可以执行的一个很好的方法。现在,到有趣的东西!溶菌酶教程我们必须下载我们将要工作的蛋白质结构文件。在本教程中,我们将使用鸡蛋白溶菌酶(PDB代码1AKI)。转到RCSB网站并下载PDB文本的晶体结构。下载结构后,您可以使用VMD,Chimera,PyMOL等查看程序来可视化结构。一旦看到分子,您将要去除晶体水域。使用纯文本编辑器,如vi,emacs(Linux / Mac)或记事本(Windows)。不要使用文字处理软件!删除与这些分子对应的行(PDB文件中的残基“HOH”)。注意,这种方法不是普遍适用的(即,结合的活性位点水分子的情况)。对于我们这里的意图,我们不需要水晶。请务必检查您的.pdb文件中的评论MISSING中列出的条目,因为这些条目表示不存在于晶体结构中的原子或全部残基。终端区域可能不存在,并且可能不存在动态问题。不完整的内部序列或任何具有缺失原子的氨基酸残基将导致pdb2gmx失败。这些缺失的原子/残基必须使用其他软件包进行建模。还要注意,pdb2gmx不是魔术。它不能为任意分子产生拓扑,只是由力场定义的残基(在* .rtp文件中 通常是蛋白质,核酸和非常有限量的辅因子,如NAD(H)和ATP)。现在晶体水已经消失了,我们已经证实了所有必需的原子存在,PDB文件应该只包含蛋白质原子,并准备输入到第一个GROMACS模块pdb2gmx。pdb2gmx的目的是生成三个文件:1.分子的拓扑结构。2.一个位置限制文件。3.后处理结构文件。拓扑(默认情况下为topol.top)包含在模拟中定义分子所需的所有信息。该信息包括非键合参数(原子类型和电荷)以及键合参数(键,角度和二维)。一旦生成了拓扑结构,我们就会详细的看一下拓扑。通过发出以下命令执行pdb2gmx:gmxpdb2gmx-f1AKI.pdb-o1AKI_processed.gro-waterspce结构将由pdb2gmx处理,您将被提示选择强制字段:选择力场:从'/usr/local/gromacs/share/gromacs/top':1:AMBER03蛋白,核酸AMBER94(Duan等人,J.Comp.Chem.24,1999-2012,2003)2:AMBER94力场(Cornell等人,JACS117,5179-5197,1995)3:AMBER96蛋白,核酸AMBER94(Kollman等人,Acc.Chem.Res.29,461-469,1996)4:AMBER99蛋白,核酸AMBER94(Wang等人,J.Comp.Chem.21,109-1074,2000)5:AMBER99SB蛋白,核酸AMBER94(Hornak等人,Proteins65,712-725,2006)6:AMBER99SB-ILDN蛋白,核酸AMBER94(Lindorff-Larsen等人,Proteins78,250-58,2010)7:AMBERGS力场(Garcia&Sanbonmatsu,PNAS99,2782-2787,2002)8:CHARMM27全原子力场(CHARM22plusCMAPforproteins)9:GROMOS9643a1力场10:GROMOS9643a2力场(改进的烷烃二面体)11:GROMOS9645a3力场(SchulerJCC2001221205)12:GROMOS9653a5力场(JCC2004vol25pag1656)13:GROMOS9653a6力场(JCC2004vol25pag1656)14:GROMOS9654a7力场(Eur.Biophys.J。(2011),40,,843-856,DOI:10.1007/s00249-011-0700-9)15:OPLS-AA/L全原子力场(2001氨基酸二面体)强制字段将包含将写入拓扑的信息。这是非常重要的选择!你应该总是仔细阅读每个力场,并决定昀适合你的情况。对于本教程,我们将使用全原子OPLS强制字段,因此在命令提示符下键入15,后跟“Enter”。还有许多其他可以传递给pdb2gmx的选项。一些常用的列出在这里:成功的路上并不拥挤,因为坚持的人不多!by@杂草一族——幼儿梦想追求中。ignh:忽略PDB文件中的H原子; 特别适用于NMR结构。否则,如果存在H原子,则它们必须在GROMACS期望它们的力场如何确定。存在不同的约定,所以处理H原子偶尔会头疼!如果您需要保留初始H坐标,但是需要重命名,那么Linux sed命令是您的朋友。ter:交互地分配N和C末端的电荷状态。inter:交互指定Glu,Asp,Lys,Arg和His的电荷状态; 选择哪个Cys参与二硫键。您现在已经生成了三个新文件:1AKI_processed.gro,topol.top和posre.itp。1AKI_processed.gro是GROMACS格式的结构文件,其中包含在力场内定义的所有原子(即,H原子已添加到蛋白质中的氨基酸)。topol.top文件是系统拓扑(一分钟后更多)。posre.itp文件包含用于限制重原子位置的信息(稍后再说)。昀后一点:许多用户认为.gro文件是强制性的。 这是不正确的。GROMACS可以处理许多不同的文件格式,而.gro只是编写坐标文件的命令的默认格式。它是一种非常紧凑的格式,但精度有限。如果您喜欢使用PDB格式,您需要做的就是使用.pdb扩展名指定适当的文件名作为输出。pdb2gmx的目的是产生强制场符合拓扑; 输出结构很大程度上是这个目的的副作用,用于方便用户。返回:介绍下一篇:拓扑Bevan实验室主页弗吉尼亚理工大学首页弗吉尼亚科技生物化学网站设计和内容版权所有20082015由Justin Lemkul 网站的问题?发送给网站管理员格式可以是您喜欢的任何内容(请参阅GROMACS手册以了解不同格式)。用的是开心就好了说明:用的是谷歌的翻译,有些专业的词汇并不是那么准确,仅限参考。GROMACS教程第二步:检查拓扑我们来看看输出拓扑结构中的内容(topol.top)。再次,使用纯文本编辑器,检查其内容。经过几个注释行(前面加上),你会发现如下:#include“oplsaa.ff/forcefield.itp”该行调用OPLSAA强制字段中的参数。它在文件的开头,表示所有后续参数都是从该力场派生出来的。下一个重要的一行是[moleculetype],下面你会发现;NamenrexclProtein_A3基于蛋白质在PDB文件中被标记为链A的事实,名称“Protein_A”定义了分子名称。保税邻居有3个排除。有关排除的更多信息,请参见GROMACS手册; 此信息的讨论超出了本教程的范围。下一节定义[atoms]蛋白质。信息以列表示:[atoms];nrtyperesnrresidueatomcgnrchargemasstypeBchargeBmassB;residue1LYSrtpLYSHq+2.01opls_2871LYSN1-0.314.0067;qtot-0.32opls_2901LYSH110.331.008;qtot0.033opls_2901LYSH210.331.008;qtot0.364opls_2901LYSH310.331.008;qtot0.695opls_293B1LYSCA10.2512.011;qtot0.946opls_1401LYSHA10.061.008;qtot1对此信息的解释如下:nr:Atom号type:Atom类型resnr:氨基酸残基数residue:氨基酸残基名称请注意,PDB文件中的残留物为“LYS”; 使用.rtp条目“LYSH”表示残基被质子化(中性pH下的主要状态)。atom:Atom名称cgnr:充电组号充电组定义整数单位; 它们有助于加速计算charge:不言而喻“qtot”描述符是分子上的电荷的总计mass:也不言自明typeB,chargeB,massB:用于自由能扰动(这里不讨论)后续部分包括[bonds],[pairs],[angles],和[dihedrals]。这些部分中的一些是不言自明的(债券,角度和二角形)。与这些部分相关的参数和功能类型详见GROMACS手册的第5章。特殊的14相互作用包括在“对”(GROMACS手册的第5.3.4节)之下。该文件的其余部分涉及定义一些其他有用/必需的拓扑,从位置约束开始。“posre.itp”文件由pdb2gmx生成; 它定义了一个力常数,用于在平衡期间将原子保持在原位(此后更多)。;IncludePositionrestraintfile#ifdefPOSRES#includeposre.itp#endif这结束了“Protein_A”分子类型的定义。拓扑文件的其余部分专用于定义其他分子并提供系统级描述。下一个分子类型(默认情况下)是溶剂,在这种情况下是SPC / E水。水的其他典型选择包括SPC,TIP3P和TIP4P。我们通过将“water spce”传递给pdb2gmx来选择此选项。对于许多不同水模型的优秀摘要,请点击这里,但请注意,并不是所有这些模型都在GROMACS中。;Includewatertopology#includeoplsaa.ff/spce.itp#ifdefPOSRES_WATER;Positionrestraintforeachwateroxygen[position_restraints];ifunctfcxfcyfcz11100010001000#endif您可以看到,使用1000 kJ mol 1 nm 2的力常数(k pr)也可以对水进行位置限制。离子参数如下:;包括离子的通用拓扑#include“oplsaa.ff/ions.itp”最后进入系统级定义。该[system]指令给出了在仿真期间将被写入输出文件的系统的名称。该[molecules]指令列出了系统中的所有分子。[system];NameLYSOZYME[molecules];Compound#molsProtein_A有关[molecules]指令的几个关键说明:1.列出的分子的顺序必须与坐标(本例中为.gro)文件中分子的顺序完全一致。2.列出的名称必须与[moleculetype]每个物种的名称相匹配,而不是残留名称或任何其他名称。如果您不能随时满足这些具体要求,您将会从grompp(稍后讨论)中获得关于不匹配的名称,未找到分子或其他许多人的致命错误。现在我们已经检查了一个拓扑文件的内容,我们可以继续构建我们的系统。返回:pdb2gmx解决Bevan实验室主页弗吉尼亚理工大学首页弗吉尼亚科技生物化学GROMACS教程第三步:定单元和添加溶剂既然您熟悉GROMACS拓扑结构的内容,那么现在是继续构建系统的时候了。在这个例子中,我们将要模拟一个简单的含水系统。可以在不同溶剂中模拟蛋白质和其他分子,条件是所有物种都可获得良好的参数。定义盒子和填充溶剂有两个步骤:1.使用editconf模块定义框尺寸。2.使用solvate模块(以前称为genbox)将盒子装入水中。现在,您将看到如何处理晶胞的选择。为了本教程的目的,我们将使用一个简单的立方体作为单元格。随着您对周期性边界条件和箱型更加舒适,我强烈推荐菱形十二面体,因