Gromacs是最常用的分子动力学模拟软件之一。小编很早就想写一点关于Gromacs的东西,可是Gromacs涉及东西太多了:从安装到使用,从分子动力学模拟基本知识到最终的数据分析,内容太多导致小编不知道从何处入手。然而,正所谓不积跬步,无以至千里,今天下定决心,首篇文章先介绍一些Gromacs使用中涉及到的文件。
Gromacs是Groningen Machine for Chemical Simulations的缩写,这里的Groningen指的是荷兰的格罗宁根大学。Gromacs最开始是由格罗宁根大学,生物物理化学系的Herman Berendsen课题组开发的,目前Gromacs的维护及更新由斯德哥尔摩的Science for Life Laboratory实验室领导。具体参与Gromacs研发及维护的人员可以在这个链接中查到http://www.gromacs.org/About_Gromacs/People。
Gromacs是一个用来进行分子动力学模拟的软件。可以使用Gromacs进行模拟研究的生物化学分子包括蛋白质,脂,核酸甚至是一些非生物来源的分子,多聚物等等。Gromacs是一个免费开源的软件,官方网址http://www.gromacs.org/。在官网中可以下载到Gromacs最新及历史版本的软件程序以及安装说明,用户手册,使用案例,常见问题等。
使用Gromacs的过程中会遇到各种类型的文件,下面按照文件的分类,我们简单介绍一下这些文件。
PDB文件
分子坐标文件(.pdb),这个是进行蛋白质分子动力学模拟时的输入文件。PDB文件可以从PDB数据库中下载到。如果你的蛋白质没有三级结构,可以先使用同源建模软件预测一个,然后就可以进行模拟了。PDB文件的详细解释,可以看我们的往期文章,点这里。
GRO文件
分子坐标文件(.gro)。这是使用Gromacs时输出的第一个文件,也是GROMACS的最主要分子坐标文件。当 pdb2gmx 程序被执行以生成分子拓扑文件的时候,它同时将结构文件 (.pdb) 转换为 gromacs 结构文件 (.gro)。gro 文件和 pdb 文件最大的不同在于 gro 还能保存速度信息。此文件的从左到右各列信息分别是:剩余的数量,剩余的名字,原子名字,原子数量,X、Y、Z坐标(单位nm),X、Y、Z速度(单位nm/ps)。具体固定文本列有:残基序号,5位数;残基名称,5字母;原子名称,5字母;原子序号,5为数;原子坐标三列,X,Y,Z坐标各8位数,含3个小数位;速度同坐标,速度单位为nm/ps(km/s)。详细信息见这里http://manual.gromacs.org/online/gro.html
TOP文件
模拟系统的拓扑文件(.top)。分子拓扑文件,包含所有的力场参数。由程序 pdb2gmx 生成。pdb2gmx 程序将肽或者蛋白质的结构文件(.pdb) 转换为分子拓扑文件(.top)。这个拓扑文件包含了在肽或者蛋白质中所有交互作用的完整信息,主要有这些内容:包含的力场,键相互作用参数,非键相互作用参数,限制性参数,定义一些名称等。详细信息见这里http://manual.gromacs.org/online/top.html
ITP文件
分子拓扑文件(.itp)。被主拓扑文件(.top)包含的分拓扑文件,一般包含某个特定分子的类型。于主拓扑文件区别有它不引用其他力场文件,同时包含[system],[molecule]等拓扑字节。
RTP文件
残基拓扑文件(.rtp)。该文件包含常见残基的力场信息,包括残基所含原子,成键种类等。使用pdb2gmx处理PDB文件时,程序按照PDB文件信息,在RTP文件中寻找对应的残基力场信息。
NDX文件
原子索引文件(.ndx)。该文件含原子的序号,当使用make_ndx程序生成索引文件时,可以定义不同的原子组,每组名下即是该组所含各个原子的序号。
MDP文件
GROMACS的模拟参数文件(.mdp)。该文件包含关于分子动力学模拟的全部信息。例如,时间步长,步数,温度,压力等等。操作这样一个文件最容易的方法是修改一个简单的 .mdp 例子文件。这是使用GROMACS进行分子动力学模拟最重要的文件。详细信息见这里http://manual.gromacs.org/online/mdp.html
TPR文件
最终一步分子动力学模拟的输入文件Run input file (.tpr),二进制。内容包含模拟的初始结构,分子拓扑,和所有的模拟参数。利用Grompp程序连接分子结构文件(.gro)、拓扑文件(.top)、分子动力学参数文件(.mdp)和索引文件(.ndx)(可选),即生成该文件。这个文件包含了开始使用 Gromacs 进行模拟的所有信息。
详细信息见这里http://manual.gromacs.org/online/tpr.html
TRR文件
Trajectory file (.trr),二进制,轨道文件(.trr),一旦运行时输入参数文件(.tpr)可以使用了,我们就可以模拟了。开始运行模拟的程序是 mdrun。当开始运行 mdrun 时,你经常需要的唯一输入文件就是运行输入参数文件(.tpr)。mdrun 的输出文件是轨道文件和一个日志文件(.log)。它包含所有的坐标、速度、力和能量信息,就如在(.mdp)文件中指出的一样。
详细信息见这里http://manual.gromacs.org/online/trr.html
XTC文件
模拟轨迹单精度文件(.xtc)。单精度轨迹文件,文件较TRR和TRJ小,为常用分析文件。包含模拟系统中原子坐标,模拟时间,和模拟盒子信息。
EDR文件
模拟输出的系统能量文件(energy,.edr)。该文件记录模拟输入文件中定义的能量组的各种相互作用能量等。
XVG文件
二维图标文件(.xvg)。二维画图工具xmgrace的默认文件,可以使用xmgrace打开。
CPT文件
该文件为模拟断点文件(check point,.cpt)。该文件为模拟过程固定时间间隔产生,保存模拟系统所有信息。该文件一部分可以在能量文件(.edr)找到,一部分可以在双精度轨迹文件(.trr)中找到。如果模拟不幸因为外界条件中断(如断电,模拟人发脾气砸电脑等),可以使用该文件重新在断点处开始模拟,以节省模拟时间。同时也可以依靠该断点文件开始,并延长模拟计算(见tpbconv)。
EPS文件
封装文件格式(.eps),并不是GROMACS自身文件格式,可以当图片打开。LINUX系统下一般已经有默认打开程序,WINDOWS要安装其他打开程序(可以GOOGLE以下)。GROMACS的DSSP和罗麽占陀罗图等通过xpm2ps处理后都是这个文件格式。习惯就好。
M2P文件
xpm2ps程序配置文件,定义输出eps文件中颜色,字体种类及大小等。
N2T文件
原子名称及类型对照文件(.n2t)。x2top程序可以按照原子名称得到该原子的原子类型力场参数,N2T就是x2top程序扫描的数据库,文件很小。文件中文本行有原子名称,原子类型,原子电量,原子质量,该原子与其他原子成键距离等。
XPM文件
数据矩阵文件(.xpm)。该文件矩阵中每个值即是矩阵点所表示的物理量大小(也可以是布尔值)。该文件其实就是二维图,可以失踪xpm2ps转换为图片。
上面我们简单介绍了一下Gromacs使用过程中的遇到的一些文件及用途。如果有好的材料和资源,Gromacs的入门并不难,推荐给大家一个网站http://jerkwin.github.io/Gromacs,这是目前小编发现,与Gromacs相关的最详细的中文网站。另外,感兴趣的同学,可以联系我们的管理员微信bioengxadmin,申请加入到BioEngX-分子动力学模拟 科研讨论群中。
管理员邮箱:info@bioengx.org;管理员微信:bioengxadmin; 内容和图片来自网络。欢迎留言讨论哦,如需再转载,请联系管理员。
扫描下方二维码关注BioEngX官方微信公众平台
.gro文件中,速度同坐标还是存在差异的,坐标是小数点后三位,速度是小数点后四位