您的位置 首页 技术频道

蛋白质结构PDB文件详细解释

蛋白质数据库Protein Data Bank(PDB)是一个包含蛋白质、核酸等生物大分子的结构数据的数据库,网址是http://www.rcsb.org。PDB可以经由网络免费访问,是结构生物学研究中的重要资源。为了确保PDB资料的完备与权威,各个主要的科学杂志、基金组织会要求科学家将自己的研究成果提交给PDB。PDB数据库存储结构数据的文件是PDB文件,每一个蛋白质或核酸都对应着一个编号,即PDB ID, 文件的扩展名为.pdb。PDB文件可以由各种3D 结构显示软件打开,比如pymol,Swiss-PDB viewer,VMD 等。

PDB文件里面的信息是有严格的格式的。各行数据, 如标识, 原子名, 原子序号, 残基名称, 残基序号等, 不仅要按照严格的顺序书写, 而且各项所占的空符串长度, 及其所处的各行的位置都是严格规定。今天小编就为大家介绍一下PDB文件中信息的格式。

标题部分

  1. HEADER: 分子类, 公布日期, ID号
  2. OBSLTE: 注明此ID号已改为新号
  3. TITLE: 说明实验方法类型
  4. CAVEAT: 可能的错误提示
  5. COMPND: 化合物分子组成(比如 蛋白质以及配体)
  6. SOURCE: 化合物来源(比如来源大肠杆菌的某种酶)
  7. KEYWDS: 关键词
  8. EXPDTA: 测定结构所用的实验方法
  9. AUTHOR: 结构测定者
  10. REVDAT: 修订日期及相关内容
  11. SPRSDE: 已撤销或更改的相关记录
  12. JRNL: 发表坐标集的文献
  13. REMARK REMARK 1: 有关文献;REMARK 2: 最大分辨率;REMARK 3: 用到的程序和统计方法. 该记录用来记述结构优化的方法和相关统计数据;REMARK 4-999: 其他信息

一级结构

  1. DBREF: 其他数据库的有关记录
  2. SEQADV: PDB与其他数据库内记录的出入
  3. SEQRES: 残基序列
  4. MODRES: 对标准残基的修饰

杂因子

  1. HET: 非标准残基
  2. HETNAM: 非标准残基的名称
  3. HETSNY: 非标准残基的同义字
  4. FORMOL: 非标准残基的化学式

二级结构

  1. HELIX: 螺旋
  2. SHEET: 折叠片
  3. TURN: 转角

连接注释

  1. SSBOND: 二硫键
  2. LINK: 残基间化学键
  3. HYDBND: 氢键
  4. SLTBRG: 盐桥
  5. CISPEP: 顺式残基

晶胞特征及坐标变换

  1. CRYST1: 晶胞参数(NMR除外).
    该记录用来记述晶胞结构参数(a, b, c, α, β, γ, 空间群)以及Z值(单位结构中的聚和链数).
  2. ORIGXn: 直角-PDB坐标
  3. SCALEn: 直角-分数结晶学坐标(n=1, 2, 3, NMR除外).
    该记录介绍数据中直角坐标向部分晶体学坐标的转换.
  4. MTRIXn: 非晶相对称
  5. TVECT: 转换因子

坐标部分

  1. MODEL: 多亚基时示亚基号
    当一个PDB文件中包含多个结构时(例:NMR结构解析), 该记录出现在各个模型的第一行. MODEL记录行的第11-14列上记入模型序号. 序号从1开始顺序记入, 在11-14列中从右起写. 比如说有30个模型, 则第1至9号模型, 该行的7-13列空白, 在14列上记入1-9的数字; 第10-30号模型, 该行的7-12列空白, 13-14列上记入10-30的数字.
  2. ATOM: 标准基团的原子坐标
    该记录记述了标准氨基酸以及核酸的原子名, 残基名, 直角坐标, 占有率, 温度因子等信息.
  3. SIGATM: 标准差
  4. ANISOU: 温度因子
  5. SIGUIJ: 各种温度因素导致的标准差
  6. TER: 链末端
    该记录表示链的末端,在每个聚合链的末端都必须有TER记录, 但是由于无序序列而造成的链的中断处不需要该记录.
  7. HETATM: 非标准基团原子坐标
    该记录记述了标准氨基酸以及核酸以外的化合物的原子名, 残基名, 直角坐标, 占有率, 温度因子等信息.
  8. ENDMDL: 亚基结束
    与MODEL记录成对出现, 记述在各模型的链末端的TER记录之后.

连通性部分

CONECT: 原子间的连通性有关记录

簿记

  1. MASTER: 版权拥有者
  2. END: 文件结束
    该记录标志PDB文件的结束, 是必需的记录.

我们最后再看一下PDB文件中坐标部分每一列的含义:

示例:

说明:

说明
1 – 6 记录类型
7 – 11 原子序号
13 – 16 原子名称,往往从第14位开始写, 占四个字符的原子名称才会从第13位开始写
17 额外定位符
18 – 20 残基名称
22 原子所属的链
23 – 26 残基序列号
27 残基插入代码
28 – 30 留空
31 – 38 x坐标
39 – 46 y坐标
47 – 54 z坐标
55 – 60 占有率
61 – 66 温度因子
67 – 72 留空
73 – 76 区段标识
77 – 78 元素符号, 右对齐
79 – 80 原子电荷

图片和内容由BioEngX原创,欢迎留言讨论哦,如需转载,请联系管理员。

管理员邮箱:info@bioengx.org;管理员微信:bioengxadmin


扫描下方二维码关注BioEngX官方微信公众平台
qrcode_for_gh_1d4074a25cf9_258

作者: 于浩然

本科及硕士毕业于天津大学,博士毕业于伦敦大学学院。现就职于浙江大学化学工程与生物工程学院,PI,博导。研究方向为蛋白质工程、生物催化剂、合成生物学等。



发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

联系我们

联系我们

(44)07934433023

在线咨询: QQ交谈

邮箱: info@bioengx.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部