您的位置 首页 工具使用

如何根据靶点蛋白质结构设计药物

编者按  

本文作者目前所在课题组是DOCK软件主要开发组之一。DOCK是世界上第一款模拟分子对接的软件,也是应用最广泛的分子对接软件之一,目前已经开发到DOCK6.7版本。DOCK官方网站http://dock.compbio.ucsf.edu/

为了完成一个小分子和一个靶点蛋白质的对接模拟,需要考虑两个要素:第一就是小分子本身可能形成的结构,这基本上由分子每一个可能旋转的键(rotatable bond)的二面角(dihedral angle)所决定;另一点就是小分子和靶点蛋白质之间的相互作用,最基本的就是范德华力和静电作用。

对接软件(DOCKING)

对接软件目前有两大流派,二者的区别就在于完成上述两个要素的过程不尽相同。比方说我们要模拟某一个小分子和某靶点蛋白质的对接,一大流派的思路就是,首先生成这个小分子所有可能的结构,然后试着把这些结构在不改变内部自由度的前提下对接到靶点蛋白质的结合位点(binding site)内,然后进行一些局部的能量最小化(minimization),寻找到最合适的对接位置,最后用打分函数对于所有的结构打分排序,autodock以及DOCK3应该就是这一流派的。

另一个流派的思路是这样的,我们首先试图把这个小分子按rotatable bond分为若干片段,然后从其中最大的片段(我们称之为锚,anchor)开始,首先把这个anchor放到binding site里,计算这个anchor和蛋白质之间的相互作用,进行局部优化。然后按顺序把下一个片段接到anchor上,尝试不同的二面角,计算相互作用,局部优化,周而复始,直到在binding site内把这个小分子组装完成为止,这一流派以DOCK6分支为代表。

从目前所知的数据来看,两种方式在复制晶体结构的成功率方面不相上下,但是效率似乎是第一种方式更高一些。不过第二种方还有一些更多的应用前景,后面会提到。这里提一下,复制晶体结构指的是对于一个小分子和蛋白质complex的晶体结构,把小分子拿出来,用软件模拟小分子与蛋白质的对接,看软件模拟结果和晶体结构是否相似。

打分函数

对于一个对接软件来说,打分函数可以说是最重要的一个部分,有一个或者多个好的打分函数,可以大大提高虚拟筛选的成功率。打分函数也可以大致分为两大类,一类就是以物理性质为基础,比如之前提到的范德华力和静电作用,还可以包括类似单点(single point)的MM/GBSA或者MM/PBSA计算,能够包括去溶剂化惩罚(desolvation penalty),但是由于只有一个结构进行单点计算,所以结果可能不是特别准确,远不如使用分子动力学模拟以后的计算来的准确。

另一类的打分函数是以相似度为基础的,即已知一个具有活性的小分子抑制剂,通过计算一个化合物库内化合物和已知小分子抑制剂之间的相似程度排序,找出其中最接近的分子,也就是理论上最可能具有相似活性的分子。这里所说的相似可以有许多不同的方面,包括二维分子结构,三维分子结构,在binding site内所占体积相似,药效基团(pharmacophore)结构相似,或者是和靶点蛋白质的相互作用方式相似等等不同的方式比较。据我所知这一类的打分函数在工业界应用得似乎更多一些。

当然以相似度作为打分函数最大的问题可能就是,你找到的得分最高的分子,理论上是跟已知分子最接近的一个,但同时很有可能在活性上没有特别大的提升。不过,另一方面来说,筛选抑制剂或者说最终制药,活性只是一个方面,还有其他各种标准,所以这样的筛选也是有很大意义的。

虚拟筛选

虚拟筛选简单说就是用对接软件,去做大量化合物库的对接模拟。现在用于虚拟筛选的化合库包括的分子数量一般都是以百万计的,需要挨个做一遍对接,然后打分,排队,买化合物,测活性。目前也有一种高通量的筛选方式,就是拿几百几千个小分子出来高通量地做活性检测。不过我所在组是纯计算组,每次都只能买一百个左右的小分子拿去到合作实验室做活性,不过多少还是能找到几个有活性的分子的。

对接软件的缺陷

问题一:慢

现在对接软件最大的缺陷的就是慢,这个东西其实也没辙,只能这么慢,当然对于我们这些学术软件来说,木有人做软件优化也是一个很大的问题,一代一代的PhD们攒下来的代码,要说没有问题没有bug,那才是见鬼呢。。。。所以软件本身的效率确实存在一定问题,

问题二:无法模拟蛋白质灵活性

再有一个问题是,因为要兼顾准确率和效率,所以现在市面上绝大多数对接软件基本都没有办法很好的在计算对接的同时模拟靶点蛋白质的灵活性(receptor flexibility),只能使用一个静态的靶点蛋白质结构。

事实上,小分子和靶点蛋白质在对接过程中两者都在运动,靶点蛋白在binding site内氨基酸侧链的移动很有可能让原本看起来不能fit进去的小分子能够很好的和蛋白质产生相互作用。遗憾的是,目前我们使用对接软件都无法模拟这一点。

问题三:打分函数粗糙

另一个问题就是我们对接软件内现在所有的打分函数对于小分子的排序都是基于一个静态的结构,导致的结果就是计算结果误差相对比较大,这一点其实和上一点是相关的。

这个问题目前来说只能通过分子动力学模拟(Molecular dynamics simulation, MDS)来解决,但是MDS的效率相对来说就太低了,所以只能针对比较少量的分子进行模拟。我们现在的一个思路是在开发新的打分函数的同时,能够将各种不同的打分函数进行组合,以期得到最好的效果。

进展/设计

下面我介绍一些有关小分子设计的内容,其实这也是对接软件的一个重要的发展方向。小分子的设计,也可以分为两类,一类是在已知有活性的小分子基础上进行设计,通过改变各种基团,试图提高小分子的活性。而另一类就是完全从头开始设计一个全新的分子,也就是所谓的de novo design。

第一类:改造设计

第一类设计一般是在虚拟筛选得到一些有活性的分子以后进行的,一大方式就是SAR模型,这一类研究更多的要依靠实验室合成和测试化合物,大概就是这里添一个基团,那里换一个基团,看看怎样做出来的化合物活性最高,然后总结出一些规律。这种做法的一大好处是,有没有结构都能往下做,有结构自然最好,没有的话问题也不大,凭经验也能分析个八九不离十。

另一个种方式就是以结构为基础的设计(structure-based design),我们也喜欢把这个称为rational design。从名字就知道,对我们来说结构异常重要,能够有晶体自然是最好的,没有的话就要靠对接软件预测了,预测得到的结构我们一般会用MD进一步验证,主要是看结构是否稳定,同时计算free energy of binding这些东西,然后根据结构来判断在哪些位点上添加哪些基团会得到更好的亲和力,然后就是又一轮新的预测和计算,排序,合成,测试活性,周而复始。

第二类:全新设计/de novo design

我们重点来说说de novo design。我个人认为这将是小分子抑制剂设计的发展方向。简单说,这个概念和虚拟筛选相对,使用的是分子片段,或者基团组成的库,而不是完整的化合物库。针对一个靶点蛋白质的binding site,通过不断地排列组合各种不同的基团,最终设计出一些对于这个蛋白质有比较好理论活性的小分子。这一类方式最大的好处在于不受到所使用的化合物库的限制,理论上能够通过不断地排列组合来探索一个极其巨大,甚至于覆盖所有的chemical space。据我所知,市面上目前还没有一款软件能真正完成这样的功能。我见到过一些软件能做一些类似于通过排列组合生成新的化合物之类的模拟,但是似乎并没有太大的影响力。我组现在对于最新版本DOCK的开发就是针对这个方向。

回到之前面提到的对接软件的两大流派,我个人认为要应用在de novo design上的话,第二流派会更加有效,也就是在binding site内通过一个个片段组装的方式来搭建一个新的分子。因为如果按着第一流派的思路,要先做好分子结构,然后试着fit进binding site,一个很大的问题是这样真的会需要通过排列组合生成所有可能的分子构成和各种不同的结构(conformer),这样效率会是一个大问题。但是如果采用在binding site内搭建的方式的话,可以一定程度上避免这个问题。因为有了binding site结构的限制,许多基团在搭建的过程中就可以知道无法fit进去,也就由此减少了很多无谓的尝试。

另一方面,整个de novo design的过程,可以由不同的打分函数来指导,以期得到不同性质的结果,比如如果只用分子间作用来指导设计,那么很可能会最终得到一个相对比较大的分子,因为更大的分子能够形成更多的分子间作用力,从而获得更好的分数;而如果用二位分子结构相似度来指导设计的话,就可以期待最终会得到一个和参考分子非常相似的分子。而最终,在我们的理想当中,我们应该用一些列打分函数的组合来指导de novo设计出的分子,以期得到有最好性质的一些分子。同时,de novo design也可以被用来在已知活性的小分子为基础的设计,可以将小分子的全部或者部分保留,以此为基础做设计,这样的话可以完成自动化程度更高的analog design。

de novo design的应用前景看起来非常美好,但现阶段还是有一些非常大的挑战的。其一就是效率,这个挑战是必然存在的,要覆盖更大的chemical diversity,必然花费相对更多的时间。另一点就是如何设计出更合理,更现实,能够被合成的分子。因为我木有任何化学和有机化学的背景,当初刚开始是试着设计分子往上加基团的时候,往往是看上去很美,但是老板拿着我设计的分子,第一句话一般是,你去给我查查,你设计的这玩意儿真的有可能存在吗?所以,让电脑设计出有可能被合成的分子当然也是一个很大的挑战了。

好了,拉拉杂杂写了那么多,基本就是我在这个领域内一些了解和认识了,欢迎讨论,欢迎指正。谢谢大家。

作者: Homesick Alien

科研工作者。 知乎个人主页 https://www.zhihu.com/people/homesick_alien



发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

评论列表(23)

联系我们

联系我们

(44)07934433023

在线咨询: QQ交谈

邮箱: info@bioengx.org

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部