JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法

JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法
JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法

NLDock将现有的核酸-配体相互作用评分函数ITScoreNL集成到MDock程序的升级版本中,结合模式预测准确性优于Glide等且计算效率有所提高。

背景介绍

有机小分子作为核酸的非共价调节剂可以阻断或调节核酸的功能。例如,核酸与小分子之间的相互作用可以调节DNA的转录过程,最终抑制蛋白质的生物合成。此外,一些配体作为潜在的抗菌药物,可以通过提供一个负反馈回路来调节代谢,从而抑制细菌的生长。这些配体往往具有较高的选择性,应用前景广阔。因此,识别这些复杂结构对于理解它们在原子水平上的生物过程,从而开发针对这些相互作用的治疗干预方案或药物非常重要。考虑到湿实验方法的高成本和技术难度,分子对接等计算方法在模拟核酸-配体相互作用和高通量应用中发挥着重要作用。

基于结构的对接,是评估小分子与核酸结合紧密性的一个有力工具。首先在给定核酸结合位点周围采集每个药物分子可能的结合模式。然后,使用评分函数对结合模式列表进行排序,并将结合评分作为评价复合物结合亲和力的指标。由于核酸通常存在于盐溶液环境中,会产生强烈的静电效应。因此,不能直接将蛋白配体相互作用的评分功能用于核酸-配体的相互作用。

一些核酸-配体对接程序,是在传统的蛋白质-配体对接算法基础上改编而成的,包括DOCK 6和AutoDock等。虽然蛋白-配体对接在核酸-配体相互作用中取得了一些成功,但由于结合位点的不同,RNA对接参数与蛋白对接参数并不一致。配体结合位点在蛋白质中通常是明确的,但在核酸中,尤其是螺旋结构中,配体结合位点更为广泛。因此,研究者开发了专门的核酸-配体对接方法,遗憾的是,目前较为流行的算法寥寥,仅有:rDock,MORDOR以及RLDOCK。

主要内容

本文中,来自华中科技大学的黄胜友等人开发了一种快速的核酸-配体对接算法,命名为NLDock,将针对核酸-配体相互作用的内在评分函数ITScoreNL实现集成到MDock程序中。NLDock在四个测试集上进行了广泛评估,并与AutoDock、DOCK 6、rDock、GOLD和Glide等其他五种最先进的对接算法进行比较。研究表明:NLDock算法在结合模式预测方面,获得了明显优于其他对接程序的性能,在77个复合物的最大测试集上,局部刚性、局部柔性和全局柔性配体对接的成功率分别为73%、36%和32%。此外,NLDock方法的计算效率也很高,对于局部柔性配体对接和全局柔性配体对接,平均耗时分别为0.97和2.08 min。相关的研究成果以 “NLDock:a Fast Nucleic Acid-Ligand Docking Algorithm for Modeling RNA/DNA-Ligand Complexes” 为题发布在国际著名期刊Journal of Chemical Information and Modeling上。

NLDock算法工作流

NLDock是一个集成了多个组件的软件包,包括若干个第三方程序、对接算法、评分功能以及一套额外的工具。图1给出了NLDock方法的工作流。

JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法

图 1. NLDock算法工作流。图片来源于JCIM

对接及评分方法

NLDock包含两个重要的组成部分–位置和得分。首先,对一个配体的所有可能的结合模式进行采样。然后,使用评分函数来评估与核酸结合的配体的紧密性和特异性。NLDock通过将配体原子与代表结合口袋负像的球点进行穷尽匹配来对结合口袋中的刚性配体进行定位。为了生成和选择球点,先用dms程序制备核酸结构的分子表面,再利用sphgen_cpp程序在制备的表面上生成球点,最后生成约50,000个形状互补性最好的结合模式。每个结合模式都通过基于知识的迭代评分函数ITScoreNL进行了优化。最终的对接结果存储在一个MOL2文件中。用户可以指定输出的结合模式的数量。公平起见,所有测试对接任务均采用默认参数。

测试集

为评估NLDock对接协议的性能,研究者使用了以下4个不同的测试集。

1. Yan集:取自SPA-LN研究,包含77个核酸复合物,其中RNA配体复合物62个,DNA配体复合物15个。

2. Ruiz集:取自rDock研究,包含56个RNA配体复合物。

3. Chen集:从Chen等人的文献中提取,同样包含56个RNA配体复合物。

4. Philips集:取自Philips等人的ligandRNA研究,包含42个RNA配体复合物。

刚性配体对接

图2显示了NLDock刚性配体对接的成功率,它是结合模式预测中topN的函数。为了便于比较,图中还列出了AutoDock、rDock和DOCK 6的结果。表1详细对比了考虑前1位和前5位结合姿势时,四种对接方案的成功率。 

JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法

图 2. 在rmsd≤2.0 Å的标准下,NLDock (A)、AutoDock (B)、rDock (C)和DOCK 6 (D)对刚性配体对接的结合模式预测的成功率。图片来源于JCIM

JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法

表 1. 四种对接方案在不同核酸-配体复合物测试集上局部刚性-配体对接的成功率。表格来源于JCIM

从图2A中可以看出,NLDock在识别同源-配体结合模式方面的表现明显优于其他对接程序。如果只考虑得分最高的构象,NLDock从同源配体中找到的rmsd≤2.0 Å的最佳解决方案为73%,AutoDock为34%,rDock为66%,DOCK 6为58%。如果考虑前五名的解决方案,NLDock的成功率为82%,也明显高于AutoDock、rDock和DOCK 6。这些结果表明NLDock在DNA和RNA-配体对接中的结合构象识别方面具有良好的性能。

对于RNA -配体复合物(图2B-D),在Yan集中可以观察到类似的性能趋势,NLDock也是四个对接项目中表现最好的。在考虑top预测时,NLDock在Ruiz集上的预测成功率为64%,在Chen集上的预测成功率为68%,在Philips集上的预测成功率为71%,AutoDock分别为16%、38%和33%, rDock分别为57%、70%和57%,在DOCK 6上分别为38%、57%和48%。当考虑前5个预测时,NLDock在rmsd≤2.0 Å范围内正确识别同源配体,Ruiz集为73%,Chen集为77%,Philips集为79%。均高于其他三个对接项目算法。这些结果表明NLDock在刚性对接姿势确定方面也具有良好的性能。

柔性-配体对接

图3显示了NLDock、AutoDock、rDock和DOCK 6在四个测试集上结合模式预测中柔性-配体对接的成功率。从图3可以看出,NLDock的性能明显优于其他三个对接方案。表3列出了在考虑前1位和前5位结合姿势时,4个对接方案的成功率。从表中可以看出,当考虑高分姿势时,NLDock在四个测试集上的成功率分别为36%、16%、25%和26%。

JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法

图 3. 在rmsd≤2.0 Å准则下, NLDock (A)、AutoDock (B)、rDock (C)和DOCK 6 (D)对局部柔性配体对接的结合模式预测的成功率。图片来源于JCIM

 

JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法

表 3. 四种对接方案在不同核酸-配体复合物测试集上局部柔性-配体对接的成功率。表格来源于JCIM

计算效率

研究者统计了NLDock在四个测试集的139个核酸-配体复合物上进行局部柔性配体对接作业的运行时间,包括配体构象生成和对接计算的时间。NLDock比其他对接方法占用的时间要少得多。如图4A所示,NLDock在局部柔性-配体对接工作中平均消耗0.97分钟,而AutoDock为19.06分钟,rDock为23.93分钟,DOCK 6为12.18分钟。对于全局柔性配体-对接,如图4B所示,NLDock的计算效率也优于rDock。平均而言,NLDock对接一个配体需要2.07分钟,而rDock需要48.49分钟。这些结果表明NLDock在局部和全局核酸-配体对接中具有较高的计算效率。

JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法

图 4. 139个核酸-配体对接任务中四种对接程序平均运行时间的对比。图片来源于JCIM

 

对接模型案例

图5显示了NLDock成功预测的两个核酸-配体复合物的例子。图5A为一个DNA-配体复合物的对接结果(PDB code:1QV4)。在排名前五的结合模型中,有四个成功预测(rmsd≤2.0 Å),第一个模型rmsd为1.231 Å。图5C显示了另一个示例(PDB代码:1AM0)。在前5个预测结合模型中,第一个预测模型的rmsd为1.03 Å。这些结果表明了NLDock在预测DNA/RNA-配体的正确结合模式方面的准确性。

JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法

图 5. 两个对接案例的晶体结构(蓝色)和NLDock预测(品红)的对比。图片来源于JCIM

这样的识别同源配体构象测试案例对于对接程序评分功能来说极具挑战性。四种对接算法给出的预测模式中,当考虑top1结合模式时,只有NLDock成功生成了近同源配体构象。图6E显示了竞争性结合模式,它具有良好的结合得分,但rmsd最大(绿色)。与晶体结构(蓝色)相比,竞争结合构象具有明显的反向取向。图7展示了NLDock与商业软件GOLD及Glide在60个复合物数据集上的预测成功率。

 

JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法

图 6. 一个核酸-配体复合物2KU0的不同软件对接得分- rmsd关系及复合物的同源配体(蓝色)与NLDock预测的rmsd大的一种竞争评分结合模式(绿色)的比较。图片来源于JCIM

 

JCIM | NLDock:一种用于复合物建模的快速核酸-配体对接算法

图 7. NLDock、GOLD和Glide分别以配体rmsd≤1.0和≤2.0 Å为标准时,对60个RNA-配体复合物进行预测时,top1预测的成功率。图片来源于JCIM

结论总结

本文介绍了一种快速的核酸-配体对接算法NLDock,它改进了固有的核酸-配体相互作用评分函数ITScoreNL,其中配体的灵活性是通过对接多个配体构象的集合来实现的。总体而言,NLDock在结合模式预测和计算效率方面,都明显优于其他先进的核酸-配体对接程序。

参考文献

Yuyu Feng, Keqiong Zhang, Qilong Wu, and Sheng-You Huang, NLDock: a Fast Nucleic Acid-Ligand Docking Algorithm for Modeling RNA/DNA-Ligand Complexes, Journal of Chemical Information and Modeling Article ASAP. DOI: 10.1021/acs.jcim.1c00341.