背景介绍
药物发现是一项具有挑战性的任务,需要对多个参数进行优化,以适应不同的药物性质。对于靶向特定生物大分子的药物,药物与其靶点之间的充分结合亲和力是药物药效发展的基础。由于这一过程的复杂性,发展最先进的方法,包括实验和计算方法,可以加快项目进展和发现高质量的化合物,是极其重要的,与此同时,药物发现研究也在不断地探索创新方法。
近年来,为了预测药物发现项目中的结合亲和力,人们已经开发了多种计算机模拟方法,预测的质量随着时间的推移而不断改善。这些方法通常依赖于基于规则的物理模型或基于数据的机器学习(ML)和人工智能(AI)模型。其中,自由能微扰法(FEP)是一种基于统计力学的严格的自由能预测模型,由于其准确可靠的性能,在预测候选化合物与其生物靶点之间的结合亲和力方面,受到越来越多的关注。FEP的计算依赖于一系列定义明确的中间炼金术态的定义,在两个不同的物理态之间进行插值,并通过耦合参数的作用,将初始(参考)态逐渐转化为最终(目标)态。典型的两个例子是:计算两种不同配体之间的相对结合自由能(RBFE)或计算配体与其生物靶点的绝对结合自由能(ABFE)。然而,到目前为止,由于FEP热力循环的终端态之间存在显著的结构差异,导致精度问题的出现,因此ABFE的使用受到了更多限制。尽管如此,ABFE计算也取得了重大进展,并实现了相关应用。人们众多的努力使得FEP在药物发现研究中,得到了更广泛的应用。然而,由于可扩展性、可负担性、效率和适用场景的限制等问题,FEP在药物发现项目中更广泛和普遍的使用,仍然存在局限性。
主要内容
自由能微扰(FEP),已广泛应用于药物发现项目中,用于预测候选化合物与其生物靶点之间的结合亲和力。然而,目前FEP应用程序存在众多局限性,包括但不限于成本高、等待时间长、可伸缩性有限和应用场景的广度等。为了克服这些问题,来自晶泰科技有限公司的Peiyu Zhang & Mingjun Yang等人,开发了一个可扩展的云计算平台XFEP,可以使用优化的模拟协议进行相对和绝对自由能预测。XFEP以一种更高效、可扩展和经济的方式实现了大规模FEP计算,例如,使用50-100 GPUs可以在1周内对5000种化合物进行评估,计算成本大约相当于合成一种新化合物的成本。相关的研究成果以题为“A Cloud Computing Platform for Scalable Relative and Absolute Binding Free Energy Predictions: New Opportunities and Challenges for Drug Discovery”发布在国际著名期刊Journal of Chemical information and Modeling上。
在XFEP中,RBFE和ABFE协议都得到了进一步优化,并辅以了系统特定的精细化力场(FFs)和增强采样。XFEP平台构成了一个集成工作流的主干,该工作流将FEP计算与AI模型和湿实验室实验耦合起来。该工作流程能够使用人工智能高效地产生目标导向的设计想法,使用给定生物系统的验证FEP协议对假设想法进行快速评估和优先排序,湿实验室合成优先排序的分子,以及活性和其他药物性能的体外和体内测试。XFEP平台使FEP应用程序在药物发现项目中的命中识别、先导物选择和先导物优化场景中更具可扩展性、可负担性和效率。
在本研究中,研究者通过RBFE和ABFE计算研究了XFEP平台的性能,这些计算分别对应于药物发现场景的命中识别、先导物选择和优化、蛋白-蛋白相互作用中的蛋白突变效应、药物选择性和耐药性。
XFEP云计算平台的特性
可扩展性:FEP计算的本质,即许多λ窗口(11或22)短模拟(即1或2 ns)和许多不同的化合物,使它成为在云计算平台上以完全可扩展的方式使用的理想工具。充分利用这种可扩展性,一个项目的FEP计算实例的典型数量可以从数十个或数百个扩展到数千个甚至更多,潜在地允许计算分子的数量增加两倍。
高效性:氢传质允许使用更大的时间步长,这可以加快模拟的两倍。协定的λ方案可以将λ窗口总数从22个减少到11个,从而提高仿真速度。结果表明,FEP模拟的GPU成本可以降低8倍,同时以最小的统计不确定性增加产生类似的结果。
可负担:通过这些努力来提高FEP计算的效率,可以根据取决于系统的大小、采用何种FEP协议(有效或完整)以及是否可以使用现场实例模式的节点进行计算,一个分子的FEP计算成本从不到1美元到10美元不等。在一个内部药物发现项目中,使用50-100个GPU,在1周内完成了对5000个设计化合物的FEP评估,该评估针对一个拥有37000个原子的中型系统,使用高效协议,总成本约相当于合成一种新化合物(2500美元)。
图表汇总
表1. 8种蛋白质靶标配体构建的模型化合物中FF和QM柔性扭转能量分布比较
表格来源于JCIM
图 1. XFEP云计算平台的图形用户界面
图片来源于JCIM
图2. FEP预测的RBFE ΔΔG值与所有8个生物靶标的实验数据之间的相关性
图片来源于JCIM
表2. XFEP和FEP+的性能综述(均方根误差kcal/mol)
表格来源于JCIM
图3. 8种生物靶标的预测相对自由能变化进行比较
图片来源于JCIM
图4. CDK2、Jnk1、p38和Tyk2化合物的ABFE预测值与实验数据之间的相关性
图片来源于JCIM
图5. 所有BRD4化合物的ABFE预测值与实验数据之间的相关性
图片来源于JCIM
表3. 突变引起SGPB与OMTKY3之间结合自由能的变化(实验和计算的ΔΔG数值比较,单位为kcal/mol)
表格来源于JCIM
表4. 单突变引起的阿西替尼与激酶Abl结合自由能的变化值(实验和计算的ΔΔG数值比较,单位为kcal/mol)
表格来源于JCIM
表5. 化合物CEP-701对MAP4K蛋白家族的选择性XFEP计算和实验测定值(单位为kcal/mol)
表格来源于JCIM
图6. 不同FFs下RBFE预测误差(ΔΔGexp – ΔΔGFEP)的概率密度分布
图片来源于JCIM
图7. 关于FEP预测的R2(左)和τ(右)实验值范围的变化(由高斯分布的标准差、σexp表示)和RMSE
图片来源于JCIM
结论总结
本篇文章,研究者提出了一个可靠的计算机模拟平台XFEP,可用于各种药物发现场景中的RBFE和ABFE预测。凭借其集成的基于云的框架和随时可用的协议,XFEP为药物发现项目提供了大规模FEP计算的高效和可负担的方式。这些进展,加上人工智能技术在目标导向分子生成和评估方面的应用,为FEP在药物发现阶段(靶点识别、靶点到先导物、先导物优化)的应用提供了更多的机会,不仅可用于开发R-基团替换和核心跳跃,还可以比较完全不相关的分子。从对给定生物目标具有验证性能的FEP协议开始,使用50-100个GPU,可以在1周内完成5000种设计化合物的可扩展FEP评估,其成本大约相当于合成一个新化合物的成本。预计将来,可扩展的FEP应用,与AI建模紧密结合,将在药物发现场景中得到更广泛的应用,以加速从临床前候选化合物提名阶段的进展。
参考文献
Zhixiong Lin, Junjie Zou, Shuai Liu, Chunwang Peng, Zhipeng Li, Xiao Wan, Dong Fang, Jian Yin, Gianpaolo Gobbo, Yongpan Chen, Jian Ma, Shuhao Wen, Peiyu Zhang, and Mingjun Yang, A Cloud Computing Platform for Scalable Relative and Absolute Binding Free Energy Predictions: New Opportunities and Challenges for Drug Discovery, Journal of Chemical Information and Modeling, 2021, 61, 6, 2720-2732. DOI: 10.1021/acs.jcim.0c01329.