中大唯信·唯信计算

引言

在保证安全性和生物学功能的前提下，寻找高亲和力的配体是小分子药物开发的目标。因此，精确预测结合自由能一直是计算机辅助药物设计中的一个重要方向，而使用建立在严密物理基础上的蒙特卡罗或分子动力学模拟方法一直被认为是解决此问题最严谨的方法。然而，高昂的计算成本及采样算法和力场局限性仍阻碍着这类方法的广泛应用。过去十年间，硬件及算法的不断发展，越来越多药企将相对自由能计算工具（如薛定谔的FEP+）纳入其药物研发流程。

最近，来自德国默克集团的研究者们展示了他们从2016年起的一项对FEP+的大型前瞻性研究工作。在这项研究中，作者们旨在将FEP+应用到所有合适的内部在研药物发现项目中，以达到三个目的：（1）对计算工具进行前瞻性盲评，（2）评估药物研发中普遍存在的时间限制、资源限制和信息限制对使用该方法效用的影响，（3）对此前2015年以来FEP+加入的新功能进行基准测试。从2016年到2019年，作者前瞻性地将FEP+应用于12个靶点和23个化合物系列，进行了超过35,000个独立扰动计算。最终，作者获得了6,000多个化学实体的有效预测，合成和测试了400多个预测得到的新颖分子，产生了大量的前瞻性数据，提供了该方法在典型小分子药物发现的实际流程中准确性的详细评估。

项目中自由能计算工作流程

在过去三年中，作者建立了一个用于在项目中部署自由能计算的工作流程（图1）。首先，作者通过收集可用的蛋白结构数据和实验测得的结合亲和力，对给定的靶点和感兴趣的化合物系列使用FEP的一般可行性进行的评估。在这一阶段，作者通常需要至少一个高分辨率的共晶结构，且其配体应属于靶点化合物类似物。这一严格的要求源于作者在三个项目中的失败经验，作者尝试在没有X射线衍射结构的情况下使用同源模建模型，结果均未获得令人满意的结果。虽然作者使用同源模建模型未能成功，但当作者使用蛋白晶体结构和对接技术获得复合物结构时，两个项目中一成功一失败。与实验结果不一致的那个项目中，后来获得共晶结构表明蛋白结合位点有相当大的柔性。在第一个项目中，作者无法与实验数据取得良好的一致性。后来获得的共晶体结构在结合位点显示出相当大的蛋白质柔性，尽管预测的结合姿势与晶体结构相对相似。而成功的项目中，后续的共晶结构与预测时的一致性很强。

图1 德国默克的自由能计算流程。

图片来源：Journal of Chemical Information and Modeling

一旦获得足够的结构数据，作者将收集具有实验结合亲和力的同类配体的数据集（至少10个配体，最好20个），以及有关生化和生物物理测定的所有可用信息。注意，关于配体数据集大小的建议是一个“经验法则”，通常在早期项目中其实很难获得更大的数据集。如果配体数据集足够大，则可以根据被修饰的分子的R-基团进行拆分，因为不同位点可能准确性不同。然后根据这些数据集进行回顾性自由能计算评估，将预测值与实验值进行比较。作者将这些回顾性的计算实验称为验证研究（System Validation）。在这一阶段，通常会评估不同的输入结构和体系设置，以便找到最佳参数用于以后的前瞻性计算。实际流程中，由于时间限制这一阶段通常只能评估3种可能的模型。

针对出现的较大的异常值（| ΔGpred – ΔGexp | > 2 kcal / mol），需要进行详细的分析以便了解的其产生原因。如果获得的RMSE pw < 1.3 kcal / mol且存在较大的异常值能够充分解释的话，通常可以认为验证研究成功了。尽管FEP所需的确切准确度取决于具体应用场景，如通常认为2 kcal / mol的准确度可用于对大型化合物库打分，但作者发现验证研究中使用更严格的阈值（RMSE pw < 1.3 kcal / mol）可以更大概率的保证在前瞻性预测中获得足够准确度（RMSE < 2 kcal / mol）。

理想情况下，如果数据集的动态范围合适则FEP预测也应产生良好的排名。但实际上，经常只有动态范围有限的数据集可用。在这种情况下，作者以“试用”方式进入了前瞻性预测阶段。作者预测了所有正在合成的分子，并在合成以后评估这些前瞻性预测的准确性。最后，作者再决定是否在生产模式（Production）下将FEP应用于该项目。

在成功完成验证阶段之后，FEP项目进入生产模式，对复合物构象进行前瞻性计算。这些新化合物必须与验证阶段的化合物足够相似。对于新的骨架和新的晶体结构信息，必须进行新的验证研究。作者在整个项目中密切监视前瞻性预测的准确性，并跟踪已合成了哪些化合物。所有数据存在数据库中，使用自动化的工作流程。根据作者的经验，这种对合成分子的持续监控以及及时更新的前瞻性预测准确性对于在项目团队中建立最初的信任以及随后监测衍生化合物何时超出模型的适用范围是必不可少的。

内部药物研发项目中的

FEP可行性和验证性研究

在三年的过程中，作者评估了28个靶点上FEP的可行性（图2 A）。作者对18个靶点和44个化合物系列进行了验证研究，并对14个靶点和25个化合物系列进行了前瞻性计算。大部分无法进行验证研究的靶点的主要原因是缺乏相关的结构数据（7个靶点）。总体而言，一旦有足够的结构和结合亲和力数据可用于进行验证研究，作者观察到FEP验证研究的失败率相对较低。图2 B显示了18个靶点在验证研究中的准确性。总的来说，作者获得了针对14个靶点和21个化合物系列的高精度（RMSE pw <1 kcal / mol）和可接受精度（RMSE pw <1.3 kcal / mol）的预测。在该计划的早期阶段，作者判断验证研究成功的标准较宽，因此了RMSE pw大于1.3 kcal / mol的一些系列也进入了生产模式。后续发现由于验证研究中准确率较低总会导致前瞻性预测准确度更低。预测准确率不仅在不同靶点之间而且在同一靶点蛋白的不同化合物系列之间都有差异。此外，在在研项目中前瞻性地使用FEP时，作者经常会面临各种各样可能影响方法准确性的挑战。图2 C显示了对这些挑战的定性评估。几乎所有项目都有至少一个方面可能影响在其中应用自由能计算。毫无疑问，现实生活中的药物发现项目并不是理想的案例方案。

在作者尝试进行验证研究的项目中，作者遇到的最常见挑战是至少一部分配体的结合模式存在不确定性，并且由于怀疑的蛋白质构象变化而导致蛋白质结构存在不确定性（分别为66％和44％）。在六个项目中，作者发现实验数据的来源会影响作验证研究是否成功的判断。在一种情况下，作者最初将预测的亲和力与功能分析的结果进行了比较，发现偏差较大。但是，在将相同的预测亲和力与SPR数据进行比较时，作者发现了很好的一致性，因此决定将系列推向生产模式。在四个项目中，作者发现小分子力场的参数可能无法准确描述相互作用。在其中两个项目中，使用更高版本的OPLS3e力场提高了验证研究中使用的配体组的准确性。在一个项目中，力场的变化与部分电荷有关。在另一个项目中，该化合物具有取代脂肪环。而最近版本的Force Field Builder中对该环中扭转电势进行重新参数化，提高了预测的准确性。然而对于三个出现较大离群值的项目，作者使用较新版本的力场进行重新计算也并未改善结果。

图2 内部项目的FEP可行性、验证结果和挑战。（A）对28个靶点进行FEP评估的结果。（B）使用FEP +进行验证研究的结果。（C）在所有项目中都可能遇到预测准确性方面的挑战。