JCIM | BFEE2:自动化、流程化的精确绝对结合自由能的计算

JCIM | BFEE2:自动化、流程化的精确绝对结合自由能的计算

背景介绍

结合自由能计算在许多研究中发挥着重要作用,但计算过程繁琐易错,让人望而却步。许多步骤需要人为干预,缺乏标准,他人难以复现。BFEE2软件在严谨的理论基础上对绝对结合自由能计算进行了标准化和自动化,尽量减少人的干预,使计算结果准确、可复现。BFEE2仅需要蛋白质-配体结合复合体就可以进行自由能计算,不仅提供GUI方便使用,也提供CLI方便批量计算,兼顾易用性和专业性,使更广大的用户群体可以进行更可靠准确的绝对结合自由能计算。不管是炼金术(alchemical)路线还是几何(geometrical)路线, 准确的绝对自由能计算都分包含多个步骤, 且需要引入几何约束。然而人为干预,比如定义CVs(collective variables)、准备输入文件、监控模拟过程、后处理,不仅枯燥、麻烦,而且容易出错。为了实现自动化和流程化(Streamlined)的自由能计算,特别是面向非专业用户,第二代结合自由能评估器(binding free energy estimator,BFEE2)提供了标准化的炼金术和几何自由能计算流程,去除人为干预以保证计算结果的完全可重复。为了最大化覆盖蛋白质-配体复合体,或者更广泛的主体-客体复合体,BFEE2支持绝大多数学术力场,如CHARMM、Amber、OPLS、GROMACS。可以生成NAMD和Gromacs格式的配置文件,且所有的后处理都可以自动化。最后,自由能计算是否收敛可以通过模拟过程中生成的中间文件判断。总而言之,BFEE2是一个简单易用、功能强大的准确自由能计算工具,可以帮助用户实现广泛的应用。

标准化自动化的CV定义

自由能计算时,CVs(又称反应坐标、广义坐标)的选择是非常重要的一步,作者选用科学严谨七自由度CVs,见图1A。以蛋白质-配体复合体为输入,定义7个自由度分别为用球坐标(r,θ,φ)表示配体的平移变化,蛋白质以固定朝向放在球坐标的中心。其中 r 为蛋白质质心到配体质心的距离。以结合状态的配体为参考,计算欧拉角(Θ,Φ,Ψ)和RMSD,表示配体的旋转变化和构象变化。由于欧拉角有万向锁问题,配体的旋转会先转化为四元数,再转化为欧拉角。由于七自由度CVs可以根据复合体自动生成,这使标准化和自动化地准备所有输入文件成为可能。

流程化的多步自由能计算

在BFEE2中,绝对自由能计算被分解为4步:1)构建复合体;2)准备输入文件;3)MD模拟;4)后处理(计算并扣除几何约束对自由能的贡献),见图2所示。第1步构建复合体,用户可以使用他们熟悉的软件准备坐标和力场拓扑文件。第2步,用户需要根据蛋白复合体的情况选择使用炼金术路线还是几何路线。几何路线是计算实际三维空间中的配体结合过程,比较适合配体结合位置比较靠近表面的体系。炼金术路线让配体逐渐“消失”和“出现”,可以应用在配体包埋比较深的体系。

实现方法

BFEE2由Python实现,整合的软件和模块有:1) Qt5 + PySide2实现GUI;2) MD Analysis解析各种结构和拓扑文件;3) Matplotlib负责作图;4) VMD作为外部依赖生成PSF和PDB文件;5) Colvars负责CVs计算;6) NAMD或者Gromacs负责MD模拟。

主要结果

为了测试BFEE2的可靠性,作者选取了4个体系进行不同策略的绝对结合自由能计算,力场统一使用CHARMM36m(蛋白质)+ CGenFF(配体)+ TIP3P(水模型)。计算结果相对实验结果误差都小于 1 kcal/mol,见表5,这在流程化的自由能计算中,已经是极高的精度。

图表汇总

JCIM | BFEE2:自动化、流程化的精确绝对结合自由能的计算

图1. 定义蛋白质-配体的CVs(A)

炼金术绝对自由能计算流程(B)

图片来源于JCIM

 

JCIM | BFEE2:自动化、流程化的精确绝对结合自由能的计算

 图2. BFFE2功能示意图

图片来源于JCIM

 

JCIM | BFEE2:自动化、流程化的精确绝对结合自由能的计算

表1. 几何路线结合自由能的计算流程

表格来源于JCIM

 

JCIM | BFEE2:自动化、流程化的精确绝对结合自由能的计算

表2. BFEE2采用的默认的模拟参数

表格来源于JCIM

 

JCIM | BFEE2:自动化、流程化的精确绝对结合自由能的计算

表3. BFEE2采用的默认的自由能计算参数

表格来源于JCIM

 

JCIM | BFEE2:自动化、流程化的精确绝对结合自由能的计算

表4. 在本研究的四个体系中用于自由能计算的分层窗口数和模拟长度

表格来源于JCIM 

表5. 在本研究的四个体系中分子模拟的细节

表格来源于JCIM

亮点总结

尽管已经有不少自由能计算辅助软件,如基于Python的YANK(炼金术路线)、基于网页的CHARMM-GUI(炼金术路线)、BFEE 1.0 (几何路线),BFEE2应该是第一个将炼金术路线和几何路线的绝对结合自由能计算统一到一个框架中的软件,通过标准化,进而自动化,这不仅提高了自由能计算的可用性,也提高了计算结果的可复现性,更方便不同方法比较,促进自由能计算方法的发展。

资源

Conda安装:conda install -c conda-forge BFEE2

pip安装:pip install BFEE2

源码:https://github.com/fhh2626/BFEE2

开源协议:GPL-3.0 License

 

参考文献

Haohao Fu, Haochuan Chen, Wensheng Cai, Xueguang Shao, and Christophe Chipot, BFEE2: Automated, Streamlined, and Accurate Absolute Binding Free-Energy Calculations, J. Chem. Inf. Model., 2021, 61, 5, 2116-2123. DOI: 10.1021/acs.jcim.1c00269.