Nature Reviews | 人工智能时代药物设计的思考

引言

人工智能(AI)正越来越多地被应用于药物研发过程中。一些观点认为人工智能可以极大地促进药物研发,而另外一些则仍然持保守态度,在观望AI技术的影响。现实中大多数人的态度可能处于此两者之间,但是很明确的一点是AI技术给科学家以及生物制药行业都带来了极大地影响。本文就小分子药物研发中AI技术的应用,对众多国际专家的观点进行了归纳和总结。

Nature Reviews | 人工智能时代药物设计的思考

获取适当的数据集

一套标准的数据集对建立AI预测模型至关重要。如果凭借有限的数据以及局限的理解来进行预测,那么即使是很复杂的模型也无法产生有用的结果。其中的一个重要的影响因素是数据集的适用范围,比如说,很多课题组都在建立毒性模型来预测分子毒性,但是使用的是体外毒性数据集建立的模型,与体内毒性预测有差距;另外一个建立适当数据集的困难是偶然性错误数据,错误数据可以是简单的错字形式,包括科学文献中报告并存储在数据库中的报告值,基因标识符或其他参数,甚至一个或两个错误的数据点都有可能使预测模型的结果产生偏差;另一个挑战则是,在很多情况下,实验数据无法轻易的转化为单个数字,例如:生化解离常数(Kd)或半数有效浓度(EC50),而目前AI常常被用于建立分类预测模型。

产生新的假设

尽管HTS(高通量筛选技术)有了很大的进步,但实际上我们在寻找新的治疗方法以及药物时,仅仅探索了很小的一部分化学空间。最近进行的超大规模的虚拟筛选也只是进行了1.7亿个化合物的对接,但是对于整个类药化学空间10^18–10^200来说,仍然是很小的一部分。巨大的数目使得穷举整个化学空间变的十分困难,因此药物设计本质上可以归纳与下一步要做什么,药物化学家从以往的经验中归纳出灵感并进行基团的替换以提高药物活性。

可以将化学设计视为模式匹配,显式化学转化(例如,基于反应SMILES的虚拟反应方案)和装配规则(例如,片段生长),这些生成模型隐含地表示了化学知识,即基于数据分布的统计概率。换句话说,这两个概念不再是传统教科书化学,而是一种新的化学语言。利用提供的新假设的模型和数据以测试这些假设并改进对应的机器学习模型,形成了一个虚拟循环,该循环就可以创建一套完整的化学空间自我学习系统。 

Nature Reviews | 人工智能时代药物设计的思考

图1. 新的假想与机器学习

图片来源Nature

多目标优化

药物研发过程中需要对多个目标进行平衡,包括活性,选择性,清除率和渗透性。但是,针对这些属性之一进行优化可能会对其余属性造成不好的影响,这样的问题称之为MOO(也称为多目标优化,多参数优化,多属性优化或Pareto优化)。多目标优化旨在发掘所有满足临床前候选药物理想特征的化合物。理想情况下,AI通常会采取以下形式来优化分子的各种性能指标。例如通常表示药物的吸收性能ADMET可以用下列特征来表示:水溶性,代谢稳定性,细胞通透性,与细胞转运蛋白(例如P-糖蛋白)的作用,药物–药物相互作用。

从历史上看,MOO的算法主要由“遗传算法”决定,该算法使用变异和交叉操作以及适应性的概念来进行优化步骤。这些方法已被那些更多样化的操作所取代。现在经常与机器学习方法协同作用。因此,这些算法优化和机器学习领域之间的交叉可能会导致药物研发领域更快的发展。

Nature Reviews | 人工智能时代药物设计的思考

图2. 多角度优化分子

图片来源Nature

减少周期时间

潜在先导化合物的识别以及NCEs的优化需要巨额的投资以及大量的时间,并且在药物研发过程中所有阶段失败的风险都很高。为了解决这个问题,制药行业一直在投资于其化合物分析功能。在药物发现中,将先导分子的特征提高到候选药物级别的过程称为设计-制造-测试-分析(DMTA)周期。这种基于假设的经典方法首先使用可用数据来进行假设并设计分子(或从库中选择现有分子),随后合成设计化合物,并用适当活性测试法进行测试,以研究假设是否正确并加强理解。然后,对这些知识进行分析并将其转化为下一个周期的设计假设的基础。AI的某些方面可能为HTS提供替代方案。无需依赖大型筛选化合物库,而是可以在每次操作中合成少量化合物,并且仅以测试所需的量进行合成。AI为提高DMTA效率提供了一系列选择,包括整合和分析所有可用的实验数据和预测数据,以支持化学家和设计团队的分析以及分子从头设计。通过提供改进合成路线和优化反应条件,AI模型可以使化学家遵循最有效的路线,从而最终缩短“制造”阶段。

Nature Reviews | 人工智能时代药物设计的思考

图3. 通过自动化减少周期时间

图片来源Nature

改变AI研究文化和思维方式

除了技术问题外,人工智能在药物研发中的成功应用的最大挑战还在于培养相关人员的适当思维方式以及相对应的文化氛围,以使他们愿意应用这些计算模型并使用其结果。在药物设计领域中,利益相关者包括来自各个学科的研究人员以及商人,各方对机器学习的认知程度并不相同。要做到这一点,首先要认识到各个利益相关者的不同经历,然后发展通用的术语和规范。在大学层面上要促进这种趋势则需要教育和指导学生进行批判性思维,使其变得自我反省,包容其他的思维方式,学生就可以向同事(包括其他研究领域的人员)或者广为广阔的受众来解释AI可以在哪些领域进行扩大以及支持相关的发展(而不是进行替代)。

展望

制药公司已经开始应用AI相关技术以及各种机器学习方法,但是并没有将全部的赌注都压在AI上面,这是可以理解的。考虑到药物研发的复杂性和受监管的特性,建议采取一种好奇而谨慎的态度进行尝试。在药物设计中开发AI应用程序时需要长期的时间,但AI可以提高所涉及的各个研究过程的效率,并减少研究文化之间的壁垒。

参考文献

Schneider, P., Walters, W.P., Plowright, A.T. et al. Rethinking drug design in the artificial intelligence era. Nat Rev Drug Discov (2019). DOI: 10.1038/s41573-019-0050-3