Nature Communications | 整合药物大数据与贝叶斯方法大规模预测药物靶点

简介

药物靶标识别是药物研发过程中的重要一步,也是最复杂的环节之一。为了解决这个问题,作者开发了一种贝叶斯机器学习方法BANDIT (Bayesian ANalysis to determine Drug Interaction Targets) 以预测药物结合靶标。作者整合了大量的公共数据来训练此模型,并在2000多种小分子的数据集上进行测试, BANDIT的预测准确率为90%。然后,在对14,000多种化合物的靶点进行预测过程中,BANDIT计算出约4,000种未知的分子靶标。随后BANDIT被应用于预测临床开发阶段的靶点未知的抗肿瘤药物ONC201的靶点,通过实验验证了BANDIT预测的准确性,并且此靶点信息推动了相关临床试验进展。最后,BANDIT也可用于确定不同药物类别之间的联系,从而阐明无法解释的临床现象,进而可以进行药物重定位。总体而言,BANDIT是一个高效,准确的药物靶点预测平台,可加快药物靶标发现和临床应用的速度。

Nature Communications | 整合药物大数据与贝叶斯方法大规模预测药物靶点

图片来源 Nature Communications

背景

药物从实验到临床,通常需要数十年和十几亿美元的投入。对于一些从天然产物以及表型筛选中筛选出的小分子,研发过程中最大的瓶颈就是确定药物靶标。正确理解药物的作用靶标可以准确的定位药物的适应症范围以及患者范围,也可以进行更好的药物类似物设计,并解释药物不良事件。一个优秀的靶点预测模型可以减少识别药物研发的时间和资源。传统的计算方法,①基于配体的方法需要药物的全面信息;②分子对接则需要大量的算力和已解析的蛋白质3D结构。为了克服这些限制,作者构建了药物靶标预测平台BANDIT。BANDIT集成了许多不同类型的药物数据,与使用单数据类型的模型相比,BANDIT的预测能力更强。

集成药物开源大数据提高预测准确性

BANDIT整合了来自六种不同数据类型的20,000,000个数据点,包括药物功效数据,治疗后转录反应数据,药物结构数据,已报告的不良反应数据,生物活性数据和已知靶标数据。这些开源数据被整合以预测药物与靶标的相互作用。整合后数据库包含约2000种药物的信息,1670个已知靶标以及100,000多种孤儿化合物(无已知靶标的化合物)。

对于每种数据类型,BANDIT会计算已知靶标的药物对的相似性得分。由于每个数据集使用不同的报告指标,因此相似度计算会依赖于特定的数据类型。使用整合的数据库,作者发现不同相似性评分之间几乎没有相关性,每种数据类型都可以在不同方面表征分子活性,而整合多种数据类型可以显著提高预测的准确性。 

Nature Communications | 整合药物大数据与贝叶斯方法大规模预测药物靶点

图2. BANDIT的预测能力

图片来源 Nature Communications

BANDIT揭示了ONC201的作用靶标

BANDIT可用于识别孤儿药靶标,作者研究如何将BANDIT整合到药物开发流程中,并测试其预测药物靶标的能力。作者将BANDIT应用于ONC201,一种通过表型筛选出的孤儿药,目前正在被应用于针对于癌症的多个II期临床试验中。尽管其表现出临床前和早期临床阶段的抗癌活性,但该化合物的真正靶标仍然是未知的。

通过计算 ONC201与数据库中所有已知靶标的药物之间的似然比。预测结果表明,ONC201最可能的靶标是多巴胺受体,为G蛋白偶联受体(GPCR)超家族的成员。体外实验也表明,ONC201选择性拮抗多巴胺受体,这是肿瘤药物的非常规靶标。这些结果表明了BANDIT能够加快药物研发。

Nature Communications | 整合药物大数据与贝叶斯方法大规模预测药物靶点

图3. BANDIT预测ONC201的作用靶标

图片来源 Nature Communications

 

BANDIT可用于识别药物空间中的相互联系

BANDIT可以用来描述整个临床领域中不同类别的药物之间的潜在关系。基于药物对之间的TLR,作者构建了一个网络来展现药物空间。每种药物均根据其Anatomical Therapeutic Chemical(ATC)编码进行分类,ATC分类标准即为药物类型和预期用途。如预想的那样,ATC类似的药物会聚在一起,与此同时,BANDIT还发现了一些新奇的药物机制或相互作用。通过BANDIT揭示的药物空间信息,作者发现已知的β-受体阻滞剂与许多帕金森氏药物在空间上紧密相关。目前β-受体阻滞剂被用于减少帕金森氏症患者的震颤,而这一临床应用充满争议,BANDIT的预测可有效的推动争议的解决。药物空间上的聚类也表明了可能具有相似的潜在副作用,抗逆转录病毒药物通常会引起新陈代谢副作用,例如高胆固醇血症。总的来说,BANDIT可以通过预测药物组合连用,药物潜在副作用,来对药物重新定位,从而促进未来的药物研发。

Nature Communications | 整合药物大数据与贝叶斯方法大规模预测药物靶点

图4. BANDIT可以预测药物的作用机制以及相互关系

图片来源 Nature Communications

总结

BANDIT涵盖了药物靶标的识别,临床候选药物开发和药物再利用的整个阶段。研究人员可以利用此工具快速预测药物靶点,简化开发工作,节省时间和资源。 此外,BANDIT可用于快速筛选大型化合物数据库,并对一些潜在的,有前景的疗法进行有效评估。

参考文献:

Madhukar, N.S., Khade, P.K., Huang, L. et al. A Bayesian machine learning approach for drug target identification using diverse data types. Nat Commun 10, 5221 (2019) doi:10.1038/s41467-019-12928-6