Nature | 计算如何将化学废弃物转化为药物?

Nature | 计算如何将化学废弃物转化为药物?
Nature | 计算如何将化学废弃物转化为药物?

基于正向合成Allchemy平台,从大约200种商业规模回收的废弃化学品中得到了巨大的合成网络并从中检索出数以万计的路径,可生产大约300种重要的药物和农药,用算法按可持续化学的公认指标对这些合成物进行排名。通过实验验证了其中几种途径,包括在“按需制药”流动化学平台上的工业现实演示。

背景介绍

化学工业持续产生了大量的化学废料,科学家一直致力于设计循环化学方案以有效地将这些不需要的材料,至少将一部分转化为有用的产品。尽管在某些类别有害化学品的降解方面取得了重大进展,但将废弃基质转化为有价值产品的工作尚未有重大突破。

到底哪些有价值的产品可以从不同的化学废弃物中合成呢?这个综合分析是很困难的,因为即使是很小的一组废弃物基质,也可以在几个步骤内产生数百万个假定的产品,每个产品都可以通过形成紧密连接网络的多条路径进行合成。光是追踪所有这些合成并选择那些符合“绿色”化学标准的合成就已经超越了人类化学家的认知。

或许,计算机可以帮我们做到这一点?这篇文章就向我们展示了计算机广泛的合成知识及强大的学习能力。

研究者所有的分析都是基于Allchemy收集的大约10,000个通用反应性反应形式,包括但不限于化学工业中常见的强反应类型,特别是制药、农化和香料。这些反应规则比机器提取的变换形式更广泛,也更准确,而且专家编码方法已经通过大量计算机计划合成的成功实验执行得到验证:比如在Allchemy中理解生命的起源,在合成中使用了一套不同的逆转录合成规则用于药物和复杂的天然产物的合成。

Allchemy web网址

https://waste.allchemy.net

Nature | 计算如何将化学废弃物转化为药物?

图1. 从各种工业化学废弃物中回收小分子的例子。图片来自Nature

反应网络的构建

化学废弃物的概念可能有不同的含义,在这里,研究者考虑了189个可作为底物的小分子,同时确定是大规模工业过程的废弃物副产品(图1)。在算法的最基本版本中,每一代合成产物G所产生的分子都与前几代的产物和原始底物相结合,并重复这个循环,直到达到用户定义的合成世代极限(图2a)。然而,由于通过这种方法创建的反应网络(图2b)随着底物数量和代数的增加而迅速扩展(图2c, d),因此,研究者倾向于生成以合成感兴趣的高价值分子为目标的网络。

在这种方法中,只有当每一代合成产品够小(分子量(MW) < 150)才能作为后续合成的有用构件,或者分子量处于150到500之间,但与至少一种目标药物或农药相比,谷本相似度阈值高于指定的指纹阈值。

对相似度阈值进行调整,使每一代之后网络中保留的分子总数不超过用户定义的限制(搜索的“宽度”,通常为W = 10,000-100,000)。通过这种方式,能够将传播网络从大型基质集合(数百个到超过1000个分子)扩大到第7代甚至第8代,并评估跨越数亿个分子的合成空间。在多核工作站上,这样的计算需要几天的时间。

Nature | 计算如何将化学废弃物转化为药物?

图2. “正向”合成网络的生成与性质。图片来自Nature

 

Nature | 计算如何将化学废弃物转化为药物?

图3. 从废弃底物和一些在有机合成中经常使用的简单辅助分子开始的更高级药物的合成案例。图片来自Nature

合成网络的案例

第一个大规模网络是从189个废弃基质的“基本”集传播而来,W = 10,000-30,000,一直到第7代。在由这个网络组成的大约3亿个分子中,该算法识别出69种药物和98种农药,表明每个目标需要1 – 2081次合成。

然而,单是“废弃物”显然缺乏合成灵活性,无法构建更复杂的骨架。考虑到这一点,研究者的第二次计算用前面提到的1000种基本试剂和流行试剂增加了废弃物基质的集合。使用更“聚焦”的宽度参数W = 10,000和G8来传播网络,产生了超过1.6亿种可合成化合物,包括71种额外药物和20种农用化学品。

这些靶点在结构上比第一个网络更复杂,包括一些世界上最常用的处方药(例如缬沙坦、米拉贝隆、多非利特)。图3等显示了一些根据成本函数排名靠前的路径:只有在少数情况下,它们涉及受管制的中间体(例如,合成卡维地洛时的芳酰肼,合成双异丙酚时的环氧乙烷)或方案中没有提出更绿色替代品的溶剂和/或试剂(例如,合成缬沙坦时的四唑环时的叠氮,合成米拉贝隆时的重氮甲烷)。

仅按途径长度排序可产生一条聚合路线(蓝色反应箭头),该路线始于受EPA-调控的烯丙醇,在光信反应中依赖使用有毒和潜在致癌的二异丙基偶氮二羧酸盐(DIAD)和三苯基膦,在臭氧分解中依赖使用臭氧。惩罚使用有害物质的成本函数排在最前面的是一个更线性的途径(紫色箭头),而烯丙醇不是,同时,问题步骤被更温和的溴化反应(NH4Br, Oxone条件)和SN2反应取代。

最后,研究者考虑了一个支持特定商业操作的网络,即按需制药(ODP)去中心化和完全自动化的药品和活性药物成分(APIs)生产。以广泛的探索宽度(W = 40000-107000)扩展到G5,产生了大约3.5亿个分子的空间,包括另外27种药物和11种农药。ODP确定了用于呼吸性COVID-19患者急需的药物和/或其中间体:顺阿曲库铵(一种肌肉松弛剂)、咪达唑仑(一种镇静剂)和异丙酚(一种麻醉剂)。

实验验证

研究者挑选了算法在上述网络中追踪的几条路径进行了实验验证。最初,研究者进行了如图4所示的实验室规模的合成,目的仅仅是确认计算机设计方案的总体正确性。

Nature | 计算如何将化学废弃物转化为药物?

图4. 在实验室规模的合成中,对选定的计算机设计的路径进行实验验证。图片来自Nature

其次,研究者使用ODP的流动化学平台,加入掺入次品的废水(以模拟来自不同地点不同供应商的不同质量的起始材料),在更大的规模和现实的工业环境中测试了计算机规划的路线的适用性。具体来说,在连续生产顺阿曲库铵、咪达唑仑和丙泊酚等战略性中间体的过程中,ODP建立了战略性隔离点,以确保高质量的产品(图5a-c)。

对于顺阿曲库铵中间体(22),高藜芦酸(20)作为起始物质和第二底物高藜芦胺(21)的潜在进入点。在香草酸和愈创木酚(都代表潜在的废弃物流掺假)存在下,生成了20的酸氯衍生物,随后进行反应和分离,结果表明对产品质量没有影响。值得注意的是,与20(1.33)或21(1.21)相比,22的Allchemy计算的logP值(2.62)有很大的不同。 

Nature | 计算如何将化学废弃物转化为药物?

图5. 在自动化、模块化的ODP平台上合成COVID-19重症监护室药物或其中间体。图片来自Nature

对于苯二氮杂卓家族成员咪达唑仑,ODP的进入点是溴乙酸(23)和市售2-氨基-5-氯-2′-氟苯甲酮(24,logP = 3.29),有大约97家供应商提供。批量实验表明,当二苯甲酮被10 mol%的硝基苯和氯苯污染时,对内酰胺转化的影响最小。在生产过程中,二苯甲酮与溴乙酰氯反应,溴乙酰氯也是由相应的酸和草酰氯生成的,通过10小时的反应得到48 g的乙酰胺,高效液相色谱法的LCAP为91.6%。

最后,在异丙醇中以4-羟基苯甲酸(26;由木质素废料制成)为原料制备了脂溶性麻醉剂异丙酚(28)。利用该起始物质与3,5-二异丙基-4-羟基苯甲酸中间体之间logP值的显著差异(27,DIHA;logP = 3.37),使得连续搅拌槽式反应器与同时进行的重力分离和沉淀相结合,最终为成功清除原料中的杂质提供了多种途径。

总结

本文表明:配备了全面的化学反应规则的计算机可以迅速追踪和排序前所未有数量的循环合成,以开发新的、生产性的工业化学废弃物用途。

Allchemy等应用如果在整个化工行业被采用和共享,将会产生巨大的影响——例如,一些公司输入他们希望处理的废弃基质,另一些表明他们想要合成的产品,还有一些人竞标执行由机器计划(或启发)的废弃物到药物的合成。在执行这些任务时,可以设想软件之间的协同作用,如Allchemy(指导化学家找到潜在的定价机会)和分布式制造网络,如ODP(利用当地可用的废弃物流快速和经济有效地部署多个生产单元)。这样一个全工业的系统,将有助于使循环化学的努力得到回报,但其实施可能需要监督化学工业的行政机构给予奖励。

参考文献

Wołos, A., Koszelewski, D., Roszak, R. et al. Computer-designed repurposing of chemical wastes into drugs. Nature 604, 668–676 (2022). https://doi.org/10.1038/s41586-022-04503-9

X