引言
不对称催化是探索新的化学空间的一种方法,今天的计算能力足以协助这一探索。不幸的是,现有技术通常需要专业的计算知识而导致其未在合成化学中被充分利用。加拿大麦吉尔大学Nicolas Moitessier团队联合Molecular Forecaster公司和阿斯利康研发中心共同开发了Virtual Chemist平台,实验化学家仅需在电脑旁单击几下就可预测不对称化学反应的结果。在1 kcal/mol的精度范围内可指导化学家设计和发现不对称催化剂。
背景
为设计新颖的有机合成方法以获取新化合物,化学家通常利用大量有机化学工具来开展工作,尽管计算化学已被用于帮助解释某些现象和提出新机制,但相比于NMR,MS和质谱来说,计算化学因需要编程知识而在合成化学领域较难被实验人员运用。在该领域中,不对称合成是产生大量高纯度手性分子的有力方法,但仅用传统的实验技术去发现有机催化剂或过渡金属催化剂来探索化学空间显得十分具有挑战性且乏味,迫切需要一款既简单高效又准确实用的计算工具。
初步考虑及界面简介
对有机化学家而言,一款工具必须在不牺牲准确性的情况下解决可访问性的问题,该问题通过化学家与技术的交互来解决,例如指定特别想要的化合物属性。理想情况下,一个平台应该无缝执行所有三个发现催化剂的过程(准备潜在催化剂分子库,评估催化活性,评估对映选择性)而无需人工干预。作者扩展了他们的药物发现平台FORECASTER来创建一个新的平台Virtual Chemist,该平台的用户界面(UI)包括一个2D结构绘制器用于输入催化剂和底物结构,以及一个三维图形界面用于可视化计算出的TS结构。UI中还汇总了所得数据(如,TS结构的势能和对映选择性)。整个工作流已变成一个通用模块可以很好地被研究人员使用。
图1. 二乙基锌加成为醛的催化剂筛选流程
图片来源:Nature Catal.
四种应用场景
1. 一对一设计
化学家可能希望一次测试一种催化剂以确定最有潜力的,在这种情况下,可以用2D绘制器绘制每个催化剂,TS模板可以直接使用或从文献数据中构建。作者测试了7类反应中共超过350个反应并和随机预测结果比较以评估方法准确性。发现,平台的整体平均误差在0.94~0.97kcal/mol,1kcal/mol是量化和催化反应的金标准。另外,平台还能够从良好的不对称催化剂(90% e.e., ΔΔG‡ ~1.4 kcal mol–1)中区分出差的(0% e.e., ΔΔG‡ ~0 kcal mol–1),从极好的非对称催化剂(99% e.e., ΔΔG‡ ~2.8 kcal/mol–1)中区分出良好的。数据表明该平台可用于通过与化学家的互动来评估不对称催化剂,并促使开展更大规模的虚拟筛选。
图2. A:七大类反应的TS态的2D和3D表示;B:一对一设计的准确性
图片来源:Nature Catal.
2. 筛选手性分子库
化学家可能正在寻找新的化学系列作为已知反应的催化剂,例如Shi环氧化和有机催化的Diels-Alder反应。作者从ZINC库中为DA反应组装了大约14万个含手性胺的分子库。通过计算分子描述符来筛选感兴趣的分子(MW<500,不带电荷,除去仲胺、醛和其他反应性基团),然后去掉与任何已知催化剂过于相似的分子并选择最多样化的分子,程序DIVERSE确保不遗留重复项,这样最终剩下1307种候选催化剂进入下一轮筛选。对这些胺的评估分两步进行,根据反应性过滤得到798个分子,由ACE计算各分子TS的立体选择性,将6种催化剂加入到库中以评估ACE回收这些结构的准确性。以相同的过程从手性酮开始搜索Shi环氧化催化剂,最后向库中添加18种已知的立体选择性催化剂。图3表明大多数已知的立体选择性催化剂的排名很高(图3c,AUROC:Shi环氧化的为0.79,DA的为0.92),平台可以筛选多种化学物质并发现新的化学系列的不对称催化剂。
图3. 筛选新型不对称催化剂的准确性
图片来源:Nature Catal.
3. 优化先导化合物
化学家可能有一个先导化合物需要优化结构以提高选择性。合成了手性吡咯烷衍生物作为DA环加成反应的有机催化剂进行测试。先合成亚胺,然后使其与手性双极性亲核试剂反应生成三种潜在的非对映异构体,这些吡咯烷均在endo-Diels–Alder和exo-Diels–Alder环加成中进行评估,极大的减轻了实验工作量。数据显示该先导化合物优化的平均误差低至0.33 kcal/mol,该项目在几天内就可在标准PC上完成且可扩展到数百个类似物。
图4. DA环加成反应的不对称有机催化剂的优化
图片来源:Nature Catal.
4. 评估催化剂的底物范围
化学家可以用平台来评估给定催化剂的潜在底物范围。该计算选择(DHQD)2PHAL这种用于非对称二羟基化反应的市售催化剂进行模拟。模拟结果表明,该催化剂在约25%的底物上具有很高的对映选择性(≥97% e.e.),在约20%的条件下选择性很差(≤40% e.e.),与实验数据十分吻合。但与其他反应相比,二羟基化的结果重现性较差,这是由于用于该反应的催化剂分子更大更有柔性,这暗示了该方法的局限性。要充分搜索此类系统的构象空间,可能需要更多的时间和计算资源。每次计算运行5次,预测的对映体选择性平均在67%~76%e.e.之间变化,而实验值为73.6%e.e.,与实验数据有良好的相关性(r2: 0.51~0.64)。
图5. 使用(DHQD)2PHAL进行底物范围的研究
图片来源:Nature Catal.
小结
Virtual Chemist平台旨在帮助实验化学家更好地使用计算化学的工具完成不对称催化项目。该平台对用户友好工作流程可以进行高度自定义且准确性已在4个实际方案中得到了证明。虽然会有基于MM的计算受限于当前FF限制和模拟可能陷入局部能量最小值的障碍,但大多数情况下,平台能以较好精度识别出好的不对称催化剂,化学家可在几小时内测试自己的想法。
工具下载地址
www.molecularforecaster.com
参考文献
Mihai Burai Patrascu, Joshua Potte, Sharon Pinus, Michelle Bezanson, Per-Ola Norrby and Nicolas Moitessier, From Desktop to Benchtop with Automated Computational Workflows for Computer-aided Design in Asymmetric Catalysis. Nature Catalysis, 2020, 3, 574–584. DOI: 10.1038/s41929-020-0468-3.