Walter Kohn和John A Pople两位科学家分别因“密度泛函理论”和“量子化学计算方法”研究获得了1998年的诺贝尔化学奖, 他们的成果使化学发展成为理论与实践相结合的科学, 可以说是化学领域的一次革命. 2013年诺贝尔化学奖又授予3位科学家Martin Karplus、Michael Levitt和Arieh Warshel, 以奖励他们“在开发多尺度复杂化学系统模型方面所做的贡献”. 他们将经典物理学与量子化学相结合, 在计算机的辅助下, 揭示了化学反应过程包含的每一个步骤, 从而解决了传统化学实验无法解决的难题, 这无疑是化学史上里程牌式的发现, 使得利用量子计算解决化学问题的研究得到了飞速发展. 此外, 有关“量子信息科学”领域的开创性研究更是获得了2022年的诺贝尔物理学奖. 由此可见, 基于量子信息的计算化学已将传统的实验化学带入了信息化时代, 未来有可能与人工智能(AI)一起对催化科学这样一个一直以来以经验为主的实验科学发生颠覆性的变革.
量子化学通过量子力学来深入研究原子系统的物理化学性质, 因此需要求解薛定谔方程找到正确的波函数. 然而目前精确的求解方案只适用于非常小的原子系统, 在大多数情况下, 研究人员不得不求助于各种近似的量子化学方法, 将近似值代入薛定谔方程以减少计算时间, 但却是以牺牲准确性为代价的. 近年来计算科学和人工智能的发展, 在量子化学的基础上加入机器学习, 可突破传统量子化学的局限性. 机器学习可以说是对量子化学的重要补充, 在具有良好的训练数据和机器学习算法的条件下, 量子机器学习无需求解每个原子系统的薛定谔方程便可预测所需的量子化学性质而不损失精度, 计算速度比传统量子化学方法快很多数量级[1]. 随着机器学习算法开发的进步、实验数据的增加以及软件和硬件资源的改进, 量子机器学习在许多领域取得了显著的进展, 例如在化学领域, 材料和药物设计的高通量筛选达到了前所未有的规模[2]. 量子机器学习为信息化的化学学科开辟了“新纪元”, 已成为加速科学研究和技术发展的常见而有力的工具[3].
量子化学计算中的密度泛函理论(DFT)长期以来都是催化研究的主要手段, 但对于催化这样一个复杂、多维、多尺度的研究领域, DFT的计算成本太高, 极大限制了催化研究的发展. 例如在催化材料的筛选、自由能的计算、分子动力学模拟等方面需要数千甚至数十万次的计算, 非常耗时. 尽管有时加入经典物理学原理可提高DFT计算速度, 但依然缺乏准确性, 且很难系统性地改进. 通过量子机器学习可以有效地从DFT计算中建立模型, 从而预测过于庞大而无法用DFT计算的数据, 有助于研究者理解催化研究、产生关于催化的新知识并指导化学实验[4]. 研究人员通过收集高质量的实验或模拟数据建立数据库, 然后将这些数据分成训练集和测试集, 接下来, 量子机器学习算法不断调整内部参数以减少拟合误差, 直到在测试集上达到较高的分类或预测精度. 经过这一流程可快速、准确地预测理想性能的催化剂设计参数、最佳的催化剂材料的合成方法和反应条件以及催化剂结构和性能之间的关系[5]. 作者从量子机器学习应用于催化化学研究中催化材料的设计、催化反应性能和催化反应机理等方面进行评述, 并对未来的发展趋势进行了展望.
1 催化材料的设计设计一种催化材料, 通常需要定性地确定催化剂结构和催化剂效率之间的关系, 并对反应的机理有清晰的认识, 这其实极大程度受限于化学实验的数量和化学家的知识水平和经验, 使得催化剂设计的难度大为增加. 然而量子机器学习为催化材料的设计提供了更高效的方法, 使反应机理信息成为非必要条件, 催化剂结构可以用三维描述符(从3D分子结构派生出的分子性质的数值表示)来表征, 它可以量化为成千上万个候选分子的空间和电子性质, 并且可通过将其性质与基于实验数据训练的机器学习模型进行比较来量化给定的候选催化剂的适用性[6].
筛选多相催化材料的传统方法关键取决于吸附物在活性位点上的吸附行为和相关的一些线性关系, 氢吸附的吉布斯自由能是判断潜在的析氢反应电催化剂性能的基本标准, 但这个量通过DFT计算是具有挑战性且非常耗时的. 量子机器学习在高通量筛选催化剂材料时[7], 先建立机器学习的模型并设置描述符, 之后将DFT产生的数据输入并训练此模型, 比较模型精度, 最后利用训练好的模型预测催化剂的性能. MXenes是过渡金属碳、氮化物的总称, 是公式为Mn+1XnTx的二维结构, 可拥有多种金属组合、分层构型和官能团. 当高熵、固溶、非化学计量的MXenes和表面终端也被考虑在内时, 这种详尽的构型和组成空间使MXenes成为量子机器学习的理想研究对象(如图 1)[8]. 此外, 大量基于MXenes作电催化剂的DFT研究数据都可用于训练机器学习模型, 从而预测所需MXenes催化剂的物理和化学性质. 例如, 可利用机器学习模型来准确预测功能化MXenes的带隙. 从初始数据库中的23 870个候选数据开始, 使用有限带隙分类模型筛选出76个数据, 开发出准确率为94%的预测模型. 通过量子机器学习, 很容易地得到了MXenes的沸点、熔点、组成元素的原子半径、键长等性质, 而且可进行快速的MXenes带隙估算, 并绕过DFT计算存在的带隙低估问题, 不需要进行后续校正. 同样, 为了加速过渡金属硼化物(MBenes)析氢催化剂的筛选, Sun等[9]利用DFT计算的吸附能对180个MBenes进行了机器学习模型训练. 通过选择算子(LASSO)、随机森林回归(RFR)、核脊回归(KRR)和支持向量回归(SVR)等模型, 发现Co2B2和Mn/Co2B2在理论上是析氢反应的优良催化剂. 模型还阐明了驱动催化剂性能的潜在因素, 如层比、点阵参数和金属价电子数, 且这些模型也可应用于基于MXenes作电催化剂时的反应体系.
![]() |
图 1 量子机器学习模型精准预测功能化MXenes带隙的工作流程[8] Fig.1 The workflow of quantum machine learning model for accurate band gap prediction of functionalized MXenes[8] |
量子机器学习中的量子深度学习可更精准和高效地在量子层面上描述物质[10]. DeepMind公司将深度学习神经网络用于预测分子内在的电子分布, 从而揭示分子特性, 结果比传统DFT计算结果更为精确(如图 2)[11]. 研究者使用与分子有关的数据和带有分数电荷和分数自旋的虚拟系统, 训练出了深度神经网络DeepMind 2021, 并嵌入物理基本定律, 从而克服了DFT的局限性, 并能准确模拟如氢链、带电DNA碱基对和双自由基过渡态这样的复杂系统. 《Nature》杂志这样评价他们的研究成果: “DeepMind的人工智能解决了化学领域的顶级难题之一” [12]. 由此可见, 量子深度学习对分子的准确描述, 未来将为催化材料的精准设计提供更多可能.
![]() |
图 2 DeepMind 2021的泛函架构和训练示意图[11] Fig.2 The functional architecture and training of DeepMind 2021[11] |
量子深度学习目前已开始应用于单原子催化材料的设计研究[13-14]. 所有负载型过渡金属催化剂都可能存在单原子催化位点, 然而当透射电子显微镜(TEM)发展到可以直接确认单独的金属位点时, 有关单原子多相催化剂(SACs)设计方面的研究才开始迅速增多. 虽然原子分辨率成像仍然是主要的表征工具, 但较差的(统计学上的)显著性、再现性和互操作性限制了它获得这些前沿催化材料重要特性的范围. Mitchell、Collins和Garcia-Gasulla等研究了一种自定义的深度学习方法, 用于在单原子催化剂的球差校正扫描透射电子显微镜(AC-STEM)图像中自动检测金属中心, 这是迈向高通量TEM的关键步骤(如图 3)[14]. 该单原子催化剂基于光支撑, 没有可见的晶体特征(如功能化碳和碳氮). 他们的定制神经网络与传统的图像分析方法相比, 在原子标记方面更加标准化, 减少了人为误差, 并实现了每张图像大约2 000倍的处理速度. 研究人员以铂原子稳定在具有不规则三维形貌的功能化碳载体上的催化材料(这一催化材料在热和电化学反应中具有广阔的应用前景)为研究对象, 用深度学习模型检测了20 000多个原子位置, 用于建立纳米结构催化剂的结构-性能关系重要性质的统计分析, 如表面密度、邻近性、聚类程度和负载金属物种的分散均匀度等. 此外, 该研究小组将深度学习模型直接应用于基于铁负载的氮化碳, 获得了良好的性能, 证明了该模型在碳材料上的单原子检测方面的通用性.
![]() |
图 3 量子深度学习用于自动检测单原子催化剂中原子的工作流程[14] Fig.3 Quantum deep learning workflow for the automated atom detection in SACs[14] |
量子机器学习除了可用于催化材料的设计, 在预测催化反应性能方面也表现优异[15-17], 主要过程是从海量的化学实验中提取数据信息, 并加上物理化学描述, 然后利用这些反应结果数据来训练机器学习模型, 从而预测出最佳的反应条件或判断给定条件下反应能否进行, 效率和准确率大大高于人工实验操作和传统DFT计算.
Doyle研究小组使用高通量反应仪做了4 608个Buchwald-Hartwig交叉偶联反应, 将这些实验结果数据作为训练量子机器学习模型的数据集, 从而考察钯催化剂和配体对多维空间化学反应性能的影响(如图 4)[16]. 研究者使用简单的原子、分子和振动描述符作为输入数据, 用于预测芳基卤化物与4-甲基苯胺在各种潜在抑制/添加剂存在下的偶联产物收率. 这一研究为给定条件下新反应物反应性能的预测、以及最佳反应条件的预测提供了更为便利和广阔的空间.
![]() |
图 4 量子机器学习用于Buchwald-Hartwig胺化反应性能的预测[16] Fig.4 The prediction of Buchwald-Hartwig amination performance by quantum machine learning[16] |
除了上述均相催化反应外, 量子深度学习也可有效预测多相催化反应性能. 为了研究和预测多孔碳材料的孔隙率如何影响CO2/N2混合物的分离性能, Jiang研究小组使用在-196 ℃时的N2吸附等温线作为直接输入, 训练卷积神经网络(CNN)来预测多孔碳材料在环境条件下的CO2和N2吸收率以及CO2/N2选择性, 实验结果与CNN的预测值保持高度接近(如图 5)[17]. 之后他们研究了1.0×106个假设的-196 ℃下N2吸附等温线不同的多孔碳材料, 并预测其对CO2/N2混合物的分离性能. 从预测CO2/N2混合物的理想吸附溶液选择性中, 研究人员发现具有分隔较好的微孔(< 2 nm)和中孔(3~7 nm)双峰孔径分布的多孔碳的选择性最好, 充分说明了分级孔结构在吸附选择性中的重要作用.
![]() |
图 5 量子深度学习用于CO2/N2选择性的预测[17] Fig.5 The prediction by quantum deep learning of CO2/N2 selectivity[17] (a) Architecture of the convolutional neural networks(CNN) used in this work: input, N2 adsorption at-196.15 ℃; output, gas uptakes at ambient temperature (T) and pressure(P). The correlation between experimental and CNN-predicted gas uptakes; (b)CO2 by CNN-1; (c) N2 by CNN-2. |
催化反应机理的合理解释在催化化学研究中同样具有举足轻重的地位, 传统研究方法通常是基于研究者的实验数据、文献调研以及研究经验做出推测, 但这种方法在复杂的反应体系中, 可能会因人为因素忽略重要参数, 从而影响机理的准确性. 但如果在量子机器学习结果的指导下, 将控制实验、表征结果以及可解释的方法引入机器学习模型, 挖掘数据集中潜在的重要变量, 则可以更深入和精确地研究催化反应过程和机理.
吡啶氮的含量是沸石咪唑骨架(ZIF)衍生的非贵金属催化的氧气还原反应(ORR)中影响催化活性的一个重要指标, 通过人工智能特征排序发现, 在大量已报道的工作中经常被忽略的催化剂热解时间对吡啶氮的含量有很大的影响. Li和Liu等基于高质量文献构建的大型数据库来训练机器学习模型, 以分析影响ZIF衍生的ORR催化剂活性的复杂因素(如图 6)[18]. 他们用9种机器学习算法建立起54个分类模型和18个回归模型, 并通过网格搜索优化得到特征重要性分布结果, 发现在催化剂的化学性质中, 吡啶氮的含量对ORR催化剂的活性起着决定性作用. 此外, 使用另外36个分类模型和18个回归模型的计算方法, 发现在众多相关合成参数中, 热解时间也应考虑在内, 适当的热解时间可以平衡热处理过程中Zn-N蒸发、Fe-N形成和石墨-N转化等复杂过程的动态变化, 从而提供理想的催化性能.
![]() |
图 6 量子机器学习指导实验的过程[18] Fig.6 The workflow of how quantum machine learning guided experimental discovery[18] |
量子深度学习也可作为DFT计算的重要辅助工具应用于电催化反应机理的研究. Che研究团队首次利用深度学习算法研究了外加电场对钌催化的电合成氨反应的影响, 发现反应机理倾向于利用正场(> 6 V/nm)来避免动力学上不利的Ru(1013)上的氮氮叁键解离, 并确定了与电场有关的吸附能、偶极矩和反应中间体的极化能力(如图 7)[19]. 他们采用图像神经网络(GNN, 一种特殊的深度学习架构, 广泛用于捕获关系数据之间的信息交换)来捕获气相吸附物(合成氨过程中的中间体)、单独的催化表面和催化表面上吸附物的几何形状之间的关系; 还预测了氨合成的场相关反应能和能量图, 并得出与DFT计算相似的结论. 而与单独使用DFT相比, 他们开发的深度学习算法将场相关能量预测的精度提高了5个数量级. 此外, 研究人员还可对Ru(0001)和Ru(1013)上依赖电场的氨合成系统的少量DFT数据进行训练, 并用Ru训练的深度学习模型来高质量地预测电场作用下Fe(110)和Fe(111)表面上氨合成的能量特性. 上述工作为更好地理解电场对催化反应的影响提供了参考.
![]() |
图 7 量子深度学习作为DFT的辅助工具用于催化氨合成中电场偶极效应的研究[19] Fig.7 Quantum deep learning assisted DFT calculations for electric field-dipole effects on catalytic ammonia synthesis[19] |
当前对催化化学反应的理解是以传统化学实验或复杂DFT算法为主要方式获得的, 而将量子机器学习用于催化反应的研究, 有可能对完全新的催化材料创制、真实分子、反应性能和反应机理进行精准、快速、实时的预测. 量子机器学习突破了实验和DFT的局限性, 允许研究人员在现有催化知识的基础上进行预测, 甚至在某种程度上可利用现有知识来预测未知的系统、属性和场景; 消除了研究人员对化学感知、实验经验和重复体力劳动的过度依赖, 为更具创造性和创新性的工作节省出大量时间和资源; 量子机器学习擅长识别个体偏好, 有效缩小了实验和理论研究之间的差距; 还可以从失败的数据中学习和提取有用的信息. 量子机器学习的这些优点, 为催化化学提供了更智能、更有效的研究方式, 且正在快速发展中的量子机器学习有可能成为解决催化学科中一些长期存在的诸多基本问题的最佳途径[20].
尽管如此, 现阶段量子机器学习在催化学科中的应用依然面临一些挑战, 例如: 1) 对量子机器学习模型进行有效的构建和理解, 需要研究者同时具备化学、计算机科学、甚至物理的高水平知识; 2) 需要收集更多高质量的数据, 以及开发新的描述符来描述相互作用的多分子系统; 3) 让量子机器学习能够进行定性和定量的反应预测、反应条件的预测以及分析数据的自动评估[21]. 但可以预见, 随着越来越多不同领域科学家交流合作、新兴交叉学科的快速发展以及海量数据的不断累积, 量子机器学习将作为催化化学研究的重要手段之一推动催化学科向更前沿的方向迈进. 一个新的问题是, 如果量子计算+人工智能解放了催化科学家的部分精力, 他们将会做什么?可能的答案是催化科学家将把注意力集中到更有创新性的新问题上, 把科学家的智能真正解放出来, 去思考50年甚至是几百年后人类将要面对的催化问题之上, 而把需要大量体力和脑力的常规工作交给机器去做. 如果说密度泛函理论和量子化学计算方法、经典物理学与量子化学的结合分别为化学领域带来了两次革命, 那么我们有理由相信, 量子机器学习是化学领域的又一次革命.
[1] |
a. Dral P O. Quantum chemistry in the age of machine Learning[J]. J Phys Chem Lett, 2020, 11(6): 2336-2347. b. Biamonte J, Wittek P, Pancotti N, et al. Quantum machine learning[J]. Nature, 2017, 549: 195-202. |
[2] |
Butler K T, Davies D W, Cartwright H, et al. Machine learning for molecular and materials science[J]. Nature, 2018, 559: 547–555.
DOI:10.1038/s41586-018-0337-2 |
[3] |
a. Shen Lin(申林), Jia Luyang(贾璐阳), Tang Diandong(汤典东), et al. Machine learning in computational chemistry(计算化学中的机器学习)[J]. Sci Sin Chim(China)(中国科学: 化学), 2022, 52(6): 858-868. b. Keith J A, Vassilev-Galindo V, Cheng B, et al. Combining machine learning and computational chem-istry for predictive insights into chemical systems[J]. Chem Rev, 2021, 121(16): 9816-9872. c. Huang B, Anatole von Lilienfeld O. Ab initio machine learning in chemical compound space[J]. Chem Rev, 2021, 121(16): 10001-10036. d. Meuwly M. Machine learning for chemical reactions[J]. Chem Rev, 2021, 121(16): 10218-10239. e. Liu Cong(刘聪), Hu Xing-bang(胡兴邦). Theoretical calculation on the CO2 hydrogenation to formic acid and design more effective iron based catalyst for this process(CO2加氢制甲酸理论研究及高效铁基催化剂设计)[J]. J Mol Catal(China)(分子催化), 2022, 36(2): 162-170. f. Yu Shu-min(于书敏), Wang Lan(王岚), Qi Li-lei(齐礼磊), et al. Adsorption and decomposition of H2S on metal-modified Ti2N MXene: A first principle calculation(金属修饰Ti2N MXene吸附分解H2S的第一性原理计算)[J]. J Mol Catal(China)(分子催化), 2021, 35(4): 343-352. |
[4] |
Kitchin J R. Machine learning in catalysis[J]. Nat Catal, 2018, 1: 230–232.
DOI:10.1038/s41929-018-0056-y |
[5] |
Yang W, Fidelis T T, Sun W H. Machine learning in catalysis, from proposal to practicing[J]. ACS Omega, 2020, 5(1): 83–88.
DOI:10.1021/acsomega.9b03673 |
[6] |
Oviedo F, Ferres J L, Buonassisi T, et al. Interpretable and explainable machine learning for materials science and chemistry[J]. Acc Mater Res, 2022, 3(6): 597–607.
DOI:10.1021/accountsmr.1c00244 |
[7] |
a. Mai H, Le T C, Chen D, et al. Machine learning for electrocatalyst and photocatalyst design and discovery[J]. Chem Rev, 2022, 122(16): 13478-13515. b. Farris B R, Niang-Trost T, Branicky M S, et al. Evaluation of machine learning models on electro-chemical CO2 reduction using human curated datasets[J]. ACS Sustainable Chem Eng, 2022, 10(33): 10934-10944. c. Zahrt A F, Henle J J, Rose B T, et al. Prediction of higher-selectivity catalysts by computer-driven workflow and machine learning[J]. Science, 2019, 363(6424): 247-257. d. Masood H, Toe C Y, Teoh W Y, et al. Machine learn-ing for accelerated discovery of solar photocatalysts[J]. ACS Catal, 2019, 9(12): 11774-11787. |
[8] |
Tsounis C, Kumar P V, Masood H, et al. Advancing MXene electrocatalysts for energy conversion reactions: Surface, stoichiometry, and stability[J]. Angew Chem Int Ed, 2022, 2022: 10828.
|
[9] |
Rajan A C, Mishra A, Satsangi S, et al. Machine-learning-assisted accurate band gap predictions of functionalized MXene[J]. Chem Mater, 2018, 30(12): 4031–4038.
DOI:10.1021/acs.chemmater.8b00686 |
[10] |
Sun X, Zheng J, Gao Y, et al. Machine-learning-accelerated screening of hydrogen evolution catalysts in MBenes materials[J]. Appl Surf Sci, 2020, 526: 146522–146531.
DOI:10.1016/j.apsusc.2020.146522 |
[11] |
a. Matlock M K, Hoffman M, Dang N L, et al. Deep learning coordinate-free quantum chemistry[J]. J Phys Chem A, 2021, 125(40): 8978-8986. b. Mater A C, Coote M L. Deep learning in chemistry[J]. J Chem Inf Model, 2019, 59(6): 2545-2559. |
[12] |
Kirkpatrick J, McMorrow B, Turban D H P, et al. Pushing the frontiers of density functionals by solving the fractional electron problem[J]. Science, 2021, 374(6573): 1385–1389.
DOI:10.1126/science.abj6511 |
[13] |
Castelvecchi D. Deepmind AI tackles one of chemistry's top techniques[J]. Nature, 2021, 600: 371.
DOI:10.1038/d41586-021-03697-8 |
[14] |
Lee J, Jeong C, Yang Y. Single-atom level determination of 3-dimensional surface atomic structure via neural network-assisted atomic electron tomography[J]. Nat Commun, 2021, 12: 1962.
DOI:10.1038/s41467-021-22204-1 |
[15] |
Mitchell S, Parés F, Akl D F, et al. Automated image analysis for single-atom detection in catalytic materials by transmission electron microscopy[J]. J Am Chem Soc, 2022, 144(18): 8018–8029.
DOI:10.1021/jacs.1c12466 |
[16] |
a. Watanabe N, Yamamoto M, Murata M, et al. Comprehensive machine learning prediction of extensive enzymatic reactions[J]. J Phys Chem B, 2022, 126(36): 6762-6770. b. Rück M, Garlyyev B, Mayr F, et al. Oxygen reduction activities of strained platinum core-shell electrocatalysts predicted by machine learning[J]. J Phys Chem Lett, 2020, 11(5): 1773-1780. |
[17] |
Ahneman D T, Estrada J G, Lin S, et al. Predicting reaction performance in C-N cross-coupling using machine learning[J]. Science, 2018, 360(6385): 186–190.
DOI:10.1126/science.aar5169 |
[18] |
Wang S, Li Y, Dai S, et al. Prediction by convolutional neural networks of CO2/N2 selectivity in porous carbons from N2 adsorption isotherm at 77K[J]. Angew Chem Int Ed, 2020, 132(44): 19813–19816.
DOI:10.1002/ange.202005931 |
[19] |
Ding R, Chen Y, Chen P, et al. Machine learning-guideddiscovery of underlying decisive factors and new mechanisms for the design of nonprecious metal electro-catalysts[J]. ACS Catal, 2021, 11(15): 9798–9808.
DOI:10.1021/acscatal.1c01473 |
[20] |
Wan M, Yue H, Notarangelo J, et al. Deep learning-assisted investigation of electric field-dipole effects on catalytic ammonia synthesis[J]. JACS Au, 2022, 2(6): 1338–1349.
DOI:10.1021/jacsau.2c00003 |
[21] |
Anatole von Lilienfeld O. Quantum machine learning in chemical compound space[J]. Angew Chem Int Ed, 2018, 57(16): 4164–4169.
DOI:10.1002/anie.201709686 |
[22] |
Pflgger P M, Glorius F. Molecular machine learning: The future of synthetic chemistry[J]. Angew Chem Int Ed, 2020, 59(43): 18860–18865.
DOI:10.1002/anie.202008366 |