2024年12月17日,J. Am. Chem. Soc.在线发表了首尔国立大学Seungwu Han课题组的研究论文,题目为《Data-Efficient Multifidelity Training for High-Fidelity Machine Learning Interatomic Potentials》。
最近,机器学习(ML)已经成为解决材料科学中各种挑战的强大工具。特别是在计算材料科学中,机器学习已被有效地用作从头算的替代模型,在显著降低计算成本的情况下实现了接近量子力学的精度。然而,创建具有精确从头算的高保真训练数据库在计算上要求很高。机器学习原子间势(MLIPs)用于从头算估计势能面(PES),在降低计算成本的同时提供接近量子水平的精度。然而,组装高保真数据库的高成本阻碍了MLIP在需要高化学精度体系中的应用。
在此研究中,作者利用等变图神经网络提出了一种MLIP框架,可以同时在多保真数据库上进行训练。这种方法能够以最少的高保真数据准确学习高保真PES。分别采用广义梯度近似(GGA)和meta-GGA作为低保真度和高保真方法,在Li6PS5Cl和InxGa1-xN体系上测试了该框架。结果表明,与参考的高保真MLIP结果相比,使用约为低保真集10%的高保真训练集,多保真训练框架获得了出色的精度,锂离子电导率预测误差在10%以内,InxGa1-xN混合能量的R2为0.98
。
研究表明,高保真meta-GGA数据库未覆盖的几何和组成空间可以从低保真GGA数据中有效推断出来,从而提高准确性和分子动力学稳定性。同时还开发了一种通用的MLIP,它利用了Materials Project的GGA和meta-GGA数据,显著提高了MLIP在高精度任务中的性能。此外,研究证明了目前的多保真学习比迁移学习或Δ学习更有效,并且它也可以应用于学习高保真的耦合簇水平。这项研究中的方法有望通过有效扩展高保真数据集来创建高度准确的定制或通用MLIP。
图5 预训练通用MLIP的多保真度训练
Kim, J., Kim, J., Kim, J. et al. Data-Efficient Multifidelity Training for High-Fidelity Machine Learning Interatomic Potentials.
J. Am. Chem. Soc., 2024. https://doi.org/10.1021/jacs.4c14455
【其他相关文献】
[1] Chen, C., Zuo, Y., Ye, W. et al. Learning properties of ordered and disordered materials from multi-fidelity data. Nat. Comput. Sci., 2021, 1, 46–53. https://doi.org/10.1038/s43588-020-00002-x[2] Buterez, D., Janet, J.P., Kiddle, S.J. et al. Transfer learning with graph neural networks for improved molecular property prediction in the multi-fidelity setting. Nat. Commun., 2024, 15, 1517. https://doi.org/10.1038/s41467-024-45566-8
【注】:小编水平有限,若有误,请联系修改;若侵权,请联系删除!