机器学习Machine learning(ML)模型,如果被训练到高保真量子模拟的数据集,则产生精确和有效的原子间势。主动学习Active learning (AL)是迭代生成多样化数据集的有力工具。在主动学习方法中,机器学习ML模型提供了不确定性估计及其对每个新原子构型的预测。如果不确定性估计超过某个阈值,则将该配会置包含在数据集。近日,美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)Maksim Kulichenko,Justin S. Smith & Benjamin Nebgen等,在Nature Computational Science上发文,报道开发了一种策略,以更快速地发现有意义地增加训练数据集的配置。该策略方法,即用于主动学习的不确定性驱动动力学uncertainty-driven dynamics for active learning (UDD-AL),在分子动力学模拟中,修正了使用的势能面,以有利于存在较大模型不确定性的构型空间区域。
不确定性驱动动力学的主动学习UDD-AL性能,在两个主动学习AL任务中得到了证明:甘氨酸的构象空间采样和乙酰丙酮中质子转移的促进采样。该不确定性驱动动力学的主动学习方法,可以有效地探索化学相关的构型空间,而这是在目标温度条件下使用常规规则的动态采样无法实现。
Uncertainty-driven dynamics for active learning of interatomic potentials.
原子间势主动学习的不确定性驱动动力学。
图1:甘氨酸测试案例,不确定性驱动动力学的主动学习uncertainty-driven dynamics for active learning,UDD-AL和分子动力学-主动学习Molecular dynamics-active learning,MD-AL方法比较。图2:通过UMAP降维技术处理的甘氨酸构象空间的二维表示。图3:在分子动力学-主动学习MD-AL和不确定性驱动动力学的主动学习UDD-AL数据集中,甘氨酸原子间距分布。图4:在乙酰丙酮中,系综不确定度和不确定性驱动动力学UDD。文献链接
https://www.nature.com/articles/s43588-023-00406-5
https://www.nature.com/articles/s43588-023-00406-5.pdf
https://doi.org/10.1038/s43588-023-00406-5
本文译自Nature。
推荐阅读
Nature专刊|AI用于分子动力学模拟中原子间势预测
武汉大学刘胜教授、郭宇铮教授等:基于机器学习的原子间势构造方法在先进制造领域中的应用 | IJMSD论文推荐
Nature子刊:原子间势的深度学习用于新材料开发