社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

浙大邢华斌/陈华钧Nat. Commun.:多孔材料吸附性能预测深度学习框架DeepSorption

研之成理 • 1 年前 • 406 次点击  

共同第一作者:崔稷宇,吴方,张文,杨立峰 
共同通讯作者:邢华斌,陈华钧 

通讯单位:浙江大学 
论文DOI:10.1038/s41467-023-42863-6  


  


全文速览
近日,浙江大学杭州国际科创中心生物与分子智造研究院邢华斌教授团队和陈华钧教授团队瞄准多孔吸附剂材料的精准智造,开发出专家知识共学习的晶态多孔材料吸附性能端对端深度学习框架DeepSorption,有效提升多孔材料吸附性能的预测精度与速度,并展示了原子尺度的计算轨迹及可解释性。并实现了原子尺度的可解释性。这一成果以《Direct prediction of gas adsorption via spatial atom interaction learning》为题近期发表在Nature. Commun.上。


  


背景介绍
基于多孔材料的物理吸附技术为二氧化碳捕获、能源气体储存、化工分离过程等全球挑战提供了低成本和节能环保的解决方案。然而,基于trial-and-error实验范式的传统高性能多孔材料的筛选和设计方式受到实验时间长、试错成本高等问题的阻碍。机器学习通过学习多孔材料及其物理吸附行为的知识,为快速发现具有所需吸附特性的材料提供了一种有效的方法。传统的基于专家设计的多孔材料描述符的机器学习算法通过最大限度地包含多孔材料的关键结构信息来提高模型预测的准确性。然而,由于该方法存在的原始结构信息丢失和描述符生成和处理过程中计算成本高的固有缺点不可避免地会导致误差的传播,造成模型预测精准度的局限。端到端的深度学习模型有利于保持完整的原始结构信息,具有实现准确预测的巨大潜力。



  


本文亮点
1、本文开发出专家知识共学习的晶态多孔材料吸附性能端对端深度学习框架DeepSorption,实现了利用晶态多孔材料的原子坐标和化学元素类型的信息作为输入,结构吸附性能的端对端预测。该框架的独特架构在于开发的Matformer模型,该模型可以高保真地解释多孔材料的整体结构信息,包括原子空间排列和化学元素信息。


2、此外,模型内的多尺度原子注意(MSA)机制实现了对不同尺度原子间相互作用的准确、高效认知,并实现了隐藏在编码层中的潜在原子相互作用的可视化。同时专家知识共学习模块通过多任务学习的方式利用孔径、孔容等专家信息减少了端到端网络对海量训练数据的依赖,进一步了提高DeepSorption框架对于吸附性质预测的准确性。


3、与巨正则蒙特卡罗分子模拟和其他机器学习模型相比,使用DeepSorption进行晶态多孔吸附剂的气体吸附曲线预测的精度更高、速度更快。与基于专家信息描述符的机器学习模型和晶体图神经网络CGCNN相比,DeepSorption在多个二氧化碳和氮气的吸附量数据集上预测性能的平均绝对误差下降了20-35%。



  


图文解析
图1| DeepSorption深度学习框架的组成部分及多尺度原子注意力机制介绍


要点:

晶体多孔材料可以通过有机单元、无机单元或组合的原子精确组合集成来展示设计的骨架和纳米孔结构 (图1a)。晶体材料的原始数据,包括原子坐标和元素类型,直接作为DeepSorption的输入(图1b),这减少了使用处理过的专家知识描述符作为输入造成的信息丢失。Matformer的关键创新在于多尺度原子注意力机制(MSA),用于理解空间排列中不同定义原子之间的相互作用(图1e)。MSA通过在不同距离的原子对之间交换信息,使Matformer具有直觉判断不同尺度上原子间相互作用的能力,MSA根据输入的原子坐标计算原子距离,同时考虑原子元素类型。Matformer中指定的单元可以有针对性地处理不同距离尺度下原子对之间的相互作用,揭示客体分子的物理吸附行为。


图2| 不同的机器学习模型框架介绍


要点:

为针对纯数据驱动学习中存在的数据饥渴的弊端,采用了专家知识共同学习(knowledge co-learning, KCL)策略。结果表明,KCL可以将专家知识作为预测的辅助任务,促进模型在结构-吸附性能构效关系空间中的收敛,有利于提高吸附性质的预测精度。值得注意的是,专家知识的输出只在模型训练时需要,而不干扰预测过程,保证了快速的预测速度。DeepSorption深度学习框架拥有时间效率高、误差传播少以及数据效率高的优点。


图3| DeepSorption深度学习框架在多个数据集上的预测性能


图3a-3b为DeepSorption深度学习框架在CoREMOF-CO2 (a)、hMOF-CO2 (b)预测任务上的真实吸附吸附量与预测吸附量之间的相关性绘图。图3c为不同模型在CoREMOF-CO2预测任务上的真实吸附量与预测吸附量在测试集上的绝对误差分布,DeepSorption模型的平均绝对误差(MAE)降低了23-52%。Matformer的全局结构感知能力提高了物理吸附相关参数的预测精度,对于CoREMOF-CO2、hMOF-CO2预测任务,KCL平均使RMSE降低了13%,R2增加了18%。这些结果不仅表明DeepSorption和人类科学家一样,可以很好地学习和利用专家知识,也解释了为什么数据驱动的知识协同学习模型比单纯的数据驱动学习方法能取得更好的学习效果。

 


图4| DeepSorption深度学习框架在实验数据集上的预测性能


要点:通过实验收集的乙炔(EXPMOF-C2H2)和二氧化碳(EXPMOF-CO2)吸附等温线进一步验证了DeepSorption的优越性。通过对实验数据进行DeepSorption模型训练,并利用留一法(leave-one-out)进行交叉验证,得到了较低的RMSE,其中EXPMOF-C2H2和EXPMOF-CO2的R2分别达到0.86和0.87(图4a和b)。



图5| DeepSorption深度学习框架原子尺度的可解释性

要点:图5a是SIFSIX-1-Cu在不同距离尺度下的三维注意图。在5 Å尺度下,DeepSorption主要关注相邻原子之间的相互作用去寻找重要的基团和化学键,如Cu···N、N···C和F···H,。在8 Å尺度下,通过评价SIFSIX2-阴离子上的F、Si原子与有机配体上的H、C原子之间的相互作用,重点研究材料的局部结构特征,探索潜在的吸附位点和孔隙表面。在12 Å尺度处,开始考虑孔隙通道表面原子之间的相互作用,这意味着模型试图学习和计算专家知识信息,如孔径、孔体积和比表面积。在无限尺度上,重原子Si、Cu原子之间的相互作用被突出,这有利于模型理解和提取晶体材料的整体拓扑和整体结构信息。体现了授人鱼不如授人以渔的重要性。



  


总结与展望
DeepSorption通过空间原子相互作用学习网络实现了晶体多孔材料复杂吸附特性的准确、快速预测。得益于多尺度原子注意机制,DeepSorption能够准确评估原子之间的相互作用,实现物理吸附行为预测,并提供直观的可视化思维和执行轨迹。复杂物理化学性质预测的准确预测凸显了整体结构意识、原子级空间结构信息与化学元素信息的耦合传递和相互作用的重要性。DeepSorption深度学习框架不仅实现晶态多孔材料吸附性能的端对端准确预测并在原子尺度揭示了决定晶体多孔材料表达功能的内在化学性质,并有望成为预测其他晶体材料(如钙钛矿和晶态催化剂)的各种物理化学和表面性质的一种基准算法工具。
1. 仪器表征基础知识汇总
2. SCI论文写作专题汇总
3. Origin/3D绘图等科学可视化汇总
4. 理论化学基础知识汇总
5. 催化板块汇总
6. 电化学-电池相关内容汇总贴
7. 研之成理名师志汇总
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/165571
 
406 次点击