社区
教程
Wiki
注册
登录
创作新主题
社区所有版块导航
Python
python开源
Django
Python
DjangoApp
pycharm
DATA
docker
Elasticsearch
分享
问与答
闲聊
招聘
翻译
创业
分享发现
分享创造
求职
区块链
支付之战
aigc
aigc
chatgpt
WEB开发
linux
MongoDB
Redis
DATABASE
NGINX
其他Web框架
web工具
zookeeper
tornado
NoSql
Bootstrap
js
peewee
Git
bottle
IE
MQ
Jquery
机器学习
机器学习算法
Python88.com
反馈
公告
社区推广
产品
短视频
印度
印度
一周十大热门主题
图解机器学习:贝叶斯算法
数字孪生建模:基于ChatGPT/Deepseek与谷歌地图平台的三维建模、GIS集成、高斯渲染及可...
2025必看AI干货!《大模型/AIGC/GPT-4/Transformer/DL/KG/NLP/C...
简单的Python调用C++程序
从入门到实践,专为社科研究者打造的Python文本分析教程
DeepSeek vs ChatGPT:谁可以预测股票市场与宏观经济?
Python高性能编程:五种核心优化技术的原理与Python代码
【python篇】——python基础语法一篇就能明白,快速理解
Adv Sci 封面论文丨伯晓晨/何松团队综述机器学习赋能药物毒性预测的前沿进展
过气网红ChatGPT,终于还是“下海”了
关注
Py学习
»
机器学习算法
CEJ:采用迭代机器学习方法筛选高性能H2O2生产催化剂
催化开天地
• 1 年前 • 250 次点击
【做计算 找华算】
理论计算助攻顶刊,10000+成功案例,全职海归技术团队、正版商业软件版权!
经费预存选华算,高至15%预存增值!
研究背景
过氧化氢(H
2
O
2
)作为一种重要的原料,已被广泛应用于纺织、食品、废水处理和造纸等领域。尽管H
2
O
2
代表一种绿色氧化剂,但传统的生产工艺根本不是绿色的。目前,H
2
O
2
的工业生产在很大程度上依赖于蒽醌氧化工艺,这是一种能源密集型和环境污染型的工艺,会导致环境问题。电化学H
2
O
2
生产是未经验证取代蒽醌循环工艺的一种非常理想的方法。在催化剂的帮助下,一种先进的双电子氧还原反应(ORR)的电化学方法可以由清洁的反应物(O
2
,H
+
)进行,其主要产物是H
2
O
2
。然而,设计和开发绿色、低成本和高效的电催化剂仍然是一个挑战。
因此,
广西大学危增曦和赵双良等人
提出了一种迭代机器学习(iML)方法,该方法大大减少了所需的训练集大小,如图1。通过引入空间坐标信息的特征,可以从数百种单原子催化剂中快速筛选出最佳催化活性。发现RhO
2
N
2
(A)是H
2
O
2
生产的理想催化剂,具有0.013V的超低过电位。这项工作为加快数据驱动的高性能催化剂的设计和发现开辟了道路。
图1. iML方法方案
计算与机器学习方法
DFT计算方法:
所有计算均采用自旋极化密度泛函理论(DFT)方法进行,并采用维也纳从头算模拟软件包(VASP)在广义梯度近似(GGA)-Perdew-Burke-Ernzerhof(PBE)水平上进行催化剂电子结构计算,施加投影增强波PAW泛函计算电子-离子的相互作用。平面波截止被设置为500eV。电子会聚能量被设置为10
-6
eV,并且所有原子位置都被允许弛豫,直到力小于0.02eV/Å。布里渊区由Monkhorst 2×2×1 k点网格组成。为了避免两个相邻的周期性几何图像之间的相互作用,真空度设置为15Å来消除对称性的影响,同时采用DFT-D3方案来校正范德华相互作用。
机器学习方法:
本文将线性模型和非线性模型都被考虑在内。为了预测回归数据,通过线性/非线性模型考虑了50%的交叉验证。采用网格搜索对模型进行超参数筛选。所有算法都使用Python软件包Scikit-Learn进行了评估和优化。
结果与讨论
本文选择了17种不同的物理和化学性质(1)d和p轨道的电子数(
E
dp
);(2)氧化物生成焓(
H
fox
),(3)电负性(
N
m
);(4)电子亲和能(
A
m
);(5)第一电离能(
I
m
);(6)原子序数(
A
n
);(7)原子半径(
R
);(8) 价电子数(
V
e
);(9)筛选百分比(
S
cpe
);(10)共价半径(
C
cr
);(11)配位环境原子半径之和(
SR
);(12)配位环境的原子质量总和(
SR
am
);(13)配位环境的原子序数之和(
SA
n
);(14)配位环境的电子亲和能之和(
SA
m
);(15)配位环境的电负性之和(
SN
m
);(16)配位环境的价电子之和(
SV
e
);(17)配位环境的质子亲和能之和(
SE
pa
),这些描述符特征都是从数据库、元素周期表和公开文献信息中得到的。
特征选择的包装法以基本模型训练为机器学习模型,以性能评价指标为特征选择的重要依据。因此,随机森林(非线性模型)和支持向量机(线性模型)被采用。如图6a所示,当维度达到17,随机森林模型稳定。SVM模型在维度超过5时保持其性能,但随后在维度超过20时迅速下降。为了进一步确定特征的重要性,使用了嵌入方法LASSO,将特征选择过程与模型训练过程相结合。如图2b所示,结果表明在这些候选者中,六个电子结构特征占主导地位,包括
N
m
、
R
、
H
fox
、
I
m
、
E
dp
、
A
m
。此外,
N
m
和
R
是H
2
O
2
产生的两个重要特征。特征相关性通过Pearson系数进行研究,该方法通过评估每个特征与结果之间的相关性来实现。如图6c,各种特征与
△G
*OOH
之间的相关系数,在特征选择方法中,TM的电负性和原子半径都是双电子ORR催化活性的主要催化活性描述符。
图2.(a)通过随机森林算法和线性回归算法测试了特征数量方面的性能;(b) 14个特征的特征重要性;(c)过渡金属的10个输入特征和配位原子的7个输入特征之间的Pearson相关图,E表示
△G
*OOH
20个不同的过渡金属原子和六种构型(TMN
4
、TM-N
3
O、TM-N
2
O
2
(A)、TM-N
2
O
3
(B)、TM-NO
3
和TM-O
4
)构建了120种可能的组合。通常,配位原子的电负性相加作为活性预测的描述符。然而,配位原子的几何差异被忽略。为了揭示几何差异,本文首先提出了SACs的空间(三维坐标)特征。如图3所示,中心金属的坐标和配位原子被考虑在内,并采用映射函数方式进行了降维。
图3. 将单原子催化剂的空间坐标信息简化为数字特征,以区分结构的多样性。具有空间信息的特征由空间信息权重和配位原子的固有特征定义以及过渡金属的
P
TM
的空间信息权重
在特征工程之后,本文进一步选择合适的模型进行数据集训练。在iML过程中,每批B
i
都可以通过交叉验证方法进行有效训练。本文将数据集的一部分用于测试,其他四部分用于训练(图4a)。如图4b所示,共测试了13个模型。仅在第四次迭代中的四次测试结果表明,BayesianRidge、RandomForest、MLP和XGBoost,有较低的MAE和MSE,表现出良好的性能。MLP和XGBoost模型都可以用于训练我们的数据集,因为它们具有高效的可扩展性和强大的鲁棒性。然而,在没有空间坐标信息的情况下,XGBoost和MLP模型对H
2
O
2
产生的预测性能较差。通过空间坐标信息,XGBoost(s)模型表明,数据集训练的MAE和MSE得分分别为0.494eV和0.434eV。此外,MLP(s)模型在预测H
2
O
2
活性方面表现出优异的性能。
为了在MLP模型中提高模型的泛化性能,考虑Dropout调优。激活函数和优化器分别设置为tanh和SGD。最后,在输出中可以获得70个神经元。
图4.(a)五折的交叉验证模型;(b)对13个机器学习模型的平均绝对误差和均方误差进行了交叉验证测试;(c)第三次迭代机器学习过程后机器学习模型(即XGBoost、XGBoost(s)、MLP和MLP(s))的R
2
得分、平均绝对误差和均方误差。XGBoost(s)和MLP(s)表示在XGBoost和MLP中引入空间坐标信息的特征,吸附自由能约为4.22eV的输入数据可以通过第三次迭代机器学习过程识别
利用iML过程,预测了的吸附自由能。结果表明,在第三次迭代过程中可以找到最佳催化剂,如图5a。RhN
2
O
2
A模型表现出4.233eV的最佳*OOH吸附自由能,表明其产生H
2
O
2
的超低过电势为0.013V。其次是NiN
2
O
2
B,其*OOH吸附自由能为4.116eV。但NiN
3
O构型表现出4.380eV的弱*OOH吸收能,其中Ni的中心原子分别由一个氧原子和三个氮原子配位。此外,对于H
2
O
2
的产生,CoN
3
O构型表现出4.115eV的*OOH吸附自由能。
图5.(a) 4.22eV附近的吸附自由能可以通过第三个迭代机器学习过程来识别。表现出用于H
2
O
2
生产的合适*OOH吸附自由能,包括RhN
2
O
2
A(4.233eV)、NiN
2
O
2
B(4.116eV)、CoN
3
O(4.115eV)和NiN
3
O(4.422eV);(b)*OOH在各种SACs上的中间吸附自由能
此外,*OOH中间体在各种SACs上的吸附自由能是通过DFT计算确定的,如图5b所示。在H
2
O
2
生产中,虚线代表理想
△G
*OOH
=4.22eV。
事实上,在过去几十年中,双电子ORR途径一直被视为四电子ORR过程在燃料电池应用中的副反应。因此,SACs上的双电子ORR选择性可以作为筛选用于H
2
O
2
生产的高效催化剂的标准。如图6所示,两个电子的ORR活性和四个电子的ORR活性都被绘制为*OOH吸附自由能的函数。两电子ORR在SACs上的过电位小于四电子ORR的过电位,这表明ORR过程对H
2
O
2
的产生具有优势。
图6. 作为*OOH吸附自由能函数的两电子和四电子氧还原反应的理论火山图
结论与展望
本文提出了一种iML方法来快速筛选用于H
2
O
2
生产的目标催化剂,在机器学习过程中,可以通过空间坐标特征来区分SACs中复杂的协调环境。在新的迭代机器学习方法中采用了多层神经网络,并在第三次迭代过程中识别了理想催化剂RhN
2
O
2
A。此外,RhN
2
O
2
A在0.013V的超低过电位下表现出最佳的H
2
O
2
生产活性,本工作将有助于筛选工业系统中用于H
2
O
2
生产的新型催化剂。
文献信息
Deng B, Chen P, Xie P, et al. Iterative machine learning method for screening high-performance catalysts for H
2
O
2
production[J]. Chemical Engineering Science, 2023, 267: 118368.
https://doi.org/10.1016/j.ces.2022.118368
【做计算 找华算】
华算科技专注DFT代算服务、正版商业软件版权、全职海归计算团队,10000+成功案例!Nature Catalysis、JACS、Angew.、AM、AEM、AFM等狂发顶刊,
好评如潮!
计算内容涉及OER、HER、ORR、CO
2
RR、NRR自由能
台阶图
、火山理论、d带中心、
反应路径、掺杂、缺陷、表面能、吸附能
等
。
添加下方微信好友,立即咨询
:
电话/微信:13622327160
点击阅读原文,立即咨询计算!
Python社区是高质量的Python/Django开发社区
本文地址:
http://www.python88.com/topic/158598
250 次点击
登录后回复