机器学习加速锂离子电池电极材料和电解质的发现与设计
锂离子电池因其优异的能量密度、循环寿命和相对低廉的成本,被广泛应用于电动汽车和移动设备中。当前,设计新型电池材料以提升电池性能是热门研究领域。然而,传统的材料研究方法耗时耗力,且无法有效揭示电池性能、材料和工作环境之间的关系。随着理论方法的发展,如密度泛函理论(DFT)和分子动力学(MD),材料性能的研究变得更加深入,但也会消耗大量计算资源和时间。为了克服这些挑战,数据驱动的材料科学应运而生。通过积累大量的实验和理论数据,并利用人工智能中的机器学习(ML)方法,研究人员可以降低实验和计算成本,加速新材料的发现和优化。ML在电池材料设计中的应用场景广泛,包括设备状态估计、材料设计等。通过学习已有的实验数据,ML可以预测未知材料的性能,从而为实验提供明确方向。此外,ML在锂离子电池材料研究中越来越重要,尤其是最近几年,相关领域的研究论文数量显著增加,表明ML在电池材料设计中的快速发展。
图1. 2017 - 2024 年,每年有关电池材料和 ML 以及锂离子电池材料和 ML 主题的论文发表数,以及锂离子电池相关论文占电池论文总数的比例。数据来源于 Web of Science,截止日期为 2024 年 7 月 23 日。
近日,华东师范大学潘丽坤教授,暨南大学黎晋良副研究员,泰山学院玄晓阳博士合作,综述了近年来ML方法在锂离子电池电极和电解质材料设计和发现的最新进展。通过总结 ML 在锂离子电池正/负极和液/固态电解质材料的设计、性能预测和成分优化方面的最新研究现状,展示了ML在储能电池设计领域的良好应用前景,分析了ML在电池材料领域应用中的不足和挑战,并展望了未来的发展方向。相关成果以“Machine learning-accelerated discovery and design of electrode materials and electrolytes for lithium ion batteries”为题,发表在国际知名期刊Energy Storage Materials上。
要点一:ML 在促进锂离子电池材料的设计和发现方面发挥了重要作用
近年来,ML 在锂离子电池材料研究中的应用发展迅速,出现了一些新数据、新方法、新模型和新应用,有必要对这些最新进展进行有效总结。本研究总结并整理了近年来 ML 在锂离子电池正/负极和液/固态电解质材料的设计、性能预测和成分优化方面的相关工作,展现了ML 在锂离子电池材料的设计和发现中的作用和良好前景。
图2. 近年来有关ML 辅助锂电池材料研究的图形摘要。
要点二:电池材料的研究中,数据的质量和数量对ML有着重要的影响
数据的数量在多个方面显著地影响ML方法。充足的数据有助于提高模型的泛化能力和预测性能,使得能够使用更复杂的模型,并提高评估结果的可靠性。另一方面,数据的质量也深刻地影响ML。高质量数据可以显著增强模型的性能、稳定性和泛化能力,减少数据预处理的工作量,提高评估结果的可靠性,并在实际应用中产生更好的效果。相反,低质量数据可能导致模型性能下降。电池材料数据通常是多源的(如实验数据、计算数据、生产数据和文献数据)且异质的(如结构化和非结构化数据),不同来源的数据外部一致性难以保证,导致用于ML建模的最终数据集通常是小样本。尤其是文献数据的标注较为困难,小样本问题更为突出。
例如,图3所示的两个ML回归模型对两个目标值的预测结果均不理想。较高的RMSE值和较低的R²值表明模型存在拟合不足的问题。这主要是由于所使用的数据集来自文献,并且只有168个样本。然而,可以观察到,更复杂的梯度提升回归(GB)模型相比随机森林(RF)模型表现出更好的拟合。因此,在电池材料研究中,当数据集通常较小且质量较低(多源且异质)时,选择更复杂的模型,如GB或XGB,可以获得更好的拟合效果。相反,对于高质量数据,更简单的模型如线性回归、逻辑回归或支持向量机(SVM)更为适用。此外,在数据充足的情况下,深度学习(神经网络)具有自动特征提取的优势,更适合对复杂数据和非线性关系进行建模。
图3. GB 和 RF 模型对掺杂 NCM 正极系统的充电(IC)和放电(FC)容量预测结果。
要点三:复杂材料体系的特征选择限制了 ML 在电池材料中的应用
电池中材料的性能指标,如容量,只能通过实验获得,且通常来源多样。电池研究涉及的材料在成分、化学结构和微观结构上具有显著的复杂性和多样性,这种复杂性使得很难为这些材料建立统一的特征描述。因此,研究人员通常选择具有某些共性的特定材料进行研究。然而,这种选择不仅进一步限制了数据集的规模,还在一定程度上限制了ML在电池材料研究中的应用。因此目前ML模型在捕捉材料之间细微差异和泛化能力方面还有一定局限性,影响了其在实际研究中的潜力。此外,电池研究中材料的复杂性对特征选择提出了重大挑战,限制了特征选择的可能性。这不仅影响了ML模型的预测结果,还限制了模型可解释性研究的广度和深度,阻碍了对材料结构与电池性能之间关系的理解。
因此,当面对复杂材料时,难以充分利用ML进行全面和准确的分析与预测。尽管来自计算和模拟的数据往往能够提供更大的数据集,但这种方法通常仅适用于大量低复杂性材料或同一材料系统中的不同状态。且这些计算和模拟通常仅关注材料本身的某些特性,而将材料应用于电池时,这些特性可能与实际电池性能(如容量)没有直接关联。因此,有必要对材料特性的各个方面进行计算和模拟,以评估它们在电池中的性能,或者进行广泛的实验以进一步验证材料特性对电池性能的影响。
图4. 筛选和设计高性能锂离子电池固态电解质材料需要关注的材料特性。
要点四:ML方法在电池材料领域的应用存在着机遇和新的研究方向
目前,缺乏统一的电池材料数据标准不仅阻碍了ML模型的数据挖掘潜力,还使得许多数据特性被忽视。因此,未来有必要为复杂的电池材料建立更适合的描述符和统一的基准数据库。此外,将ML的一些最新技术和进展与电池材料研究相结合,可以为新型电池材料的设计和开发提供新的方向和见解。例如,集成ML方法(包括Bagging、Boosting和Stacking)可以提高预测的准确性和鲁棒性,使其适用于小型电池材料数据集。生成对抗网络(GAN)不仅可以生成逼真的虚拟数据以补充实验数据,从而增加数据的多样性和数量,还可以创造具有特定电化学特性的全新材料结构。因此,GAN与电池材料研究的结合可能会在未来加速新材料的发现,减少对传统实验方法的依赖,节省大量时间和资源。由于材料的化学结构可以自然地表示为图,图神经网络(GNN)在材料研究中越来越受到关注。通过有效处理和学习材料的图结构数据,GNN可以识别材料结构中的关键特征,从而更准确地预测材料性能和行为,加速新材料的发现。随着GNN的不断发展,其在电池材料研究中的应用前景将越来越广阔。
https://doi.org/10.1016/j.ensm.2024.103710
潘丽坤,华东师范大学物理与电子科学学院教授、博导。1997、2001和2004年分别毕业于复旦大学应用化学专业(学士)、中科院声学研究所信息与信号处理专业(硕士)、新加坡南洋理工大学微电子专业(博士)。科睿唯安2021-2023全球高被引科学家,爱思唯尔2021-2023年中国高被引学者。已发表SCI论文400余篇,被引用32000多次,H指数 105。授权了中国发明专利30余项。目前担任 Journal of Colloid and Interface Science等期刊的编委。
黎晋良,暨南大学物理与光电工程学院副研究员,2012及2017年分别毕业于华南理工大学电子科学与技术专业(学士)、华东师范大学材料与光电子专业(博士),从事锂/钠/钾离子电池电极材料开发与电解液设计方面相关研究,以第一/通讯作者发表论文50余篇,总引用次数5500次。获省部级奖项2项;授权中国发明专利6件,主持2项国家级基金,4项省部级基金,担任广东省材料研究学会青委会委员,国际学术期刊Batteries编委,中文期刊《材料研究与应用》青年编委,国际学术期刊Rare Metals青年编委。
玄晓阳,泰山学院讲师。2017年毕业于泰山学院(学士),2022年毕业于华东理工大学(博士),2018–2022年于华东师范大学潘丽坤教授课题组联合培养。现主要从事电化学储能材料的储能机制和性能优化研究。在电化学表征和动力学分析方面具有一定经验。已发表SCI论文14篇,被引用300多次。
添加官方微信 进群交流
SCI二氧化碳互助群
SCI催化材料交流群
SCI钠离子电池交流群
SCI离子交换膜经验交流群
SCI燃料电池交流群
SCI超级电容器交流群
SCI水系锌电池交流群
SCI水电解互助群
SCI气体扩散层经验交流群
备注【姓名-机构-研究方向】
说明
🔹本文内容若存在版权问题,请联系我们及时处理。
🔹欢迎广大读者对本文进行转发宣传。
🔹《科学材料站》会不断提升自身水平,为读者分享更加优质的材料咨询,欢迎关注我们。
投稿请联系contact@scimaterials.cn