
随着新能源汽车的快速普及,对锂离子电池的安全性、能量密度和循环性能提出了更高的要求。因此,开发具备高安全性、低成本、稳定性强、高性能和高容量等优势的锂离子二次电池显得尤为关键。然而,主要基于经验和重复实验的传统材料研发方法“试错法”,存在研发周期长、经济成本高、不确定因素多、效率低下等缺陷。因此,通过寻找新的研究方法来加速材料创新势在必行。相较于传统实验与计算方法,机器学习以其独特优势脱颖而出:它不仅能够实现大规模材料的快速筛选,显著降低研发成本,提升材料发现效率,还擅长在复杂材料系统中揭示结构-性能关系,使材料研究更加深入透彻。
近日,上海交通大学杨晓伟课题组对机器学习在锂离子电池材料领域的最新进展进行了系统梳理和深入分析。该综述全面探讨了材料科学中常用的机器学习算法,重点介绍了机器学习在锂离子电池材料性能预测和逆向设计中的具体应用,同时指出了该领域面临的挑战和未来发展方向。通过聚焦锂离子电池材料这一具体应用场景,本文深入剖析了机器学习技术的实际应用价值,为相关研究提供了新的思路和方向。
该论文以“Leveraging Machine Learning for Accelerated Materials Innovation in Lithium-Ion Battery: A Review“为题发表在期刊Journal of Energy Chemistry上。
材料科学中常用的机器学习算法
从模型的个数和性质角度,材料科学中常用的机器学习算法可以划分为单模型和集成模型。前者是指机器学习模型仅包括一个模型,以某种模型独立进行训练和验证使用的。例如,线性回归、逻辑回归、Lasso回归、Ridge回归、最近邻、支持向量机、神经网络、K-means聚类、层次聚类、谱聚类、主成分分析和奇异值分解等。但在运行中单模型往往会出现泛化能力不足、稳定性不高、表达能力有限等问题。这一系列问题恰好与电池材料数据相关联,由于电池内部环境的复杂性使得电池样本具有多种特性,以及材料性能受到各种物理和化学因素以及工艺条件的影响,导致电池材料领域的数据集通常样本量小,维度高。使得电池材料特性常表现为同时存在多个重要特征的表格数据。而另一种集成模型是将多个单模型进行组合构成一个强模型,从而提高预测性能和泛化能力,解决了单模型的不足,使得集成模型在解决电池材料表格数据的时候往往能发挥更好的性能。常见的集成模型包括极端提升树、随机森林、多元随机森林、MTB、AdaBoost、GBDT、LightGBM、CatBoost和XGBoost等。
锂离子电池材料性能预测
液体电解质在锂离子电池中扮演着至关重要的角色,其性能直接影响电池的容量和循环寿命。然而,由于液体电解质结构的无序性,传统实验和理论计算在评估其热导率、离子电导率、粘度、密度等关键性质时面临高成本和技术瓶颈。机器学习(ML)方法因其在预测这些性质方面的潜力而受到广泛关注。例如,研究者通过人工神经网络(ANN)成功预测了电解质溶液的热导率,并结合分子建模和机器学习技术,精确绘制了离子液体(ILs)和深共熔溶剂(DES)的热导率空间。此外,机器学习还被用于预测电解质的还原稳定性、电化学窗口和热容等热力学性质,以及离子电导率和粘度等动态性质。例如,通过结合密度泛函理论(DFT)和机器学习模型,研究者揭示了影响溶剂还原稳定性的关键描述符,并提出了基于热力学循环的高精度电化学窗口预测方法。总体而言,机器学习在液体电解质性质预测中的应用显著加速了高性能电解质的筛选和设计,为电池材料的开发提供了新的工具和视角。
采用适当的固态电解质可以抑制锂枝晶的生长,减少电池容量损失和防止短路。理想的电解质需要满足几个要求,包括快速离子电导率、与高能量密度电极的兼容性、宽电化学窗口、高机械刚度和热力学稳定性。然而,传统实验与理论计算面临效率低、成本高等瓶颈,机器学习(ML)的引入为材料设计提供了新范式。通过ML对固体电解质的离子迁移机制、机械性能、分子结构-性能关系等方向的应用,可以显著加速材料的设计进度。例如,研究者结合物理模型与数据驱动方法开发的化学信息传递神经网络,融合阿伦尼乌斯方程,实现高效筛选出2万种固态聚合物电解质;此外,机器学习分子动力学(MLMD)也展现出超越传统模拟的性能。例如,研究者通过MLMD精准解析离子在复杂势能面中的扩散行为,揭示了阴离子骨架振动与锂离子迁移的协同机制,为设计高迁移率电解质提供理论指导。当前,机器学习通过融合物理先验知识、优化特征工程与开发高效算法,正重塑固态电解质的研发路径,有望进一步解锁新材料体系,推动全固态电池的产业化进程。
图5. ML在电极材料设计方面的研究总结论。
作为电池中的关键组件,电极通常由正极和负极材料组成。高质量电池电极的生产通常需要复杂的制造过程。在复杂和多方面的电池电极生产过程中,实现分析制造参数的主流策略仍然基于反复试验,这非常耗时且耗费资源。因此,迫切需要一种可靠、系统和以数据为导向的策略来探索和预测制造电极的影响变量。目前已有大量应用于电极开发的机器学习研究,例如,研究者团队开发的多输出集成深度学习框架(MOEDL),集成贝叶斯优化、注意力机制等技术,实现同步预测电极材料的弹性模量、离子扩散系数等5项关键指标。以及将ML与DFT结合,来加速电极材料研发。例如,研究者融合DFT计算与ANN模型,通过电子亲和势、HOMO-LUMO能隙等量子化学描述符,实现分子氧化还原电位的高通量预测,并筛选出12种潜在高容量候选材料。 从材料基因解码到制造工艺优化,机器学习正在重塑电极研发的每个环节。当算法能够预见材料性能的“蝴蝶效应”,当数字孪生替代昂贵的试产线,动力电池的迭代速度将迎来指数级提升。
锂离子电池材料的逆向设计
对于新功能材料的设计,可以通过结构和属性之间的反向映射来推断出满足这些属性的未知分子,即分子的逆向设计,该过程从功能开始,到结构结束,旨在找到具有所需性能的目标材料。
(1)高通量虚拟筛选。逆向设计的早期工作之一是高通量虚拟筛选的方法。HTVS 起源于制药行业的药物发现,虚拟筛选是指基于蛋白质等生物大分子的三维结构或定量构效关系模型,借助计算机技术及软件,模拟目标靶点与候选药物之间的相互结合能力,从已知小分子数据库中挑选出符合要求化合物的一种快速筛选方法,是寻找潜在活性化合物、发现药物构效关系、优化药物设计、发现药物靶标的有效手段。然而,其原理和方法同样可以拓展应用到其他领域,包括材料科学,特别是电解质、电极材料的研发。在电解质材料的开发中,虚拟筛选技术可以用来预测和筛选具有特定离子传导性能、热稳定性、化学稳定性和其他所需物理化学性质的化合物。通过构建或利用现有的大型化合物数据库,结合量子化学计算、分子动力学模拟以及机器学习模型,研究人员可以评估众多化合物作为电解质材料的潜力,而无需逐一实验合成和测试。
(2)全局优化。材料科学中的全局优化算法是旨在探索材料的结构、组成或工艺参数的庞大空间,以找到具有最优性能(如高强度、高导电性、低成本等)的材料设计。这些算法能够在多维参数空间中寻找全局最优解,克服局部最优陷阱,适用于材料设计中的复杂、高度非线性问题。常见的有遗传算法(GA)、粒子群算法(PSO)、耦合模拟退火算法(CSA)、蚁群优化(ACO)、差分进化(DE)、洗牌复演化(SCE)、Levenberg-Marquardt算法(LM)、贝叶斯正则化(BR)算法、反向传播(BP)算法、缩放共轭梯度(SCG)算法。在优化问题中,系统的整体性能由称为目标函数的多元函数表示,例如,以原子坐标为变量的多原子聚集体的能量。当目标函数达到其全局极值时,通过一般趋势、方向和曲率的指导下,找到一个解决方案,即最佳条件。例如,有研究者采用粒子群优化算法,从11个合成参数中解析出镍含量、烧结温度与负极材料性能的量化关系,指导制备出容量达209.5 mAh/g的高性能硅碳负极。
(3)生成模型。最后一种逆向设计方法即是生成模型。它们是一类旨在捕捉分子结构与其性质之间的非线性关系的方法。使用一系列线性变换层将不同形式的数据相互转换,这些变换层之间具有非线性激活函数。通过从大型数据集中捕获这些信息,模型试图模拟或学习导致某种特性或行为的分子的特征。常见的生成模型有:变分自动编码器 (VAE)、生成对抗网络(GAN)、图神经网络(GNN)等。生成模型开始大多数应用于计算机辅助药物设计(CADD),而近年来材料领域对于生成模型的分子结构设计等能力愈发关注,试图帮助材料学家探索潜在的结构并加速材料发现的周期。例如,有研究团队训练变分自编码器(prVAE),通过5万组SEI膜动力学模拟数据学习多孔结构生成规律,成功将SEI厚度降低40%,锂离子迁移能垒下降0.3 eV。
机器学习正在锂二次电池的研究中引发了一场革命,尤其是在电解质和电极材料等关键组件的优化方面。ML 能够快速分析大规模数据集并预测材料行为,加速高质量材料的发现,提高电池性能并延长其寿命。随着 ML 技术的不断进步以及可充电电池材料科学中新挑战的不断涌现,其应用范围将持续扩展。未来机器学习在材料科学中的研究前景可能集中在以下几个方面:(1) 面向 DFT 及其他计算方法的低成本资源利用;(2) 智能机器人自主实验室与闭环优化;(3) 数据驱动的新材料研究方法。
本研究综述了 ML 在锂二次电池领域的研究进展和应用,重点探讨了 ML 模型在性能预测和逆向设计中的作用。通过分析 ML 在其他领域的应用,可以发现相较于传统方法,机器学习展现出独特的高维数据处理能力与跨尺度关联挖掘优势。然而,ML 在可充电电池领域的应用也面临诸多重大挑战。 例如:(1) 数据稀缺、小样本规模和高维度问题;(2) 模型的可解释性。
尽管仍然面临挑战,但ML在锂二次电池领域已经取得了显著突破。并展现了AI在理解、监测、发现、管理和优化锂二次电池方面的巨大潜力。我们相信,随着材料信息学、统计学和AI的快速发展,以上挑战将在不久的将来得到解决或缓解。因此,ML技术将在锂二次电池新材料的发现及其相应的工艺开发方面提供强有力的技术支持,进一步推动这一领域的创新与发展。
Leveraging Machine Learning for Accelerated Materials Innovation in Lithium-Ion Battery: A Review
Rushuai Li, Wanyu Zhao*, Ruimin Li, Chaolun Gan, Li Chen, Zhitao Wang, Xiaowei Yang*
Journal of Energy Chemistry
DOI: 10.1016/j.jechem.2025.02.038
杨晓伟
上海交通大学特聘教授,国家杰青获得者、国家级青年人才。中国化工学会储能工程专委会副主任委员、中国有色金属学会新能源材料工作委员会副主任。曾先后承担科技部青年973计划、国家基金委杰青/合作创新团队/面上等基金项目。发表100多篇学术论文,最高单篇他引近2000次。研究方向为多价离子电池、膜及膜分离、界面传递过程。课题组主页:https://www.x-mol.com/groups/yang_xiaowei
赵婉玉
上海交通大学化学化工学院助理研究员、博士后。研究方向为镁二次电池、电解液化学与计算化学。
李如帅
河南大学能源科学与技术学院/上海交通大学绍兴新能源与分子工程研究院硕士研究生,导师杨晓伟教授。目前研究方向为人工智能驱动电池电解液的开发。

业务介绍
研理云,研之成理旗下专门针对科学计算领域的高性能计算解决方案提供者。我们提供服务器硬件销售与集群系统搭建与维护服务。 ● 配置多样(单台塔式、两台塔式、多台机架式),按需定制,质量可靠,性价比高。
● 目前已经为全国 100 多个课题组提供过服务器软硬件服务(可提供相同高校或临近高校往期案例咨询)。 ● 公司服务器应用工程师具有量子化学、第一性原理、分子动力学等相关学科研究背景。 ● 公司与多位化学、材料领域理论计算方向专家长期合作,一起探索最优服务器软硬件配置和部署。
● 定制化硬件配置:提供售前实例测试,为您提供最合适的硬件配置方案。 ● 一体化软件服务:根据需求,发货前,完成系统、环境、队列、计算软件等所有内容的安装与配置,让您实现开机即用。 ● 完善的售后服务:为每位客户建立专属服务群,遇到问题及时解决。大大降低使用学生使用门槛和缓解老师压力。三年硬件质保 + 三年免费软件技术支持。 ● 已购买客户咨询:我们已有超过100位已购买客户,可以给您提供相同城市或者临近城市已购买客户的联系方式,以提供真实案例咨询。 ●
赠送课程学习机会:可选课程包括量子化学(Gaussian),第一性原理,(Vasp),分子动力学模拟(Lammps、Grommacs),钙钛矿计算模拟(Vasp)等。具体赠送方案以沟通结果为准。
更多科研作图、软件使用、表征分析、SCI 写作、名师介绍等干货知识请进入后台自主查询。