有机太阳能电池(OSC)具有重量轻、可折叠和溶液大面积加工等独特优势,但在功率转换效率方面仍存在巨大提升空间。提高效率的两种常见而有效的策略是合成新型给受体光伏材料和确定合适的给受体材料组合。目前实验报道的给受体材料达到几百个以上,而新的给受体材料也在不断研发中。然而使用传统方法筛选与优化高性能材料需要耗费大量的人力和物力。在这项工作中(如图1流程图),我们首先从文献中建立了一个标准化的数据集。我们使用密度泛函理论(DFT)来计算OSC给体和受体材料的内在分子特性,并将其用作机器学习模型训练的输入特征。随后,我们使用Sure Independence Screening and Sparsifying Operator(SISSO)算法结合特征分析来分析预测结果并提出潜在公式。最后,我们使用热力学原理和我们开发的置信度检验规则来证明预测模型的潜力和可靠性。
在各种机器学习方法中,随机森林和神经网络(图2a)在预测OSC中的效率、短路电流、开路电压、填充因子上表现出较为卓越的性能如图2b所示。基于随机森林和神经网络的所有可能组合的预测结果如图2c-d中的热度图所示。随机森林和深度学习预测的最大效率均为16%,分别为PTQ10:Y6和PTQ10:IT-M。我们发现Y6与不同给体配对时效率较高,而P3HT与不同受体配对时效率通常较低,这与文献值吻合。
图2. 机器学习模型与性能。(a) 基于全连接神经网络的训练和推理示意图。(b) 基于随机森林和神经网络的功率转换效率(PCE)预测性能。(c)基于随机森林和(d)深度学习的PCE预测热度图。
为了评估预测结果,我们使用了SISSO和Shapley additive explanations (SHAP)。SISSO是一种基于压缩感知原理的数据驱动方法,其工作流程如图3a所示。在这项工作中,我们使用从文献中收集的性能数据作为目标属性,并使用相应分子的DFT计算的属性作为SISSO操作的输入特征,获得的最佳拟合的数学公式如图3b所示,效率的拟合效果如图3c。SHAP可用于解释输入数据的各种特征对预测结果的影响。图3d-e显示了特征重要性排序。我们发现效率公式中出现的费米能级和HOMO在SHAP分析中也起着重要作用,从而证明了我们提出的公式的合理性。通过评估这些特征的重要性,我们可以更好了解每种特征如何对最终的性能做出贡献,从而指导合成与选择OSC中的给受体材料组合。
图3. 可行性公式提出的方法及效果。(a) 公式提出的流程图。(b) SISSO提出的有机太阳能电池性能公式。(c) PCE拟合公式的拟合效果。d) 特征重要性图和(e)PCE的SHAP值分布图。
最后,我们结合了不同的模型和单结有机太阳能电池的详细平衡极限来评估我们模型的可靠性。如图4a-c所示,预测结果都在合理的区间,没有超过预设的上限值。结合理论上下限、随机森林、深度学习的预测,我们推出每个组合的置信度,如图4d-f所示,大部分气泡分布在对角线周围,表明不同模型预测的数据非常相似。结合效率和置信度的预测,效率的最大值的PTQ10:IT-M(16%),置信度仅为9%。我们的方法不仅展示了高性能组合和潜在公式的挖掘,还展示了模型的可靠性。
图4. 模型稳定性分析。(a)Y6、(b)ITIC和(c)IEICO与不同的给体配对的PCE和其理论上限值。与各种受体匹配的(d)P3HT、(e)PM6和(f)PTQ10的置信区间图。