作为一种通过预设计有机配体间的共价键连接而形成的新型多孔晶体材料,COFs自2005年Yaghi等人首次合成以来便引起了广泛关注。COFs具有高比表面积、可调节的结构功能空间和孔径,使其在吸附与分离、催化、传感和能源储存等多个领域中展现出广阔应用前景。随着现代工业对高性能材料需求的不断上升,实现对材料结构与性能的精确控制已成为亟待解决的问题。传统的材料研究方法主要依赖人工实验,通过“假设-验证”的迭代过程逐步接近目标材料。然而,这种方法不仅耗时费力,效率也较低。尤其是在COFs研究中,配体种类繁多且组合多样,单靠大量重复实验来筛选理想配体及其组合在实践中是不现实的。
近年来,随着计算机科学与数据科学的迅速发展,基于分子模拟的高通量筛选方法逐渐成为新材料探索的有力工具。COFs具有结构组成规律性强、结构单元类型丰富的特点,使得通过高通量计算方法可程序化地生成大量潜在结构。然而,随着COFs数量的迅速增长,即使是高通量分子模拟方法也逐渐难以应对,计算资源与时间成本成为限制其应用的瓶颈。在此背景下,ML作为一种无需明确编程即可让计算机自主学习的人工智能方法,正迅速崛起,并在材料研究中受到广泛关注。ML不仅擅长处理大规模数据集,还能有效建立材料的物理化学特性与性能之间的关联关系,从而构建出可靠的预测模型,实现对材料性能的快速、高效、精准预测。更重要的是,ML能够深入挖掘材料之间隐藏的模式与趋势,揭示其潜在的结构-性能关系,从而突破传统试错路径,加快新材料的设计进程,同时节省时间和成本。
除了从现有数据库中筛选具有特定功能的材料外,那些尚未在实验中制备、但被预测具有优异性能的材料结构,也可以通过高通量计算与ML等数据分析技术相结合加以预测。这种被称为“材料基因组学方法”的研究范式,已成为材料科学中的新兴方向。研究人员可借此在实验前自动且快速地生成并筛选潜在材料结构,有效克服传统实验与高通量计算耗时过长的局限。近年来,ML已广泛应用于多个材料领域,例如碳材料、金属有机框架、锂离子电池材料以及催化材料,并凭借其优势在COFs研究中表现出越来越显著的作用。大量的数据、方法与模型不断涌现,解决了许多传统方法和人类分析难以处理的复杂问题。因此,系统梳理ML在COFs研究中的最新进展显得尤为必要,但目前仍较为缺乏。这综述不仅可以整合已有研究成果,还能为未来研究指明方向,助力COF材料在机器学习辅助下持续取得突破与创新。
本研究总结了ML在COFs筛选、设计、优化与性能预测中的作用,这些工作基于传统实验与高通量计算筛选方法开展。同时,文章重点强调了ML与COFs在CO₂捕集、CH₄储存、气体分离及催化等领域的典型应用。此外,文章还指出了当前ML在COFs研究中面临的主要挑战,并对未来的发展方向进行了展望。