社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

弗吉尼亚理工同嵘/辛洪良《自然·通讯》: 机器学习优化高分子立体选择聚合反应

高分子科学前沿 • 1 年前 • 408 次点击  

寻找高性能的催化剂进行反应优化是合成化学的基础和核心。由于实验反应的高成本,传统化学反应优化和催化剂筛寻局囿于对文献的理解和个人的经验进行直观的判断来决定反应优化的方向。然而,化学反应优化本身是一种复杂且多维的挑战,传统试错的方法或者高通量大规模筛选是对实验资源的浪费并缺乏一般适用的理性的指导。近年来,人工智能和机器学习开始被大量应用于化学领域,包括传统有机化学的反应优化和催化剂筛选。其中,贝叶斯优化算法 (Bayesian optimization),即一种基于迭代响应曲面的全局优化算法,在机器学习模型的优化方面表现出了良好的性能,并被用于许多化学反应优化过程。然而,其在高分子化学反应优化中的应用,尤其是对于高分子立体选择聚合反应(stereoselective polymerization),并未得到重视和研究。对于许多含有手性中心的高分子,其立体构象直接决定了高分子本身的机械性能和热性能,因而在实际应用中立体规整(stereoregular)的高分子具有更高的应用价值。不同于有机反应,许多高分子立体选择聚合反应并没有大量的立体选择催化剂(通常数量少于100个),因而增加了机器学习的难度。因此,开发一种能够高效地预测和优化高分子立体选择催化剂性能的计算和实验集成框架非常重要。

对此,来自弗吉尼亚理工大学 (Virginia Tech) 化工系的同嵘教授团队和辛洪良教授团队合作开发了一种贝叶斯反应优化和分析框架使得高分子化学家能够将先进的优化算法集成到高分子立体选择催化剂的筛选和优化实践中(图1)。研究者针对开环聚合合成的可降解的立体规整聚乳酸(Poly(lactic acid), PLA),从文献中收集了立体选择铝催化剂并建立了贝叶斯优化模型成功的预测多个高效的等选择性(isoselective)和异选择性(heteroselective)的铝催化剂用于立体选择的外消旋丙交酯 (racemic lactide)的聚合开环反应(ring-opening polymerization)。

图1. 贝叶斯优化高分子立体选择聚合反应的工作流程。

首先,研究者从文献报道的56个salen-和salan-型对称的铝催化剂的催化聚合过程中提取描述符(descriptor),并开始进行机器学习模型训练。经过不同研究者发现使用通过DFT(density function theory)描述符生成的数据集可以实现一致的回归性能,即具有最低的均值误差和标准差。在PmPr值的优化过程中,通过贝叶斯优化方法中的高斯过程回归替代模型(Gaussian process regression surrogate model),在经过7次迭代后就实现了收敛;而随机搜索过程在经过12次迭代后仍未实现收敛。这说明基于高斯过程回归的贝叶斯优化模型相较于随机搜索过程具有更高的搜索效率(图2)。

图2. 针对立体选择开环的机器学习算法模型的基准测试

接下来,作者利用这一模型预测出一系列新型铝催化剂,可用于催化合成具有高PmPr值的高分子。根据模型的预测结果,作者合成了33种新型铝催化剂进行实验验证。值得一提的是,在合成过程中,研究者考虑了合成步数并优先选择合成步数较少的催化剂进行测试。聚合结果显示,其中有8种催化剂达到Pm>0.85种催化剂实现Pr>0.8。并且基于这些催化剂的合成高分子展示了优异的热学性能和力学性能。其中高效异选择性催化剂合成得到聚乳酸具有和低密度聚乙烯相似的机械拉伸性能。重要的是,在测试反应中,贝叶斯优化确定了一系列催化剂配体,配体中的部分取代基团仅在文献中出现一次并未获重视。在进行了三轮预测后,实验值与预测值之间的平均绝对误差显著降低,从第一轮的0.36降低到第三轮的0.10,同时模型的搜索效率也显著提升。

最后,研究者利用SHAP (SHapley Additive exPlanations) 模型对各类DFT描述符在PmPr值中的贡献进行了详细分析。SHAP分析发现催化剂配体的掩埋体积(%Vbur )和配体芳香环部分的HOMO能级(EHOMO)都对催化剂的立体选择性有重大的影响。用这些重要的DFT描述符可以构建线性模型来解释配体的的选择性并帮助反应机理的理解 (图3)。

图3. 针对催化剂配体DFT描述符对立体选择贡献的SHAP分析和线性模型。

综上所述,研究者提出了一个数据驱动的全面的贝叶斯优化计算和实验框架,可用于发现具有高立体选择性的开环聚合催化剂,并深入理解影响催化剂立体选择性的结构因素。研究结果也证明了机器学习技术在加速催化剂开发方面的强大能力。该工作以“Bayesian-optimization-assisted discovery of stereoselective aluminum complexes for ring-opening polymerization of racemic lactide”为题发表在《Nature Communications》上。弗吉尼亚理工大学王晓倩博士,黄杨博士生,谢小雨博士生为文章共同第一作者

--纤维素推荐--

--扫下方二维码即可报名--

--荐号--

参考文献:
Wang, X.; Huang, Y.; Xie, X.;  Liu, Y.;  Huo, Z.; Lin, M.;  Xin, H.; Tong, R., Bayesian-optimization-assisted discovery of s
tereoselective aluminum complexes for ring-opening polymerization of racemic lactide. Nature Communications 2023,14, 3647.
来源:高分子科学前沿
声明:仅代表作者个人观点,作者水平有限,如有不科学之处,请在下方留言指正!

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/156537
 
408 次点击