Py学习  »  机器学习算法

Nat. Nanotechnol. | 机器学习加速发现全天然塑料替代品

吕华课题组 • 1 年前 • 221 次点击  

    大家好,今天为大家分享一篇最近发表在Nature Nanotechnology上的文章,题目为Machine intelligence-accelerated discovery of all-natural plastic substitutes这篇文章的通讯作者是来自美国马里兰大学的Teng Li教授、Liangbing Hu教授和Po-Yen Chen教授。

    塑料污染是目前全球面临的共同问题,防止石化基塑料在自然环境中积累的一个可能的解决方案是利用天然材料开发可持续的、可生物降解的塑料替代品。然而,可生物降解的塑料替代品的材料性能往往不如传统石化基塑料,寻找满足特定性能的全天然塑料替代品仍然具有很大的挑战性。

    在本文中,作者利用自动移液机器人和机器学习构建了一个集成工作流程,用于加速发现具有可编程光学、热和机械性能的全天然塑料替代品(1a)。作者使用了四种公认安全 (Generally-recognized-as-safe, GRAS) 的天然材料,包括纤维素纳米纤维 (CNFs)、蒙脱土 (MMT) 纳米片、明胶和甘油,来作为制造各种塑料替代品的原料。作者利用移液工作站制备不同CNF/MMT/明胶/甘油比例的纳米复合材料,通过主动学习和数据增强构建了在设计空间中的高精度预测模型,并实现天然纳米复合材料的逆向设计 (1b)

1. 机器学习加速发现具有可编程特性的全天然塑料替代品


    作者首先利用OT-2移液工作站制备不同比例的MMT/CNF/明胶/甘油混合物库 (2a),该工作站可在6小时内制备286种不同比例的混合物 (四组分,步长为10 wt.%),然后将混合的溶液浇铸到平面聚苯乙烯基板上,让其蒸发过夜。

    作者根据纳米复合膜的可拆卸性和平整度,将286个样品分为四种情况,分别是(1)可拆卸且平坦(A)(2)可拆卸但弯曲(B)(3)可拆卸但断裂(C)(4)不可拆卸(D)最终混合物中共有132A级、36B级、46C级及72D,其中A级的材料属于可行的设计空间,作者将在后续的实验中测试这些A级纳米复合膜的性能。作者训练了一个支持向量机 (SVM) 分类器用于预测特定的MMT/CNF/明胶/甘油比例的分级情况,该模型预测A级纳米复合膜成功率高达94%。通过将获得A级纳米复合材料的可能性阈值设置为75%作者定义了一个3D的、不规则的可行设计空间,占整个设计空间的48% (2b)

2. 通过主动学习、数据增强和人机协作构建高精度预测模型


    主动学习循环的起点是十种随机比例的混合物,作者在用OT-2工作站得到这些纳米复合膜后,分别测试了它们的光学、耐火和力学性能,这些数据作为它们的性能标签,将薄膜的(MMT/CNF/明胶/甘油)组成比例作为组成标签(2c)。为了提高模型的学习效率,防止过拟合,作者用数据增强通过一定的原则来生成虚拟数据点,虚拟点和真实点都被用作人工神经网络模型的训练数据,该模型基于一个混合采集函数来评估数据点的不熟悉程度(unfamiliarity),据此来生成下一轮需要探索采集的点。

    作者共进行了14个主动学习迭代循环,分阶段制备了135个全天然纳米复合膜,得到了约14万个真实和虚拟数据点。作者评估了不同模型对多属性预测的准确性,在一个未输入给模型的测试集上计算了预测和实际的平均相对误差 (MRE)。如图2e所示,经过14个主动学习循环后,MRE下降到17%左右,并且在所有预测模型中,人工神经网络模型的多属性预测的MREs最低,准确率最高。从图2f可以看出,未经数据增强的ANN模型MRE较高,>55%,这主要是由于训练数据点较少导致模型过拟合。作者确定了最优的虚实数据比为1000,在保持较短的循环时间的同时,最大限度地提高了模型能力

    最优的模型可以准确预测多种天然纳米复合膜的透光率、耐火性能和应力-应变曲线,与实验结果吻合较好 (3a-c)。通过输入可行设计空间内所有可能的成分,最优模型生成了一组3D热图,直观地表示了所有属性标签的空间分布(3d-f),天然纳米复合材料的光学、热学和力学性能在很大范围内都是可调的。

3. 模型预测能力


    为了进一步丰富组成空间,作者加入了第五种组分壳聚糖来扩展模型,经过三轮额外的主动学习循环,将新的自由度引入最佳的模型中,经过三次循环后, MREs107%下降到21% (3g);引入壳聚糖可以有效地提升最终复合材料的延展性(3h)。利用扩展模型,作者增加了透明文件夹和透明气垫两种高应变的全天然塑料替代品。

    为了证明模型多属性预测的能力,作者对全天然塑料替代品进行了自动化逆设计。每种模型推荐的全天然塑料替代品都具有光学透明度、阻燃性和机械弹性,符合不同的设计标准。作者按照模型建议的成分,大面积生产了各种全天然塑料替代品(4c),这些材料的保质期均超过6个月,并且可生物降解,具有良好的生物安全性。作者最后还用SHAP分析解释了模型,说明了每一种组分对于预测能力的影响(4d-f)

4.  机器学习辅助全天然纳米复合材料的逆向设计和模型解释


    总的来说,本文报道的工作结合自动化移液工作站和人工智能技术,开发了一个工作平台,用于探索具备可编程光学、耐火和机械性能的全天然纳米复合材料库;这些材料可作为可生物降解的塑料替代品。该平台有望推进多种功能材料的发展。然而,在设计全天然塑料替代品的过程中,机器学习集成工作流程仍存在一些挑战和限制:1. 全天然纳米复合材料的制备和表征过程尚未实现完全自动化,仍需人工介入以连接合成与表征步骤,随着模块数量的增加,消耗的时间和人力都会大幅增加;2. 原料批次之间的质量差异可能影响后续的大规模生产和制造过程;3. 目前模型尚未考虑成本和生命周期分析,而这对于降低成本和减少环境污染同样十分重要。


作者ZHS  审校ZQK

DOI: 10.1038/s41565-024-01635-z

Link: https://doi.org/10.1038/s41565-024-01635-z
上一篇

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/169346
 
221 次点击