
刚果红是一种广泛应用于纺织工业的染料,因其具有致癌性和不可生物降解性,对生物体构成重大威胁。本研究提出一种基于数据驱动的机器学习方法,旨在优化生物炭特性与环境条件,从而最大限度地提高生物炭对刚果红染料的吸附能力。因此,该研究利用一个包含11项输入参数(与生物炭特性及环境条件相关)和吸附能力的数据集对六种机器学习模型进行训练与测试,采用R平方(R²)、均方误差(MSE)和均方根误差(RMSE)等性能指标对这些模型进行评估。随机森林回归(RF)模型的R²值(0.9785)最高,RMSE值(0.1357)最低,优于其他机器学习模型。决策树(DT)和极端梯度提升(XGB)模型表现也较好,其R²值分别为0.9741和0.9577,略低于随机森林回归模型。线性回归(LR)模型表现最差,R²值最低(0.4575),RMSE值最高(0.6821)。此外,通过十折交叉验证法对这些模型的可靠性进行了验证。RF模型再次表现最佳,R²值为0.9762。特征分析表明,相对于生物炭用量的初始染料浓度(C0)、比表面积(BET)和孔体积(PV)是影响生物炭对染料吸附能力的最重要因素,而碳含量、氧氮与碳的摩尔比 [(O+N)/C] 和孔径(D)等参数的影响极小。研究表明,机器学习模型能够准确预测生物炭的污染物吸附能力,从而提高废水处理效果,推动高效、低成本的环境管理。
图文摘要
本研究提出一种机器学习方法优化生物炭,以实现对刚果红染料的高效去除。
初始染料浓度、表面积和孔体积被确定为影响吸附的最关键因素。
该研究展示了数据驱动的机器学习方法在加强废水处理与环境管理方面的潜力。

所有11个输入参数的小提琴图:(a)零电荷点的pH值(pH_pzc);(b)总碳含量(C,质量百分比);(c)氢碳比(H/C);(d)氧碳比(O/C);(e)氧氮与碳的比值 [(O+N)/C];(f)比表面积(,m²/g);(g)孔隙体积(PV,cm³/g);(h)孔径(D,nm);(i)吸附温度(T,°C);(j)溶液的pH值(pH_sol);(k)相对于生物炭用量的初始染料浓度(C0,mmol/g)以及目标属性;(l)吸附能力(Q,mmol/g) 

图3 生物炭对刚果红染料吸附能力的测试数据集的散点图:(a)线性回归模型(LR);(b) 支持向量回归模型(SVR);(c) 决策树模型(DT);(d)随机森林模型(RF);(e) 岭回归模型(RR);(f)
极端梯度提升模型(XGB)
图4 每个主成分的累积解释方差的碎石图(a);主成分与生物炭对刚果红染料吸附能力的相关变量之间关系的双标图(b)
图5生物炭对刚果红染料吸附能力的特征重要性图(a)和SHAP总结图(b)
图6 生物炭对刚果红染料吸附能力的部分依赖图及个体条件期望曲线

图7 六种预测生物炭对刚果红染料吸附能力的机器学习模型的残差图:(a)线性回归模型(LR);(b) 支持向量回归模型(SVR);(c) 决策树模型(DT);(d)随机森林模型(RF);(e) 岭回归模型(RR);(f)
极端梯度提升模型(XGB)
本研究凸显了机器学习模型在预测生物炭去除刚果红染料吸附能力方面的有效性。随机森林模型表现出最高的准确性和可靠性,R²值为0.9785。决策树和极端梯度提升模型表现良好,R²值分别为0.9741和0.9577。然而,线性回归模型则表现较差,R²值仅为0.4575,且均方根误差高达0.6821。特征分析确定相对于生物炭用量的初始染料浓度、表面积和孔体积是影响吸附的最关键因素,而碳含量、氧氮与碳的摩尔比和孔径等参数的影响较小。这些发现引起了人们对机器学习在显著提高染料去除效率方面潜力的关注。研究表明,数据驱动的机器学习模型能够改进废水处理策略,并降低环境管理中的运营成本。
https://doi.org/10.1007/s44246-024-00168-3
更好地理解土壤中铁循环对碳的稳定及降解的作用
Towards a better understanding of the role of Fe cycling in soil for carbon stabilization and degradation