摘要:
土壤重金属空间分布预测是场地开展风险评估和管控修复工作的重要依据。目前,利用机器学习模型预测土壤重金属空间分布逐渐成为研究热点,模型构建过程的重要性日益凸显。本文从机器学习模型特征指标体系构建、模型选择、精度评估、预测结果解释等关键过程综述了其在空间分布预测中的应用进展,分析了树模型、线性模型、神经网络模型等机器学习模型的适用性与不足,阐述了传统地统计学习模型与机器学习模型相结合的优势。
结果表明:机器学习模型输入变量主要包含空间信息、土壤性质和环境变量三类,结合相关性分析、方差膨胀因子、地理探测器等方法构建预测模型特征指标体系;随机森林(RF)和极端梯度提升机(XGBoost)模型在空间分布预测方面具有优势;与地统计模型、机器学习模型相比,混合模型均方根误差(RMSE)和平均绝对误差(MAE)均显著降低,优势明显;应用于重金属空间分布的模型解释方法主要依赖于树模型主动提供的特征指标重要性度量。建议未来加强特征选择与自动提取研究,提升指标体系科学性;深入探索模型融合方式,用优化算法确定最佳超参数;利用Shapley值等方法及因果分析,发展新算法解释复杂模型;开发综合时空维度的模型,精准把握土壤重金属浓度变化,提升预测准确性。
DOI:10.13198/j.issn.1001-6929.2025.03.06