南开大学汪磊教授团队彭楚老师在Eco-Environment & Health期刊上发表了题为“Can Oxidative Potential be a Plant Risk Indicator for Heavy Metals Contaminated Soil? Analysis of Ryegrass (Lolium perenne L.) Metabolome Based on Machine Learning”的研究论文。该论文基于黑麦草(Lolium perenne L.)抗氧化酶等生物标志物和代谢组学分析,探究了在Cu和Pb胁迫下,黑麦草氧化胁迫指标和土壤OP的潜在相关性,明确了土壤OP与植物生物标志物之间的剂量效应关系。同时,通过机器学习筛选了与土壤OP最相关的黑麦草代谢通路,这些通路与黑麦草氧化胁迫有关,确定了土壤OP评估重金属污染对植物生态风险的可行性。
1. 黑麦草生物标志物响应指数与土壤OP显著指数相关
研究采用对照土壤和某金属冶炼厂采集的Cu和Pb污染土壤样品(即S1-S8)进行黑麦草暴露实验,其中土壤OP值测定结果为20.9–62.8 pmol/(min·μg)。黑麦草暴露实验结果表明,与对照组相比,暴露于污染组黑麦草6种与氧化胁迫相关的生物标志物CAT、T-AOC、MDA、SOD、POD和MT均发生了显著变化,其生物标志物响应指数(BRI)变化范围为1.81–4.00。相关性分析结果显示BRI与OP呈极显著指数相关(r=0.923, p<0.01)(图1),明确了土壤OP与植物氧化胁迫生物标志物之间的剂量效应关系。
图1. 土壤OP值与黑麦草生物标志物响应指数(BRI)的相关性
2. 黑麦草代谢扰动与土壤OP显著相关
黑麦草暴露于污染组土壤后,与对照组相比较,共发现81个显著差异表达的代谢物(p<0.05和VIP>1),分为氨基酸,嘌呤、嘧啶及其衍生物,糖类,有机酸,脂肪酸,异戊烯醇脂类和甘油磷脂以及其他类别共7类代谢物,污染组黑麦草7类代谢物的代谢效应水平指数(MELI)均显著高于对照组。土壤OP与7类代谢物MELI的相关性结果表明,土壤OP与氨基酸和糖类的MELI显著相关(p<0.05),同时氨基酸和糖类的MELI与其余类别代谢物MELI显著相关,说明OP与重金属诱导的植物代谢扰动之间存在相关性(图2)。
图2. 土壤OP值与黑麦草不同类别显著调节代谢物的代谢效应水平指数(MELI)的相关性
3. 基于机器学习筛选与土壤OP最相关的前20种黑麦草代谢物
为了筛选与OP值相关的最重要代谢物,采用XGboost、MLPClassifier、决策树和随机森林四个机器学习模型对代谢物的重要性进行排序(图3)。通过超参数优化对XGboost、MLPClassifier、决策树和随机森林四个机器学习模型的参数进行优化,采用优化后的模型参数对代谢物的重要性进行排序。通过交叉验证准确率、召回率、精度、F1得分、ROC和AUC确定随机森林为最适合于本研究数据的最优模型。
基于随机森林筛选了与土壤OP最相关的前20种黑麦草代谢物,包含L-异亮氨酸,L-精氨酸,哌啶,丙二酸等物质,其中哌啶具有最高的重要性(图4A)。基于SHAP分析筛选的前20名代谢物中有17种与随机森林排序结果相同,最相关的代谢物也为哌啶,进一步验证了随机森林排序结果的正确性。SHAP分析提供了代谢物和土壤OP之间更全面的理解,L-苹果酸和L-苯丙氨酸含量大时SHAP值更高,说明这些代谢物与OP值呈正相关,海藻糖、腐胺等代谢物与OP值呈负相关(图4B)。
图3. 机器学习分析流程
图4. 基于随机森林模型筛选的前20种与OP最相关的代谢物(A);基于SHAP分析筛选的前20种与OP最相关的代谢物总体特征图(B)
4. 基于机器学习筛选与土壤OP最相关的黑麦草代谢通路
利用公共数据库《京都基因与基因组百科全书》(Kyoto Encyclopedia of Genes and Genomes,KEGG)进行通路富集分析,对基于随机森林筛选出与OP最相关的前20个代谢物进行代谢通路富集分析,确定与OP最相关的代谢通路包含氨基酸代谢、三羧酸循环、生物碱生物合成、咖啡因代谢、嘌呤和嘧啶代谢、鞘脂代谢、糖类代谢和a-亚麻酸代谢(图5),这些代谢通路均直接或间接与重金属诱导的植物氧化胁迫相关。
图5. 黑麦草暴露于Cu和Pb污染土壤后与OP值最相关的代谢通路
红色表示基于随机森林确定的与土壤OP最相关的前20种黑麦草代谢物
小结
采用二硫苏糖醇法测定了原位Cu和Pb污染土壤的OP,并测定了与氧化胁迫相关的黑麦草生物标志物。黑麦草生物标志物响应指数与土壤OP呈指数相关。土壤OP与黑麦草氨基酸和糖类的MELI显著相关。基于随机森林模型,SHAP分析和通路富集确定了与土壤OP最相关的前20种代谢物以及代谢通路,包含氨基酸代谢、三羧酸循环、生物碱生物合成、咖啡因代谢、嘌呤和嘧啶代谢、鞘脂代谢、糖类代谢和a-亚麻酸代谢等。总体而言,OP可用于评估重金属污染土壤对植物氧化胁迫的影响。OP值在重金属或其他污染物对更多类型植物的生态风险评估中的适用性,可以在未来进一步研究。
本研究得到了国家重点研发项目(2022YFC3703200)和教育部重点项目(B17025)资助。