今天介绍一篇七月发表在JGR: Atmospheres上的文章,这篇文章是由Jared T. Trok团队研究的《Using Machine Learning With Partial Dependence Analysis to Investigate Coupling Between Soil Moisture and Near-Surface Temperature》,主要探讨了利用机器学习和部分依赖分析来研究土壤湿度与近地表温度之间的耦合关系。
一、引言:
自1980年代早期以来,气候模式实验已经证实了土壤湿度通过调节地表能量预算来影响近地面空气温度。这种土壤湿度(SM)和温度(SM-T)的耦合关系是由地表和大气间复杂的相互作用所产生。在强SM-T耦合区域,土壤湿度影响辐射能量分配为潜热和感热通量的比例,形成正反馈机制:干燥土壤导致更高温度和进一步的土壤干燥,而湿润土壤通常导致较低温度。SM-T耦合的局部和非局部(下风)效应,在日、月和季节尺度上均有体现。
研究表明,对于SM-T耦合强度的量化多依赖于观测和模型导出的数据集。然而,传统的气候模型实验和线性统计方法在解释SM-T耦合时存在局限性,特别是在评估不同SM值下温度的敏感性时。这引出了对非线性统计方法的需求,以全面评估SM-T耦合关系而不需依赖于广泛的气候模型模拟。
图1 卷积神经网络(CNN)示意图
二、数据及其方法:
数据来源:研究使用的数据来源于ERA5/ERA5-Land历史再分析数据集。数据包括日均500hPa地势高度(GPH)异常值和日均地表层体积土壤湿度(SM)异常值,这些用作区域平均最高气温(TMAX)的预测因子。
机器学习方法:本研究中,卷积神经网络(CNN)被用来预测各个区域的平均每日最高气温。CNN模型的输入主要包括两部分:规范化的日历日期和一个三维空间输入矩阵,后者包含了预测当天的500百帕地势高度(GPH)地图和前一天的土壤湿度(SM)异常值地图。
部分依赖分析:研究应用了部分依赖分析(PDA)来可视化CNN模型预测的夏季最高气温与平均局部SM异常值之间的非线性关系。通过选择特定的GPH异常图和对应的日历日输入,并将其与测试数据集中的SM地图配对,能够评估CNN的TMAX预测如何依赖于日GPH条件下的平均局部SM异常。此外,还通过创建多个基线数据集并随机打乱SM输入图,来验证部分依赖分析方法的有效性。
图2 基于部分依赖分析的土壤湿度-温度耦合关系推导流程图
三、结果:
该研究通过分析16个中纬度区域的数据,揭示了土壤湿度(SM)和近地表最高气温(TMAX)之间的季节性耦合关系。研究发现,所有区域在夏季经历最高温度和最干燥的土壤湿度条件,而冬季则经历最低温度。这表明TMAX和SM之间存在显著的季节性变化,且这种变化在不同区域间有着显著的差异。
图3 CNN模型性能比较
卷积神经网络(CNN)模型在预测TMAX方面表现出色,优于不包括SM输入的基线模型。这表明地势高度(GPH)和SM输入均为预测TMAX提供了重要信息。部分依赖分析显示,所有区域的SM-T关系在整个SM范围内呈现负斜率,意味着在更干燥的SM条件下,CNN倾向于预测更高的TMAX值。
图4 土壤湿度-气温耦合分析
研究还对SM输入滞后对SM-T耦合强度的影响进行了分析。结果表明,几乎所有区域的SM-T耦合强度随SM输入滞后时间的增加而减弱,且这种减弱速率在不同区域间有所不同。此外,使用NCEP/DOE再分析II数据集进行的分析与ERA5分析的结果一致,进一步证实了研究结果的稳健性。
图 5 区域SM-T关系对比
这些结论表明,CNN模型能够有效地捕捉土壤湿度和近地表温度之间的复杂关系,并揭示了这些关系在不同地区和不同SM条件下的变化。通过部分依赖分析,研究提供了对SM-T耦合的深入理解,并表明SM在影响地表温度方面的重要性。
四、思考讨论
总之,本文利用机器学习和部分依赖分析方法研究了土壤湿度与近地表温度之间的耦合关系,揭示了它们之间的非线性关系。这种方法有助于加深对土壤-大气相互作用的理解,为气候模型和水文模型的改进提供依据。
文章来源:
https://agupubs.onlinelibrary.wiley.com/doi/full/10.1029/2022JD038365
声明:欢迎转载、转发本号原创内容,可留言区留言或者后台联系小编(微信:gavin7675)进行授权。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及作品内容、版权和其他问题,请后台联系小编处理。