HA.124 [深度学习-土壤水] 结合卫星数据和站点数据的土壤水分多尺度深度学习模型研究

作者简介｜PROFILE

刘江涛

刘江涛，2016年本科毕业于中国农业大学，2019年硕士毕业于北京师范大学，目前在美国宾夕法尼亚州立大学攻读博士学位，主要研究方向是使用深度学习的方法进行全球土壤水分模拟和滑坡敏感性预测。在GRL等期刊上发表一系列学术论文。

联系方式：liujiangtao3@gmail.com

个人主页：https://scholar.google.com/citations?user=raNrs0gAAAAJ&hl=en&oi=ao

引文链接｜CITATION

Liu, J., Rahmani, F., Lawson, K., & Shen, C. (2022). A Multiscale Deep Learning Model for Soil Moisture Integrating Satellite and In Situ Data. Geophysical Research Letters, 49(7), e2021GL096847. https://doi.org/10.1029/2021GL096847

关键词｜KEYWORDS

多尺度模型，深度学习，卫星数据，站点数据

摘要｜ABSTRACT

高分辨率和广覆盖的土壤水分数据具有十分重要的应用价值，比如干旱监测、作物灌溉管理、虫害的防治等。目前的一些土壤水分产品有不同的限制。例如，站点数据观测比较准确，但在空间覆盖范围上受限；卫星数据具有较高的空间覆盖范围，但是它的分辨率往往较粗，难以在农业尺度进行应用。为此可以使用陆面模型、卫星数据降尺度和机器学习等方法获取高分辨率土壤水分数据。其中，深度学习模型是一个重要的方法，它在土壤水分模拟、径流模拟和模型参数学习等方面都有较好的表现。

当前，数据驱动模型往往从单个数据源中学习，它的准确性和分辨率受限于这个单源数据。因此建立多尺度、多来源的混合数据集驱动模型可以克服单源数据的限制，让模型具有更好的表现。这种多尺度方案可以广泛应用于环境科学的多个研究领域（如图1）。简单的说，多尺度方案包括以下四步：

1. 在细尺度上运行长短期记忆网络（Long Short-Term Memory，LSTM）模型，其中模型在每个细格点上具有相同的权重；

2. 在粗尺度的格点上对预测值进行平均，计算卫星数据的损失项（loss term）值；

3. 在细尺度上计算站点数据的loss值；

4. 合并两个loss值，其中w是站点数据loss值的权重，（1-w）是卫星数据loss值的权重。

图1：多尺度方案示意图。（i）4个粗分辨率网格覆盖64个高分辨率网格；（ii）示例包含64个并行运算的9km LSTM模型，且每个模型有各自的输入，但每组细网格模型权重一致；（iii）通过少数位置（a11, b6, c12, d16）的9km LSTM模型输出结果与观测值来计算站点的loss值。

使用空间交叉验证（spatial cross-validation）的方法将模型的预测结果与美国本土（Contiguous United States，CONUS）站点观测数据进行比较。结果上，多尺度方案在USCRN（US Climate Reference Network）站点上得到的相关系数为0.901 (median)，均方根偏差为0.034m³/m³ (median)。它的表现优于SMAP产品、仅根据站点数据训练的深度学习模型以及Noah模型等（如图2）。

图2：多尺度方案的结果与SMAP，Noah以及36km的LSTM模型比较。（a）多尺度方案（w=0.5）结果和观测站点的RMSE；（b）和（a）相似，但表示的是相关性；（c）根据USCRN站点评估模型和产品；（d）和（c）相似，但是对SCAN（Soil Climate Analysis Network）站点进行评估。

使用多尺度方案对多源数据学习可以让模型摆脱单一数据源限制，从而获得更好的表现。从结果上看，大部分的有用信息来自于站点数据，尤其是USCRN这样的高质量站点，而粗尺度的卫星数据loss项本身似乎无法约束高分辨率的模型。但是当它与站点数据结合使用时，会给模型带来更多有价值的信息。

数据链接

https://github.com/mhpi/hydroDL

相关推荐｜RECOMMENDATIONS

[1] Tsai, W. P., Feng, D., Pan, M., Beck, H., Lawson, K., Yang, Y., & Shen, C. (2021). From calibration to parameter learning: Harnessing the scaling effects of big data in geoscientific modeling. Nature communications, 12(1), 1-13. https://doi.org/10.1038/s41467-021-26107-z

[2] Feng, D., Liu, J., Lawson, K., & Shen, C. (2022). Differentiable, learnable, regionalized process-based models with multiphysical outputs can approach state-of-the-art hydrologic prediction accuracy. Water Resources Research, 58, e2022WR032404. https://doi.org/10.1029/2022WR032404

[3] Liu, J., Hughes, D., Rahmani, F., Lawson, K., & Shen, C. (2022). Evaluating a Global Soil Moisture dataset from a Multitask Model (GSM3 v1.0) for current and emerging threats to crops. Geoscientific Model Development Discussions, 1-23. https://doi.org/10.5194/gmd-2022-211

撰稿: 刘江涛 | 编辑: 范云江 | 校稿: 周旭东

【下一篇：洪水发生机制】