文章推荐|基于深度学习的气象要素时空预报策略——直接预报和迭代预报的对比

气象要素的时空预报问题是天气气候预报中一个重要的研究课题。近年来，随着可用气象观测数据的增多以及计算机技术的发展，机器学习，特别是深度学习方法被越来越多地应用于天气气候预报问题中。周康辉等（2021）总结了传统机器学习方法和深度学习方法在强对流监测、短时临近预报和短期预报领域的应用，对目前机器学习存在的问题和未来发展方向进行了讨论。贺圣平等（2021）在关于机器学习方法在气候预报中的应用的研究中，介绍了机器学习方法和卷积神经网络（Convolutional Neural Network, CNN）的原理，并利用卷积神经网络对东亚冬季温度进行了建模回报。在北京地区体感温度误差和华北气温多模式集合预报的订正问题中，机器学习方法均取得了较好的效果（门晓磊等, 2019; 武略等, 2022）。Zhou et al.（2022）利用深度学习方法，基于基本数值模式变量进行定量降水预报，预报效果超过了欧洲气象中心的ECMWF HRES高分辨率数值模型。

在气象要素的临近预报问题中，以长短期记忆网络（Long Short-Term Memory, LSTM）结合卷积神经网络CNN为主要结构的卷积长短期记忆模型ConvLSTM （Shi et al., 2015）和预报循环网络PredRNN（Wang et al., 2017）被用来进行雷达回波的时空预报。这类模型主要是基于能直接提取时序信息的循环神经网络（Recurrent Neural Network, RNN）构建的。在基于RNN结构的预报中，韩丰等（2019）利用具有空间记忆模块和时间记忆模块的ST-LSTM（SpatioTemporal LSTM）单元构建模型，对雷达反射率进行预报，其预报效果超过了业务使用的交叉相关法。

近年来，有较多的研究以卷积神经网络CNN为主要网络结构构建时空预报模型。一般来说基于CNN结构的模型能够较好地捕捉空间信息（Reichstein et al., 2019），常用于和图像处理相关的问题中。但基于CNN结构的模型也能利用卷积结构将时间序列图像叠加在通道或深度维度上，隐式地处理时空序列预报问题（Prudden et al., 2020; Hu et al., 2021）。相比基于RNN的预报模型（如ConvLSTM），基于CNN的预报模型的结构更加简单灵活，优化模型所消耗的计算资源更少，被越来越多地应用于时空预报任务（Han et al., 2021; Hu et al.,2021）。

为了预报未来多个时次的气象要素场，基于CNN的模型通常采用不同的预报策略，例如迭代预报策略（Recursive Forecast Strategy, RFS）以及直接预报策略（Direct Forecast Strategy, DFS）（Shi and Yeung, 2018）。RFS模型一般以相对于输入时段气象要素场的下一时次气象要素场为训练目标，通过将上一时次的预报场作为预报下一时次气象要素场的一个输入，迭代使用RFS模型从而实现目标时段的预报（曹伟华等, 2022）。Ayzel et al.（2020）构建了一个基于CNN的雷达回波预报模型RainNet，RainNet输出未来5 min的雷达回波，通过迭代策略RainNet被用于预报未来1 h内12个连续时次的雷达回波。对于较低的降水阈值，RainNet预报效果超过了基于光流法的传统模型，RainNet对较强降水的预报能力有限。

与RFS利用模型自身输出作为新的模型输入进行预报不同，DFS模型直接对目标时段进行训练，不需要借助模型中间输出就能生成目标时段的预报。DFS模型通常有多输出的多时次直接预报模型（Direct Forecast Strategy-Multi steps, DFS-M）和单输出的单时次直接预报模型（Direct Forecast Strategy-Single step, DFS-S）。DFS-M模型在整个目标时段的所有时次上计算损失函数，通过一个模型直接输出多个时次的预报结果。在使用DFS-M预报策略的研究中，Zhang et al.（2019）使用多来源的3维雷达回波数据和气象再分析数据，构建了一个3D卷积模型（3D-cube Successive Convolution Network, 3D-SCN）用于预报对流雷暴的生消发展，该模型的预报效果超过了传统临近预报算法雷暴识别、追踪与外推算法（Thunderstorm Identification, Tracking, and Nowcasting, TITAN ）。Castro et al.（2021）利用时空卷积“序列到序列”网络（Spatiotemporal Convolutional Sequence to Sequence Network, STConvS2S）构建了一个 DFS-M模型，相比于一般的CNN序列预报模型，STConvS2S在训练阶段不会违背输入数据的时间顺序，可以生成超过输入时次长度的预报。其对于气温的预报效果超过基于RNN的基准模型，训练耗时比RNN模型更短。Pan et al.（2021）构建了基于UNet网络变体的混合重分配网络（FUsion and REassignment Networks, FURENet），通过融合额外的偏正雷达数据，FURENet可以更好地预报对流雷暴的演变过程。

DFS-S模型一般由多个子模型构成，每个子模型负责预报目标时段中的一个时次。在使用DFS-S预报策略的研究中，Agrawal et al.（2019）使用UNet模型预报未来1 h的雷达降水，预报效果超过了光流法、持续预报以及一个数值预报模型。Ham et al.（2019）利用CNN直接预报未来某一个时刻的Niño指数，相比动力预报模型CNN模型更善于预报海温的纬向分布。Trebing et al.（2021）提出加入注意力机制的UNet变体模型SmaAt-UNet（Small Attention-UNet），该模型使用更少参数取得了和其他深度学习模型相似的降水预报效果。

通过相关研究可以看出，在使用基于CNN的模型进行临近预报时，可以采用不同的预报策略，但目前缺少针对同一个气象要素临近预报问题使用多个预报策略的研究，此类研究可以通过对比不同预报策略预报效果的差异，分析预报策略对模型预报效果的影响。

曾安捷, 华维, 严中伟, 等. 2023. 基于深度学习的气象要素时空预报策略——直接预报和迭代预报的对比 [J]. 气候与环境研究, 28(5): 547−558. doi:10.3878/j.issn.1006-9585.2023.23011

摘要：

以大气垂直累积液态水含量的预报问题为例，使用UNet网络结构作为基础结构构建时空预报模型，对比了采用两类预报策略的模型的预报效果，预报策略包含一个迭代预报策略（Recursive Forecast Strategy, RFS）以及两个直接预报策略（Direct Forecast Strategies, DFSs）。研究结果表明，两个直接预报模型对整体预报时段的预报效果明显优于迭代预报模型，直接预报模型的RMSE比迭代预报模型低19%。随着预报时次的增加，迭代预报模型的预报误差累积速度比两个直接预报模型快。在两个直接预报模型中，多时次输出模型（Direct Forecast Model Multi-Steps, DFS-M）的预报表现更加稳健，在整体预报时段上预报效果优于单时次输出模型（Direct Forecast Model Single-Step, DFS-S），但DFS-S模型对几个前期时次的预报效果较好。本研究利用深度学习可解释性技术中的深度学习重要特征分析方法（Deep Learning Important FeaTures, DeepLIFT）分析DFS-M和DFS-S模型各个输入时次对于模型预报的相对重要性。研究结果表明，DFS-M和DFS-S模型80%的输入重要性都集中在最后两个输入时次上，较早期输入时次的重要性随着预报时次的增加而呈现上升趋势。由于各输出时次间存在一定的统计相关性，受输出时次相关性约束的DFS-M模型的输入时次重要性变化比DFS-S模型更加稳定。通过将DFS-M和DFS-S模型对于不同时次的预报进行结合，可以得到效果更加均衡的预报。本研究可以为基于深度学习的天气气候预报方法的选择提供新的思路。

图 1 构建三个预报策略模型的基础UNet网络结构

Fig. 1 Basic UNet architecture for constructing three forecast-strategy models

图6 预报策略模型的（a）RMSE（单位：kg m−2）、（b）POD、（c）CSI和（d）FAR随12个预报时次的变化

Fig. 6 Variations of (a) RMSE (kg m−2), (b) POD, (c) CSI, and (d) FAR of forecast-strategy models over 12 forecast time steps

图7 2019年6月1日（89.6°W～94.9°W，43.3°E～46.6°E）区域测试集一次降水天气事件实例中（d1）观测和（d2−d4）模型预报的t+1时次（第一列）、t+3时次（第二列）、t+5时次（第三列）、t+7时次（第四列）、t+9时次（第五列）和t+11时次（第六列）垂直累积液态水含量分布

Fig. 7 Vertically Integrated Liquid water content (VIL) distributions across t + 1 (the first column), t + 3 (the second column), t + 5 (the third column), t + 7 (the fourth column), t + 9 (the fifth column), and t + 11 (the sixth column) time steps for (d1) observation and (d2−d4) model outputs within a single weather event from test dataset on 1 Jun 2019 within the region (89.6°W−94.9°W，43.3°E−46.6°E)

全文链接:

http://www.iapjournals.ac.cn/qhhj/cn/article/doi/10.3878/j.issn.1006-9585.2023.23011