气象要素的时空预报问题是天气气候预报中一个重要的研究课题。近年来,随着可用气象观测数据的增多以及计算机技术的发展,机器学习,特别是深度学习方法被越来越多地应用于天气气候预报问题中。周康辉等(2021)总结了传统机器学习方法和深度学习方法在强对流监测、短时临近预报和短期预报领域的应用,对目前机器学习存在的问题和未来发展方向进行了讨论。贺圣平等(2021)在关于机器学习方法在气候预报中的应用的研究中,介绍了机器学习方法和卷积神经网络(Convolutional Neural Network, CNN)的原理,并利用卷积神经网络对东亚冬季温度进行了建模回报。在北京地区体感温度误差和华北气温多模式集合预报的订正问题中,机器学习方法均取得了较好的效果(门晓磊等, 2019; 武略等, 2022)。Zhou et al.(2022)利用深度学习方法,基于基本数值模式变量进行定量降水预报,预报效果超过了欧洲气象中心的ECMWF HRES高分辨率数值模型。
在气象要素的临近预报问题中,以长短期记忆网络(Long Short-Term Memory, LSTM)结合卷积神经网络CNN为主要结构的卷积长短期记忆模型ConvLSTM (Shi et al., 2015)和预报循环网络PredRNN(Wang et al., 2017)被用来进行雷达回波的时空预报。这类模型主要是基于能直接提取时序信息的循环神经网络(Recurrent Neural Network, RNN)构建的。在基于RNN结构的预报中,韩丰等(2019)利用具有空间记忆模块和时间记忆模块的ST-LSTM(SpatioTemporal LSTM)单元构建模型,对雷达反射率进行预报,其预报效果超过了业务使用的交叉相关法。
近年来,有较多的研究以卷积神经网络CNN为主要网络结构构建时空预报模型。一般来说基于CNN结构的模型能够较好地捕捉空间信息(Reichstein et al., 2019),常用于和图像处理相关的问题中。但基于CNN结构的模型也能利用卷积结构将时间序列图像叠加在通道或深度维度上,隐式地处理时空序列预报问题(Prudden et al., 2020; Hu et al., 2021)。相比基于RNN的预报模型(如ConvLSTM),基于CNN的预报模型的结构更加简单灵活,优化模型所消耗的计算资源更少,被越来越多地应用于时空预报任务(Han et al., 2021; Hu et al.,2021)。
为了预报未来多个时次的气象要素场,基于CNN的模型通常采用不同的预报策略,例如迭代预报策略(Recursive Forecast Strategy, RFS)以及直接预报策略(Direct Forecast Strategy, DFS)(Shi and Yeung, 2018)。RFS模型一般以相对于输入时段气象要素场的下一时次气象要素场为训练目标,通过将上一时次的预报场作为预报下一时次气象要素场的一个输入,迭代使用RFS模型从而实现目标时段的预报(曹伟华等, 2022)。Ayzel et al.(2020)构建了一个基于CNN的雷达回波预报模型RainNet,RainNet输出未来5 min的雷达回波,通过迭代策略RainNet被用于预报未来1 h内12个连续时次的雷达回波。对于较低的降水阈值,RainNet预报效果超过了基于光流法的传统模型,RainNet对较强降水的预报能力有限。
与RFS利用模型自身输出作为新的模型输入进行预报不同,DFS模型直接对目标时段进行训练,不需要借助模型中间输出就能生成目标时段的预报。DFS模型通常有多输出的多时次直接预报模型(Direct Forecast Strategy-Multi steps, DFS-M)和单输出的单时次直接预报模型(Direct Forecast Strategy-Single step, DFS-S)。DFS-M模型在整个目标时段的所有时次上计算损失函数,通过一个模型直接输出多个时次的预报结果。在使用DFS-M预报策略的研究中,Zhang et al.(2019)使用多来源的3维雷达回波数据和气象再分析数据,构建了一个3D卷积模型(3D-cube Successive Convolution Network, 3D-SCN)用于预报对流雷暴的生消发展,该模型的预报效果超过了传统临近预报算法雷暴识别、追踪与外推算法(Thunderstorm Identification, Tracking, and Nowcasting, TITAN )。Castro et al.(2021)利用时空卷积“序列到序列”网络(Spatiotemporal Convolutional Sequence to Sequence Network, STConvS2S)构建了一个 DFS-M模型,相比于一般的CNN序列预报模型,STConvS2S在训练阶段不会违背输入数据的时间顺序,可以生成超过输入时次长度的预报。其对于气温的预报效果超过基于RNN的基准模型,训练耗时比RNN模型更短。Pan et al.(2021)构建了基于UNet网络变体的混合重分配网络(FUsion and REassignment Networks, FURENet),通过融合额外的偏正雷达数据,FURENet可以更好地预报对流雷暴的演变过程。
DFS-S模型一般由多个子模型构成,每个子模型负责预报目标时段中的一个时次。在使用DFS-S预报策略的研究中,Agrawal et al.(2019)使用UNet模型预报未来1 h的雷达降水,预报效果超过了光流法、持续预报以及一个数值预报模型。Ham et al.(2019)利用CNN直接预报未来某一个时刻的Niño指数,相比动力预报模型CNN模型更善于预报海温的纬向分布。Trebing et al.(2021)提出加入注意力机制的UNet变体模型SmaAt-UNet(Small Attention-UNet),该模型使用更少参数取得了和其他深度学习模型相似的降水预报效果。
通过相关研究可以看出,在使用基于CNN的模型进行临近预报时,可以采用不同的预报策略,但目前缺少针对同一个气象要素临近预报问题使用多个预报策略的研究,此类研究可以通过对比不同预报策略预报效果的差异,分析预报策略对模型预报效果的影响。