这篇文章名为《GenCast: Diffusion-based ensemble forecasting for medium-range weather》。它介绍了GenCast,这是一种基于机器学习的生成模型,用于天气预测的集合。GenCast采用了一种新颖的基于扩散的方法来生成全球范围的15天集合预测,并展示了机器学习在概率天气预测中的潜力。
GenCast通过模拟天气状态在时间和空间上的联合概率分布,生成的全球15天集合预测比欧洲中期天气预报中心(ECMWF)的运行集合预测更准确,且速度更快。
一:引言
过去30年,天气预报从单一最佳猜测的确定性系统转变为基于数值天气预报(NWP)的随机集合预报。尽管这些集合预报在许多领域至关重要,但它们仍存在偏差和错误,并且计算成本很高。近年来,机器学习在中期预测方面取得了显著进展,但大多侧重于确定性预测和最小化均方根误差(RMSE),而相对忽视了不确定性量化和概率建模。
二:数据及其方法
GenCast使用的数据来自欧洲中期天气预报中心(ECMWF)的ERA5存档。所使用变量如下:
图1 数据集中的ECMWF变量
GenCast是一种基于机器学习的概率天气预测模型。其核心是使用扩散模型,这是一种生成式机器学习模型,用于从给定数据分布中生成新样本。GenCast的过程开始于从一个噪声分布中抽样,然后通过学习去噪器迭代变换该样本,直到它接近目标分布的样本。
GenCast的特点在于它不是直接采样天气状态,而是采样与最近天气状态的残差,并通过加到最近状态来恢复当前状态。这种方法允许模型有效地生成多步天气预测,并通过生成多个预测样本来形成集合预测,从而提高预测的精确性和可靠性。
时间步长与预测范围: GenCast处理的每个天气状态包含特定时间间隔(12小时)内的数据,预测的时间范围为15天。
数据的空间表达: 使用1度经纬网格来表示数据,包括大气和地表变量。
概率分布的采样: 利用基于扩散模型的神经网络来模拟天气状态的联合概率分布,并从中进行采样。
图2 GenCast示意图
三:结果
GenCast的预测能力通过与现有模型(如ECMWF的ENS)进行比较进行评估。总体而言,GenCast在多个方面显示出其优越性。
图3 GenCast与GraphCast状态可视化对比
图4展示了GenCast与GraphCast在特定湿度700hPa层的预测结果对比。结果显示,即便在长期预测中,GenCast生成的预测较为清晰。在连续排序概率得分(CRPS)和集合均值均方根误差(RMSE)方面,GenCast表现优于ENS,尤其是在超过36小时的预测时段。
此外,GenCast在极端事件预测上也显示了优势,其Brier分数优于ENS,展现了其在稀有事件预测方面的能力。
图4 GenCast、ENS和GraphCast-Perturbed三个模型在不同预测时长的球谐功率谱和风速变量上的表现
GenCast在长期预测中有效地保持了高频分量,而GraphCast-Perturbed则在长期预测中丧失了这些高频内容。在物理合理性方面,GenCast的预测能够更准确地模拟实际数据的高频特征,避免了模糊不清的预测结果,展现了其在细节保留上的优势。
图5 GenCast、ENS和GraphCast-Perturbed集合预测的可靠性和分散度评估
图5表明GenCast在短期预测中略微过分散,但总体上与ENS相当,并且优于GraphCast-Perturbed。
四:结论及其思考
GenCast是一个新型的全球中期(最长15天)天气预测方法,使用扩散模型从天气轨迹的联合分布中抽取集合样本。在关键技能指标(集合均值RMSE、CRPS、Brier分数)上,GenCast的表现一致优于ECMWF的ENS系统。
GenCast能够在预测轨迹中很好地保持高频空间结构和物理一致性。其集合预测的可靠性高于或等同于ENS。GenCast在计算效率上也表现出色,可以在短时间内生成大规模集合预测。尽管GenCast在分辨率和计算成本上还有提升空间,但它在基于机器学习的天气预测方面代表了重要的进步。
声明:欢迎转载、转发本号原创内容,可留言区留言或者后台联系小编(微信:gavin7576)进行授权。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及作品内容、版权和其他问题,请后台联系小编处理。