社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

重磅!GenCast:基于机器学习的全球中期天气预测新突破

气象学家 • 11 月前 • 352 次点击  

  第一时间获取气象科研资讯

气象学家公众号交流群

加入


这篇文章名为《GenCast: Diffusion-based ensemble forecasting for medium-range weather》。它介绍了GenCast,这是一种基于机器学习的生成模型,用于天气预测的集合。GenCast采用了一种新颖的基于扩散的方法来生成全球范围的15天集合预测,并展示了机器学习在概率天气预测中的潜力。

GenCast通过模拟天气状态在时间和空间上的联合概率分布,生成的全球15天集合预测比欧洲中期天气预报中心(ECMWF)的运行集合预测更准确,且速度更快。

一:引言

过去30年,天气预报从单一最佳猜测的确定性系统转变为基于数值天气预报(NWP)的随机集合预报。尽管这些集合预报在许多领域至关重要,但它们仍存在偏差和错误,并且计算成本很高。近年来,机器学习在中期预测方面取得了显著进展,但大多侧重于确定性预测和最小化均方根误差(RMSE),而相对忽视了不确定性量化和概率建模。

二:数据及其方法

GenCast使用的数据来自欧洲中期天气预报中心(ECMWF)的ERA5存档。所使用变量如下:

图1 数据集中的ECMWF变量

GenCast是一种基于机器学习的概率天气预测模型。其核心是使用扩散模型,这是一种生成式机器学习模型,用于从给定数据分布中生成新样本。GenCast的过程开始于从一个噪声分布中抽样,然后通过学习去噪器迭代变换该样本,直到它接近目标分布的样本。

GenCast的特点在于它不是直接采样天气状态,而是采样与最近天气状态的残差,并通过加到最近状态来恢复当前状态。这种方法允许模型有效地生成多步天气预测,并通过生成多个预测样本来形成集合预测,从而提高预测的精确性和可靠性。

  1. 时间步长与预测范围: GenCast处理的每个天气状态包含特定时间间隔(12小时)内的数据,预测的时间范围为15天。

  2. 数据的空间表达: 使用1度经纬网格来表示数据,包括大气和地表变量。

  3. 概率分布的采样: 利用基于扩散模型的神经网络来模拟天气状态的联合概率分布,并从中进行采样。

图2 GenCast示意图

三:结果

GenCast的预测能力通过与现有模型(如ECMWF的ENS)进行比较进行评估。总体而言,GenCast在多个方面显示出其优越性。

图3 GenCast与GraphCast状态可视化对比

图4展示了GenCast与GraphCast在特定湿度700hPa层的预测结果对比。结果显示,即便在长期预测中,GenCast生成的预测较为清晰。在连续排序概率得分(CRPS)和集合均值均方根误差(RMSE)方面,GenCast表现优于ENS,尤其是在超过36小时的预测时段。

此外,GenCast在极端事件预测上也显示了优势,其Brier分数优于ENS,展现了其在稀有事件预测方面的能力。

图4 GenCast、ENS和GraphCast-Perturbed三个模型在不同预测时长的球谐功率谱和风速变量上的表现

GenCast在长期预测中有效地保持了高频分量,而GraphCast-Perturbed则在长期预测中丧失了这些高频内容。在物理合理性方面,GenCast的预测能够更准确地模拟实际数据的高频特征,避免了模糊不清的预测结果,展现了其在细节保留上的优势。

图5 GenCast、ENS和GraphCast-Perturbed集合预测的可靠性和分散度评估

图5表明GenCast在短期预测中略微过分散,但总体上与ENS相当,并且优于GraphCast-Perturbed。

四:结论及其思考

GenCast是一个新型的全球中期(最长15天)天气预测方法,使用扩散模型从天气轨迹的联合分布中抽取集合样本。在关键技能指标(集合均值RMSE、CRPS、Brier分数)上,GenCast的表现一致优于ECMWF的ENS系统。

GenCast能够在预测轨迹中很好地保持高频空间结构和物理一致性。其集合预测的可靠性高于或等同于ENS。GenCast在计算效率上也表现出色,可以在短时间内生成大规模集合预测。尽管GenCast在分辨率和计算成本上还有提升空间,但它在基于机器学习的天气预测方面代表了重要的进步。






声明:欢迎转载、转发本号原创内容,可留言区留言或者后台联系小编(微信:gavin7576)进行授权。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及作品内容、版权和其他问题,请后台联系小编处理。


往期推荐

 获取ERA5/ERA5-Land再分析数据(36TB/32TB)

 获取全球GPM降水数据,半小时/逐日(4TB)

 获取1998-2019 TRMM 3B42逐日降水数据

 获取最新版本CMIP6降尺度数据集30TB

 EC数据商店推出Python在线处理工具箱

★ EC打造实用气象Python工具Metview

★ 机器学习简介及在短临天气预警中的应用

★ Nature-地球系统科学领域的深度学习及理解

★ 灵魂拷问:ChatGPT对气象人的饭碗是福是祸?

★ 气象局是做啥的?气象局的薪水多少?

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/166461
 
352 次点击