今天介绍一篇2020年发表在npj上的文章,标题是《Predicting global patterns of long-term climate change from short-term simulations using machine learning》。研究了如何利用机器学习方法,利用现有气候模型模拟的独特数据集,学习不同气候强迫情景下短期和长期温度响应之间的关系。
一:引言
为了实现长期的气候变化减缓和适应目标,需要全球努力决定并采取有效且现实的排放途径。全球气候模型(GCMs)可用于探索排放与多区域气候响应之间的关系,但这些模型计算复杂度高,需要大量计算资源。
文章研究如何使用机器学习方法来加速对不同气候强迫情景下全球和区域气候变化的估计。目标是找到一个快速的“替代模型”,可以在给定的GCM中映射短期和长期响应模式。这个模型可用于快速预测其他输出(长期响应),只需要输入短期模拟的结果。
图1 以数据为驱动,了解短期和长期气候响应模式之间的关系。
二:数据及其方法
使用的数据集:采用了HadGEM3的全球气候模型(GCM)模拟数据,涵盖了对长寿命温室气体和短寿命污染物的全球及局部扰动。
回归模型构建:为每个网格单元构建了独立的回归模型,这些模型基于全球范围内所有网格单元的短期响应,意味着预测不仅基于局部信息,还能从全球范围的温度变化中提取预测能力。选用Ridge回归和高斯过程回归(GPR)。
训练与预测:训练模型以从GCM的短期温度响应预测长期地表温度响应。使用新的短期模拟作为输入进行即时预测。
定义长期与短期响应:将长期响应定义为去除初始瞬态响应后的平均响应,短期响应定义为每次模拟的前10年响应。
交叉验证:使用除一外的所有模拟进行训练和交叉验证,再用留出的模拟进行测试。然后通过比较机器学习模型预测的长期响应图与复杂GCM模拟的结果来评估预测能力。
三:结果
3.1 方法的总体性能
在评估两种机器学习方法(Ridge回归和高斯过程回归,GPR)的性能时,研究将它们与传统的模式缩放方法进行了比较。
图2 针对一种短寿命强迫(No_SO2_Europe)和一种长寿命强迫(3xCH4),所有方法预测的网格点尺度地表温度响应分布。
比较表明,虽然Ridge回归和GPR能有效捕捉北半球特别是陆地上的增温等广泛特征,它们的主要优势在于能够预测传统方法无法捕捉的区域模式和响应的多样性。尤其是在短寿命强迫情景下,模式缩放方法在预测响应的范围和变异性方面存在显著低估。此外,Ridge和GPR通常表现优于模式缩放方法,尤其是GPR在大多数情况下误差更低。
3.2 识别长期气候变化的早期迹象
研究显示,机器学习方法不仅提高了气候变化的预测能力,还揭示了在全球气候模型中最先显现长期变化迹象的区域。
图3 全球和世界十个主要地区的预测技能比较。
通过分析Ridge回归系数,发现短期响应中的特定模式能够指示长期温度变化。例如,在东亚,重要的系数出现在预测网格单元附近,而在欧洲,预测则受到北极海冰区等遥远区域短期响应的影响。此外,通过分析全球平均系数图,研究还指出北极和高海拔地区由于其独特的气候反馈机制,是长期气候变化的重要指示区域。
3.3 数据限制和未来方向
研究发现,随着训练样本数量的增加,预测的准确性显著提高。因此,增加训练数据,尤其是包含短寿命污染物情景的数据,有望进一步改善预测性能。
图4 高斯过程回归的预测技能是在越来越多的模拟中训练出来的。
此外,研究还面临着处理气候模型信息高维度(27,840个网格单元)的挑战,特别是在模拟样本量较小的情况下。尽管尝试了降维方法(如区域平均和主成分分析),但这些方法导致了更大的预测误差。同时,研究也探讨了使用不同变量作为短期预测因子,发现地表温度是一致的最佳预测因子。
四:结论及思考
这项研究通过使用机器学习方法分析短期气候模拟数据,成功预测了长期气候变化的全球模式。该方法特别有效于捕捉传统模型难以预测的区域性气候响应和多样性。增加更多的训练数据可以显著提高预测准确性。
文章提出长远视角:使用这种方法设计长期气候模拟器。这种模拟器能够根据特定输入近似地预测模型输出,对于气候预测、灵敏度分析、不确定性量化和校准等方面具有巨大的潜力。通过简化模拟的长度并利用短期和长期响应之间的关系,这一方法加速了长期气候模拟器的设计过程。
文章来源:
https://www.nature.com/articles/s41612-020-00148-5#Sec7
声明:欢迎转载、转发本号原创内容,可留言区留言或者后台联系小编(微信:gavin7576)进行授权。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及作品内容、版权和其他问题,请后台联系小编处理。