热带气旋在某些地区也被称为台风和飓风,由于其巨大的社会影响,一直是研究的重要目标。为了减少热带气旋的影响,气象界和其他地球科学界一直在努力从理论和经验两方面加深对热带气旋的理解,如推进卫星遥感和构建更高分辨率的大气模拟模型,以便更好地分析和预测热带气旋。
随着人工智能机器学习技术的迅猛发展,气象学界对利用热带气旋大数据开发基于数据驱动的模拟预报模型的兴趣与日俱增。本文介绍的数字台风(Digital Typhoon)项目,目的是将机器学习应用于台风分析和预报。第一步是开发用于机器学习的同质卫星图像数据集。第二步是应用可用的机器学习算法,如 SVM、生成地形图和基于内容的图像检索,构建基于深度学习的分类和回归模型。第三步是构建用于机器学习的公共数据集。
本文介绍的数字台风(Digital Typhoon)数据集,是一个以台风为中心的卫星图像数据集,由每小时一次的气象卫星红外通道图像创建而成。自1978年以来,连续几代葵花系列气象卫星图像的数据被转换为亮度温度,并针对不同的卫星传感器观测进行校准,结果产生了一个跨越40多年的统一时空数据集。该数据集时间范围为1978至2022年,空间范围为西北太平洋。该数据集降低了机器学习研究人员应对热带气旋这一大规模真实世界事件的障碍,以便研究人员可以集中精力构建和评估机器学习模型,并有助于开发用于台风分析和预报的机器学习模型,从而推动热带气旋科学知识的发展,并解决防灾减灾和气候变化等社会和可持续发展问题。
数据集下载地址:http://agora.ex.nii.ac.jp/digital-typhoon/dataset/archive/standard/WP.zipPaper:https://arxiv.org/abs/2311.02665
Reference:
Asanobu Kitamoto*1*2, Jared Hwang*3*1, Bastien Vuillod*4*1, Lucas Gautier*5*1, Yingtao Tian*6, Tarin Clanuwat*6,
"Digital Typhoon: Long-term Satellite Image Dataset for the Spatio-Temporal Modeling of Tropical Cyclones", NeurIPS 2023 Datasets and Benchmarks (Spotlight), 2023.