Py学习  »  机器学习算法

《Atmospheric Environment》 | 机器学习集成模型改进京津冀二次无机气溶胶模拟

气象学家 • 4 月前 • 120 次点击  

  第一时间获取气象科研资讯

气象学家公众号交流群

加入


二次无机气溶胶是大气细颗粒物(PM2.5)的重要组分,其快速生成与积累往往是冬季重污染天气出现的关键因素。传统的空气质量数值模式由于输入数据的不确定性和模式内部物理化学机制模拟方案的不完善,导致二次无机气溶胶模拟仍然具有较大的不确定性。

针对这一难题,大气所唐晓课题组构建了一个基于层叠泛化算法(Stacked Generalization)的机器学习集成模型,实现多个机器学习模型(RF、LGBM)的集成。利用气象模拟、污染物模拟、排放源清单、地形、二次无机气溶胶地面观测数据进行模型训练,实现了对嵌套网格空气质量预报模式(NAQPMS)模拟的2020年1~3月京津冀二次无机气溶胶模拟浓度场的订正。试验结果表明机器学习集成模型能有效提高京津冀二次无机气溶胶模拟精度,其不仅能改进观测所在站点的模拟,也能改进空间分布模拟,使得模拟浓度的均方根误差下降30%以上。集成模型相较于单一的机器学习模型在综合统计指标上表现更优,特别是在污染程度重的区域。该研究为改进二次无机气溶胶模拟提供了一种新的方法,揭示了机器学习模型在观测数据稀缺时改进气溶胶模拟的潜力。


图1机器学习集成模型的流程示意图


图2 机器学习集成模型与空气质量数值模式(NAQPMS)、单机器学习模型(RF、LGBM)精度评估的泰勒图

该论文第一作者为中国科学院大气物理研究所硕士生丁宁,通讯作者为唐晓正高级工程师。该成果近期在线发表于Atmospheric Environment期刊,研究得到了国家自然科学基金(Grant No. 42175132)、国家重点研发计划(Grant No. 2022YFC370270)、中国科学院网络安全和信息化专项(Grant No. CAS-WX2021SF-0107-02)和国家重大科技基础设施“地球系统数值模拟装置”(EarthLab)的共同资助和支持。


【论文信息】

Ding,N.,Tang,X.,Wu,H.,Kong,L.,Dao,X.,Wang,Z.,Zhu,J.,2024. Development of an integrated machine learning model to improve the secondary inorganic aerosol simulation over the Beijing–Tianjin–Hebei region. Atmospheric Environment,327,120483. https://doi.org/10.1016/j.atmosenv.2024.120483 


点击“阅读原文”查看文章







声明:欢迎转载、转发。气象学家公众号转载信息旨在传播交流,其内容由作者负责,不代表本号观点。文中部分图片来源于网络,如涉及内容、版权和其他问题,请联系小编(微信:qxxjgzh)处理。


往期推荐
 获取ERA5/ERA5-Land再分析数据(36TB/32TB)
 获取全球GPM降水数据,半小时/逐日(4TB)
 获取1998-2019 TRMM 3B42逐日降水数据
 获取最新版本CMIP6降尺度数据集30TB
 EC数据商店推出Python在线处理工具箱
★ EC打造实用气象Python工具Metview
★ 机器学习简介及在短临天气预警中的应用
★ Nature-地球系统科学领域的深度学习及理解
★ 灵魂拷问:ChatGPT对气象人的饭碗是福是祸?
★ 气象局是做啥的?气象局的薪水多少?


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/169363
 
120 次点击