Zhu, Q., Ran, L., Zhang, Y., & Guan, Q*. (2024). Integrating geographic knowledge into deep learning for spatiotemporal local
climate zone mapping derived thermal environment exploration across Chinese
climate zones. ISPRS Journal of Photogrammetry and Remote Sensing, 217,
53-75. DOI: 10.1016/j.isprsjprs.2024.08.004.
城市化导致全球城市人口持续增加,使城市成为主要的人类活动场所,同时也引发了城市热岛效应等环境问题。热岛效应是指城市地区的温度明显高于周围乡村地区的现象,而传统城市热岛研究采用简单的“城乡”分类方式来衡量,未能考虑局部信息和城市地表的复杂性。局部气候区(Local Climate Zone, LCZ)概念沿用城市分区理念,其被定义为在水平尺度上跨度数百米到数公里的均匀地表覆盖、结构、材料和人类活动的区域。局部气候区分类方案通过提取地表要素中对温度最为敏感的指标因子以及地表要素,将全球城市简化为17种类型,为城市气候研究提供了一种精细化的局部微气候特征量化方式。目前,局部气候区分类方案已成为全球城市相关研究的基准框架,开展局部气候区分类研究对城市气候等相关研究具有重要的理论与应用意义。
随着遥感卫星技术的快速发展,遥感影像具有易获取、广覆盖、短周期等特点,目前已经被广泛应用于局部气候区分类研究。同时,深度学习的兴起推动了局部气候区分类研究进展。与传统局部气候区分类方法相比,深度学习方法在分类过程中基于遥感数据自动学习本质特征,无需进行手工特征设计,因此成为当前局部气候区分类主流方法。然而,基于数据驱动的深度学习方法在应对现实场景中复杂城市景观方面面临着巨大的挑战:(1)复杂城市场景中地理实体存在地理空间邻域相互作用。如图1(a)所示,由于成像时间、光照条件和建筑材料等因素的影响,稀疏建筑区(LCZ-9)中的建筑物的光谱信号与森林和农田相似,导致建筑类和自然类别之间的混淆。(2)局部气候区类别存在地理空间异质性。城市受地理位置、文化背景、季节时间等因素的影响,同一局部气候区类别在不同地理位置有不同的表现形式和显著的景观格局差异。如图1(b)所示,自然类别存在显著季节效应,同一建筑类别具有不同的空间分布模式和风格特征,而传统城市形态参数(UMPs)如建筑高度(BH)和建筑表面分数(BSF)仅基于全局尺度,无法准确测量建筑实体的局部形态特征,如建筑的轮廓尺度和体量大小。(3)多模态数据协同机制尚不明确。图1(c)分别显示了遥感数据和地理数据中地面物体的特征表示,遥感数据以特征图的形式表征城市场景的光谱、纹理和几何特征,而建筑数据则提供相同大小的建筑场景内的空间属性值,多维异构数据在特征表征和量级上存在巨大差异。因此,堆叠等简单融合策略难以将多模态数据整合到统一深度网络模型通道中并充分挖掘它们的互补信息。
图1. 局部气候区分类任务存在的挑战
为解决上述问题,我们提出了一种基于地理知识库构建的多源异构数据融合框架,用于精确绘制LCZ地图。本研究的主要贡献如下:(1)考虑到光学图像的季节变化,我们利用双时相Landsat-8图像来缓解自然类别的季节效应;(2)从遥感角度出发,我们确定了一系列用于LCZ制图的相关遥感指数,以减轻城市场景中地面物体的地理空间邻域相互作用所造成的混淆,并设计了一种基于自然和人工表面光谱特征分析的新颖LCZ建筑面积指数(LBAI);(3)从现实场景角度出发,生成UMPs以识别异质区域中城市类别的空间分布模式,包括传统定义参数(BH, BSF),以及首次关注每个建筑实体的局部地理空间模式的参数,即建筑轮廓因子(BOF)和建筑密度因子(BDF);(4)通过可学习的深度学习框架,以端到端的方式将异构遥感特征和地理知识与多层次融合策略整合在一起,以精确绘制LCZ地图。为了评估所提出的框架从多源数据中挖掘信息的能力,我们在构建的中国气候区时序LCZ数据集(CClimate-TLCZ)上进行了实验,该数据集涵盖了中国气候区中具有时空变化信息的18个代表性城市。此外,考虑到中国城市的地理属性和气候区域特征,我们基于LCZ制图研究了地表温度(LST)的时空格局,并进一步对地表城市热岛(SUHI)进行了时空分布分析,以更全面地把握城市化进程中中国城市热环境的发展趋势。本研究以中国五个气候区的18个代表性城市为研究区域,旨在绘制精确的局部气候区分类图,并对城市热环境进行时空变化分析。图2展示了CClimate-TLCZ数据集的地理分布情况,18个城市位于中国的五个气候区,分别是热带季风气候区(海口)、亚热带季风气候区(广州、长沙、福州、武汉、上海、香港、澳门、昆明和贵阳)、温带季风气候区(北京、哈尔滨、沈阳、石家庄和西安)、温带大陆性气候区(银川和呼和浩特)和高原高山气候区(拉萨)。在本研究中,利用Landsat-8作为CClimate-TLCZ数据集的遥感数据源,通过美国地质调查局网站下载城市空间分辨率为30米的Landsat-8 level-1级影像。为开展中国城市的长时序热环境研究,本研究选择18个城市的2016、2019和部分城市的2022年数据作为时间序列。考虑到植被受显著季节影响,这里下载了18个城市每个年份的夏季和冬季影像。在本研究中,输入的遥感数据包括9个波段,具体为Landsat-8的1-7、10和11波段。建筑数据来自公开已处理的中国城市建筑数据集,包括2016年、2019年和2022年数据。
图2. 中国五大气候区CClimate-TLCZ数据集的地理分布
为实现复杂城市局部气候区精准分类,本研究提出了多源地理知识融合引导的局部气候区分类框架,将遥感数据与建筑数据相结合,实现多模态数据的协同作用。首先,基于Landsat-8影像生成多种遥感指数图,并在生成的遥感指数图基础上构建新的局部气候区建筑面积指数,通过独立分支提取遥感影像特征和遥感指数特征,并在分类前进行特征级融合,获得含有地表先验信息的遥感语义特征,分类获得第一个分类结果。然后,利用获得的公开建筑数据生成所需的城市形态参数,通过独立分支提取建筑形态特征并分类,获得第二个分类结果。最后,通过决策级融合策略对获得的两个分类结果进行加权融合,以获得精准的局部气候区分类图。在此基础上,基于气候背景探索中国气候区城市热环境时空变化。图3展示了本研究提出框架的体系结构。
A.顾及地表先验知识和场景空间模式的LCZ地理知识库构建
表1列出了所有提取的地物特征,包括内容和数量。从Landsat-8图像中提取的光谱、空间和纹理特征有18个波段,包括夏季和冬季。从遥感角度看,为缓解城市场景中地面物体的地理空间邻域相互作用所造成的混淆,使用了一套LCZ光谱指数,包括NDVI、NDBI、NDISI和LBAI。从现实世界的角度来看,生成的UMPs可识别异质区域中城市类别的空间分布模式,包括BSF、BH、BOF和BDF。每种光谱指数都由两个波段组成,由相应的季节性图像生成。考虑到建筑区域在一年中的微弱变化,夏季和冬季使用相同的建筑参数。表1. 基于遥感图像和建筑物数据提取的多源特征信息
B.多源地理知识驱动的场景语义建模
我们采用了经典的残差神经网络ResNet作为模型基础架构,因为多项研究表明,与随机森林相比,CNN的LCZ分类准确率明显更高。为了缓解多源信息融合中的特征不兼容问题,我们的网络由三个ResNet50分支组成。遥感数据作为该框架第一个分支的输入,用于提取LCZ类别的主要分类特征。多类遥感指数作为第二个分支的输入,用于提取地表空间先验信息。考虑到遥感影像和遥感指数的本质特性,模型在分类层之前进行了特征级融合,最后通过softmax函数进行分类,从而得到了第一个LCZ分类结果。建筑数据特征由第三分支进行独立的特征提取和分类,从而得到第二个LCZ分类结果。将与传统LCZ分类相关的UMPs与遥感特征进行加权整合,从而得到多源数据融合的最终LCZ分类结果。
C.基于局部气候区的地表城市热岛强度量化
本研究通过反映局部微气候的局部气候区分类方案研究中国城市热岛的强度和时间趋势。由于夏季的SUHI更为明显,本研究主要关注城市夏季SUHI。首先,利用谷歌地球引擎平台检索了每年夏季(7-9月)中国城市的LST数据,并生成了30米分辨率的LST图。随后,结合前述的局部气候区分类图,对每个局部气候区类别的LST进行统计计算,为SUHI强度的量化提供基础数据。与传统城市热岛研究不同,本研究中SUHI
的强度被量化为局部气候区类别的LST平均值与植被的LST平均值之差,以更准确地反映城市内不同局部气候区类别的温度差异。如式(1)所示,LSTx表示LCZ-X类别的LST平均值,LSTD表示植被的LST平均值,这里指的是低矮植被(LCZ-D)。
不同方法的性能通过总体精度(Overall Accuracy, OA)、建筑类别总体精度(OAurb)、自然覆盖类别总体精度(OAnat)和Kappa系数进行评估。本研究基于CClimate-TLCZ数据集中2016和2019年的18个城市的中心区域评估了所提框架的有效性,并与基础的ResNet50模型进行了“随机验证”和“交叉验证”之间的比较。如表2所示,我们展示了2016年和2019年的18个城市的平均分类结果,随机验证的平均OA超过98%,而交叉验证的平均OA高于94%,二者之间的精度差异在5%以内,远远低于Kattenborn等人实验得出的28%的差异,结果表明所提框架在空间自相关性的影响下依然能够保持稳定。同时,所提框架既能识别复杂的城市场景,又能有效利用自然地表先验知识。例如,2016年基于随机划分的OAurb从92.91%提升到98.88%,OAnat从94.99%提升到99.24%。与随机验证相比,交叉验证的性能有所下降,但是该框架在18个城市不同样本的训练下仍能取得令人满意的结果,如2016年的交叉验证取得了94.94%的OA、93.25%的OAurb和96.08%的OAnat,证明我们的方法依然可以应用于大规模局部气候区制图。表2. 所提框架在CClimate-TLCZ数据集上的整体性能
为了进一步验证我们提出的框架的适用性,我们使用ResNeXt和
Swin Transformer进行了实验。如表3所示,与基线ResNeXt和Swin Transformer(SwinT)模型相比,我们的框架仍然取得了优异的成绩,证明了其优越性和可移植性。表3. 不同方法在CClimate-TLCZ数据集上的整体性能,“+”表示在我们所提框架中使用的基础模型结构
为验证构建的地理知识库对局部气候区分类的贡献,我们基于2016年和2019年的混合样本进行了消融实验,选择了长沙、上海、石家庄、西安和拉萨的中心区域作为实验数据,设计了四种分类方案(S1-S4)。其中,S1是一种仅基于遥感影像和ResNet50的分类方法,即基础对比方法;S2以所提框架为基础,通过仅增加遥感光谱指数作为模型的输入,提供了丰富的地表先验信息;同样,S3通过将城市形态参数作为额外输入变量添加到模型中,为建筑物提供空间维度信息;S4基于所提框架整合多源异构数据。表4展示了5个城市的整体结果,其中S4获得了94.68%的最佳OA。与S1相比,S4的OA提升了近5%,OAurb提升了近6%,OAnat提升了近4%。
表4. 2016年和2019年不同方法在长沙、上海、石家庄、西安和拉萨的整体实验结果
为了探讨不同气候区域城市地表温度的分布情况,本研究选择了2016年和2019年海口、昆明、香港、石家庄、北京、银川和拉萨的平均地表温度(Mean LST)进行实验。如图4所示,不同气候区域城市LST的分布呈现出明显的离散和聚集。从气候区的角度来看,五个气候区域的LST分布模式显示出独特的特征。其中,位于温带大陆性气候区的银川呈现出较高的LST趋势,而高原气候的拉萨则具有较低的LST水平。温带季风气候区的LST略低于银川,而热带季风气候和亚热带季风气候区的LST水平较为接近。从城市群角度来看,同一气候区域内的城市呈现出明显的集聚效应。其中,温带季风气候区内石家庄和北京的集聚效应最为明显,而亚热带季风气候区内的昆明和香港分别表现出显著的集聚效应。这些结果表明气候背景对局部气候区对LST的响应有显著影响,因此气候背景是基于局部气候区分类的城市热岛研究中的重要因素。
图4. 2016年和2019年中国五个气候带内LCZ平均LST变化情况
局部气候区的时空变化可能导致相关LST模式的变化。因此,下面在气候背景下探讨了局部气候区对LST的响应。如图5所示,我们绘制了2016年到2022年海口、长沙、上海、石家庄、西安、银川和拉萨的LST曲线。结果显示,局部气候区对
LST的响应在气候区域之间存在显著差异,并且在年尺度上高度一致。一方面,不同气候区域内局部气候区的LST时空分布模式明显不同。在热带季风气候区,局部气候区建筑类别和自然类别的类内温差明显,而建筑类别和自然类别之间的温差更为显著。亚热带季风气候区的LST更接近,曲线相对平缓。对于温带季风气候区和温带大陆性气候区,LST曲线的趋势变化更为显著,特别是随着自然类别的变化。不同的是,温带气候区的自然类别的LST明显下降,而温带大陆性气候区则明显上升。这表明地理位置和气候背景对LCZ的LST分布模式有显著影响。高原高山气候区的曲线呈现出一种新颖的模式,LST交替下降。另一方面,五个气候区域的三年LST曲线趋势表现出显著的一致性。这表明局部气候区对LST的响应在年尺度上保持一致。
图5. 2016年、2019年和2022年中国五个气候带内基于LCZ的LST时空模式
基于局部气候区分类的LST时空分析,随后进行了SUHI强度的空间分布和时空变化分析。图6展示了2016年到2022年五个气候区域内七个城市SUHI强度的空间分布和比例。高强度和轻微高强度的SUHI主要出现在城市中心,与城市的空间分布一致。另一个值得注意的现象是,从2016年到2022年,城市中SUHI偏高的区域呈明显的整体收缩趋势。在海口,从2016年到2022年,高强度SUHI区域的比例从7.90%降至5.09%。然而,轻微高强度SUHI区域的比例从7.92%升至10.13%。对于长沙,城市中心的SUHI从2016年到2019年显著增加,高强度SUHI区域的比例从1.07%增至6.59%。上海作为一个高度城市化的城市,在城市中心具有显著高强度的SUHI,2016年的比例达到36.10%。随着时间的推移,高强度SUHI逐渐转变为轻微高强度SUHI,而轻微低强度SUHI的大部分被低强度SUHI替代。由于石家庄和西安的大片森林区,城市和植被区的SUHI存在明显差异。对于石家庄,2016年到2019年高强度SUHI区域的比例从1.11%上升至4.01%,主要集中在城市中心地区。此外,从2019年到2022年,森林的SUHI在轻微低强度和低强度之间发生了较大的转变。相反,西安的高强度SUHI比例继续上升至7.64%,而轻微高强度SUHI的比例也在上升,从11.80%增至26.22%。银川的SUHI空间分布显示出独特性,植被区的裸岩或硬化地面LCZ-E和裸地LCZ-F显示出显著的SUHI。这可能归因于温带大陆性气候的影响,在植被区域导致较高的温度。受高原高山气候的影响,拉萨保持了良好的热环境,其低强度SUHI的比例较大。
图6. 2016
至2022年七个城市SUHI 强度的空间分布情况
本研究构建了一个用于精确LCZ制图的地理知识库,包括一组遥感指数和UMPs,并提出了一个多源异构数据融合框架,以从多源异构数据中挖掘多维信息。该框架由三个独立的ResNet50结构组成,采用多层次融合策略提取多源异构特征。通过在CClimate-TLCZ数据集上的实验验证,我们在18个城市上取得了非常理想的结果(94.94%),在OA方面比标准WUDAPT方法高出20%以上。令人惊喜的是,我们的框架在时空样本中表现出明显的优势,为跨时空LCZ制图提供了潜力。此外,我们还从气候区的角度探讨了LST和SUHI的时空变化,以研究中国城市热环境的变化趋势。结果表明,城市热特征与相关地理区域之间存在相互反馈关系,城市结构和气候背景对城市热环境均有显著影响。