社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

【Sustainable Cities and Society】通过可解释机器学习量化地理特征对城市 GDP 产出的贡献

景观及规划前沿 • 1 月前 • 46 次点击  


【Sustainable Cities and Society】

通过可解释机器学习量化地理特征对城市 GDP 产出的贡献

01

摘要

    城郊景观的土地使用需求与城乡驱动因素并存,相互冲突。在英格兰,绿化带是城市遏制政策,它影响着与它们所覆盖的更广泛景观隔离的城郊地区。绿带在规划政策方面的耐力导致了一个有争议和政治化的政策领域,受到了严格的审查。虽然研究表明绿化带中存在异质的生态系统服务供应,但目前尚不清楚绿化带作为景观的未来如何以及是否会超出其城市遏制范围发生变化。尽管参与式情景已广泛应用于景观规划,但它们尚未应用于英国绿化带。为了解决这些差距,举办了一次跨部门利益相关者研讨会,以在 20 年内在全国范围内共同开发探索性绿化带景观情景。三个场景:“强化和多样化”,“建设-建设-建设”和“多功能”被框定在治理-功能轴上,确定了未来的驱动因素、影响和假设。这些情景表明,绿化带承受着来自多种土地用途、社会需求和政策的更大压力,其中许多是相互冲突的,这源于通过不同的治理机制对这些需求进行优先排序或平衡。利益相关者的批评和愿景表明,英格兰的绿化带具有更大的(多)功能,包括作为“战略性城市支持景观”,以适应和减轻与气候变化相关的威胁。最后,在人工智能的辅助下,制作了“虚构”景观的互补景观照片可视化,突出了这些工具在支持景观研究方面日益增长的潜力。这种对虚构景观的使用将我们的结果扩展到具有相似背景和驱动因素的城郊地区,例如西欧和北欧地区。

02

研究结果

1.模型性能

    我们进行了一系列实验,旨在使用人口和 UGF 对城市 GDP 进行建模。最初,我们采用城市尺度定律作为基线模型,该模型仅考虑人口。这种基本方法使我们能够将其与包含 UGF 的更复杂的多变量模型进行比较。我们检查的多元模型包括多元线性回归、地理加权多元线性回归、多元非线性回归、地理加权多元非线性回归、深度神经网络、XGBoost 和 CatBoost。这些模型在 补充说明 1 中进行了广泛描述,提供了有关其理论基础和实际应用的详细信息。为了确保对模型拟合进行全面评估,我们采用了一套全面的指标:R 平方 (𝑅2)、皮尔逊相关系数(皮尔逊的𝑟) 和 Jensen-Shannon 散度 (JSD) 的 Diff S Vargence 的 Diff Al Divergence (JSD) 中。这些指标提供了每个模型性能的多方面视图,评估了准确性、稳定性以及估计和观测的城市 GDP 分布之间的相似性。这些评估指标的细节在补充说明 2 中进一步详细说明。根据这些评估指标分析结果表明,CatBoost 模型的性能优于同类模型,在稳定性和准确性方面都成为首选模型(表1)。

    图1 说明了观测到 GDP 值与城市缩放定律和 CatBoost 模型估计的 GDP 值之间的关系。结果表明,与传统的城市缩放定律相比,CatBoost 模型的拟合度要好得多,特别是对于后者估计不太准确的国家。这突出了种群和 UGF 之间非线互的关键作用。此外,与零模型相比,我们的模型性能优越,这凸显了城市 GDP 是由人口和 UGF 之间的相互作用驱动的。

表1 使用 评估的模型性能𝑅2、皮尔逊的𝑟和 JSD 指标

图1 城市缩放和 CatBoost 模型的拟合性能

2.模型解释

    图2a-e 显示了不同国家/地区每个特征的 SHAP 值分布,阐明了人口和 UGF 对 GDP 的影响。人口是一个主要特征,尤其是在尼日利亚,这与将城市 GDP 增长与人口增长联系起来的城市规模定律一致。除了人口之外,UGF 还显着影响 GDP(见图 3 中的插图),其影响范围至少为 45% 至 89%。例如,在巴西、尼日利亚、中国和印度,道路网络对 GDP 的显著正贡献表明 GDP 产出与道路基础设施提供的交通便利性呈正相关。相反,在美国,道路网络并不能一致地提高城市之间的 GDP 产出。相反,它显示出混合效应,拥有广泛道路网络的城市有时会出现较低的 GDP。这可能是由于道路网络遍布美国,包括经济欠发达地区,这可能会减少额外道路基础设施对 GDP 增长的影响。部分依赖图更清楚地说明了特征数量之间的关系及其对城市 GDP 的影响(见补充图 S6-S10)。这些发现表明缺乏强而一致的相关性,这表明仅仅特征值的增加或减少并不能保证 GDP 增长。这凸显了战略性城市规划的关键作用。在不同城市观察到的不一致凸显了了解每个城市的独特模式以制定更有针对性的战略的必要性,同时从全球视角保持对城市系统的更广泛理解。        

图2 特征对 GDP 影响的全局解释

图3 特征对 GDP 影响的局部解释

    利益相关者的看法在“加强和多样化”情景中更为分歧。尽管与“多功能”情景相似,但大多数利益相关者认为“加强和多样化”是可能的(55%)。尽管在感知到的利益方面存在分歧(6b),39%的人认为“加强和多样化”是“无益的”,紧随其后的是“既不有益也不无益”(27%)。值得注意的是,所有利益相关者群体在感知利益方面都存在分歧。在感知功能方面,48%的人认为该情景“有些”多功能,紧随其后的是非多功能(39%)。然而,在偏好方面,分歧较少,大多数人(73%)将其排名第二。只有政治家、规划者和地方当局群体的利益相关者认为它最不受欢迎。

    最终,“建设-建设-建设”情景的认知最为分歧。这体现在大多数利益相关者认为其不太可能(33%)或既不太可能也不太不可能(27%)的分裂中。在感知到的利益方面(6b),利益相关者平分秋色,36%的人认为它“无益”,紧随其后的是“非常无益”(30%)。尽管在功能方面(6c),大多数人(52%)认为它“多功能”。值得注意的是,在利益相关者内部,分裂略少,大多数(73%)将“建设-建设-建设”排在第三位,只有已建发展利益相关者将其排在第一位。

3.城市 GDP 模式的分类:来自当地 SHAP 的见解

    我们观察到,尽管休斯顿和华盛顿特区等城市具有鲜明的特征,但某些特征对 GDP 影响的排名存在潜在的相似性。例如,人口具有很高的影响力,而旅游和购物 POI 的影响力较小,如图3所示。这一观察结果促使我们进一步研究这种平行模式是否在更广泛的城市中普遍存在,这表明城市经济结构存在潜在的共性。为此,我们采用了 Spearman 的𝑟根据城市对的局部特征贡献向量来衡量城市对的秩相关性。

     图4显示了城市集群的结果和相应的成对相关热图。粗略地看一眼,每个国家都可以分为多个城市群,这些城市群具有非常相似的特征贡献模式。

    尽管分层聚类揭示了不同城市之间潜在的相似模式,但这些分类并不是先验已知的,只有在描述每个城市的模式后才会变得明显。因此,将单个城市的模式与无障碍指标相关联至关重要。为此,我们分析了组成集群的城市的观测 GDP 值的统计数据。如图5所示,分类通常与城市的 GDP 产出相关,因为不同集群之间的平均 GDP 存在显着差异。

图4 基于特定城市 SHAP 值的分层聚类和相关性热图

图5 城市 GDP 在集群之间的分布

图6 相关热图根据本地 SHAP 值描述了同一国家/地区内城市之间的成对 Spearman 排名相关性

图7 每个城市的本地 SHAP 值

    在按 GDP 对城市进行排序后,图 7 中的相关热图证实了城市 GDP 产出与其模式之间的关系,其中城市系统按 GDP 划分为几个城市群。在图 8 中,我们显示了每个城市的本地 SHAP 值。由于折线的密集分布,我们在补充视频 S1-S5 中说明了从低 GDP 到高 GDP 城市的动态变化。正如所观察到的,低 GDP 城市的模式几乎相同,主要受人口制约。如文献中所强调的,人口是财富创造的基本驱动力,城市GDP受到一个国家人口分布的显著影响。Ribeiro、Oehlers、Moreno-Monroy、Kropp 和 Rybski (2021) 进一步证实了这种关系,强调了人口分布模式对城市经济结果的深远影响。在较小的城市,缺乏大量人口阻碍了集聚效应的形成,而集聚效应对促进经济增长至关重要。这种限制限制了各个部门的增长潜力,导致人口以外的特征对城市 GDP 的贡献最小。在 COVID-19 封锁引发的经济衰退期间,观察到了这种动态的一个突出例子,强调了人口密度和集聚效应在城市经济弹性和发展中的重要性。随着与人口相关的 GDP 限制减少,GDP 中等城市表现出多种模式,导致它们之间的明显相似性降低。相反,高 GDP 城市表现出更一致的模式,从因国家/地区而异的特定 UGF 中受益匪浅。在美国,纽约等城市显示出 GDP 与休闲 POI、教育 POI 和工业用地等特征之间的显着关联,如其当地的 SHAP 值所示。对于中国,上海与酒店 POI 显示出明显的相关性。这些模式表明,各国在塑造城市发展的经济原则方面存在显著差异,这凸显了不同国家的城市轨迹如何受到其独特的社会经济背景的影响。尽管存在这些跨国差异,但国家内部出现了惊人的规律。有趣的是,高 GDP 城市可以被视为低 GDP 城市的放大版本,反映了受人口限制的模式与专门从事特定 UGF 的模式之间的反比关系。这可能可以用城市间扩散的角度来解释,其中高 GDP 城市是创新和资源集中的中心,通过经济和空间溢出影响低 GDP 城市。然而,这种传播受到距离的限制,这与我们的发现一致,即不同国家的城市之间的相似性较弱。有趣的是,高 GDP 城市可以被视为低 GDP 城市的放大版本,反映了受人口限制的模式与专门从事特定 UGF 的模式之间的反比关系。


论文信息

标题:Quantifying contributions of geographical features to urban GDP outputs via interpretable machine learning

作者:Peiran Zhang, Haonan Guo, Fabiano L. Ribeiro e, Pavel L. Kirillov f, Alla G. Makhrova, Ziyou Gao, Liang Gao

时间:28 October 2024

DOI:https://doi.org/10.1016/j.scs.2025.106185

本文只是笔者对论文的浅薄理解,不代表原论文观点。如果您感兴趣,请点击文末【阅读原文】阅读文献


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/179317
 
46 次点击