为了比较DEA、SFA和SBM-DDF模型估计结果的差异,本文选择非参数显著性检验方法进行模型鲁棒性分析。SBM-DDF模型在标准J-T统计量、渐近显著性和蒙特卡洛双尾显著性方面表现更好。根据提供的结果,SBM-DDF模型可以被认为是本研究的最佳模型。因此,在进行碳效率评估时,使用SBM-DDF方法可以产生更全面和可靠的结果。
本研究以2006-2020年中国284个城市的CEE为研究对象。如图2所示,图(a)显示了这些年来CEE波动的总体趋势,平均值在0.61附近振荡,表明CEE分布呈左偏态分布。从2006年到2009年,CEE一直处于相对较低的水平;在2010年至2012年期间,它经历了轻微的下降;2013年之后,CEE开始上升。总体而言,城市CEE遵循“U”形曲线。与Wang等人(2021b)的研究结果类似,该研究确定了2017年的低水平碳拐点。
图2. 中国碳排放效率的发展趋势
注:(a)图描述了城市层面上CEE的变化趋势值,(b)图描述了城市的CEE分布。
图3. 2006年、2011年、2016年和2020年中国地级市的CEE排名
为进一步探究2006-2020年CEE时空分布,本文基于自然断点法将中国城市CEE划分为5个层级。结果如图3所示。总体而言,从2006年到2020年,中国城市的CEE呈上升趋势。然而,各城市之间的碳排放效率存在显著差异。前期空间分布呈现“分散分布”的特点,即“东高西低”和“南高北低”。
本节包括从变量和模型的角度优化模型的两个方面:潜在驱动因素筛选和随机森林模型训练。首先,使用Pearson相关分析处理高度共线的特征变量,以减小模型变量的处理误差。然后,将选定的驱动因子导入到模型中。基于平均边际指数找到决策树的最佳分割点,以优化模型的变量和决策树的数量,并更好地进行后续的驱动因素分析。
随机森林算法可以通过随机选择特征和样本来构建多个决策树,从而降低特征之间的相关性,从而减少共线性的影响。因此,与其他线性回归算法相比,随机森林回归不太可能受到多重共线性的影响。但是,如果数据集中存在高度共线特征,则在构建CEE回归模型时,仍需要对数据集进行度量,以避免潜在问题,并确保变量重要性评估的合理性。
使用随机森林模型的两个关键参数是测试的变量数量和生成的决策树数量。其目的是在生成决策树时实现最佳分割。输入特征的平方根决定了变量的数量。训练试验的平均余量将用于确定最小树木数量。它可以通过观察每个特征变量在模型中内置的树水平上预测结果的相对变化来反映每个特征变量对预测结果的贡献。为了避免任何类型城市的代表性样本不足而导致的误差,我们通过随机、一般抽样选择了平衡的训练集。所有样本的平均裕度测量训练性能,快速增加并降低到峰值0.70,如图5所示。换言之,当树数增加到某个点时,代表随机森林模型泛化误差的平均裕度变得稳定,模型性能相对稳定,损失的时间更少。因此,使用具有95棵树的随机森林模型可以获得最佳结果。本研究采用的分类和回归树(CART)是一种专门的监督分类方法。在分类之前,训练样本分为两部分进行模型测试和验证。实验表明,随着训练样本从70% 增加了5%,决策结构和模型准确性都会提高。然而,当等效地减少测试样本时,决策效果不会发生显着变化。观察到,当训练样本达到 80% 时,该模型会产生最佳分类结果。如图6所示,本文选择基尼系数最小的子树作为最佳值。根据CEE和基尼水平的不同,该模型将城市分为7类,即规模经济城市(ESCs)、工业发展城市(IDCs)、低碳潜力城市(LPCs)、经济发展城市(ECDC)、低碳增长城市(LCG)、人口发展城市(PDCs)、能源依赖型城市(EDCs)。图7显示了决策树方法确定的城市群的空间分布。
决策树方法将 284 个城市分为七组。不同组别的城市空间分布如图7所示。分组前的平均CEE值为0.617,而分组后的平均CEE值在0.612至0.732之间。聚类分析表明,城市区划总体上表现出空间相关性。
图8(a)展示了城市七维特征变量的重要测量结果。城市人口(A1和A3)、经济(B1、B2、B5)、能源(E1、E2)和社会(D4)因素是最关键的变量,其次是城市建成区面积、工业污染物排放和建成区绿化率。
图8. CEE驱动因素对城市发展的重要性排名
注:图(a)表示不同城市维度的特征变量的重要性,图(b)表示驱动因素序列的测量结果
驱动因素的排名因城市类型而异。由于CEE在排名12位后对城市碳排放的影响相对较小,图9仅显示了7类城市中排名前12位的驱动因素。能源因素在 EDC、ECDC 和 LPC 中起着更关键的作用。在ECDC中,能源消耗、用电量和固定资产投资总额占据前三位。相比之下,EDC的主要因素是能源消耗和区域GDP,这与图8(b)中观察到的CEE驱动因素重要性的趋势一致。在LCG中,技术支出的比例最高,城市绿化和电力消耗起着至关重要的作用。这意味着发展绿色低碳工业技术,加快传统产业转型升级,减少重点行业的污染物排放,可以有效改善CEE。
图9. 对不同类型城市中CEE驱动因素的重要性进行排名
结果表明:东部地区城市,尤其是东部沿海城市的技术效率高于西部地区城市。东部地区在地理、政策支持、人才等方面具有优势,科技成果转化水平高。中部地区城市能源消耗的重要性超过东部和西部地区。一方面,中部战略的兴起在一定程度上扩大了化石能源的使用。另一方面,也与黄长经济带的建设有关。中部地区为经济带建设提供了相当量的能源支撑,承担了能源生产的碳排放压力。西部地区城市人口因素占重要比重,特别是以重庆、成都为代表的人口和经济发展集中的西南经济区,为协调CEE与经济社会发展的联系提供了有利的智力、物质和财政支持。