基于空间非均衡视角的“大城市病”成因研究

2022-01-04齐子翔QIZixiang吕永强LVYongqiang王亚欣WANGYaxin

价值工程 2022年1期

齐子翔QI Zi-xiang；吕永强LV Yong-qiang；王亚欣WANG Ya-xin

（①北京物资学院经济学院，北京 101149；②山东建筑大学测绘地理信息学院，济南 250101）

0 引言

“大城市病”表现为人口过度向核心城市集聚，突破承载力上限，从而引发的交通拥堵、环境污染、房价高企、热岛效应等一系列城市治理问题。习近平总书记明确指出城市建设落实到各地就是城市治理问题，要合理进行生产、生活、生态布局，提高城市发展的宜居性和持续性。显然，地方政府对“大城市病”的治理已成为了城市治理的重中之重和提高百姓生活福祉的迫切需要。论文旨在使用空间计量经济学方法，实证探查“大城市病”的成因，从而为我国制定区域发展战略和城市规划提供决策依据，服务国家十四五规划。

1 文献综述

使用空间计量经济学研究空间问题可以追溯到Paelinck 于1967 年在法国区域科学年会上的报告[1]。Moran（1947）提出用0-1 连接矩阵表示空间相关关系之后，于1950 年提出了Moran’s I 统计量，用来测度空间自相关[2]。Geary（1954）给出了另一种度量空间依赖的统计量Geary’s C[3]。Cliff 和Ord（1972）提出Moran’s I 可以用于检验最小二乘回归得到的残差中是否存在空间自相关效应[4]。Ord（1975）提出了空间误差模型和空间滞后模型并给出了最大似然估计方法[5]。Paelinck 和Klaassen 于1979 年提出了空间计量模型建立的5 个重要研究范畴：空间依赖、空间关系不对称、其他空间单元的解释因素、事前事后相互作用的差异以及空间显式建模[6]。Anselin（1988，2006）认为空间计量经济学的发展应有别于空间统计，更加侧重空间模型的设定、估计、检验等计量理论，并对于广义空间模型的最大似然估计进行了推导和总结[7]-[8]。Pace（1997）推广了基于LU 分解的最大似然估计快速计算方法[9]。Barry（1999）给出了基于稀疏矩阵对数行列式的蒙特卡罗方法[10]，Pace（2004）讨论了稀疏矩阵对数行列式的切比雪夫近似[11]。Zhang（2007）讨论了高斯过程的对数行列式近似[12]。Bivand（2013）论证了基于高斯空间自回归模型的雅可比行列式计算方法[13]。Anselin（1980）使用空间两阶段最小二乘法，估计空间滞后模型[14]。广义矩估计方法最早由Kelejian（1998，1999）提出[15]-[16]，并进一步由Kelejian（2010），Drukker（2013）将其完善[17]-[18]。Hepple（1979）讨论了空间计量模型的贝叶斯估计[19]。Lesage（1997）将马尔可夫链蒙特卡洛方法和Gibbs 抽样应用到了空间计量模型的贝叶斯估计当中[20]。得益于计算上的简化，贝叶斯估计得到了广泛的应用。例如Wang（2012）基于动态空间离散选择模型的贝叶斯估计讨论了土地利用变化[21]。空间计量经济学模型的检验方法除了Moran（1950）提出的Moran’s I 统计量、Geary（1954）提出的Geary’s C 统计量、Getis（1995）提出的G 统计量以外[22]，沃尔德检验、拉格朗日乘子检验、似然比检验同样也是适用的。这几种经典的检验方式随着空间计量经济学的发展也得到了改进。Anselin（1997）构造了稳健的拉格朗日乘子检验统计量，极大的方便了实际应用中的模型设定[23]。Baltagi（2001）依据拉格朗日乘子，检验函数格式是否被错误设定[24]。Anselin（2001）讨论了拉格朗日乘子检验应用在其他空间误差自相关的情况[25]。Lauridsen（2006）提出了一个基于LM 检验的单位根检验[26]。Kelejian（2008）讨论了非嵌套假设的检验[27]。此外，其他检验在各种模型上的适用性也得到了讨论，例如Amaral（2014）讨论了Moran’s I 在空间Tobit 模型中的性质[28]。以上各种空间计量经济学方法能否正确估计并检验空间效应，关键在于针对不同的研究问题，选择恰当的空间权重矩阵，根据适宜的矩阵设定方式，将空间自相关过程参数化，从而挖掘隐藏在经济问题中的空间非均衡现象。

2 “大城市病”成因假说

本文以北京这个特大城市为例，从市场（流通经济）、社会（公共服务）和就业（民生问题）三个层面出发，通过空间统计，探查北京是否存在上述三大要素的空间非均衡现象？并结合空间计量模型，加以验证。

2.1 假说一：流通经济布局的空间非均衡

人们的生产和生活离不开流通；流通经济反映一个城市的贸易状况和繁华程度。流通业态分为批发和零售。由于篇幅限制，论文以批发企业密度反映市场贸易状况，使用2012 年北京市1835 家批发企业的POI 矢量数据，利用核密度估计方法，探查北京市流通经济的空间格局，估计结果如图1。结果现示：北京市批发企业呈现出沿轨道交通线路集聚的空间格局。流通经济布局的空间非均衡引致区际流通经济规模的空间分异。

图1 北京市批发企业空间集聚格局（2012）

本文得出关于“大城市病”的第一个假说。假说一：北京存在流通经济布局的空间非均衡；这种非均衡可能是导致“大城市病”的原因之一。

2.2 假说二：公共服务布局的空间非均衡

本文涉及的公共服务是指在社会发展领域中的公共服务，主要包括教育、医疗卫生、文化、体育、公共安全、社会福利和社会救助等内容。论文借鉴Getis（1995）[22]提出的局域Gi统计量（式1），使用2010 年北京市67 家三级医院的日门诊量数据，对北京市以医院为代表的公共服务机构进行空间热点分析，探查公共服务部门的空间格局。

其中xj为第j 家医院的日门诊量，wij是第i 家医院与第j 家医院的空间权重。论文以d=2000 米①为距离阈值构建空间权重矩阵，n 为医院数量。，统计量z 得分常被用作“热点”分析的工具。统计量z 得分公式为。②统计量z 得分高且为正时表明高值集聚或热点的存在；相反统计量z 得分低且为负时说明低值集聚或冷点的存在。论文通过z 得分检验统计量的显著性，当样本量足够时统计量z 得分服从标准正态分布。p 值表示统计量z 得分返回的概率，置信度包含了90%、95%或99%三种水平。对于热点分析来说，p 值表示所观测到的空间模式是由某一随机过程创建而成的概率。当p 很小时，意味着所观测到的空间模式不太可能产生于随机过程（小概率事件），因此论文可以拒绝统计量不显著的原假设。热点分析结果见表1、图2。

表1 北京市三级医院日门诊量热点分析表（2010）

图2 北京三级医院热点分析图

在北京67 家三级医院中，有50 家医院是百姓看病的热点医院，如图2 可以清晰看出他们集聚在北京朝阳区、西城区、东城区和海淀区。公共医疗资源在北京核心城区集聚，空间非均衡特征十分明显。除上述4 区外，北京另外12 个区县无1 家百姓看病热点医院。公共服务的空间非均衡会导致区际公共服务能力的差距。

本文得出关于“大城市病”的第二个假说。假说二：北京存在公共服务的空间非均衡；这种非均衡可能是导致“大城市病”的原因之一。

2.3 假说三：就业机会空间非均衡

为刻画北京就业人口空间变动趋势，本文对各街道乡镇就业密度占北京总就业人口密度的份额应用非参数估计的LOESS 方法，通过曲线拟合各街道乡镇就业密度到城市中心距离变化的规律。为方便比较，将LOESS 曲线的平滑系数设置为0.5。通过对比2008 和2013 年拟合的LOESS 曲线，如图3（横坐标表示离城市中心的距离，纵坐标表示就业密度份额），可以发现不同空间范围内人口集聚和扩散的趋势特征：2008-2013 年间，北京就业密度在全市范围内进一步上升，向城市中心集聚趋势没有改变，从一个侧面反映了就业机会的空间非均衡分布。

图3 2008 和2013 年北京就业密度LOESS 曲线

论文得出关于“大城市病”的第三个假说。假说三：北京存在就业机会的空间非均衡；这种非均衡可能是导致“大城市病”的原因之一。

3 “大城市病”成因的实证检验

通过对北京市的空间分析，本文得出了导致“大城市病”的三个假说。针对上述假说，基于全国视角，我们实证检验假说是否成立。

3.1 数据来源与变量解释

目前，国内大部分空间计量研究均是使用面域数据，以边界相邻设定空间权重矩阵。这种研究范式的弊端是省域、市域、县域数据同时涵盖城市与乡村，不能在空间上明显刻画城市的属性和特征。

本文数据来源于《中国城市统计年鉴2015》，选取我国大陆地区289 个地级及以上城市作为统计样本，利用矢量点数据，放弃边界相邻的空间权重矩阵设定方式，依据引致被解释变量空间自相关效应最为显著的距离阈值，设定空间权重矩阵，以城市年末市辖区人口密度为被解释变量（popden），刻画城市人口集聚程度，以市辖区规模以上工业企业数量作为解释变量（enter），反映就业机会，以市辖区社会消费品零售总额作为解释变量（sale），表示流通经济规模，以市辖区医院、卫生院床位数作为解释变量（hospi），代表公共服务能力，实证检验“大城市病”的成因③。变量解释见表2，变量描述如图4。

图4 变量描述与散点图

表2 变量解释

3.2 空间自相关检验

回归过程使用经典计量方法，还是空间计量方法？需要进行空间自相关检验。

①按距离定义的全域空间自相关检验。

Moran（1950）[8]提出了全域自相关指数Moran’s I，按照空间赋值状况测量变量间的相关关系。全域自相关Moran 指数I 的取值在-1 与1 之间，取值大于0 表示正相关，表示相似的值在空间上靠近，越接近于1，相关性越强，也可以理解为集聚；取值小于0 表示负相关，表示相异值在空间上靠近，越接近-1，空间分异越强；如果取值接近于0，表示变量是随机分布的，不存在空间自相关。全域自相关指数Moran’s I 的计算公式如式（2）：

xi是第i 个城市年末的市辖区人口密度（被解释变量），n 等于城市的总数量。Wij为空间权重矩阵，。论文测量一系列距离的城市人口密度全域空间自相关指数，并选择性创建这些距离及其相应z 得分④的折线图。z 得分反映空间聚类的程度，具有统计显著性的峰值z 得分对应促进空间过程聚类最明显的空间自相关以及距离阈值d，如图5。

图5 按距离定义的全域空间自相关

表3 中列出了十次实验中，按照距离d 构建空间权重矩阵所得到的全域空间自相关指数和z 得分。其中具有统计显著性的峰值z 得分出现在第三次实验中，对应的距离阈值d=1198300.76 米，z 统计量分值d=8.015472，在十次实验中最高，且大于标准正态分布在显著性水平为0.05的临界值1.96，由此判定我国城市人口密度分布存在全域空间自相关，即空间依赖，并在距离阈值d=1198300.76 米时，全域空间自相关程度最为显著，全域自相关指数Moran’s I=0.047512。之后随着距离的增大，z 得分快速下降，空间自相关程度（Moran’s I 值）也随着距离的增大而逐渐衰减。这也印证了地理学第一定律。论文将第三次实验的结果经标准化后，落在笛卡尔坐标系中，如图6。

图6 我国城市人口密度全域空间自相关

表3 按距离全域空间自相关Moran’s I 汇总表

在图6 中，笛卡尔坐标系的曲线斜率既是空间滞后模型（SAR）及广义空间模型（SAC）中的空间效应系数ρ（ρ=Moran’s I），也是城市人口密度全域空间自相关指数；而各象限则表示局域空间自相关中各城市的点分布。

②按距离定义的局域空间自相关检验。

全域空间自相关指数只能说明具有相似值的变量出现了空间集聚，不能说明这种集聚是由高值，还是低值组成的。Anselin（1995）[29]提出了局域自相关指数Moran’s Ii（Local Moran index），或称LISA（Local indicator of spatial association），是一种描述空间联系的局域指标，用来检验局域地区是否存在相似或相异的观测值集聚在一起。城市i 的局域Moran 指数Ii用来度量城市i 和他邻域城市之间的关联程度，被定义为式（3）：

论文对局域自相关指数Moran’s Ii中空间权重矩阵的设定方法如下：如果两个城市之间距离（欧氏距离）小于或等于d=1198300.76 米，记wij=1，否则记wij=0。

将图6 中各象限的局域空间自相关落在地图上，如图7：Cluster:High 代表第一象限的城市点数据，表示具备同样高人口密度的城市集聚在一起；Cluster:Low 代表第三象限的城市点数据，表示具备同样低人口密度的城市集聚在一起；High Outlier 代表第四象限的城市点数据，表示高人口密度的城市附近毗邻了低人口密度的城市；Low Outlier代表第二象限的城市点数据，表示低人口密度的城市毗邻高人口密度的城市；白色的点表示未通过显著性检验的城市。局域自相关检验表明我国城市人口集聚在“胡焕庸线”东侧，京津冀、长三角以及中原城市群人口分布呈现出高密度集聚，同样说明了我国城市人口密度呈现出空间自相关，所以需要使用空间计量模型加以解释。

图7 我国城市人口密度局域空间自相关（2015）

③空间模型选择。

本文依据不同空间计量模型的性质，选择适合本文研究主题的模型。空间回归是通过将空间自回归过程加入到模型设定中，来处理空间效应，从而将空间自相关过程参数化的。其中最经典的模型是空间滞后模型（SAR）：

和空间误差模型（SEM）：

而这两者是空间杜宾误差模型（Spatial Durbin Error Model，SDEM）：

和广义空间模型（General Spatial Autocorrelation Model，SAC）：

的特殊形式。空间杜宾误差模型和广义空间模型又是广义嵌套空间模型（General Nesting Spatial Model，GNS）的特殊形式：

广义嵌套空间模型的其他特殊形式还有空间杜宾模型（Spatial Durbin Model，SDM）：

进一步特殊形式是类似于经典线性模型的自变量空间滞后模型（Spatial Lag Of X Model，SLX）：

而如果令所有空间自相关系数均为0 就退化成经典线性模型（Classical Linear Regression Model，CLR）：

在式（4）-（11）中，ρ、λ 分别为被解释变量以及模型随机扰动项的全域空间自相关系数，W 为空间权重矩阵，β与θ 为回归系数，μ 为存在空间自相关的随机扰动项，ε为消除空间自相关（空间依赖）后的随机扰动项。各类模型间的相互关系如图8 所示。

图8 空间回归模型设定

上述模型中，广义空间模型（SAC）同时将空间效应引入模型的被解释变量与随机扰动项中，并在模型变换中使得解释变量也产生了空间效用（式（12）-（13））；由于本文的三个假设将作为解释变量纳入计量模型，而且假设它们都会对人口的集聚产生空间自回归影响；因此，SAC 模型较适合本文研究主题。

因为散点图4 显示被解释变量与各解释变量呈线性关系，本文分别选择SAC、SEM 和SAR 三类线性模型，进行对比回归。空间权重矩阵的设定方法依然遵从本文空间自相关检验部分（2.2 部分）的设定方式，以两个城市间距离是否达到d=1198300.76 米为阈值。这样可以最大化模型中空间自相关效应，充分体现人口在城市集聚过程中的空间自回归机制。

④内生性问题。

由于数据存在空间异质性与空间自相关，使得空间计量模型的随机扰动项存在异方差与序列相关，OLS 估计量为无效估计量；又因为SAC 和SAR 模型的动力机制是空间自回归过程，如式（14）所示：

使得模型产生了内生性问题，引致OLS 估计是有偏的；所以，论文将被解释变量的空间一阶滞后项作为工具变量（IV），使用广义空间两阶段最小二乘法（GS2SLS）进行参数估计。

4 估计结果与空间异质

由于就业机会变量（lnenter）与流通经济规模变量（lnsale）存在多重共线性，本文将其分开进行空间回归。估计结果见表4。三种模型估计结果中：lnenter、lnsale 和lnhospi 变量系数均为正，说明就业机会、流通经济规模和公共服务能力与人口密度正相关，其中lnenter 和lnsale 变量系数通过了显著性水平为0.05 的T 检验，lnhospi 变量系数通过了显著性水平为0.01 的T 检验，说明这三个因素确是导致人口集聚的成因。论文使用Breusch-Pagan 异方差检验，P 值为0.0001，拒绝同方差的原假设。模型的随机扰动项存在异方差，说明引致我国“大城市病”的空间非均衡，不仅可以理解为空间自相关（空间依赖），也是一种空间异质。综上检验，三个假说全部成立。

表4 SAR、SEM、SAC 模型参数估计结果

5 稳健性检验

5.1 全域稳健性分析

本文在此忽略SAC 模型被解释变量以及随机扰动项中的空间自相关影响，使用经典线性模型和OLS 估计方法，以2015 年289 个地级及以上城市作为统计样本，进行稳健性检验，参数估计结果见表5。表5 中已估参数符号与表4 一致，说明表4 的估计结果是稳健的。

表5 OLS 参数估计结果

5.2 区域稳健性分析

本文进一步考虑空间样本选取对于模型的稳健性影响。本文从2011 年289 个地级及以上城市样本中随机抽取100 个，使用OLS 进行稳健性检验，参数估计结果见表6。表6 中已估参数符号与表4 一致，说明表4 的估计结果是稳健的。

表6 100 个地级市参数估计结果

5.3 空间协整检验

Fingleton（1999）[30]最早将时间序列的协整等概念引申到了空间计量经济学，利用蒙特卡罗模拟的方法研究了伪空间回归、空间单位根和空间协整。Kosfeld 和Lauridsen（2006）[31]提出了一个基于LM 检验的单位根检验。Lee 和Yu（2009）[32]研究发现相比于时间序列的情况，空间回归模型发生伪回归的现象较弱，但仍然存在。本文使用Kosfeld和Lauridsen（2006）[31]提出的空间单位根检验对模型进行稳健性检验。若被解释变量的空间差分是稳定的，即

表7 空间协整检验结果

6 结论与对策反思

就业机会、流通经济布局以及公共服务的空间非均衡直接表现为不同城市间平等就业机会、市场繁荣程度以及公共服务能力的差距，而上述三个因素又与人口密度显著正相关，引致人口非理性迁移与集聚，是造成我国“大城市病”的原因。在以疏解大城市人口，促进区域协同发展，为目标的国家区域政策与地方探索中，首先要解决上述空间非均衡在我国新型城镇化过程中的对立统一问题。推动产业区际有序转移、搬迁区域性贸易市场和均衡配置公共服务资源是治理我国“大城市病”，促进经济社会一体化的路径选择。在推动产业转移方面可以借鉴沈体雁、齐子翔等（2016）[33]提出的人工智能算法，利用经济工程学思想，通过将北京拟转出企业与河北承接开发区双边匹配的市场设计，疏解非首都功能。

注释：

①经测算任意两家医院的最近距离为18000 米，所以距离阈值取值20000 米。

③2014 年国务院印发《关于调整城市规模划分标准的通知》，规定城区常住人口100 万以上500 万以下的城市为大城市。我国地级及以上城市基本符合这个标准。

④对于Moran 指数的估计结果可以用标准化统计量z 来检验其显著，。z 统计量服从标准正态分布。