基于空间结构的数据驱动式都市圈经济分析
2022-04-17左丹如侯佳伟方明璐宋允全
左丹如 侯佳伟 方明璐 宋允全
摘 要:文章基于2006—2019年广东省21个城市的相关经济面板数据,采用了一种新的变量筛选方法及指数衰减型空间权重矩阵,构建空间自变量滞后模型,以此为依据定义影响力指标,实现广东省都市圈划分。利用都市圈经济发展空间效应明显的特点,加强区域间经济联动,形成良性“内循环”,最终实现区域经济协调发展。
关键词:都市圈;空间效应;变量筛选;SLX模型;聚类分析
本文索引:左丹如,侯佳伟,方明璐,等.<标题>[J].商展经济,2022(06):050-052.
中图分类号:F127 文献标识码:A
近年来,我国倡导“推动形成以国内大循环为主体、国内国际双循环相互促进的新发展格局”,中国国内的经济发展正在实现由点到面的转变,进入以城市为主导的经济集群化整体竞争新时代。党的十九大报告指出,要建设“以城市群为主体构建大中小城市和小城镇协调发展的城镇格局”。2019年,国家发展改革委在《关于培育发展现代化都市圈的指导意见》中提出了都市圈的概念,提出“城市群 (都市圈)是新型城镇化主体形态,是支撑全国经济增长、促进区域协调发展、参与国际竞争合作的重要平台”。都市圈经济是带动中国经济发展新的增长动力,一个优秀、成熟型的都市圈需要具备以下几个特点:(1)中心城市带动力强。都市圈的中心城市需要较高的经济发展水平及人口集聚程度,能够吸引其他城市要素向着中心集聚,从而带动整体经济的发展。(2)城市之间联系紧密。为区域一体化提供先行基础优势。(3)城市发展速度快。城镇化发展能够促进都市圈的建设。本文通过研究广东省都市圈的经济发展情况,对准确定位城市特点、定制发展规划和配套政策具有重要的现实意义。
1 广东省基本经济情况
本文数据摘自2007—2020年的《广东省统计年鉴》,拟从广东城市群内的城市单元出发,研究2006—2019年間广东省21个城市经济发展基本情况及集聚的空间分布特征。为了避免异方差性和解释变量呈指数式增长的趋势,本文对所有指标数据均采取自然对数处理。如表1所示,2006—2019年广东省整体人均GDP稳步上升,每年增长水平保持稳定。
其中,佛山市、广州市、东莞市、深圳市、珠海市属于发达地区;茂名市、阳江市、江门市、肇庆市、惠州市属于较发达地区;湛江市、清远市、韶关市、汕头市、潮州市属于发展区;其余城市属于欠发达区。欠发达地区地域面积较大、资源较少,而且随着周围区域经济发展的逐步提升,传统产业难以继续带动整个区域经济的发展,并且这些城市的人口容易向毗邻的佛山、深圳等经济发展前列城市转移,因此经济结构转型,减少人口流失是欠发达地区面临的严峻问题。
2 研究概况
2.1 变量筛选
选用人均GDP作为衡量区域经济发展水平的重要经济指标,即响应变量,记作Y。结合已有的文献研究,本文从广东省经济的真实情况及数据的可获得性角度选取了11个指标作为解释变量,分别是城镇居民可支配收入 (元)、人均外商直接投资实际使用金额 (美元)、城镇人口占常住人口的比例 (%)、人均社会消费品零售额 (元)、人均教育支出 (元)、第三产业占GDP比重 (%)、商品房价格 (元)、工业企业成本费用利润率 (%)、规模以上服务业企业利润率 (%)、人均一般公共预算收入 (元)和公路密度 (公里每百平方公里),记作X1—X11。
为了提高模型对实际问题的泛化能力,需要对收集到的解释变量进行筛选,本文采用了一种新的变量筛选方法,可用于识别在高维回归分析中对响应变量有局部贡献的解释变量。本文用模型的残差平方和 (SSE)来衡量变量的边际贡献度,并选择边际贡献度较大的变量进行模型构建,具体方法如下:
Step1:首先,将解释变量Xi分别与响应变量Y建立非参数模型:
计算模型的残差平方和 (SSE):
依据边际贡献度最大准则 (即SSE最小准则),选出对响应变量Y解释性最好的变量,记作X(1),其模型所得的预测值记为,模型残差为 。
Step2:将剩余的解释变量分别与残差e (1)建立非参数模型:
依据SSE最小准则选出对e (1)解释性最好的变量,记作X(2),其预测值记为,则新的残差为。
Step3:重复步骤2,直至所有自变量Xi(i=1,…, p)被排序为X (1),…, X (p)。
按照向前逐步回归思想,将排序的变量X (1),…, X (p)逐一加入非参数模型中,假设第j个变量代入模型前,SSE下降速度较快,然而加入第j+1个变量后,SSE下降减慢,并随着更多变量的加入趋于平稳,此时我们可以将集合{X(1),…, X(j)}看作经过变量筛选的最优子集合。
依照上述步骤,11个解释变量的排序结果为:{X4,X5,X9,X3,X11,X6,X8,X7,X2,X1,X10},逐次将排序好的变量代入模型,得到拟合模型的SSE序列,通过模型拟合结果得出,X3变量之前的变量代入模型时,SSE下降速度快且预测精度符合最低标准,因此本文选择{X3,X4,X5,X9}作为最优自变量集合。
2.2 模型构建
结合数据特点,本文将选用空间自变量滞后模型(SLX模型)来进行建模,SLX模型可以完整体现自变量X的空间自相关特征,并能充分解释Y, X的空间效应,其形式如下:
其中, Y是n*1维因变量; W是n*n维空间权重矩阵; X为p*n维的自变量矩阵; ε是n*1维随机误差项;截距项β0为n*1维常数向量; β为p*1维的解释变量回归系数; γ为p*1维的空间自变量滞后回归系数。
将数据与模型进行拟合,具体模型结果为:
2.3 都市圈划分
本文将采用层次聚类方法进行都市圈划分,其具体过程如下:对于选定的样本指标集合,初始状态下将每个样本单独作为一类;之后按照选定的合并规则,依次将满足规则的类别两两合并;重复上述步骤减少类别数量,直到满足所设定的停止条件后停止。本文采用欧式距离计算方法,采用最大最小距离的合并原则,停止条件设为所有的样本聚为一类。定义一个影响力指标,其计算公式为:
其中, Yj為被解释变量; Wi为权重矩阵的第i行元素;XTi表示为1*n维的自变量矩阵; γ为n*1维的空间自变量滞后回归系数。 bij表示城市j剔除城市i对其经济影响后,剩余部分占城市j自身经济总体量的比例。如果城市i对城市j的空间影响越大, bij的数值越小,表示两个城市间的影响力距离较小。本文重点关注城市i对其余城市j(j=1,…, i-1,i+1,…, n)的经济辐射能力的强弱,因此需要对空间影响力指标矩阵进行标准化,记为B*。将矩阵进行聚类分析,我们可以将广东省分为五大都市圈,分别包括惠州市、深圳市、东莞市的都市圈Ⅰ;揭阳市、汕头市、潮州市、汕尾市、河源市、梅州市的都市圈Ⅱ;湛江市、茂名市、阳江市、云浮市的都市圈Ⅲ;中山市、珠海市、江门市的都市圈Ⅳ;广州市、韶关市、佛山市、肇庆市、清远市的都市圈Ⅴ。
3 经济建设发展建议
本文通过数据驱动进行建模,估计广东省各城市对周围的辐射划分五大都市圈。对比分析广东省政府2020年5月8日印发的《广东省建立健全城乡融合发展体制机制和政策体系的若干措施》中制定的都市圈规划方案,对广东省城市群经济发展提出以下建议:
3.1 发挥都市圈核心城市的带头作用,以“先富”带“后富”
都市圈的发展水平和路径一定程度上取决于核心城市,因此核心城市应作为该都市圈的标杆和榜样,以点带面,提升自身辐射能力,引领周围城市群发展,构建协同发展模式。
3.2 鼓励经济发展贫瘠地“报团取暖”,共同致富
数据驱动下划分的都市圈结果显示,有部分都市圈内无核心城市,该方案打破了都市圈的核心设定,添加了城市之间互帮互助、携手共进的情形。这种共同致富的模式适用于地理位置偏僻、周围无核心城市、经济基础薄弱的城市群,加强空间经济联动,协调内部资源分布,促进整体共同发展,而且内部发展较为均衡。
3.3 重点关注城镇化、消费、教育和第三产业指标,打造地区经济发展的“风向标”
基于本文变量筛选和SLX模型估计结果可知,城镇化、消费、教育和第三产业这四个重要影响变量可以充分解释和预测人均GDP的发展趋势,因此可利用这四个指标提前预测和分析地区经济发展走向,加快城镇化水平建设、刺激居民消费、增加教育投入和扶持第三产业,努力引导地区经济朝着更好的方向发展。
参考文献
周南南,林修宇.金融集聚、技术创新与经济发展:基于面板数据的空间计量分析[J].宏观经济研究,2020(11):34-48.
周春山,罗利佳,史晨怡,等.粤港澳大湾区经济发展时空演变特征及其影响因素[J].热带地理,2017(6):802-813.
冯鹏睿,徐泮林,田梦娜,等.基于GIS的福建省区域经济发展差异研究[J].测绘与空间地理信息,2020,43(4):131-133+136.
张学良,林永然.都市圈建设:新时代区域协调发展的战略选择[J].改革.2019(2):46-55.
肖金成,马燕坤,张雪领.都市圈科学界定与现代化都市圈规划研究[J].经济纵横.2019(11):32-41+2.
Vega S H , Elhorst J P. THE SLX MODEL[J]. Journal of Regional Science, 2015, 55(3): 339–363.
Anselin L. Estimation Methods for Spatial Autoregressive Structures[J]. Ithaca,New York: Regional Science Dissertation and Monograph Series,1980: 263-273.
Yunquan Song, Xijun Liang, Yanji Zhu,Lu Lin. Robust variable selection with exponential squared loss for the spatial autoregressive model[J].Computational Statistics & Data Analysis, 2021:155.