APP下载

基于信息流的长三角城市群中心性及影响因子研究

2022-02-23恒,许卫,汪

地理与地理信息科学 2022年1期
关键词:信息流城市群长三角

汤 恒,许 捍 卫,汪 成 昊

(河海大学水文水资源学院,江苏 南京 210024)

0 引言

西方早期城市结构研究以克里斯泰勒提出的中心地理论为基础[1],城市间层级体系分明、相互孤立、交流较少、关系相对薄弱,在此基础上提出的城市模型侧重于研究城市的属性和功能且局限于个体,忽略了个体间的联系及其在整体中的作用。曼纽尔·卡斯特等[2]提出的流空间理念为城市群网络提供了新的研究方法,学者们对城市联系网络的关注点由原来的静态研究转变为以各种流要素为主导的动态研究。国内对于城市群网络结构的研究[3-5]起步稍晚,多基于城市静态属性数据,未兼顾动态流要素,导致其不能准确考察城市间联系。传统城市体系研究数据侧重于评价城市的相对重要性,难以体现城市网络的结构特征及城市间的联系内因[6]。流空间理念[7,8]出现后,有关城市群尺度的研究逐渐增多[4],描述城市间流信息常用的方法包括:通过计算城市的外向功能量进行建模、通过计算两城市间的网络连接度构建流要素矩阵和城市引力模型(如零售引力模型、经济相互作用模型等),以及利用企业流[9]和交通流[9,10]展开城市关系研究,但以上流数据获取与整合难度大,且对于表征城市间联系存在一定的局限性。网络大数据挖掘技术为城市网络研究提供了新思路,利用虚拟流数据得出城市间的信息流,可较准确地模拟城市间的真实网络,如甄峰等[11]利用新浪微博用户数据及用户间关系,研究中国城市网络特征的发展,并解释网络空间视角下中国城市间的层次关系。

在全球化时代,交通系统和信息系统的连通以及在此基础上形成的物、信息等要素的流动将各城市紧密连接[12]。在此背景下,本文从点—线—面角度研究流空间下地理中心性随距离的变化情况以及形成城市关联的影响机制。首先基于百度指数构建城市关联强度矩阵,利用社会网络分析法(Social Network Analysis,SNA)分析城市群网络的中心性特征,并采用网络信息流强度描述两城市间的相互作用强度,进而构建城市间在短距离和长距离下的空间权重矩阵;然后计算两城市在短距离下的交互作用指数(SDII)和长距离下的交互作用指数(LDII),据此对城市空间单元类型进行划分;最后以经济、人口、环境、交通等因素为指标探究各城市信息流强度的影响因素,选取最优组合因子构建城市引力模型描述城市间关系,分析信息流网络的影响机制,以期发掘影响城市间关系的内在因素,从而全面理解城市群的空间结构及成因。

1 研究方法

1.1 社会网络分析法

本文采用社会网络分析法中的网络中心性进行研究,包括点度中心度、中间中心度和接近中心度3个指标[13]。点度中心度表示与某节点相连接的点的数量(式(1)),可衡量某城市节点的中心性和影响力程度,由于研究网络为有向网络,所以将点度中心度分为出度与入度,出度表示以某节点为弧尾,起始于该节点的弧的数量,入度表示以某节点为弧头,终止于该节点的弧的数量;中间中心度表示某节点在整个网络中的媒介程度,如果一个节点位于较多其他节点对的最短路径上,则说明该节点的中间中心度较高(式(2));接近中心度表示某节点和所有其他节点的接近程度,用于衡量网络中某节点对其他节点的依赖程度(式(3))。

(1)

(2)

(3)

式中:Xij为节点i和j之间的联系;n为网络节点数量;l与k为网络中除节点i以外的节点;glk、glk(i)分别为节点l和k之间的最短路径数量和经过节点i的所有最短路径数量;d(i,j)为节点i和j之间的最短距离。

1.2 城市引力模型

本文采用引力模型(式(4))计算城市间吸引力,对引力模型进行对数变换(式(5))后可知,城市间吸引力是不同变量的线性组合,因此选取研究时段中与城市信息流强度相关性较强的因子,对式(5)中变量进行替换(式(6)),经过多元线性回归分析计算不同变量因子的影响程度。

(4)

lgRij=lgk+algEijPij-βlgDij

(5)

(6)

式中:Rij为城市i对城市j的吸引力;k为常数;Eij、Pij分别为城市i和j在经济、人口方面的联系;Dij为两城市间的距离(km);ap为变量系数;xp、n分别为变量因子及其总数;c为残差。

1.3 信息流强度统计

信息流强度V用于表征区域城市信息流联系的强度(式(7)),将城市i与其他城市的信息流强度之和作为城市i的信息流总强度Mi(式(8)),其值越大,说明城市i与其他城市的联系越紧密,在区域网络中的影响力越大。为便于分析,将某城市Mi与区域中信息流总强度最大值Mmax进行标准化处理,得到相对信息流强度Ti(式(9))。

Vij=Aij+Aji

(7)

(8)

Ti=Mi/Mmax

(9)

式中:Aij为城市i对城市j的关注度;Aji为城市j对城市i的关注度;m为除城市i以外的城市。

1.4 地理中心性度量

为度量流空间下的地理中心性,本文分别定义短距离尺度下和长距离尺度下的空间权重(WSij、WLij),在此基础上构建短距离交互作用指数SDII和长距离交互作用指数LDII,分别测算短距离交互作用和长距离交互作用强度,计算公式为:

(10)

WLij=1-WSij

(11)

(12)

(13)

式中:σ为区分短距离与长距离的阈值。

基于SDII和LDII,将空间单元识别为4种类型:1)全局型空间单元,该类空间单元在短距离和长距离下与其他空间单元的交互作用均很强;2)外向型空间单元,该类空间单元在流空间主导的长距离下与其他空间单元的交互作用很强,依赖于长距离的信息交互;3)孤立型空间单元,该类空间单元在短距离和长距离下与其他空间单元的交互作用都很弱,在区域中通常处于较低梯级地位;4)局部型空间单元,该类空间单元在以地理邻近关系为主导的短距离下与其他空间单元的交互作用很强,传统的地理中心性理论主要描述的是该类空间单元,其主要与腹地内的城市进行交互,与长距离下的空间单元发生交互则需要依赖区域中的核心城市。

2 研究区及数据源

以2019年《长江三角洲区域一体化发展规划纲要》确定的长江三角洲城市群为研究区域,该区域是“一带一路”与长江经济带的重要交汇处,在国家现代化和开放大局中具有举足轻重的战略地位[14],是中国城市化基础最好和经济发展水平最高的地区。区域内各城市间地缘相近、市场相连,不仅促进长三角一体化发展,实现地理意义上的整合,更加强了各城市间的合作程度。从信息流的角度分析长三角城市群的中心性不仅有利于从网络视角揭示现有城市群网络存在的不足,同时也可以促进城市群内各空间单元间的资源合理配置,完善城市群内外部的空间组织联系,从而扩大区域中核心城市的影响范围。

百度指数是基于百度网民的行为大数据搭建的平台[15],用以反映过去一段时间内不同关键词的“用户关注度”,其以网民在百度的搜索量为数据基础,以关键词为统计对象,科学分析并计算各个关键词在百度网页中搜索频次的加权和。本文通过Python爬虫技术共采集2011年、2015年、2019年各城市间的百度指数数据1 795 800条,采集字段包括城市名称(Keyword)、数据类型(Type)、日期(Date)、指数值(Index),其中,指数值表示设定的当前城市(i)对搜索城市(j)的关注程度,所有数据构成两城市间的关联强度矩阵(表1)。影响因子数据来源于相关统计年鉴。

表1 城市关联强度矩阵Table 1 Urban correlation strength matrix

3 结果分析

3.1 信息流强度分析

由2011年、2015年和2019年长三角城市群各城市的信息流总强度(图1)可以看出,上海的信息流总强度一直处于领先地位,表明其影响力较高,其余大部分城市的信息流总强度较低。2011年因网络发展程度相对较低,各城市的信息产出量较低,导致各城市信息流强度总体偏低。2015年和2019年各城市信息流总强度均出现提升,以上海、南京、杭州等城市为首的核心城市的信息流总强度较高,处于引领地位。进一步根据信息流总强度对各城市进行分级(图2),可以看出,上海、南京、杭州、苏州始终处于第一梯级,无锡、常州、宁波、温州、合肥长期处于第二梯级,江苏省内大部分城市处于第三梯级,安徽省内城市则以第四梯级居多,反映出江苏省的城市在长三角范围内和其他城市的联系更紧密。其中,合肥在省内的单核地位明显,而浙江、江苏两省则有两个以上的高梯级城市带领周边区域发展。

图1 长三角城市群各城市信息流总强度Fig.1 Total information flow intensity of cities in the Yangtze River Delta Urban Agglomeration

图2 长三角城市群各城市梯级划分Fig.2 Cascade division of cities in the Yangtze River Delta Urban Agglomeration

为更直观地识别长三角城市群的信息流网络格局,基于相对信息流强度,运用自然断裂法对各城市内部的联系强度进行梯度划分,选取相对信息流强度为0.25~0.5和0.5~1.0的信息流网络[10]分别构成主干网络和骨架网络(图3)。由图3可以看出,2011年长三角区域呈现以上海、杭州、南京、苏州、宁波、无锡为主的骨架网络轴线,2015年和2019年合肥、马鞍山、温州、绍兴的依次加入使骨架网络进一步扩大,网络架构从上海主导的辐射型架构转向以上海、南京、杭州、苏州等城市为主导的多核心架构。主干网络方面,长江三角洲及长江沿岸的城市信息沟通更加紧密,随着时间推移,主干网络的支线不断扩展,上海、南京、杭州、苏州、合肥表现出较强的辐射能力,越来越多城市与一、二梯级城市间的联系趋于紧密,信息流的作用一定程度上打破了地理位置的限制,弱化了行政区划的影响。

图3 2011年、2015年和2019年长三角城市群各城市的相对信息流强度Fig.3 Relative information flow intensity of cities in the Yangtze River Delta Urban Agglomeration in 2011,2015 and 2019

3.2 网络中心性分析

由图4可以看出,2015年和2019年的出度、入度远大于2011年,与前述信息流总强度的变化特点一致。在入度方面,各城市差距不明显;在出度方面,两极分化现象明显,上海、南京、杭州、合肥呈现高值特征,其他城市则与上述城市差距明显。从出入度总和看,上海在长三角区域位居首位,结合图3可以看出,上海和南京、苏州、杭州、合肥共同组成“一主四副”的空间分布格局。上海的进出口量一直较高,而城市的进出口量与其出入度具有一定的内在联系,因此上海的出入度总和一直为最高;而其他4个城市在本省的城市定位及地理位置决定了其进出口量处于高值,从而导致出入度总和也较高。

图4 长三角城市群各城市的出度、入度Fig.4 Out-degree and in-degree of cities in the Yangtze River Delta Urban Agglomeration

以2018年中国高铁及动车运营线路图为参考,构建长三角城市群网络,其中各城市抽象成节点,各运营线路抽象成连接节点的链路,以此计算各城市的中间中心度(图5a),可以看出,南京、杭州、蚌埠、湖州、徐州、合肥位于前列,表明这些城市因具有完善的高铁枢纽,在长三角城市群中可以担任其他城市间沟通的桥梁,与其他城市的通达度较高;部分中间中心度为0的城市多为长三角城市群中人口相对较少、层级较低的城市,城市职能较单一,在城市群中的地位有待提高。参考各城市间的空间距离(km),计算各城市接近中心度(图5b),可以看出,马鞍山、南京、芜湖、镇江、宣城等占据长三角城市群的中心位置。结合前文的点度中心性看,只有南京、镇江的影响力较高,其他城市虽占据地理中心位置,但其对外或接受关注的能力明显不足。

图5 长三角城市群各城市中间中心度和接近中心度分布 Fig.5 Distribution of betweenness centrality and closeness centrality of cities in the Yangtze River Delta Urban Agglomeration

3.3 流空间下的地理中心性度量

首先,利用式(10)-式(13)分析SDII和LDII对阈值σ的敏感性(图6),可以看出,随着阈值σ的增加,SDII和LDII均下降,但LDII的下降幅度小于SDII,表明距离的变化对短距离下的交互作用影响更大;同一年份SDII的值恒大于LDII的值,说明短距离的交互作用始终强于长距离的交互作用,侧面反映地理邻近下的地理空间相对于流空间下的地理空间的比重更大;在400 km范围内,曲线变化幅度较大,大于400 km后曲线趋于平稳。以上海、苏州、南京、杭州4个核心城市为例,分析其不同距离阈值下的覆盖范围(图7)。可以看出,100 km半径范围覆盖了核心城市周边的部分城市,200 km半径范围覆盖了大部分省内城市,300 km半径范围几乎覆盖了附近省份的整个地区,当半径超过300 km 时,不同城市的近距离空间存在较大重叠,失去空间尺度的现实意义。因此,选择100 km、200 km和300 km 3个空间尺度分别对应城市尺度、省域尺度和区域尺度[16],进一步分析地理中心性(图8)。

图6 SDII、LDII 随距离阈值的变化情况Fig.6 Changes of SDII and LDII with distance threshold

图7 不同距离阈值下的覆盖范围Fig.7 Coverage under different distance thresholds

由图8可以看出,区域中的核心城市主要集中于江苏南部和浙江沿海,上海、南京、苏州、无锡、常州、杭州始终为全局型空间单元,且全局型空间单元主要以区域中一、二梯级的城市为主;安徽省仅合肥市为全局型空间单元,但安徽省城市数量为长三角三省中最多,因此需要更多的核心城市来带动本省中孤立型空间单元的发展;200 km及以上范围内,徐州、扬州和黄山为外向型空间单元,这些城市均为区域中的交通集散城市和旅游热门城市;多数沿海城市为局部型空间单元,嘉兴、台州、南通地位稳固;孤立型空间单元多分布于长三角区域的中西部,体现出长三角城市“由东向西”的发展格局。

图8 不同年份不同阈值下的空间单元类型分布Fig.8 Distribution of spatial unit types under different distance thresholds in different years

4 城市群联系的影响因素分析

4.1 自变量选取与分析

为保证影响因素(自变量)与城市属性信息相关及其全面性,选取人口、就业等方面的19个指标,对其取对数,与2011年、2015年、2019年城市关联强度对数值进行相关性分析(表2),并进行双尾显著性检验。R<0.5、0.5≤R<0.75、R≥0.75分别表示二者呈弱相关性、中等相关性和强相关性。

由表2可知,常住人口、从业人员、社会消费品零售总额等因子一直保持中等或强相关性,而在国民经济产业中占重要地位的农林牧渔业总产值的相关性一直较低,这种产业以劳动密集型为主,对信息通信技术的需求较小,所以其产生的信息量和本文所描述的城市间关联并无直接关系;进口总额与出口总额始终保持中等相关性,二者分别对应点度中心度的流入量、流出量,高值表示城市的对外贸易规模较大,根据点度中心度的分析结果可知,长三角城市群中的城市以出度为主,所以相对而言,出口总额对城市间的关联强度更有解释力;客运量和货运量均呈弱相关性,但二者是从运输业方面表现城市经济和人民生活的服务型指标,侧重于运输层面的规模和效率,其值的高低不能直接反映城市信息关联的强弱,对信息的依赖程度较小;人均可支配收入是衡量市民生活水平的重要指标,但其计算过程复杂且易受所在地域发展情况影响,如黄山市虽然在长三角城市群中受关注度较高,但其人均可支配收入却不高;两城市空间距离与城市关联强度呈负相关,这在一定程度上也符合传统地理学理论的认知,但3个年份中距离的负相关程度都不高,说明“距离衰减”对于城市间联系的影响并不显著,这也与前文结论一致,体现了在信息流作用下,两城市可以在远距离产生交互,进一步减弱地理空间的作用,但从另一角度分析,传统的基于邻近性的地理空间仍在省域范围内发挥作用,除强中心性城市和处于行政区划边界的城市外,省内城市间关联强度往往比与省外城市的关联强度更高。

表2 相关性分析结果Table 2 Results of correlation analysis

4.2 模型构建

根据相关性分析结果选取3年中总体相关性强度为中等相关和强相关的因子,并结合因子特征将其分为直接因子和间接因子,前者包括GDP、常住人口、从业人员,这些因子具有综合性特征,能通过这些因子直接观察出城市的某项特征;将社会消费品零售总额、公共预算收支(公共预算收入与公共预算支出之和)、房地产开发投资(经济因素)和移动电话用户数、互联网接入用户数、民用汽车数量(人口因素)归类为间接因子,该类因子是对城市某项活动发展情况的特定解释。基于直接因子和间接因子的模型拟合结果如表3和表4所示。

表3 直接因子模型拟合结果Table 3 Fitting results of direct factor model

表4 间接因子模型拟合结果Table 4 Fitting results of indirect factor model

由表3、表4可以看出:1)对于直接因子而言,2011年和 2015年的拟合优度较差,说明在这两个年份GDP和常住人口或从业人员的组合并不能很好地解释当年城市间信息流的联系状况,2019年的拟合优度最好,两类指标组合的R2分别为0.76082和0.76470,说明2019年的自变量因子较2011年和2015年具有更好的指示意义。2)对于间接因子而言,其拟合效果整体上比直接因子好。但2011年拟合情况较差,这间接说明2011年城市发展的各项指标与城市间联系偏弱,2015年中房地产开发投资、移动电话用户数、两城市空间距离3类因子组合的拟合优度达0.70283,2019年拟合优度普遍达到0.78以上,可以看出2015年和2019年模型拟合结果较好。以上拟合结果表明,社会消费品零售总额、房地产开发投资、公共预算收支等间接因子对城市间信息流的影响大于地区生产总值、常住人口等综合性指标,居民消费水平、城市建设规模、通信规模等细化指标能更精确地描述城市间的关系。对选取的相关性因子进行模型拟合时,2015年和2019年的拟合效果比2011年更好,说明随着社会经济的发展,选取的因子对城市的信息流强度和两城市间关联强度的解释逐渐更合理。

以拟合效果较好的2019年为例,选取拟合优度较高的3组因子:房地产开发投资、移动电话用户数、两城市空间距离,社会消费品零售总额、民用汽车数量、两城市空间距离,公共预算收支、互联网接入用户数、两城市空间距离,观察其数据分布可知,3组变量拟合模型结果的标准化残差 P-P 图均呈明显的正态分布,因此这3组因子拟合出的模型均有意义。

5 结论

本文以长三角区域41个城市为研究对象,利用百度指数构建城市间信息流强度矩阵,并对城市群网络的中心性及影响机制进行研究。首先从城市梯级划分、主干网络和骨架网络提取及网络中心性3个角度分析城市的外部结构特征;其次重点分析流空间下的地理中心性,并判定城市单元类型;最后选取多个因子与城市关联强度进行相关性分析,从而挖掘城市关联强度的影响机制。结果表明:从年际变化看,长三角城市群网络的主体结构由以上海为核心的单核结构转为由上海、苏州、南京、杭州4个城市构成的多核结构,与传统角度分析结果一致;从地理中心性的分析结果看,长、短距离下的交互强度差异与距离呈负相关,即流空间的主导作用削弱了距离的作用,但短距离交互作用强度仍大于长距离交互作用强度;城市经济等各项指标与城市间关联强度的相关程度随年份增长而提高,此外,距离与城市间关联强度呈弱负相关,这表明流空间一定程度上削减了距离因素对城市间关联强度的影响。

目前,社会网络分析法未考虑距离对城市关联的影响,而传统的地理中心地理论则将距离作为衡量城市关联的唯一标准,忽略了城市属性。本文基于信息流会在远距离影响城市间交互这一假设,对流空间下的城市群展开研究,并综合考虑距离与城市属性对城市关联的影响,提供了从流空间角度对城市群中心性研究的新思路,且基于此构建的城市关联强度的影响因子选取模型具有一定的普适性,可为其他相关研究提供参考。但本研究的城市关联强度只能反映在网络信息交互方面的城市联系。城市关系网络复杂多样,流空间所涉及的方法与类型也多种多样,如何采取合适的方法以及如何融合多源流数据研究城市间的联系仍需进一步探讨。

猜你喜欢

信息流城市群长三角
“1+1=7”凝聚长三角人大更大合力
紧扣一体化 全面融入长三角
基于信息流的作战体系网络效能仿真与优化
“首届长三角新青年改稿会”作品选
基于信息流的RBC系统外部通信网络故障分析
2019长三角企业100强
战区联合作战指挥信息流评价模型
长三角城市群今年将有很多大动作
《关中平原城市群发展规划》获批发布
为世界级城市群铺路