APP下载

中国人口流动网络时空演化及其对新冠疫情传播的影响

2022-11-28曹炜威贾建民

系统管理学报 2022年6期
关键词:介数流动人口

石 峰 ,袁 韵 ,曹炜威 ,贾建民

(1.西南交通大学 经济管理学院,成都 610031;2.服务科学与创新四川省重点实验室,成都 610031;3.清华大学 经济管理学院,北京 100084;4.中国民用航空飞行学院 民航飞行技术与飞行安全重点实验室,四川 广汉 618307;5.中国科学院成都计算机应用研究所,成都 610029;6.香港中文大学(深圳) 经济管理学院,广东 深圳 518172;7.深圳市人工智能与机器人研究院,广东 深圳 518129)

人口流动行为的研究是全球各国家和地区的重要议题,反映着物理世界纷繁复杂的区域人地关系。人口在地理空间上的流动不仅推动了经济要素的扩散和集聚,促进资源配置和社会发展,也会造成交通拥堵、疫病传播、社会动荡和生态破坏等负面问题[1-2]。因此,对人口流动行为的探索已成为经济学、社会学、地理学、物理学、流行病学、城市规划与管理等交叉学科共同关注的焦点。实际上,学界对人口流动的研究已有百余年之久,研究人员采用不同的理论、模型、方法和技术探索人口流动特征和规律,其中影响力最大的是引力模型和推拉理论[3-4]。引力模型认为区域间的人口流动量与两地的人口成正比,与其距离成反比;推拉理论更加适用于长期性的人口迁徙行为研究,经典的推拉理论认为人口迁移同时受到流出地推力(对本地居民生活的不利因素)与流入地拉力(对迁移者的有利条件)的影响。

除人口流动理论和模型取得研究进展,过去几十年中,国内外众多学者还依赖观察、访谈、调查问卷和出行日志等方式研究人口流动的特征,但由于这些数据存在更新速度慢、统计粒度粗、获取成本高等特点,难以有效观测和刻画人口的流动行为,也无法真实准确反映人口流动的时空特征[5]。随着互联网时代的到来和信息技术的迅速发展,传感器技术、卫星定位、无线通信和移动互联网等客观记录了海量人群长时间的流动数据,推动了人口流动行为的定量分析[6]。与传统调查方式相比,移动定位数据及其分析方法以强大的信息搜集、整合、分析和处理优势,在大样本、多源数据和强预测性等方面占据绝对优势,已经逐渐成为人口流动研究领域中的重要数据来源[7]。

以往学者利用来自电信运营商、互联网服务商的用户移动定位数据研究日常、特殊事件或重大灾难等情景下的人口流动规律。文献[8-10]中最早利用手机信令数据开展人类空间流动行为的研究。部分研究基于腾讯和百度迁徙数据分析日常或节假日期间的人口流动空间格局、城际人口流动网络结构特征、人口流动中的富人俱乐部效应以及人口流动的影响因素等,研究成果为形成经济发展新格局和促进区域平衡提供了重要参考[11-17]。有研究采用地理标记的社交媒体数据研究了小空间尺度下的人口流动模式,研究结论可为城市规划和商业服务发展提供建议[18-19]。Brockmann等[20]在有效距离框架下基于全球航空数据构建了反应-扩散模型,将流动网络中的疾病扩散简化为一种均匀的波传播模式。文献[1,21]中分别对短距离通勤流、长距离航空流和境外输入流等不同尺度流动行为带来的疾病异质性传播风险进行了分析。这些研究成果对于疫情防控、分析疾病传播路径以及应对突发性公共卫生事件开创了一种通用的分析范式。

大规模的人口流动行为往往是传染性疾病迅速扩散的重要媒介,对流动规律的深刻理解可以有效指导政府制定和实施相关防疫决策。在本次Covid-19流行初期,各国政府实施关闭边境、旅行禁令和城市封控等政策和措施,旨在通过减少个体接触来遏制疫情蔓延[22-28]。文献[29-33]中研究了管控政策对中国长三角和大湾区人口流动的影响,分析了疫情后人口迁徙强度的恢复在时空上的差异。文献[34-35]中分别对美国和法国防疫期间人群流动行为进行了研究。Jia等[36]证实武汉市封城政策对流出人口规模的显著影响,揭示了疫情传播与武汉流入人口的高度相关性并建立了风险度量模型;分析显示,武汉流出人口中18岁以下的儿童和青少年学生在驱动全国各地疫情传播中比其他年龄段的人口起着更加重要的影响作用。Fan等[37]构建居住-出生地RB矩阵实证检验了全国地级市疫情风险与迁移比率的相关性。此外,一些研究基于流动性的年龄结构构建了传播仿真模型,模拟基于不同年龄群体流动接触矩阵的疫情传播与非药物干预措施效果比较[38-40]。

然而,疫情防控政策导致的流动性限制是否会造成人口流动网络结构发生深层次变化,而这种变化又将如何反馈到疫情传播和发展中? 研究表明,在疫情传播的不同阶段,流动网络拓扑属性差异显著,封控政策将导致流动网络的小世界特性消失,而人口流动网络的地理碎片化也将在社交隔离措施下加剧[41-42]。Schlosser等[43]对德国2020 年1月至6月间的人口流动性和疫情发展进行研究,观察到流动网络局域化、小世界效应的减弱缓和了疫情蔓延,减慢了病毒传播到地理上较远的地区。文献[44-46]中采用基于智能体的仿真探讨了个体尺度下社交接触网络的优化如何有效减少病毒传播速率。但是,目前有限的研究尚不足以完全揭示流动网络的结构特征变化及其对疫情传播的影响。在此背景下,本文利用电信运营商的手机信令数据建立由367个城市节点构成的人口流动网络,以天为时间单位探究网络结构的时空动态演变。在此基础上,融合卫健委通报的各地级市新增确诊病例数据,建立时间断点回归模型分别评估封控政策对疫情发展和流动网络拓扑结构的影响,进而在控制武汉流入人口的基础上,应用逐步回归方法检验城市节点拓扑特征在疫情防控政策对疫情发展影响的中介效应。本文对理解疾病在复杂网络中的传播规律具有重要的现实意义,为流行病预测与防控政策制定提供帮助。

1 数据与方法

1.1 数据

本文使用的人口流动数据来自于中国三大电信运营商之一,是由每日的海量信令数据聚合而成的城市间匿名位置移动记录。数据集记录了367个地级市2020-01-01~2020-02-29的人口流动情况,共涉及51 836个城市对之间的2 195 986 035次个体流动。数据包括日期、出发城市、出发省份、到达城市、到达省份、各年龄段人口流量以及外推人口流量在内的7个字段。外推数据是运营商利用机器学习方法根据各城市、各年龄段用户覆盖比例和其他运营商市场占比等因素计算得到。因此,外推数据超越了单一电信运营商的用户范畴,是对全国尺度人口流动数据的完整估计[2]。新冠肺炎确诊病例数据来自国家和各省份的卫健委网站,统计自2020 年1月1日以来各城市的每日确诊人数,根据城市名称与人口流动数据匹配。

以城市为节点,城市间每日人口流量为边权重,构建全国人口流动网络。根据人口流动特征结合春运时间节律和疫情爆发时间,将数据切片划分为日常(2020-01-01~01-09)、春运(01-10~01-23)、封控(01-24~02-10)和恢复(02-11~02-29)4个阶段,对不同时间阶段、城市等级、年龄组别和出行距离的流动数据聚类处理以观察网络拓扑特征和流动行为在春运和疫情双重影响下的时序演变。本文将0~18岁划分为儿童组,19~29岁、30~39岁划分为青年组,40~49岁、50~59岁划分为中年组,60~69岁和70岁及以上划分为老年组。

1.2 研究方法

(1) 网络结构分析。采用社会网络分析方法对人口流动网络结构特征及其演化进行研究,具体指标包括度及其相关性、特征路径、加权介数、接近中心性和特征向量中心性[47]。人口流动网络是加权有向网络,城市的出/入度分别表示由节点城市流出的总人数和由其他城市流入的总人数。度相关性则描述了网络中节点之间相互选择的偏好性,如果度大的节点倾向于与度大的节点连接,则网络是度同配的,反之则是异配的。度相关性采用Newman[48]提出的方法进行计算,当计算值>0时,表明网络同配,计算值为0说明网络不相关(中性网络),否则网络异配。人口流动网络中,同配网络中O-D 两端的城市流量较为均衡,如发达城市群内部之间的连接;异配网络中O-D 两端的城市流量差异性较大,如典型的核心-边缘连接结构。

介数中心性是一个全局特征量,反映节点或边在整个网络中的枢纽影响力。考虑到权重对节点重要性的影响,加权介数中心性定义为网络中经过该点的所有最短路径的权重之和与网络中所有最短路径上的权重之和的比值。在人口流动网络中,无权介数小的节点有可能加权介数较大,例如通过该节点的最短线路少但人口流量却比较大的点,因此,采用加权介数来考察节点的重要性更具现实意义。接近中心性为给定节点到其他节点最短路径之和的倒数,反映在网络中某一节点与其他节点之间的接近程度。特征向量中心性则用邻居节点的中心性定义节点本身的重要性,与之相连的邻居节点越重要,则该节点就越重要。

(2) 断点回归方法。采用断点回归设计方法检验封城、一级紧急响应等防控政策的实施对武汉流入人口、流动网络拓扑结构以及当地疫情传播的影响。断点回归设计由Thistlethwaite等[49]首次提出,其有效利用现实约束(或政策)条件,是一种仅次于随机试验的分析变量之间因果关系的实证方法。断点回归设计可以解决选择性偏误问题,利用一个取决于某连续变量的间断函数,以决定个体是否受到处置。其核心思想是假设存在一个连续变量,该变量能决定个体在某个临界点两侧接受政策处理的概率,由于该变量在该临界点两侧是连续的,因而个体依据变量取值落入到临界点任意一侧是随机发生的。Hausman等[50]指出在时间断点回归中,时间变量是判断个体是否接受政策干预的连续变量。

2 春节-疫情双重影响下的人口流动网络演化

2.1 流动网络总体时空结构特征

“春运”是中国特有的迁徙现象,导致短期内人口发生大规模流动。由于COVID-19的爆发,2020年的春运人口流动变得更为复杂。图1(a)~图1(d)分别描绘了日常、春运、封控和恢复4个阶段城市间日均流动人口数量即人口流动强度的空间分布图,连线表示城市对之间存在人口流动,颜色和粗细不同表示人口流动强度的差异。为了提高图形可读性,仅展示日均流动人口数超过1万的城市对连线。由图1可以发现,人口流动存在明显的空间分布不均衡性,西北地区人口密度小,城市间的人口流动强度始终较低。日常和春运阶段,人口流动强度在20万以上的区域主要集中在京津冀、长三角、珠三角以及成渝城市群。COVID-19的爆发对人口流动模式产生破坏性影响,人口流动强度较疫情爆发前最高降低71%。封控和恢复阶段,人口流动强度超过1万的城市对较日常和春运阶段分别降低44%和50%,人口流动空间分布格局较疫情爆发之前发生显著变化。

图1 不同阶段人口流动空间格局

2.2 流动网络的年龄结构特征

图2所示为不同年龄人群流动网络特征的时序差异。图2(a)展示了网络加权平均度的时序差异。进入封控期后各年龄流动性呈断崖式下跌,疫情封控政策对青、中年人群的流动有更大削弱,流动性最多降低72.8%和73.8%,而儿童和老年人群则分别最多降低61.9%和67.9%。2月10日国务院发布“复工复产”政策,随后各年龄人群的流动强度逐渐开始恢复[51]。图2(b)绘制了各年龄人群流动网络度相关性的时序变化,青年人群流动网络始终呈异配,这可能是以工作为主要导向的迁移所致。儿童和老年人群始终保持同配,表明后者的移动主要在相似级别城市间进行。值得注意的是,封控阶段网络度相关性显著上升,这可能是因为各地严格的防疫政策削弱了核心-边缘城市之间的强连接[52-53],使得人口流动变得较为破碎和离散。2月中旬国务院“复工复产”政策实施后,大中城市相继解封,核心-边缘的城市人流联系格局得到一定程度恢复。

图2 各年龄人群流动网络拓扑属性时序演变

图2(c)、2(d)展示了各年龄群体流动网络的最短路径数和加权平均介数。两者时序演化趋势恰好相反,分别反映了网络全局可达性和网络中城市节点的平均枢纽性。由图2可见,日常和春运阶段变化并不显著,进入封控期后,各地出台防控隔离政策导致网络中最短路径数急剧减少。同时,交通网络拓扑结构的重构使得城市节点的加权平均介数快速攀升,这是由于占城市数量绝大多数的中小城市的枢纽效应增大所致。2月中旬进入恢复期后,各大中心城市相继解封复工复产,网络加权平均介数逐渐下降,网络最短路径数得到一定恢复。不同年龄人群的流动行为也存在显著差异,中青年人群流动网络的可达性远高于儿童和老年人群,但后者的网络平均加权介数更高,表明儿童和老年人群的出行偏好更为多元,例如游玩、教育和医疗,从而使网络上更多城市节点枢纽性得到提高。值得注意的是,儿童群体流动网络的介数上升是最早的(春运开始),这与儿童更早的假期和更离散的出行目的有关。

2.3 流动性变化下的度分布重构

图3(a)、3(b)展示了双对数坐标系下四阶段人口流动网络的出入度分布图。由图3可见,出入度均呈现幂律分布,且具有明显的“低度饱和”和“高度截断”特征。低度饱和是由于网络节点数量的限制,小度节点的数量比纯幂律分布所预期的要少;同时,节点度值大小受到城市总人口的约束,无法提供足够多的胖尾节点,所以存在高度截断现象。出入度的分布也存在时间异质性,封控和恢复阶段流动网络的出入度集中于小度值区间,且度值越大,频数分布与前两个阶段相差越大,其流动网络的度均值、中位数和分布范围都相对更小。

图3 四阶段人口流动网络度分布与城市对流量分布

图3(c)刻画了四阶段人口流动强度分布的重构情况,分布总体以第400 位为界服从两阶段的Zipf定律。位序靠前的城市对人口流动强度衰减较缓慢,位序靠后的衰减较快,这体现了人口流量在城市间分布的双重不均衡性。在新冠疫情防控背景下,城市对流量分布得到重构,由表1结果可知,进入封控期后,人流量进一步向头部城市对集中且第1阶段(Top400之前)人口流动强度衰减速率显著加快,而第2阶段(Top400之后)的衰减则得到了缓解。虽然复工复产后网络总流量逐渐恢复,但这种流量分布格局的重构得到了延续。

表1 四阶段城市对流量分布格局演化

2.4 流动网络特征的城市异质性

图4按照城市分级视角刻画了各年龄群体的出入度时序变化。对各年龄人群,超一线、新一线和二线城市春节前出度显著大于入度,春节后出度小于入度;三线、四线和五线城市则相反。这体现了高等级城市在区域吸引力上占据优势,是劳动力的吸收方[53]。

入度演化趋势存在城市分异,由图4(a)~4(c)显示,超一线、新一线和二线城市,尤其是以北上为代表的超一线城市的入度在春运阶段稳步下降,无明显的“春运高峰”现象。这表明,发达城市户籍人群返乡时间较早,节前加班比例较低。从三线开始,城市入度出现明显的“春运高峰”现象,且层级越低,高峰点逐渐后移。从新一线(尽管不明显)到五线,高峰时点从1月17日(节前8天)逐延至1月19日(节前6天),低等级城市户籍居民受迫于经济压力更可能加班到节前才返乡。观察年龄分异,春运阶段,超一线、新一线和二线发达城市,青年人群入度的下降斜率最大,这意味着发达地区的年轻人相对更早地返乡,而三线、四线和五线落后城市则相反,青年人群“春运高峰”斜率反而最高。这种两级分化的现象揭示了中国当下不同城市居民的经济状况差异正在加剧,且在年轻人群中表现尤其显著。

图4 各年龄人群流动性时序演化的城市异质性

出度演化趋势也存在城市分异,超一线、新一线和二线城市的出度在日常和春运阶段差异不大,时序演变较为平稳。从三线城市开始,城市出度均存在明显的“春运高峰”现象,大量返乡流积压在节前几天。这可能是由于发达城市产业齐全且吸纳了很多学生和就业人员,提前释放返乡流,而落后城市中第二、三产业工作者比例较高,存在结构性的“春运堵塞”现象。图5(a)~(d)展示了各层级城市节点在流动性网络上的拓扑特征异质性,为便于观察变化趋势,对各指标数据做最大值标准化来描述时序相对变化情况。

图5 不同层级城市中心性分布

由图5可见,封控政策对网络结构产生了异质性影响,超一线、新一线和二线城市的度中心性、特征向量中心性和介数中心性较疫情前均显著下降,而三线、四线和五线城市则上升,尤其是特征向量中心性尤为明显。由于疫情对网络结构产生了破坏,疫情防控阶段所有城市接近中心性均显著下降,但相较中间层级城市,超一线和五线城市变化相对小。表2给出了各层级城市封控期间网络结构特征均值相较疫情发生前的变化水平,这一变化与疫情传播是否存在关联将在第3节进一步分析。

表2 各层级城市封控阶段相对疫情前的网络拓扑特征变化

2.5 出行距离的流动性依赖

正如上节探讨的流动网络拓扑结构存在节点异质性,本节对流动性变化在不同距离出行行为上的体现进行了分析。图6(a)展示了流动性变化在不同距离上的差异,这里将各距离组日常阶段的流动性平均值作为基准描述相对变化。结果表明,超短距离(0~50 km)和超越邻省的长距离(500 km 以上)流动在疫情期间受到更大的限制,而50~500 km 的中短距离流动性减少相对少。这可能是由于通勤交通和跨区域的长距离交通由于封禁政策破坏得更为严重所致。

此外,研究发现,两类距离流动性变化之间的分化是疫情后的一个长期现象,如图6(b)所示。虽然2月10日之后进入了恢复期,流动总量等已逐渐恢复至疫情前50%以上,但超短、长距离流动与中、短距离流动之间的显著差异表明人口流动模式结构性变化仍未恢复,这种变化的持续性表明新冠疫情大流行对人类流动行为产生了深远影响[43]。

图6 不同距离下流动行为的异质性

3 流动网络特征在疫情传播中的作用:一种中介效应解释

如前文对人口流动网络的时空特征分析所述,城市节点的网络中心性特征在疫情和春节前后发生显著性变化。2020年初,新冠肺炎疫情在武汉局部爆发,迅速在全国范围内扩散,各地政府紧急启动防控措施,自1月23日起,各省份陆续启动一级紧急响应,尤其在1月23日湖北省召开的省肺炎防控指挥部第二次会议强调,武汉市将启动严格的封城政策,自10时起,暂停城市公共交通运营,关闭机场、火车站等离汉通道,湖北省其他城市的人口流动也受到严格管控。因此,自2020年1月23日,以武汉市为代表,全国各省市陆续开始实施人口流动限制政策,对全国人口流动网络造成显著影响,为有效评估封控政策实施、人口流动网络特征和新冠肺炎疫情局势发展之间的关系提供了宝贵的准自然实验机会。本文采用时间断点回归设计实证封城政策对人口流动网络拓扑特征和疫情发展影响的因果效应,同时提出流动网络拓扑结构和武汉流入人口两个中介变量,在如图7所示的研究框架下检验网络拓扑结构特征和武汉流入人口两个因素在封城政策对新冠疫情发展影响过程中的中介效应。

图7 双中介分析框架

本文的研究问题之一是估计以武汉封城为代表的疫情防控政策(一级紧急响应)对人口流动网络结构和疫情局势发展的影响,全国各省份发布一级响应的时点相对集中(均在1月23日附近),在该政策背景下,可以认为全国所有城市(除西藏自治区外)在同一时间点受到了政策冲击[54]。首先,本文建立基准模型,评估封城政策对疫情未来发展形势的影响。在对这一政策进行效果评估中,政策实施时点即为时间断点,控制其他条件(如时间趋势)后,如果在断点前后,疫情的未来发展形势发生突变,且其余时间点附近呈现连续的特点,则可以证实封城政策与疫情发展之间因果效应的存在。设定如下准模型:

式中:本文研究中以地级市作为最小个体粒度,以天为最小时间粒度,i表示城市,t表示时间;Covid19i,t表示城市i在日期t时对应的疫情未来发展形势,由于新冠肺炎病毒的潜伏窗口期最长为21天,故使用未来3周(21天)内的新增病例数作为测量疫情未来形势的代理变量,并取对数处理;Policyi,t为时间虚拟变量,在1月23日之前值为0,1月23日之后值为1;x是执行变量,表示距离政策实施时点(1月23日)的天数,政策实施前值小于0,政策实施时值等于0,政策实施后值大于0;f(x)表示一组以x为自变量的多项式函数,用于捕获政策实施效应的动态变化,本文主要使用一阶线性多项式;Z是其他控制变量,如节假日效应、星期效应等变量;μi为城市体固定效应;εi,t为随机扰动项。模型式(1)中的待估系数β1表示疫情防控政策(如封城、一级紧急响应)对疫情未来发展形势的影响,若值显著小于0,则可以证明疫情防控政策实施的及时性和有效性。

进一步,替换基准模型中的因变量,评估并实证疫情防控政策对全国人口流动网络拓扑结构(中心性)和武汉流入人口这两个中介变量的影响,模型设定如下式所示:

式中:Centralityi,t表示城市i在日期t时在全国人口流动网络内的中心性,中心性可以衡量任意城市节点在复杂网络中的相对重要性,分别采用度中心性、接近中心性、介数中心性和特征向量中心性4种测度,并取对数处理;Outflowi,t表示武汉流入人口,取对数处理。其余变量的设定与模型式(1)相同。

传染病疫情的传播和发展是以人口的流动与接触为媒介,大规模人口迁徙极易将新发重大传染病疫情迅速从偶发、局部升级为大流行。此外,大量研究和媒体报道表明,武汉市是新冠肺炎病毒在全国范围内扩散的主要传染源之一,武汉流入各地的人口对当地疫情发展产生决定性影响。因此,封城在内的疫情防控政策可以通过改变流动复杂网络的结构,及时切断传染源的人口流动,起到抑制疫情恶性发展的成效,全国人口流动网络的拓扑结构和武汉市流入人口在疫情防控政策可能对疫情未来发展形势的影响起到中介作用,故将网络拓扑结构和武汉流入人口作为中介变量,放入模型式(1),得到如下模型:

对模型式(1)~(3)使用逐步回归方法(见表3、表4),检验中介效应是否显著存在。其中,模型式(1)中的系数β1反映疫情防控政策对疫情未来发展影响的总效应,式(3)中的系数β1 反映疫情防控政策对疫情未来发展影响的直接效应,式(2)中的系数β1 与式(3)中的系数δ1的乘积反映疫情防控政策对疫情未来发展影响中由流动网络拓扑结构介导的间接效应,而与系数δ2的乘积则反映疫情防控政策对疫情未来发展影响中由武汉市流入各地人口介导的间接效应。考虑到恢复阶段各城市经济社会活动的差异性会导致如社区传播等不可观测因素的影响,因此将时间断点回归中的带宽设定为防控政策实施(1月23日)前后18天(到2月11日,恢复阶段开始为终止日期)。

表3 模型(1)和模型(2)的回归结果

表4 模型(3)的回归结果

实证结果表明,自2020年1月23日以来,在时间窗口(前后各18天)期内,武汉市启动封城、各省份启动一级紧急响应等防控政策有效减少未来16.5%(e-0.180-1)的疫情发展形势,各城市在全国人口流动网络中的度中心性平均减小4.5%,接近中心性减小1.78%,特征向量中心性减小0.4%,介数中心性虽然显示有微小增加,但是统计上并不显著。同时,疫情防控政策有效减少武汉流入全国各地市86.4%的人口。

在控制武汉流入人口因素的条件下,人口流动网络的拓扑结构特征依然显著影响本地未来疫情的发展态势,其中,度中心性、接近中心性和特征向量中心性每增加1%,未来3周内新增确诊病例数将分别增加0.35%、0.53%和0.61%。相反,介数中心性每增加1%,未来3周内新增确诊病例数将减少0.19%,但影响系数在统计上并不显著。

对研究框架的路径分析结果显示,人口流动网络的拓扑结构特征和武汉流入人口两个中介变量可以解释疫情防控政策对疫情未来形势影响的10%~15%左右,起到显著的部分中介作用。接近中心性与武汉流入人口共同显著,表明在分离武汉流入人口因素之后,城市节点在网络中的几何位置越接近中心,疫情依然越容易失控。这也许是由于高接近中心性的节点与其他节点拓扑距离更小,入度来源更为混杂多元,于是带来更大的不可控风险;特征向量中心性结果类似,其值越高的城市节点越倾向于与核心城市相连接,而传染病往往在人群聚集区域有更大的爆发概率,由核心城市流入所带来的潜在感染风险要远大于一般城市,如温州商人穿梭于中国各大城市,在同样的入度下存在更大的感染风险;但是,当度中心性和武汉流入人口同时存在时,武汉流入人口的中介效应并不显著,原因可能是度中心性已经度量了全国其他城市(包括武汉)流入到该城市人口所带来的网络重要性,因此,该指标在一定程度上可以解释武汉流入人口的影响。另外,介数中心性不存在中介效应,在其路径中,无论是防控政策对介数中心性的影响,还是介数中心性对未来疫情形势的影响,均不显著。表5所示为中介效应路径分析结果。

表5 中介效应路径分析结果

4 结论

本文以中国某电信运营商提供的2020年1月1日至2月29日(60天)的手机信令数据为基础,构建了覆盖367个城市节点的全国尺度人口流动复杂网络,研究各年龄人群流动网络拓扑特征的时序差异以及流动性时序演化规律的城市分异性。研究结果表明,中国人口流动强度具有明显的空间不均衡性,京津冀、长三角、珠三角以及成渝城市群人口流动强度高,西北地区人口流动强度低。疫情对人口流动格局产生破坏性影响,进入封控期后,流动强度超过10 000的城市对数量较日常和春运阶段分别降低44%和50%。各年龄人群流动网络加权平均度呈现春运期间上升,疫情防控期间断崖式下跌,复工复产阶段缓慢回升的规律,且封控政策对中青年人群的流动有更明显的削弱作用。青年人群流动网络表现出异配性,儿童和老年人群则始终保持同配,这种差异可能是出行目的不同所致。值得注意的是,封控阶段流动网络度相关性均显著上升,这可能是防疫政策导致各地人口流动趋于破碎离散。网络最短路径数和平均加权介数则呈现相反的变化趋势,防疫政策抑制了网络可达性,并通过降低高层级城市提升低层级城市的枢纽性造成网络平均介数的上升。可以观察到,中青年人群流动网络的可达性远高于儿童和老年人群,但后者的网络平均加权介数更高。疫情-春运叠加影响下的流动性演变具有明显的城市分异特征,揭示出不同城市居民生活压力的两极分化,这在年轻人群中表现更为严重。除接近中心性外,超一线、一线和二线城市的加权度中心性、加权介数中心性和特征向量中心性在进入封控期后大幅下降,但三线、四线和五线城市重要性却呈现上升趋势,表明中国流动网络的高层级和低层级城市节点性质发生了转变,这些特征的变化对疫情传播和发展的影响在本文中也得到实证支持。

大流行对人类流动行为产生长期深远的影响,在度分布、人口流强度分布以及不同距离下流动模式上均有所体现:

(1) 出入度分布在不同时间阶段均呈现“低度饱和,高度截断”的幂律分布特征。值得注意的是,与日常阶段和春运阶段相比,封控阶段网络出入度更加集中于小度值区间,且随着度值越大,节点频数与前两个阶段相差越大,其网络度均值、中位数和分布范围都相对更窄。这种出入度分布的重塑在进入恢复阶段后依旧得到了延续。

(2) 城市对流量分布以Top400为界服从两阶段的Zipf定律,第1阶段位序靠前的城市对流量衰减较为缓慢,第2阶段则加速衰减,体现了人口流量在城市对间分布的严重不均衡性。从两阶段幂指数拟合结果看,疫情防控政策使得位序靠前城市对的流量衰减速率显著加快,位序靠后城市对的流量衰减速率得到了缓解。这种分布重构同样没有在复工复产后得到恢复。这表明,大流行下人口流动模式的变化可能是结构性的。

(3) 疫情防控对不同距离的移动行为也存在异质性影响。50 km 以下和500 km 以上的流动受到的抑制明显强于中间距离段,4种距离区间的出行可能分别以通勤、邻市交通、邻省交通、跨大区交通为代表,这充分体现了不同目的出行的流动性依赖差异。这种异质性影响在交通逐渐恢复后依然保持,足见新冠肺炎疫情对人类移动行为模式的影响并不是短暂的。我们有理由相信不同人群由于存在年龄、性别、社会地位等的差异,其流动模式受疫情-春节叠加效应的影响也具有异质性,在流动性中进一步考虑人口统计学要素也是未来研究的主要工作之一。

本文还检验了流动性的政策限制是否促进了人口流动网络的深层次结构变化,以及这种变化将如何影响疫情传播和发展。以各地开始颁布封控令的2020年1月23日为时间断点,本文根据流动性数据计算所得的各城市节点拓扑指标与未来3周内新增确诊病例数据相匹配,建立时间断点回归模型,分别评估封控政策对疫情发展和人口流动网络拓扑结构的影响,在控制武汉流入人口因素的基础上,利用逐步回归方法检验城市节点拓扑特征在疫情防控政策对疫情未来发展影响中的中介效应。实证结果表明,2020年1月23日起的防控政策有效减少了未来16.5%的疫情新发病例,并平均降低各城市节点在流动网络中4.5%的度中心性、1.78%的接近中心性和0.4%的特征向量中心性,介数中心性呈现出微小增加但不显著,同时人口流动网络的拓扑结构也会显著影响本地未来疫情的发展。逐步回归分析结果表明,度中心性、接近中心性和特征向量中心性在疫情防控政策对疫情未来发展的影响中起到显著的部分中介作用,但介数中心性并未产生任何中介效应。本文的研究结论对流行病如何借助人口流动复杂网络实现异质性传播,以及如何针对性地制定防疫政策等实际问题提供了新的洞察和研究视角。

猜你喜欢

介数流动人口
《世界人口日》
电子信息类专业课程体系网络分析研究
人口转型为何在加速 精读
基于多关系网络的边转移扩容策略
基于复杂网络理论的城市轨道交通网络特性分析
流动的光
人口最少的国家
1723 万人,我国人口数据下滑引关注
为什么海水会流动
基于电气介数的电力系统脆弱线路辨识