新冠肺炎爆发前期武汉外流人口的地理去向分布及影响
2020-06-17许小可张光耀孙皓宸王贤文
许小可,文 成,张光耀,孙皓宸,刘 波,王贤文*
(1. 大连民族大学信息与通信工程学院 辽宁 大连 116600;2. 大连理工大学科学学与科技管理研究所暨WISE实验室 辽宁 大连 116024;3. 电子科技大学基础与前沿研究院 成都 610054)
随着新型冠状病毒肺炎(COVID-19)疫情的爆发与蔓延[1-2],截至北京时间2020年2月3日18时,中国累计报告了感染新型冠状(新冠)病毒确诊病例17 335例[3-5]。此次疫情爆发在春运期间,人员的密集流动给病毒的传播提供了条件[6]。为了阻止病毒随人口流动迅速传播,武汉于2020年1月23日10时全面关闭离汉通道。2020年1月26日晚,在新型冠状病毒感染的肺炎疫情防控工作的新闻发布会上,武汉市长周先旺表示在23日武汉“封城”前有500万人离开武汉,分析这部分人员的数量和目的地,对新冠疫情的传播和防治具有至关重要的意义。
当下已有相关媒体和学者使用人口迁徙数据对离汉人口的流动做了初步的分析,如第一财经使用百度慧眼数据对人口流向和比例进行了描述[7],文献[8]采用2013−2015 年百度迁徙数据分析了国内人口流向,并使用来自国际航空运输协会(IATA)的2018 年国际航空旅行数据分析了国际/港澳台流向,对从武汉出发的人口流向和模式进行了初步汇报。虽然这些分析在向社会传达信息和政府疾病防控上都有着一定社会意义,但研究仍然停留于定性和简单量化分析,从更为科学合理的角度对武汉外流人口的地理分布进行准确地量化分析,对于公众舆论的正确引导和对疾病进行更好的防控有着非常重要的意义。
本文使用腾讯和百度公司基于地理信息服务系统收集的大规模人口流动数据,对比往年武汉的春运状况,对武汉外流人口的目的地分布及对疾病传播的影响进行分析。主要关注和研究以下两个问题:1) 节前500 万人口离开武汉,是否是这个时间离开武汉的正常人流量,这些人口是属于遇到疫情离开武汉,还是正常的春节前返乡?2) 武汉流向各城市的人口地理分布是什么情况?离汉人流对全国疫情产生了什么影响?回答这些问题以期为预测和阻止疫病传播提供参考。
1 武汉外流人口的性质和地理分布
1.1 数据来源简介
每年春运期间,全国各大城市都有大量的人口进出,因为涉及到飞机、火车、汽车等多种交通方式,基于常规方法难以统计出行人数和目的地信息。随着提供位置服务的各种产品的出现,基于个体记录的“大数据”为地理学研究提供了丰富的群体行为数据。不同于统计年鉴数据,基于地理位置服务的数据具有时效性与连续性,可以包括非户籍迁移数据与旅游流动数据等。这种新数据使一些难以量化的问题得到有效分析和更好研究,而且可以揭示传统研究中难以发现的因素[9]。在基于地理位置服务获取人口流动大数据的背景下,可以准确地对大规模人口迁徙的目的地、具体流量和对疫情的影响进行深度剖析。
我国的主要大型互联网公司,如腾讯、百度等都提供基于地理位置的服务,这些服务可以让用户自报告其所在的地理位置。互联网公司可以利用这些数据开发相关的地理位置产品和服务,如腾讯位置服务(https://heat.qq.com/index.php)和百度迁徙数据服务(http://qianxi.baidu.com/)。腾讯位置服务应用于微信、QQ、京东、滴滴等多项产品,基本覆盖全部智能手机用户[10],包含汽车、火车(包括高铁)、飞机3 种交通方式,提供与360 个城市相连的最紧密城市的迁徙数据,涉及我国34 个省级行政区域的371 个主要城市(以地级市为主)。百度迁徙数据通过对比用户位置的变化,将8 小时内所有位置发生变化的智能终端用户数量进行计算分析,也可以全覆盖铁路、公路、航空等各类交通工具[11]。
腾讯位置服务目前终止了迁移数据的提供,因此本文只获取了2016 年−2019 年的历史数据。目前公开可获得的百度迁移数据是从2020 年1 月开始提供服务,没有2020 年以前的具体历史数据,但是提供2019 年与2020 年同时期对应的城市人流指数数据。基于以上对腾讯和百度数据的分析,必须综合利用两个数据来源,才能有效分析出2020年武汉流出人口和正常年度的异同。同时,每年春节的阳历时间都不一样,春节和元旦之间的时间差异对春节前的人流动态和数量有一定影响。考虑到2017 年春节为1 月27 日,2020 年春节是1 月25日,这两年的春节日期是近年来最为接近的,本文选取了腾讯2017 年和百度2019、2020 年提供的迁徙数据作为数据来源,探讨2017 年和2020 年的春节期间的离汉人口数量、目的地分布等多方面的差异。
1.2 离汉人口的数量和动态特征分析
2017 年 春 运 时 间 为2017 年1 月13 日−2 月21 日,本文将这个时间段分为春节前和春节后进行统计分析。
基于获取的数据,在1 月11 日(腊月十四)至1 月26 日(腊月二十九)之间,武汉流入的人口远远低于流出人口,人口的净流出(这些天流出的总人口−流入的总人口)的数字合计为373 万左右,此时人口流出最多的3 天是腊月二十七~二十九。考虑到2017 年到2020 年,人口数量和交通流量均有增长,且并不是所有的流出人口都会使用腾讯的相关产品,因此本文认为根据2017 年的373 万部分流出人流量来预测2020 年的外流人员数量,与武汉市市长在新闻发布会上提出的武汉市有500 万左右的流出人口数量大致相符。
正常年份下春节前武汉的人口流出较多,人口流入较少;而春节后的情况刚好相反,人口流入较多,流出较少。在2017 年1 月27 日(腊月三十)至2 月21 日(正月二十五)之间,从图1 可以看到武汉的流出人口数量比较平稳,数量也相对较少。在整个春运期间,春节后流出人口会出现3 次高峰,分别是正月初六、正月十六这两个外地务工人员回城的高峰,此外还有一个春运即将结束前出现的大中专院校学生返校高峰。
图1 2017 年春节前后武汉的人口流入和流出数据
在分析完正常年份2017 年武汉的人流数量和动态特征以后,本文将2017、2019 和2020 三年从腊月十一到春节前武汉的进出人口动态特征进行了比较,如图2 所示。首先看总体趋势,2020 年的流入和流出人口,从大的趋势上看和2017、2019年的情况基本上是相同的。具体上看,从腊月二十开始到二十六,2020 年武汉的流入和流出人口相对于往年都略有减少,很显然这段时间肯定不存在网上炒作的武汉人口“逃离”现象。
图2 2017、2019 和2020 年武汉春运人口流量的动态分析
本文也发现,腊月二十八~三十期间流入人流量更是出现明显下滑;而腊月二十七~二十九三天间流出人口明显增多,尤其是腊月二十九凌晨武汉市宣布关闭离汉通道到10 点正式关闭的这10 个小时,涌现出的人流是异于常年的,相比往年有一定的增幅。那么这两个时间段上的输入人口减少和输出人口增加和往年相比是否具有显著性差异呢?考虑到样本量比较少,本文采用配对样本t 检验来分析2020 年武汉流入和流出人流的显著性,具体数值见表1 所示。从腊月二十八~三十期间的流入人口的数量来看,2020年和正常年份具有显著性差别,和2017 年相比少流入23.33 万人,比2019 年少流入26.12 万人。从腊月二十七~二十九期间的流出人口的数量来看,2020 年和2017 年比较具有显著性差别,多流出人口12.14 万人;与2019 年相比不具有显著性差异,多流出人口6.10 万人。
表1 2020 年和2017、2019 年进出武汉人口的差异
上述结果说明在关闭离汉通道那几天,武汉出现了人口大量离开的现象,但是人口数量相对于往年和整个500 万的人口数量并不大。此外,也无法确定导致这一现象的原因是疾病爆发还是武汉要关闭出城通道这一消息。如果是正常的返乡人流,他们从官方和其他渠道得知要关闭离汉通道的消息后,很明显是要选择尽快出城回家过年。他们当中应该有在武汉求学的大学生回家、有辛苦工作一年的外地务工人员返乡,这些人的流出目的地每年几乎都是相同的。而如果是受疫情影响的外出人流,他们的流出目的地就会和返乡人流有一定区别。基于上述考虑,本文在下一节中比较2020 年和正常年份武汉春节外流人口的地理分布。
1.3 正常和疫情年份武汉春节前外流人口的地理分布比较
基于2017 年和2020 年春节前离汉人口的主要流向城市排序和比例如表2 所示。可见,排名前4 的城市排序都是相同的,排名在前20 的城市中前18 名也都是重合的。在2020 年人口流出前20 个城市中,仅有排在最后的两个城市北京和上海没有出现在2017 年的名单中;而在2017 年人口流出前20 城市中,仅有排在最后的两个城市驻马店和南阳没有出现在2020 年的名单中。上述结果说明了2017 和2020 年武汉流出人口目的地的重合度很高。
表2 2017 和2020 年离汉人口的前20 目的地城市比较
为了进一步揭示武汉正常年份和疫情年份人口流出目的地城市的相关性,本文选取了武汉2020 年流出人口的前50 目的地城市数据,然后计算这些城市和2017 年流出人口目的地人口分布之间的相关性,具体如图3 所示。图中所示两者之间的相关性很强,这说明从武汉流出人口的目的地城市,在2020 年疫情年份和正常非疫情年份的地理分布基本也是一致的。综合以上分析,从2020 年疫情发生前期,武汉流入人口数还有流出人口的分布这两个角度,本文认为绝大部分人和往年一样是正常地回家过年,而非网上所言的“逃离”武汉。
图3 2017 年和2020 年武汉春运人口流量目的地分布的相关性
2 武汉外流人口对于疾病传播的影响
大家直觉认为:一个城市或地区如果从武汉来的人流量越大,这个地区的肺炎病例就有可能越多(包括原发已感染病例和多代传染病例)。
为了验证这一点,本文计算了武汉流出人口目的地前50 城市的人流量和截至2020 年1 月24 日武汉“封城”后这些城市的肺炎病例数关系,如图4 所示。由该图可以看出,截至24 日,重庆和北京是病例最多的城市,但是重庆和北京并非武汉流出人口排名前2 位的目的地,而且从该图的整体上看,武汉流出的人口比例和病例数之间并不存在较强相关性。
图4 武汉流出人口目的地前50 城市和新冠肺炎病例数关系(截至2020 年1 月24 日,不考虑潜伏期)
本文分析两者不相关这一结果主要是由新型冠状病毒的潜伏期效应导致的。新冠肺炎患者具有较长的潜伏期,潜伏期中患者仅有较为微弱的症状,如发热、乏力和咳嗽等,甚至感觉不出有何异样。根据2020 年1 月30 日国际医学权威期刊《新英格兰医学杂志》(NEJM)中发表的论文“新型冠状病毒感染肺炎在中国武汉的初期传播动力”揭示的新冠肺炎的潜伏期的平均时间为5.2 天,潜伏期分布情况的第95 百分位数为12.5 天[12]。分析到这一点,本文计算截至2020 年1 月27 日,考虑潜伏期情况下,前50 目的地城市的人流量和这些城市的肺炎病例数关系,如图5 所示。
从图中可以发现二者存在很明显的线性相关关系。如果考虑到3~7 天的潜伏期这一重要因素,从武汉离开的人流对全国肺炎疫情的影响确实是非常大的,值得关注。表3 列出了截至2020 年1 月27 日累计病例数排名在前20 的城市排序,并计算了24 日~27 日的新增病例数占总病例数的比率,可以发现该值在67.5%~98.9%之间,这么高的数值再一次说明疫情分析和防治的过程中不可忽视潜伏期的影响。
图5 武汉流出人口目的地前50 城市和新冠肺炎病例数关系(截至2020 年1 月27 日,考虑潜伏期)
表3 截至1 月27 日累计病例数排名在前20 的城市
为了分析武汉流出人口对于目的地城市新冠肺炎疫情的长期影响,图6 绘制了城市接收武汉流出人口的数量和该城市新冠肺炎病例数关系的相关性系数随时间变化曲线。由该图可以发现,随着时间的增长,城市接收的武汉流出人口数和该城的病例数相关性逐渐增加,在2020 年1 月31 日左右达到0.92 这一较为稳定值,进一步证实了潜伏期的重要作用。
图6 城市接收武汉流出人口的数量和该城市新冠肺炎病例数关系的相关性系数随时间变化曲线
3 结 束 语
本研究基于腾讯和百度公司的人口迁移数据,分析了春运期间离汉人员的去向,并探讨了人员流动和疫情扩散之间的关系。与其他对数据的简单统计描述相比,本文发现官方公布的节前500 万人口离开武汉,大部分都不是社交媒体上热议的“逃离”武汉,绝大部分还是像往年一样正常地返乡过年。
同时也发现:腊月二十以后武汉的流入人口就相对于往年较少,腊月二十六−二十八日期间更是出现明显下滑;而腊月二十七−二十九日三天间流出人口明显增多,尤其是腊月二十九凌晨武汉市宣布关闭离汉通道到10 点正式关闭的这10 个小时,涌出的较大人流是异于往常的。尽管这些现象说明在短时间内武汉出现了部分人口紧急离开的现象,但是这些人口的数量并不大,甚至和2019 年没有显著性差异。此外,无法确定导致这一现象的原因是疾病爆发还是武汉要“封城”这一消息。本文比较2020 年和正常年份武汉春节外流人口的地理分布,发现两者之间没有特别明显的差别。
从武汉外流人口对疫情传播的影响来看,必须高度重视新冠肺炎潜伏期这一重要因素。由于此次疫病患者在潜伏期中症状轻微但是有很强的传播性,与2003 年SARS 相比更加难以防范,也是此次疫情防控的难点。因此离开武汉的人们进行14 天的自我隔离,对于疫情的控制还是非常必要的。而离汉人群需要的是帮助而不是抵制,政府部门应当有相应的保障措施,体现出人性关怀。
基于位置大数据可以对疫情期间的人口流动状况进行可视化呈现和统计分析,能更加有效了解疫区的人口流向,完善疫情地理信息数据库并在此基础上展开分析和建模工作,可有效分析疫情的时空演变和扩散特征,支持疾病应急中心的选址和设计。在此基础上通过引入疾病传播模型,可分析城市传染病传播的防控因素,对以后更好地预测和阻止疾病传播具有重要的参考意义。
本文研究工作的数据分析还得到张童、冉义军的帮助,在此表示感谢。