大数据监测出行流动 解读疫情传播
2020-05-07詹庆明
詹庆明
通过连续两年针对武汉市的对外交通可达性、人群流动性的大数据分析,以及疫情期间追踪新冠病毒在国内的传播过程和空间分布的特征,发现两者之间存在某种程度的契合性和关联性。
结合新冠肺炎疫情传播,我们尝试用大数据监测城市出行流动来解读疫情传播,思考城市群跟疫情传播的关系。
从交通供给侧分析武汉交通
数据来源包括航空、火车高铁、汽车客运数据,两实人口、人群年龄画像、遥感数据等。检测范围以武汉为出发点到湖北省内和全国38个重点城市,分析可达性与便利性。
在武汉高铁是非常便捷的一种交通方式,4小时内武汉可以到达全国三分之一的省会城市。此次新冠疫情的爆发点就是武汉海鲜市场,距离武汉的汉口火车站非常近,是一个传播扩散很重要的节点。从这个节点有两种轨道交通(城际铁路和地铁)可以到达武汉天河机场,这也导致通过航空渠道向外传播,另外它附近的汉口客运站和长途汽车站都提供了便捷的传播渠道。
铁路考虑的主要是能否通达以及每日火车班次及其扩散的范围。与15座城市每日有超百班列车往来,特别与周边城市的铁路交通是非常便利的。如果不计人口密度比较低的新疆、西藏,按人口分布的话,武汉处在全国人口重心的位置,也是GDP或主要产业的中心点的位置。
武汉延伸出去的高速公路四通八达,这就为传播提供了一定的危险因素。从1月23日封城最开始截断的是航空、铁路,最晚被截断的是公路。1月23日当天还有一部分人通过高速公路、国道等陆路交通以自驾的方式离开武汉,给管控带来了一定的难度。
距离武汉比较近的城市,如合肥、南昌、南京、长沙、郑州等由于高铁,航班联络取消了。与广州的交通往来,原有的航空客流有一半被高铁分流了,北京分流了大约三分之一。一般情况下,从武汉出发航空两小时内能到达全国主要的商务中心。
武汉交通的便利性通达性绝不在北上广深之下,甚至比以上四个城市的便利性还要高,这是由武汉所处的区位优势决定的,所以武汉的传播能力和管控重要性是不言而喻的。
可达性与城市交通便利度:(1)综合武汉市陆路、航空交通建设和运营情况来看,武汉市形成了以公路和高速铁路为主干,覆盖“1+8”城市圈和信阳、岳阳等城市的核心区域交通网络;(2)以高速铁路构成交通廊道、以高等级公路为补充,连接到郑州、合肥、南昌、长沙等重点城市,覆盖中部五省主要大中城市的中部地区区域交通网络;(3)以高速铁路为主干、以普通铁路和航空交通为补充,延申到京津冀、长三角、珠三角、西安、川渝、云贵、辽沈等地区的辐射区域交通网络。
通过互联网数据分析区域客流和交通格局
使用数据为2019年春节前后相对应时间段数据。武汉向外流动的人口一般是在春节前大约10天到节前3天,数量直线上升。
今年1月23日封城,相当于去年人流的高峰点过后的一个时间点,说明封城前一周有大量的人口向外流出。如果更早采取措施的话,如春节前10天左右采取严厉管控措施,向外的人流会大量减少。
通过腾讯定位数据分析客流交通方式:分析公路、铁路、航空客流量的比值,判断交通方式。近距离出行高铁的时效性最强,公路次之,最后是普通火车。
远距离出行的话,飞机时效性更强。从多对多的客流联系分析区域客流格局:武汉周边的中心城市人口腹地范围进行分析,囊括了湖北省区域及周边省份中心城市。与距离、交通条件以及务工人员的就业取向有关。
新数据本身的特点:(1)相比于调查统计数据,覆盖范围更广、采样率更高,有利于进行全域、多时段、多对多的分析;(2)相比于传统地理信息数据,直接提供时间和费用成本、路径等信息,不需要建立网络模型、进行复杂的运算,可以通过统计规律将精力集中于进一步的分析应用;(3)包含停站时间、车辆类型、途经地点等详细信息,具有更宽广的分析应用前景。
作为商业数据的特点:(1)数据获取和校验具有众包特点,数据完整性和可靠性较高,且数据更新频率、更新持续性更有保障。(2)可以通过数据和相关应用程序直接感知用户行为,分析用户对实际的路径选择,能反映能力数据的真实性和实际覆盖范围。(3)从定量的分析可以看出,新来源的客流数据与传统调查统计数据相比,覆盖性更广并具有更强的动态性,直接从商业合作方获得大数据具有更好的可靠性、完整性、准确性和时效性。
交通和客流数据
如何助力疫情管控
由于新冠肺炎疫情存在潜伏期较长、检测确诊需要时间、患者随区域客流可迅速扩散、患者进入缺乏准备的地区之后易迅速引发社区传播等特点,对疫情扩散情况的分析和认知必须具有高度的可预见性。
通过分析过去一两年中可比时段的区域客流、区域交通网络中各个节点的重要性和控制范围等,可以为疫情区域扩散的管控提供支撑。
提前预知 高机动性条件下应对疫情的快速扩散。对比1月28日(武汉封城后一周)与2月14日(封城后三周)全国疫情大规模爆发的确诊情况,可见春运客流在短时间内已经将疫情带往全国绝大部分地市。提前管控的措施在高流动性条件下更显急迫。
提前管控 高流动性条件下应提前做好扩散后的救治准备。大量确诊病例在封城前后,已经在全国范围内广泛移动,仅仅对武汉采取封城措施未能全面阻断疫情在区域范围内的扩散。可以通过往年的流动大数据预估可能感染的规模,提前做好更充足的准备。
提前部署 防止少量输入病例在本地造成社区传播。早期确诊病例较少或无确诊病例的这些城市未引起足够重视,导致后期医疗资源急剧紧张。区域客流的往年规律相较已确诊病例能更有效地反映和预估疫情扩散态势。
由于潜伏期较长,确诊病例相对疫情实际扩散往往存在滞后,不足以作为各地防控政策的直接依据。
例如用前一年的流动规律测算封城后三周的流动人口总数和实际感染人数的相关系数远远高于封城后一周的相关系数。这样至少可以提前2周时间进行紧急的救治准备。
区域交通网络可能對预测疫情的二次扩散有重要作用。利用2018年客流数据与2月14日确诊病例进行线性回归分析,各个人口总量大的区域中心病例数量被普遍高估(重庆、哈尔滨、京津、上海、杭州、广州等区域)。人口规模较小的区域中心病例数量被普遍低估,而个别交通枢纽城市也被严重低估。
支撑预防性的管制决策
1.区域客流数据可成为疫情扩散态势预测的基础
两年前的同时段输出客流量与封城三周后的确诊病例存在强相关性,在当前确诊病例受潜伏期等因素干扰的情况下,可用于各地预判防疫形势、提前展开部署。与路径规划等空间分析结果相叠加,客流目的地可以进一步辅助判断哪些途经和中转城市可能爆发疫情。
2.对区域交通网络的深入分析或有利于支撑预防性的管制决策
疫情被发现时,可能已经发生多来源地、多去向地的区域扩散,仅依靠从疫情爆发地出发的当前客流可能不能对当前的疫情扩散态势产生足够准确的认知。通过网络分析等基于交通网络联通状态的方法,既可以给出具有较高爆发风险的枢纽或中转节点城镇,也可以为交通节点管制的选择提供依据。