APP下载

基于DTW 和K-medoids 聚类方法的疫后交通活力与经济恢复∗

2024-01-23马健霄徐楚博白莹佳

计算机与数字工程 2023年10期
关键词:恢复模式城市交通活力

徐 乐 马健霄 李 根 徐楚博 白莹佳

(南京林业大学汽车与交通学院 南京 210037)

1 引言

COVID-19 席卷全球,新冠病毒不仅带来了死亡,而且带来巨大的经济损失,各行各业都受到不同程度的冲击[1~3]。COVID-19 的一次爆发高峰期已过,中国各个产业逐步完成复产复工[4],但受疫情常态化以及印度所出现新型变异病毒影响,存在着COVID-19 变异病毒新一轮爆发的风险。研究城市在疫情期间及疫后的经济恢复模式,对提高城市再次应对突发事件的抗风险能力,更快帮助城市走出困境具有一定意义[5]。

随着城市的经济运行状况不断好转,人们开始对疫情进行详细研究,由于疫情与城市交通出行息息相关,姬杨蓓蓓等[6]通过分析公交管控对于COVID-19 传播的影响,发现公交管制的强度和及时性对确诊患者数量的影响具有调节性,同时人们开始着手疫情与经济之间关联性的研究;吴峰等[7]通过改进中国多区域一般均衡模型模拟经济受损趋势和严重程度,通过定量的方式确立疫情冲击对于中国经济的影响。何诚颖等[8]通过多种方法测量分析疫情对于中国经济的影响,基于分析结果从政策、产业、经济3 个层面给出相关建议;马琦伟等[9]通过城市交通活力日变化反映城市受疫情冲击的短期恢复模式,研究发现政府管控和外部输入对于城市交通活力恢复具有显著性影响。

上述文献为本文提供扎实的研究基础,但是由于受到疫情常态化[10]以及疫情高峰过后数据收集困难的影响,对于城市疫情高峰过后恢复模式方面的研究有所欠缺。为了反映城市经济恢复实时情况,本文选择利用日变化的交通活力恢复指数(该指数由滴滴出行提供),而非GDP 截面数据来探究城市总体情况。考虑到城市的差异性,其恢复模式及效率也会不同[11],本文对其进行时间序列聚类处理,系统性分析不同模式下城市的共性。此举对于今后再遭遇疫情,发布因地制宜的政策[12],把握城市恢复走向,具有指导性作用。同时不同恢复模式对于城市经济的影响也不同。研究城市遭受疫情时的承受能力和疫情过后城市的恢复能力[13],考虑其不同时期经济指标的变化,为再遭受病毒冲击时制定应对措施提供指导建议,帮助城市经济平稳恢复。

2 方法与数据

2.1 动态时间规整(DTW)

基于DTW 算法[14~15]以单一特征变量计算说明,如何在时间序列之中找到两种序列的相似性,对两个序列q和c,构造矩阵,矩阵元素分别表示qi和cj,以欧氏距离作为矩阵中对应的元素的量。根据动态规划DP 的最终目标,寻找一条通过此矩阵网络中若干点的路径,现将此路径定义为Warping Path,并用W来表示,W的第k个元素定义为Wk=(i,j),Warping Path应该满足以下条件:

1)边界条件:基于时间的规划,尽管序列长度可能不一致,但是序列的起点和终点必须确定(起点为矩阵左下角,终点为右上角)。

2)连续性:Warping Path 的路径Wk节点中,任意相邻的两节点其在对应矩阵中的坐标(i,j) 和(i',j')必须满足|i-i'≤1| 且|j-j'≤1|。

3)单调性:考虑到时间序列数据是一条沿时间顺序而变化的曲线且时间是不可逆转的,所以Warping Path 中的节点Wk=(i,j)和Wk-1=(i',j'),必须满足i≥i'且j≥j'。

依据DTW,从(0,0)开始每到一个点之前所有点的计算距离都会累加,这个距离的累加叫累加距离,累加距离γ(i,j)为

当前格点距离d(qi,cj)。

而DTW所研究的就是使得累加距离最小。

K为对不同长度的规划路径进行的补偿。

2.2 K-means算法的变异K-medoids

以K-means为例:

通过定义类簇中心,类簇中心就是簇类内所有对象再各个维度的均值,Cl表示第一个聚类的中心,1 ≤l≤k,||Sl表示第一个类簇中对象的个数,Xi表示第一个类簇中第i个对象,1 ≤i≤||Sl。

进而计算各个点到中心簇的欧几里得距离,Xi表示第i个对象1 ≤i≤n,Cj表示第j个聚类中心的,Xit表示第i对象的第t个属性,1 ≤t≤m,Cjt表示第j个类簇中心的第t个属性。

最终得到围聚再不同类簇中心的多个样本群,从而达到聚类的效果,而K-means 的变异算法K-medoids[16]则不在计算类簇中心,而是通过设定某一样本为一个类簇中心,并且欧几里得距离也可以被改为差异值的计算,这里的差异值可以是人为提前定义的,降低了对数据格式的要求。

2.3 时间序列波动程度描述

设时间序列y为(x1,x2…,xn)。通过式(5):

得到新的环比增长率z,设z0=0。通过式(6):

获得一个时间序列的波动程度总体。

2.4 数据

如图1,本次交通活力恢复指数数据为滴滴公司提供,包括全国30个不同城市,覆盖时间从2020年2月10日到6月30日(节假日除外),城市交通活力恢复指数是基于滴滴出行平台海量轨迹数据、交通运行指数TTI(反应实际花费的行程时间与自由流花费行程时间的比值,TTI ≥1)等出行数据,经过拟合、交叉验证、加权处理后得出,可科学客观的反映出城市交通活跃度(处于公司保密故不能提供准确计算公式)。指标的变化趋势可体现交通活动量的态势,从而间接反映城市的恢复趋势。此外,本文还整理2020年一季度和上半年上述30个城市的经济运行状况(包括GDP、CPI等指标)。

图1 城市交通活力恢复指数(以成都为例)

3 基于DTW的城市恢复模式分析

3.1 城市恢复模式分析

利用30 条城市交通活力恢复指数的时间序列数据,通过DTW 和K-medoids 对30 个时间序列数据的增长模式进行聚类,结果如图2所示。

图2 基于DTW和K-medoids的时间序列聚类结果

根据聚类结果(图1),将3种增长模式定义为3种城市交通活力恢复模式,每一种恢复模式代表着这一类城市交通活力恢复指数的增长。在研究不同恢复模式之前,先观察各个城市交通活力恢复指数曲线,以GDP 统计时间和COVID-19 高感染时段作为划分依据。以3 月最后一个工作日为分界点,分析3 种恢复模式在不同时期的波动程度(见表1),在分界点以前,模式0 的城市其城市交通活力数在波动比较大,模式1波动次之,模式2的城市交通活力恢复指数每周工作日变化呈相对稳定态势,观察分界点后的恢复模式,基于从1 月22 日到7 月2日共计165天的各省市及直辖市每日新增患者绘制图3 分析(左边纵坐标为从1 月22 日开始的第n天,有边纵坐标为每日新增感染数量),可知4 月份时疫情严重时期(n<91)已经过去,模式0 的城市的活力指数却依旧波动较大,模式1 的城市交通活力指数前期波动较小后期出现波动上升态势,模式2的城市交通活力指数则为先增长然后逐步趋于平缓。3 种模式整体处于增长状态,符合复产复工的整体趋势。

表1 不同恢复模式下不同时期波动程度的均值

图3 数据涵盖的各省及直辖市每日新增感染病例

3.2 相同恢复模式中城市共性分析

依据中华人民共和国国家发展和改革委员会的城市等级定义为30 个城市划分等级(1、国家中心城市,2、区域中心城市,3、区域次中心城市,4、省域中心城市,5、省域次中心城市,6、普通地级市)。城市规模由2019 年各个时统计局统计的常住人口总数划分(1、超大型城市城区常驻人口1000 万以上,2、特大型城市城区常驻人口500万以上1000万以下,3、一型大城市300万以上500万以下,4、二型大城市城区常驻人口100 万以上300 万以下,累计感染人数为中国各地方卫建委发布数据统计,公交出行通勤距离为2014 年百度所推行的我的上班路数据所总结而得出。

根据表1,模式0的城市中,省中心及以下的城市占比71.4%,人口数量大,多为中国南部边域城市和中国北方滨海城市。依据图3 和表2 分析,因到武汉的距离较远或城市等级较低,在疫情爆发初期受武汉输入风险较低,故随着时间推移,武汉市通过封城降低国内疫情扩散,使得疫情得以受到控制,距武汉较远的城市通过复产复工号召,城市交通活力恢复指数乘上升态势,城市病毒感染余波震荡期到来,每日新增患者逐渐变为境外输入,边境城市首当其冲,城市进出口遭受冲击,商业贸易受影响较大,人们恢复经济的意愿和疫情余波带来的恐慌,这两者的冲突造成城市交通活力恢复波动性较大。

表2 不同恢复模式下城市地理位置和通勤信息

表3 不同时期不同恢复模式下GDP差异性的t检验

模式1 的城市,省中心城市较多且为东部不沿海城市,作为省中心带动周边地区经济发展,其复产复工情况复杂,劳动务工人员来源不限于本城市,城市外来人口的涌入城市。根据表2 分析,恢复模式1 城市的规模整体相对较大,而规模较大的城市其累计感染人数也相对较大,而市内居民可能将其于外来人口涌入产生联系,对人口涌入引来疫情的恐慌与复产复工的心情产生冲突,进而在外来人口涌入期间城市活力恢复波动较大,由于后期人员流动稳定,根据图3 城市内每日新增感染数量变低,城市交通活力则变得相对平稳,城市经济得以恢复。

模式2 的城市中,省中心及以下的城市经济基础相对较差,人口数量多,累计感染数量相对较低,对于疫情之后的城市活力恢复较为缓慢,而国家中心城市以及区域中心城市,其经济实力雄厚,人口较多,但是累计感染数量大,为防止疫情再次大面积扩散,政府对于出行的把控较为谨慎,也使得城市活力的恢复较为缓慢,但是模式2 城市交通活力总体恢复于3 种恢复模式种较为平稳,城市交通活力指数的发展趋势也印证了政府决策。同时,城市2 公交出行通勤时间也相对其他模式城市较长。考虑在公交通勤路线上人群处于聚集状态,暴露在病毒感染的威胁之下,恐慌不利于城市交通活力恢复,这也可能是城市2恢复较慢的原因。

4 不同恢复模式对城市经济的影响

分别对比2020 年一季度和2020 年上半年的经济指标,并将一季度作为受疫情严重影响时期,而上半年作为受疫情影响并且城市经济在逐步恢复时期,考虑到2 个时段数据基数的不同,即一季度和上半年的数据在量上不具有可比性,本论文通过对比2019 年一季度和上半年,得到2020 年一季度和上半年各项指标的同比增长率,利用横向对比以及纵向对比的方法,找到不同恢复模式下城市经济指标的变化规律。

1)一季度时,城市不同恢复模式下地区生产总值的的同比增长存在差异,根据图4(a)30 个城市中,93.3%的城市出现地区生产总值同比负增长。在GDP 总趋势下降的情况下,考虑到疫情对于各地区生产造成的危害有差异的,利用t 检验对于差异性进行检验,根据表2,恢复模式0 和1 在一季度没有显著性差异,而0 与2 和1 与2 有显著性差异,由图4(a)可知模式2 城市的GDP 在一季度遭受冲击严重,而疫情在一季度对模式0 和1 的GDP 影响则相对较轻,利用图4(b)以及表2从更长恢复时间的角度具体分析各个模式下城市GDP,恢复模式0和1 在上半年没有显著性差异,而0 与2 和1 与2 有显著性差异,模式2一季度的GDP同比下降幅度最大,而在上半年模式2 中70%的城市GDP 同比去年同一时期产生较小的变化(变化的绝对值≤1%),50%同比去年产生微小增长(增长≤1.3%),说明模式2 恢复能力较强,而模式1 和模式0 两种恢复模式下的城市,上半年GDP(除去个别城市以外)整体出现负增长的城市约为35%且GDP 同比降低≤1%,而模式1的城市更多呈现增长态势。通过结合之前的城市交通活力恢复指数聚类的结果,可知模式0和模式1在疫情高峰过后的3月~6月份城市交通活力指数都处于波动增长状态,而模式2 的交通活力指数则越到后期越趋于平缓,后期城市交通活力虽然交通活力恢复较前两种恢复模式下交通活力指数恢复快,但是其城市交通活力指数波动性较低,相对于未遭受疫情冲击的同一时期(2019 年上半年)城市生产呈不增不减态势,这种态势对于逐年变化的经济来讲约等于倒退,但是考虑到模式2的GDP 在疫情爆发期承受冲击最严重,仅经过半年恢复到与前年GDP 状态相同实属不易。由上总结,恢复模式2 受疫情冲击影响大需要更长的恢复时间来恢复GDP,但是恢复能力较强。而恢复模式1的GDP则在3种模式中恢复效果最好。

图4 疫情期间不同恢复模式下对GDP增长的影响情况

图5 疫情期间不同恢复模式下对通货膨胀的影响情况

2)城市居民消费价格总指数(CPI)反映了物价水平,由于疫情带来生产上的窘境,物价上涨是必然的。模式0 中的城市CPI 一季度平均同比增长3.64%,模式1 中城市CPI 一季度平均同比增长3.94%,模式2 中城市CPI 一季度平均同比增长4.78%,以上表明分析中的30 个城市均遭受通货膨胀的影响,依据图4(a),模式2和模式0的城市中超过40%的城市遭受严重的通货膨胀,而模式0 的城市CPI 平均同比增长低于模式2,说明模式0 物价的波动性更强,该模式下的城市间物价差异性更大,根据恢复模式聚类结果,根据表1 可以观察到模式0在所统计的时间范围内波动程度强于模式1和2,推测城市间物价差异性与交通活力恢复的稳定性存在关联性,而图4(b)显示2020 年上半年各个城市CPI 发现30 个城市中严重通货膨胀仅有一例,而发生通货膨胀的城市在各个模式下占比都超过70%。同样根据表1可知由于上半年整体CPI低于一季度的CPI 水平,即4 月~6 月的CPI 小于1月~3 月的CPI,即疫情高峰期过后城市交通活力指数的波动程度小于高峰时期,而物价也有所回落,印证了之前的推测。疫情高峰期过后30 座城市的整体物价都有所下降。虽然部分城市存在通货膨胀,但较疫情高峰期而言相对较轻。

5 结语

1)利用DTW 和K-medoids 的时间序列聚类方法,研究COVID-19 病毒一次爆发高峰期过后城市上半年的活力指数变化,得到三种恢复模式,每种模式有其独特的恢复特性,模式0 恢复快可是有着严重的通货膨胀,模式1 和模式0 在疫情期间经济下降程度低于模式2,模式2 恢复虽然相对平稳但是城市遭受严重的经济打击,经济恢复速度较慢且后劲不足。

2)利用城市等级、城市规模、累计感染数量,研究同种恢复模式城市间的共性,发现城市规模和累计感染数量对城市交通活力的恢复有影响,而且同种恢复模式下不同城市等级有其独特性质。在进行逐步复产复工的同时,特别针对恢复模式2 的城市,政府应当鼓励人们出行消费,避免城市交通活力在恢复时出现缓和的现象,提升人民的生产欲望,从而带动城市经济恢复。对位于广东和福建的这类城市,中央应给予适当补贴,同时城市政府应当确立高效防疫措施,保证商贸的正常进行,降低感染风险,减少人民恐慌,从而保证经济平稳恢复。

3)利用城市2020 年一季度和上半年的经济指标,研究不同恢复模式对于城市经济的影响,发现不同恢复模式下处于疫情恢复期对于生产和整体物价影响有着显著的不同,恢复模式2 的恢复能力强,而恢复模式1 的恢复效果好,各模式下城市间CPI 差异性的和各模式曲线的波动程度(即稳定性)有联系。政府还应当特别注意疫情爆发高峰时期,恢复模式0和恢复模式2的城市物价,抑制其转变为严重通货膨胀的可能性,建议以法律手段为主,行政手段为辅,稳定物价,减轻疫区人民的生活负担,从而使其度过疫情困难期。

猜你喜欢

恢复模式城市交通活力
新形势下我国城市交通发展战略思考
活力
白龙江干旱河谷恢复植被物种多样性特征
基于AHP-PCA的铁尾矿不同植被恢复模式土壤养分评价
上海城市交通大数据研究与实践
杉木人工林伐后2种恢复模式碳储量的比较
改制增添活力
收回编制 激发活力
全公开激发新活力
契合城市交通需求 推进单轨交通发展