武汉共享单车需求规模预测分析
2022-03-29孙传平
彭 闽, 孙传平, 马 跃
(1.武汉市交通运输综合执法支队, 武汉 430014; 2.中电通途(北京)科技有限责任公司, 北京 100080)
0 引言
近年来,共享单车成为一种新的出行方式,爆红于各大城市. 共享单车的出现不仅解决 “最后1 km”出行难题,而且推进绿色、低碳、环保出行,更是摆脱了传统市政公共自行车受停车桩位限制的问题. 但是,随着城市共享单车的大规模投入,无明确指导依据,乱停放、投放不均等问题日益突出,对城市交通管理也带来了一定的压力[1-5].
为解决共享单车流行带来的问题,本文将通过共享单车的需求规模预测研究,为相关公司对共享单车的合理投放提供依据,为政府单位对共享单车的管理提供数据、理论基础. 目前共享单车需求规模预测方面的相关研究有:金含笑[6]根据北京摩拜单车数据提出基于时空分布的BP神经网络预测方法模型;马勇[7]基于北京共享单车数据,首先采用二次K-means算法得到区域簇,后建立基于LSTM的线性网络预测模型进行预测;甘维德[8]采用一种融合模型进行预测,命名为SSRG,其融合了支持向量机回归模型、随机森林模型和GBDT回归模型;索源[9]采用层次凝聚聚类算法研究了共享单车出行需求分布及对应的出行需求量;周传钰[10]结合轨道交通与共享单车研究共享单车投放量的测算方法及高峰时期的调度方法,提出共享单车投放规模预测需要借鉴公共自行车需求或者其他类型的需求预测方法. 现状或缺乏共享单车需求预测的针对性研究,或相关针对性研究模型较为复杂,多选取时间、气象、位置等影响因子作为自变量进行分析,以上部分影响因子数据在实践应用中获取困难.
本文选取时间影响因子作为自变量建立模型,首先对相同共享单车车辆id开、关锁订单量数据去重后,得到共享单车发生量、吸引量数据,基于以上数据选取多元线性回归预测模型建立武汉市各区域共享单车需求规模模型,合理确定共享单车需求规模,为武汉市共享单车在各个区域的投放提供决策支持.
1 武汉共享单车需求规模现状分析
1.1 数据准备
本文共享单车需求规模预测主要依据武汉市798 839辆共享单车订单和GPS实时数据,其中摩拜单车370 108辆,哈罗bike 347 259辆,ofo 81 472辆. 根据开关锁经纬度数据定位到目标区域,然后匹配相应的车辆id,锁id以及订单数据,基于以上数据得到目标区域目标时段的开锁量即骑行发生订单数(人次)和关锁量即骑行吸引订单数(人次)后,通过对同一车id的发生、吸引订单数据去重后,得到骑行发生量(辆)、骑行吸引量(辆)和骑行需求量(辆).
1.2 武汉市共享单车需求规模现状分析
根据吸引量(统计时间内,特定区域的导入共享单车车辆数)、发生量(统计时间内,特定区域的导出共享单车车辆数)和需求量(统计时间内,特定区域的发生量与吸引量的差值)3个指标对武汉市共享单车的需求规模现状进行分析. 通过处理武汉市798 839辆共享单车订单和GPS实时数据,获取到指标值,统计分析得到武汉市共享单车发生量和吸引量的热点区域.
表1 摩拜单车数据属性
1.2.1 共享单车供需匹配现状分析
1)行政区
根据11月的数据统计得到武汉市共享单车需求现状,共享单车发生量和吸引量排名前3的行政区为洪山区、江岸区和硚口区.
洪山区为武汉市高新产业聚集地,江岸区和江汉区为武汉最中心城区,其吸引量大于发生量;武昌区和青山区则呈现相反的情况;硚口区和汉阳区基本形成供需匹配. 各行政区需求情况如表2所示:
表2 共享单车行政区需求分布 辆
2)重点区域
现状共享单车重点分析区域主要为中心城区的地铁站点区域、重点商圈、重点居住小区和就业区域.
共享单车发生量排名前三位区域与吸引量排名前三位区域相同,汉正街商圈(8 292辆)、东湖(4 500辆)和小南湖公园区域(3 782辆). 其他排名区域分别是武汉市中医院、雪松路商圈、六渡桥地铁站、江汉路地铁站、大智路地铁站、徐东商圈和大智路商圈.
图1 共享单车发生量排名前10区域分布
根据实际数据得到的武汉市共享单车吸引量排名前三位区域是汉正街商圈(9 967辆)、东湖(7 708辆)和小南湖公园区域(4 336辆). 其他排名区域为武汉市中医院、六渡桥地铁站、王家湾商圈、徐东商圈、雪松路商圈和大智路地铁站.
图2 共享单车吸引量排名前10区域分布
选取一周内武汉市重点区域共享单车日均发生量、吸引量数据做差取绝对值后进行排名,得到东湖、汉正街商圈、金融港、城开二七城市广场等区域供需较不平衡,需要重点做发生量和吸引量预测,有利于对车辆的调配.
表3 共享单车排名前十供需不匹配区域
1.2.2 共享单车时间特性分析
对以上供需不平衡区域,对其24 h发生、吸引量做平均值,得到以下变化曲线. 由曲线可得,共享单车拥有显著的早晚高峰、以及午间小高峰特征;早、晚高峰发生、吸引量体现出显著的潮汐现象和不均衡性,由此导致日发生量和吸引量的不平衡,因此主要对不平衡区域的早、晚高峰进行预测.
图3 共享单车发生、吸引量时间分布
2 武汉共享单车需求规模预测方法
2.1 模型对比分析
国内外共享单车需求规模预测模型主要有神经网络模型、支持向量机模型、灰色预测模型和时间序列预测模型. 通过对比发现前3种预测模型相对较为复杂,需要的数据类别及数量要求较高,因此本文采用时间序列法中的多元线性回归预测模型预测共享单车的需求规模. 时间序列法能简化所预测对象的影响因素,模型相对简单,便于计算. 由于共享单车在各个区域长时间的投放,已经形成了与区域用地性质、气候、日期等特性相关的规律,采用多元线性回归预测模型,通过选取当前日期属性、星期属性、时间段属性的历史数据进行模型拟合,能较为准确的预测得到相应区域的共享单车需求量.
2.2 多元线性回归预测模型
2.2.1 预测区域分析
武汉市共享单车区域需求规模预测模型采用多元线性回归方法进行预测. 首先针对各中心城区进行预测, 其次挑选相关管理部门、企业较为关注的区域,以及根据历史数据情况选取共享单车较集聚的区域.
表4 共享单车预测行政区域
表5 共享单车部分预测热点区域
2.2.2 骑行发生量/吸引量预测
本文选用多元线性回归方法对针对某一日和某时段特定区域的共享单车骑行发生/吸引量进行预测. 确定输入变量包含当前日期w、星期属性(1~7). 因日期属性的不同,而使模型有所不同. 通过选取当前日期属性、星期属性的历史数据进行模型拟合,能较为准确的预测得到相应区域的共享单车需求量. 根据日期属性的不同将模型分为工作日、非工作日和节假日3种预测模型,3种模型分别适用其对应的早、晚高峰时段预测. 早晚高峰时段预测模型只是在日期特性的基础上加以考虑早、晚高峰时间特性,输入变量在包含当前日期w、星期属性(1~7)的基础上,加上时间段m属性数据加以拟合得到早、晚高峰时间段预测模型.
由于在日尺度下共享单车发生量、吸引量往往趋于平衡,而高峰时段尺度下容易体现显著的潮汐现象以及不均衡性,以上问题是共享单车调度和运维的难题. 因此本文主要分析工作日、非工作日和节假日高峰时段的发生、吸引量预测.
2.2.3 共享单车需求规模
目标预测区域的需求量为其相应的发生量与吸引量的差值,其性质与发生、吸引量一致,存在工作日、非工作日和节假日的日期特性、早晚高峰的时间特性和地域特性不同,其需求量预测模型会相应不同.
特定区域的共享单车需求量可反映该区域的供需匹配关系,值大于0,需要移除对应数量的车辆,值小于0,则需要增加对应数量的车辆.
2.3 数据校核
因为该模型针对不同的区域,不同日期、时刻,预测模型的系数均不同. 现以江汉路地铁站和汉正街商圈共享单车工作日和非工作日早高峰时段发生量需求预测模型进行数据校核.
2.3.1 江汉路地铁站
1)工作日早高峰
选取江汉路地铁站11月25日、12月2日和12月9日3d同为星期一07:00—09:00的数据,12月10日—12月13日共4个工作日07:00—09:00的数据,一共7个数据拟合得到江汉路地铁站2019年12月16日星期一07:00—09:00的共享单车日发生量预测模型. 以上数据是将开锁订单数据对共享单车id去重后得到的数据,可近似看成骑行发生量(区域导出车辆数).
江汉路地铁站2019-12-16星期一07:00—09:00的共享单车发生量预测模型为:
表6 共享单车发生/吸引量预测模型
Yworkday=63+0.05x1+0.13x2+0.31x3+0.08x6+
0.12x7+0.13x8+0.18x9
(x1、x2、x3为江汉路地铁站11月25日、12月2日和12月9日3个星期一07:00—09:00骑行发生量;x6、x7、x8、x9为12月10日—12月13日4个工作日07:00—09:00骑行发生量. )
2)非工作日早高峰
选取江汉路地铁站11月24日、12月1日和12月8日3个星期日07:00—09:00的历史数据拟合得到江汉路地铁站2019年12月15日星期日07:00—09:00的共享单车日发生量预测模型. 以上数据是将开锁订单数据对共享单车id去重后得到的数据,可近似看成骑行发生量(区域导出车辆数).
江汉路地铁站2019年12月15日星期日07:00—09:00共享单车发生量预测模型为:
Yweekend=32+0.19x1+0.25x2+0.56x3
(x1、x2、x3为江汉路地铁站11月24日、12月1日和12月8日3个星期日07:00—09:00的骑行发生量数据. )
对江汉路地铁站工作日和非工作日早高峰共享单车发生量模型进行检验,两者模型R2分别为0.953和0.962,说明模型拟合的效果较好. 按α=0.05进行F检验,P均小于0.05,说明模型有意义.
利用模型对2019-12-15到2019-12-28两星期07:00—09:00的共享单车发生量进行预测,预测结果平均绝对百分误差(MAPE)为6.11%,表明预测精度较高.
图4 江汉路地铁站早高峰真实量与预测量对比
2.3.2 汉正街商圈
1)工作日早高峰
选取汉正街商圈11月25日、12月2日和12月9日3个星期一07:00—09:00的数据,12月10日—12月13日共4个工作日07:00—09:00的数据,一共7个数据拟合得到汉正街商圈12月16日星期一07:00—09:00的共享单车日发生量预测模型. 以上数据是将开锁订单数据对共享单车id去重后得到的数据,可近似看成骑行发生量(区域导出车辆数).
汉正街商圈2019-12-16星期一07:00—09:00共享单车发生量预测模型为:
Yworkday=76+0.07x1+0.15x2+0.21x3+0.09+
0.12x7+0.16x8+0.20x9
(x1、x2、x3为汉正街商圈11月25日、12月2日和12月9日3个星期一07:00—09:00骑行发生量;x6、x7、x8、x9为12月10日—12月13日4个工作日07:00—09:00骑行发生量.)
2)非工作日早高峰
选取汉正街商圈11月24日、12月1日和12月8日3个星期六07:00—09:00的数据拟合得到汉正街商圈2019-12-15星期日07:00—09:00的共享单车日发生量预测模型. 以上数据是将开锁订单数据对共享单车id去重后得到的数据,可近似看成骑行发生量(区域导出车辆数).
汉正街商圈2019-12-15星期日07:00—09:00共享单车发生量预测模型为:
Yweekend=61+0.24x1+0.25x2+0.51x3
(x1、x2、x3为汉正街商圈11月24日、12月1日和12月8日3个星期日07:00—09:00的骑行发生量数据. )
对汉正街商圈工作日和非工作日早高峰共享单车发生量模型进行检验,两者模型R2分别为0.989和0.978,说明模型拟合的效果较好. 按α=0.05进行F检验,P均小于0.05,说明模型有意义.
利用模型对2019-12-15—2019-12-28两星期07:00—09:00的共享单车发生量进行预测,预测结果平均绝对百分误差(MAPE)为2.34%,表明预测精度较高.
综上可利用该模型对不同区域的共享单车需求估计,能为共享单车的短时出行需求预测和实时调度提供依据.
2.4 武汉市共享单车需求规模预测结果
通过采用多元线性回归法,以2019年11月及12月小时粒度的历史数据为基础预测得到2019-12-18 07:00—09:00的共享单车需求,需求量为正的需要增加车辆的投放,为负的则需要移除相应数量的车辆.
表7 行政区域需求规模 辆
对相关管理部分、企业较为关注的其他共享单车较集聚区域进行需求量分析,分析结果见表8:
表8 其他性质区域需求规模 辆
由所选择区域预测结果可得,武汉中心城区共享单车供需均存在一定的不匹配性,其中洪山区、江汉区和江岸区呈现骑行吸引量大于发生量,需要移除相应的车辆;武昌区和青山区则呈现骑行发生量大于吸引量,需要增加车辆的投放;硚口区和汉阳区基本达到供需匹配.
其他热点区域,武汉火车站和江汉路地铁站供需匹配较好,供需不匹配程度相对较高的热点区域中六渡桥地铁站和武汉中医院需要增加车辆的投放,华中科技大学和武汉大学需要移除部分车辆.
3 结束语
1)本文研究分析共享单车区域需求规模预测方法,首先对武汉市共享单车的数据情况和需求规模现状进行介绍和分析,其现状特征如下:
共享单车发生量和吸引量排名前三位的行政区为洪山区、江岸区和硚口区,发生、吸引量热点区域为汉正街商圈、东湖和小南湖公园区域;东湖、汉正街商圈、金融港、城开二七城市广场等区域供需较不平衡.
共享单车拥有显著的早晚高峰、以及午间小高峰特征;早、晚高峰发生、吸引量体现出显著的潮汐现象和不均衡性,由此导致日发生量和吸引量的不平衡.
2)针对武汉共享单车数据情况,对相同共享单车车辆id开、关锁订单量数据去重后,得到共享单车发生、吸引量数据,基于以上数据,选取多元线性回归法对城区、商圈、大学、地铁站等热点区域共享单车在早、晚高峰以及全天的需求规模进行了相应的预测. 并以江汉路地铁站、汉正街商圈共享单车工作日非工作日07:00—09:00发生量预测模型进行检验,经检验得预测模型有意义且预测精度较高.
3)本文所建立共享单车需求预测模型,通过选取当前日期属性、星期属性的历史数据进行模型拟合,得到工作日、非工作日和节假日3种预测模型,模型相对简单,便于计算,能较为准确的预测得到相应区域的共享单车需求量.