天气与城市共享单车出行需求的关系探究
2022-04-15谢国微钱林波汤文蕴XIEGuoweiQIANLinboTANGWenyun
谢国微,钱林波,汤文蕴 XIE Guowei,QIAN Linbo,TANG Wenyun
(南京林业大学 汽车与交通工程学院,江苏 南京 210037)
0 引 言
共享单车的出现,增加了居民通勤方式的选择,其与公共交通的衔接,成为一种新的出行模式。不仅满足了人们的出行需求,也对缓解城市交通拥堵起到了一定的作用。但共享单车出行极易受到交通环境的干扰,其中天气是一种重要的干扰因素。
以往关于共享单车的骑行研究大多通过调查问卷,这样的数据来源样本小,研究结果易产生偏差。而对大数据的挖掘与分析突破了传统的数据收集方法的限制,可以得到更为可靠的研究结论,为自行车运营商和政府调整自行车管理策略提供更加坚实的参考依据。因而本文通过共享单车订单数据探究天气因素对共享单车出行需求的影响,以及各影响因素之间的相互关系。
1 国内外研究综述
Gebhark研究发现,道路上出现的雾等天气状况会降低水平能见度进而导致公共自行车出行率降低。Campbell等研究结果发现温度、降雨以及空气质量等条件对选择自行车出行影响程度较强。Wang等认为少量的雨和雾可能对用户出行的选择影响不大。Sun等得出结论,下雨天气的影响因用户群体而异。
闵家楠分别研究了雨天和空气质量较差时公共自行车的出行强度,发现两种天气情况下公共自行车的使用具有一定的规律。龚迪嘉等采用气温、降水量和地形特征作为评价因素,发现北京等城市适宜发展公共自行车,而有些山地众多的城市则不适宜发展公共自行车。黎鹏的研究表明,不同地点或不同时段受天气因素影响的特征差距很大。魏志强等认为降雨和温度都对共享单车骑行距离意愿产生显著影响。朱妍和干宏程认为天气是影响出行者短距离出行是否选择自行车的首要因素。
目前,对于自行车的研究主要集中在自行车的出行特征、出行需求预测、公共自行车站点布局等方面,对于天气的影响探究还不足。利用共享单车出行大数据,探索天气因素对共享单车出行需求的影响,不仅有助于评估天气对城市居民社会经济活动的影响程度,也能为更准确地研究城市用户使用共享单车的影响机制提供支撑。
2 数据来源与预处理
2.1 数据来源
自行车数据来源于上海市2016年8月的摩拜单车订单及轨迹数据,原始数据涵盖了2016年8月1日到8月31日,共102 361条记录,每条记录包含订单编号、车辆编号、用户编号、起终点位置、起止时间、轨迹等信息。气象数据由环保总局实时监测数据和网站rp5.ru数据整合而成,其中包含以小时为单位的天气情况、空气质量指标等信息。
2.2 数据清洗与选取
本研究利用Python(Anaconda中的Spyder平台)进行数据清洗与挖掘。在原始数据中新增“时长”列,计算骑行起止时间的差值得到骑行时长,并将时长单位换算成分钟;新增“路径”列,通过不断读入骑行轨迹列表,每一次按顺序取出两个列表元素,得到前轨迹点经纬度和后轨迹点经纬度,计算出两点的位移,再把每小段的位移累加起来得到骑行的路径;通过骑行路径除以骑行时长,新增“速度”列,并将单位换算为km/h。
参考相关文献,选取骑行速度12~20km/h、骑行时长1~120分钟的订单数据,最终提取出35 909条记录。在提取出的数据中,根据订单开始时间,新增日、星期、小时字段,并按照日、星期、小时整合数据集,统计每小时订单数,作为后续研究中的因变量。将整合后的摩拜单车数据集与天气数据集进行合并,为后续分析做好准备。
3 变量定义与编码
根据研究内容,本文的因变量定义为共享单车出行需求,用共享单车的小时出行量表示。
本文涉及的天气因素包括天气情况、空气质量指标、温度、大气压、相对湿度、风速、总云量、水平能见度。其中,空气质量指标包括AQI、PM2.5、PM10、SO、NO、CO、O等浓度。
3.1 分类型变量定义与编码
天气情况变量属于分类型变量,不能直接进行回归分析,应设置虚拟变量。如果所有虚拟变量都参与回归分析,则会导致完全共线性问题。当分类型解释变量有个类别值,则只需引入-1个虚拟变量到回归模型中。本研究调查得到的天气情况有晴、多云、阴、中雨、阵雨、雷阵雨6种变量,因此只设置5个虚拟变量。表中=0代表工作日数据,=1代表休息日数据。虚拟变量定义及编码如表1所示。
表1 虚拟变量定义及编码
3.2 数值型变量定义与编码(如表2所示)
表2 数值型变量定义与编码
4 基本统计分析
4.1 骑行时间分布特征
统计工作日和休息日的日均骑行时间分布特征(如图1所示)。工作日有明显的早高峰和晚高峰。早高峰出现在7点至9点,晚高峰出现在17点至19点,而9点至17点、19点至22点则为平峰时段;休息日数据在7点至22点无明显的波动。0点至6点的共享单车出行需求显著低于其他时段。因而后续分析中将以7点至22点作为研究时段。
图1 工作日和非工作日24h订单数分布
4.2 骑行空间分布特征
参考《上海市城市总体规划(2017-2035)》,本文将上海中心城区作为研究范围。上海中心城区包括静安区、徐汇区、虹口区、普陀区、黄浦区、长宁区、杨浦区以及浦东新区等外环线以内的区域。
将摩拜单车的骑行起点经纬度位置导入ArcGIS,运用核密度分析工具对骑行起点的空间分布进行可视化(如图2所示)。
图2 上海中心城区共享单车骑行起点密度分布
图2中黑色线框内为上海中心城区范围。可以看出,上海骑行活动多集中发生在城市公共活动中心、医院、高校等场所。如杨浦区所建高校较其他行政区域密集,自行车骑行起点的密度也是最高的。这证明了共享单车在高校学生中的流行度,也说明了骑行活动受建成环境的影响较大。
4.3 自变量相关关系分析
在Spyder中利用Seaborn库绘制所有备选自变量的相关性系数图(如图3所示),可以发现各自变量之间是否存在线性相关关系,为后文使用多元线性回归分析提供参考。
图3 自变量相关关系分析
如图3所示,橙色单元格表示所对应的两个变量呈正相关,且颜色越浅,相关性越大;紫色单元格表示所对应的两个变量呈负相关,且颜色越深,相关性越大。单元格中的数字表示两个特定变量的相关系数。
从图中可以看出,天气状况与相对湿度存在中度相关,这也与实际生活规律相符。温度和NO浓度、大气压,相对湿度与O浓度存在一定程度的负相关。其中,AQI与PM2.5、PM10、SO、NO、CO、O浓度的相关性均较强,这可能是由于他们之间的定义存在部分重叠。尤其,AQI与PM2.5和PM10高度相关,需要结合三者之间的散点图进一步分析。
如图4所示,AQI与PM2.5、PM10之间存在正相关关系,这反映出AQI与PM2.5、PM10可能存在多重共线性问题。因而在多元线性回归分析时可以考虑剔除一些变量。
图4 PM2.5、PM10和AQI构成的散点图
4.4 共享单车出行需求与各自变量关系分析
(1)共享单车出行需求与AQI
由于AQI与PM2.5、PM10、SO、NO、CO、O的定义存在部分重叠,且皆具有不同程度的正相关性。所以仅描绘共享单车出行需求随着AQI的变化图,如图5所示。
图5 共享单车出行需求与AQI
整体上看,工作日共享单车小时出行量高于休息日。随着AQI值的不断增大,休息日共享单车出行量发生变化的幅度较小,但是工作日的下降趋势比较明显。显然,空气质量因素会在一定程度上影响用户的共享单车出行需求。相关研究也表明,骑行过程中人的肺活量增大,吸进体内的有害物质会增多,对身体的潜在危害更大。
(2)共享单车出行需求与温度
根据图6可知,随着气温的上升,工作日和休息日的共享单车出行量均有小幅的降低,变化程度较为接近。这可能是因为本研究仅涵盖8月份范围的订单数据,因此气温的变化程度不明显。
图6 共享单车出行需求与温度
(3)共享单车出行需求与大气压
从图7可以发现共享单车的出行量与气压的变化均存在一定的正相关。气压的高低对人体生理的影响主要是影响人体内氧气的供应。气压下降,机体会加快呼吸及血循环,出现呼吸、心率加快的现象。且在低压环流形式下,大多为阴雨天气,风的变化比较明显;在高压环流形式下,多为晴天,天气比较稳定。同时,气压的变化还会影响人的心理变化,使人产生压抑、郁闷的情绪。例如,夏季雷雨前的高湿天气,此时气压较低,人常有抑郁不适之感。上述因素,皆会影响用户骑行的决策。
图7 共享单车出行需求与大气压
(4)共享单车出行需求与相对湿度
如图8所示,随着相对湿度的增加,共享单车出行量有较小的增长趋势。环境相对湿度过低时会降低人体呼吸系统的抵抗力,诱发和加重呼吸系统疾病,进而影响用户出行方式的选择。同时,湿度的变化通常也伴随着气温与气压的变化,因而相对湿度对用户出行决策的影响值得关注。
图8 共享单车出行需求与相对湿度
(5)共享单车出行需求与风速
风速的大小常用风级来表示。在气象上,一般按风速大小将风划分为十七个等级。通过图9可以发现,随着风速的提高,共享单车出行需求有一定程度的上升,说明用户更愿意在有风环境下骑行。可见风速在1m/s到8m/s,即5级以内的风力(清风)对于共享单车出行的影响是正向的。受调查数据的限制,当风速继续增大时,会对共享单车出行需求呈现怎样的影响还有待进一步的研究。
图9 共享单车出行需求与风速
(6)共享单车出行需求与总云量
从图10可以发现,总云量无规则波动幅度相对较大,云量的增加在一定程度上会引起共享单车出行需求的增加。这可能是因为云量的多少恰好是晴、阴、多云等天气的反映,而用户更喜欢在温度相对较低,即多云或阴天等云量较多的气象条件下选择自行车出行。
图10 共享单车出行需求与总云量
(7)共享单车出行需求与天气情况
如图11所示为共享单车在不同天气情况下平均每小时的出行量。工作日在晴天时的共享单车小时出行量最高,而休息日在雷阵雨下的共享单车小时出行量最高,这可能与工作日和休息日用户的不同出行目的有关。整体上,晴天、多云条件下的共享单车出行需求要多于阴雨天气。这与现实中的规律较为符合。但在雨天下仍有不少共享单车用户出行,这可能是因为用户习惯性地采取了某种避雨措施,也反映出在短距离出行方面,共享单车作为一种通勤、接驳工具,对用户而言是一种刚性需求。
图11 共享单车出行需求与天气情况
由于上海城区8月份无雾、霾等恶劣天气,水平能见度大部分处于10km,因此本小节暂不分析水平能见度与共享单车出行需求的关系。
5 天气对共享单车出行需求影响的建模分析
为了更好地分析天气变化与共享单车出行需求的关系,使用SPSS软件建立多元线性回归模型,分别研究工作日和休息日的数据。
采用向后选择法输入自变量建立回归方程。其中,工作日和休息日数据分别经过10步构建回归模型。
表3显示调整后平方分别为42.3%和57.2%,模型的结果较为可靠。
表3 模型摘要
表4中,工作日和休息日的显著性水平近似于0,说明因变量与自变量的线性关系显著,下面进行多元线性回归模型分析。
表4 变异数分析
如表5所示,工作日数据最终模型中各解释变量的显著性水平都小于0.05,说明表中变量对共享单车出行需求的解释是有显著性贡献的。已经筛除的自变量有多云、阵雨、PM2.5、PM10、SO、NO、O、相对湿度、总云量。将各最终解释变量带入方程,工作日回归方程如式(1)所示:
表5 工作日系数
结合回归系数可知,阴、中雨、雷阵雨天气对共享单车出行需求的影响,皆呈负相关,雷阵雨比中雨带来的影响更显著。AQI、CO的系数为负,说明与共享单车出行需求负相关,其中AQI的影响程度最大。温度对共享单车出行需求的影响是负的,随着温度每升高一个单位,共享单车出行量平均降低5.046辆/h。大气压、风速、水平能见度都与共享单车出行需求正相关。
如表6所示,休息日数据中筛除的自变量有多云、中雨、阵雨、PM2.5、SO、NO、CO、大气压、总云量、水平能见度,这些变量对共享单车出行需求的线性解释没有显著性贡献。将表中各自变量带入方程,休息日回归方程如式(2)所示:
表6 休息日系数
结合回归系数可知,雷阵雨、AQI、PM10、温度都对共享单车出行需求有着负向影响,而AQI的影响程度较之其他因素最大。风速的相关系数为正,随着风速每提高1个单位,共享单车出行量平均增加2.844辆/h。这些结论与工作日数据模型较为一致。
与工作日不同的是,休息日数据中,阴天的影响系数为正。这可能是与工作日、休息日下用户的出行目的不同有关。工作日多以通勤、接驳为目的,休息日多以娱乐、休闲出行为主。阴天时,以娱乐休闲为目的出行的共享单车用户会觉得更凉爽,骑行体验更好。另外,休息日中少了中雨、大气压、水平能见度三个因素,增加了PM10、相对湿度两个因素,其中PM10的回归系数为负,相对湿度的回归系数为正。这也可能与不同出行目的的用户对环境里不同因素的关注程度不同有关。
6 结 论
本文选取上海市中心城区,研究了天气因素对共享单车出行需求的影响。从研究中得到如下结论:
(1)工作日中,大气压和水平能见度对共享单车出行需求的影响是显著正相关的,但对休息日出行用户无影响。休息日时,PM10呈现负向影响,相对湿度呈现正向影响,但对工作日出行用户无影响。
(2)AQI与PM2.5、PM10等空气质量指标存在一定的正相关关系。随着AQI指数的增加,即污染程度增高时,会使共享单车出行需求降低。
(3)晴天、多云天气时,共享单车的出行需求要显著多于阴、雨天气。阴、中雨、阵雨、雷阵雨天气在工作日与休息日,对共享单车的出行需求影响程度有所不同。雷阵雨在工作日中的影响程度要大于其他因素,而休息日出行的用户更喜欢选择阴天骑行。
(4)随着温度的升高,共享单车的出行需求会有所降低。相反,随着风速的提高,在一定范围内,共享单车的出行需求会增加。
根据上述结论,建议共享单车管理者在雨天、污染等恶劣天气与高温时段下减少单车的投放量,节约道路空间,合理分配自行车资源。由于休息日的共享单车出行需求要低于工作日,可在休息日期间对共享单车分时段、分区域进行维护,提高用户的使用体验。