基于地理大数据的网约车节假日运营时空配置优化
2021-08-09岳鸿霄韩雪源
岳鸿霄 韩雪源
【摘 要】论文以海口市网约车运营服务为例,以2017年10月1日海口市网约车订单数据为研究对象,利用Python对原始订单数据进行清洗,借助ArcGIS与Surfer对清洗后的數据进行挖掘和可视化分析并探寻订单的空间特征,利用Excel分析订单的时间特征,研究海口市国庆长假首日网约车订单需求变化的时空分布规律,提出最优配置建议。
【Abstract】This paper takes the ride-hailing operation service of Haikou City as an example, takes the ride-hailing order data of Haikou City on October 1, 2017 as the research object, uses Python to clean the original order data, and uses ArcGIS and Surfer to mine the cleaned data, conduct visual analysis and explore the spatial characteristics of the order. By using Excel to analyze the time characteristics of orders, this paper studies the temporal and spatial distribution of the demand change of online ride-hailing orders on the first day of National Day long holiday in Haikou City, and puts forward the optimal allocation suggestions.
【关键词】地理大数据;网约车;配置优化
【Keywords】geographic big data; online ride-hailing; allocation optimization
【中图分类号】F572;F724.6 【文献标志码】A 【文章编号】1673-1069(2021)06-0107-03
1 引言
运用地理大数据深度挖掘网约车运营信息,如订单类型、订单起终点、经纬度、出行品类、乘车人数、乘车时间和时长等,进行数据可视化分析,精准描述并匹配用户对于车辆类型、用车时间、行程距离、乘车路线等用车需求,分析网约车运营的时空分布规律,对于提高网约车的运营效率和服务能力、提高城市运力资源的配置效率具有重要意义。
2 文献综述
当前研究出租车、网约车运营管理与支持的文献,主要是基于时间和空间2个维度,研究车辆运量投放和热点区域探测及路径推荐。时间维度上的研究,主要是基于车辆基本信息的统计分析,如运行时空特性及运营指标分析,根据这些基本信息确定出租车的市场供求关系以及出租车的运量投放规模,如翁剑成(2010)、程静(2016)、吴华意(2019)等。空间维度上的研究,主要是对车辆轨迹数据进行深层挖掘,研究对象有车辆的行驶速度、行驶里程、载客里程、上下客点、空载率、司机的收益排名情况,对出租车进行了行为分析,进行出行热点区域探测、寻客策略拟定和路径推荐,出行方向判断以及打车需求预测等,如孙飞(2015)、毕硕本(2018)等。
综上,当前研究车辆轨迹数据的文献较为丰富,但大多文献在进行空间分析时,未利用卫星影像图,没有结合经纬度、行政区划图等地理、地图要素进行可视化研究。本文基于地理大数据,以海口市网约车运营服务为例,以2017年10月1日海口市网约车订单数据为研究对象,利用Python对原始订单数据进行清洗,借助ArcGIS与Surfer软件对清洗后的数据进行挖掘和可视化分析,并探寻订单的空间特征,利用Excel分析订单的时间特征,研究海口市国庆长假首日网约车订单需求变化的时空分布规律,在此基础上提出节假日网约车运营的最优配置建议。
3 数据来源
本文数据均来源于滴滴出行公布的海口市2017年5月~10月每天的订单信息。数据内容包括:订单起点与终点的经纬度信息、订单类型、出行品类、预估价格、乘车时长等。对于涉及乘客个人信息的数据已进行处理,不涉及个人隐私侵犯问题。受数据和研究手段限制,本文以小时为时间单位,以海口市10月1日7:00~20:00共计13个小时的订单信息作为研究数据,探寻以“十一长假”第一天为代表的节假日网约车运营的时间与空间特征规律。
4 研究方法
首先,利用Python进行数据清洗去除无效数据,导入Excel中进行格式转换;其次,使用ArcGIS与Surfer软件挖掘订单的空间特征,对其进行数据分析与可视化;最后,使用Excel软件对订单的时间特征进行数据挖掘与数据分析。
4.1 订单空间特征挖掘
①借助ArcMap与ArcScene,以50m×50m为单元,统计每个单元内逐小时及整个研究时段内的订单数量,并使用不同的可视化方式使之更为直观,便于分析。
在ArcMap中,根据清洗后的数据中的经纬度坐标,将每小时和整个研究区的订單显示在海口市行政区划图中的相应位置。利用渔网功能,生成单元为50m×50m大小的渔网面。将生成的渔网面与导出后的订单点数据关联,以海口市行政区划图为掩模进行裁剪。为统一且直观地显示订单的密集程度,将裁剪后的图层用自然断点法分为8级,再进行手动调整,将没有订单的区域设为不可见(透明)。由于ArcScene只可以识别栅格图层,还需要在ArcMap中将图层转为栅格存储。最后在制作专题图时添加相应的地图要素。
②借助Surfer可以同时间对比多张图的特征,对比逐小时的平均起点和平均终点与订单数量。在Excel按时段进行统计,分别计算每个时段的总订单数、平均起点和平均终点的经纬度坐标,并导出为文本文件。在Surfer软件中,按照建立表面图、网格化数据、生成等值线图、生成表面图的顺序,以反距离插值的网格化方式,根据离散的经纬度坐标点和单数,完成东经110.3°~110.5°,北纬19.9°~20.02°范围内,平均起点图和平均终点图的制作。再利用百度地图的坐标反查功能,查找相应平均起点与终点的坐标与城市功能区,探寻订单整体的空间分布规律。
4.2 订单时间特征挖掘
汇总全部数据后,绘制时间-产品线关系图,探寻滴滴出行产品线(专车、快车、豪华车)与时间之间的关系;绘制时间-订单数与均价、平均时长关系图,探寻全部订单数量、平均预估价格、平均时长、时间之间的关系;绘制时间-订单类型关系图,探寻订单类型(实时单、预约单)与时间之间的关系。
5 网约车节假日运营时空特征分析
5.1 订单空间特征分析
5.1.1 累计订单起点的空间分布特征
在上述时间段内,滴滴出行一天累计订单的空间分布及单位面积上订单数量可视化图(后续简称为订单密度图)如图1、图2所示。
根据订单空间分布图,可知:订单数量的分布基本以城市核心区为中心,向外沿城市主干道、高速,呈辐射状减少,其中沿河两岸订单数量明显西岸多于东岸;西北部沿海区域订单数相较于北部及东北部多,或许与中间隔着河有关;城市的中部和南部为2个明显的订单密集区。根据订单密度图,可更为直观地发现订单密度以核心区为中心,沿城市主要道路和高速路向外辐射扩散状减少。
借助百度地图经纬度坐标反查功能,查询了所有订单平均起点和终点的位置,如图3所示。平均起点和终点之间的距离非常接近,但是向西北方向发生了一定的偏移,推测整体订单中向西北方向移动的居多。其中平均起点为海口市龙华区坡博路,平均终点为海口市龙华区南沙路62号。由卫星影像图可知,平均起点和终点均处于海口市中心位置。
5.1.2 逐小时订单起点的空间分布特征
按前述方法绘制海口市2017年10月1日7:00~20:00时间段内,滴滴出行每小时订单密度图(图略)。通过观察订单空间分布图可知,无论哪个时段,订单的分布都较为集中,且单位面积上订单数量多的位置也较为接近,同时,这些区域几乎完全覆盖城市一级道路,可知该区域为海口市核心区。通过逐小时订单数量空间分布图间的对比,可发现随着时间的推移,订单数量高的区域在不断增加,在上午7~8时,订单数量多的单元在实际中多为聚集性居民区。随着时间的推移,由居民区向商业点或城市绿化景观等休闲场所过度,但这2种区域的订单数量都保持在较高的水准。
5.1.3 逐小时订单起点与终点的平均位置空间特征
在研究时段内每小时对订单的起点与终点的平均空间位置进行统计,数据如表1所示。随着时间的推移,各时段平均起点整体呈现向西北方向移动的趋势,平均终点整体呈现由西北向东南方向移动的趋势。
利用Surfer对各个时段内的平均起点与终点进行分析,结合该时段的订单数量得到图4,其中,黄色为主色调的图层为平均终点位置与用反距离插值后的订单数量,深绿色为主色调的图层为平均起点位置与用反距离插值后的顶点数量。通过2个图层内的订单数量的多少与位置,可获得和上述内容一样的结论。
5.2 订单时间特征分析
根据滴滴出行数据,按照订单数、实时单与预约单、专车与快车和豪华车、平均预估价格、平均时长进行逐小时统计,分别从产品线的时间特征、订单数和均价、平均时长的时间特征、订单数量的时间特征进行分析。
5.2.1 产品线时间特征
基于订单数据绘制时间-产品折线图(见图5)。无论哪个时段,快车订单的数量都远大于专车的数量,而豪华车订单的数量始终为0,这与滴滴出行公司提供的3种产品线的价格和数量有着密不可分的关系。
5.2.2 订单数、均价与平均时间特征
绘制时间-订单数与均价、平均时长关系图(见图6)。由图6可知,随着订单量的增加,平均预估价格与平均时长呈现出减少的趋势。随着平均价格的降低,平均价格呈现出了与之相似的变化规律,当7~10点平均价格减少时,平均时长反而呈现出了增加的趋势。
6 网约车节假日运营配置结论和建议
6.1 结论
①全市每个地理单位每小时订单数量都随时间的增加而增长,其中城市南部和中部的变化最为显著。从10点开始,城南部的居民区订单数量骤增,11~12点时达到顶峰,随后缓慢下降,在15~16点时达到相对低谷,在16~17点时再次大量增长并保持相对稳定。
②早晨时段城市中部的商业区、绿地等区域的订单数量较低,随后逐渐增长,但增速相较居民区缓慢,在12点过后订单数量大幅增加又逐渐减少,在16~17时达到相邻时段内的谷底,随后再次增加,直至18时后达到同时段内订单密度最高的区域。
③快车的订单数量增长和减少与总订单数同步,趋势相同。
6.2 建议
6.2.1 空间配置建议
在进行网约车配置时,应以市中心为核心,沿主要道路逐渐向外减少车辆的调度,同时注意适量增加海口市西北部的车辆配置;节假日的7~9点、中午11点前后、下午17点前后,应主要配置在各个居民区,且居民区密度越大,该区域网约车数量越多;中午12点后,应注意商业区和居民区的均衡配置;下午18点后,应以商业区为主要区域。
6.2.2 时间配置建议
自早上7时起,应不断提高空闲网约车数量,以面对迅速增长的订单数量;在12~19点的订单高峰期,提高快车的数量同时控制专车、豪华车数量;鼓励乘客选择提前计划出行时间,避免8~11点道路拥挤时出行,减小对城市路面交通的压力。
【参考文献】
【1】翁剑成,刘文韬,陈智宏,等.基于浮动车数据的出租车运营管理研究[J].北京工业大学学报,2010,36(06):779-784.
【2】程静,刘家骏,高勇.基于时间序列聚类方法分析北京出租车出行量的时空特征[J].地球信息科学学报,2016,18(09):1227-1239.
【3】吴华意,黄蕊,游兰,等.出租车轨迹数据挖掘进展[J].测绘学报,2019(11).
【4】孙飞,张霞,唐炉亮,等.基于GPS轨迹大数据的优质客源时空分布研究[J].地球信息科学学报,2015,17(03):329-335.
【5】毕硕本,万蕾,杨树亮,等.基于GPS数据的南京出租车上下客时间特征及热点时空分布[J].中国科技论文,2018,13(09):1023-1028.