高铁枢纽商圈出租车需求时空特征研究
2021-04-17马新露程明远
马新露 程明远
(重庆交通大学交通运输学院,重庆 400074)
居民的出行活动特征与城市空间发展密切相关,探寻居民出行的时空特征、内在的机制,对城市管理与规划具有重要意义[1]。高铁枢纽商圈是城市新兴的地域属性,随着GPS定位技术的不断发展,居民出行数据的获取越来越迅速、客观,各行业各领域积累了大量的出行轨迹数据,这些轨迹数据中蕴含着人类行为的时空分布模式[2]。出租车作为城市居民出行中最方便快捷的公共交通工具,在其运营过程中产生了海量的轨迹数据[3]。现阶段对出租车轨迹数据的挖掘主要集中在居民出行特征分析、人群移动规律发展以及社会活动模式挖掘三个方面,其中,居民出行特征分析是人群移动规律发现和社会活动模式挖掘的基础[4]。出租车出行随机性强,不受线路约束,乘客涵盖各个年龄段、各个阶层的群体。对于没有轨道交通的城市空间,出租车换乘概率相对较小,上下车点是居民真实的出发地与目的地。因此,大规模的出租车GPS上下车点(origin-destination,OD)是研究居民活动情况的理想数据源。本文主要利用出租车订单OD数据,对出租车出行活动的时空特征进行分析,研究出租车在高铁枢纽商圈区域内的时间和空间的运营特征,并结合高铁班次数据以及天气数据,进一步解释出租车需求量与各个影响因素之间的关系。
1 研究区域及数据
研究区域为重庆市沙坪坝站以及三峡广场构成的高铁枢纽商圈。数据来源为2020年6~8月重庆市出租车运营的订单数据,每辆出租车一次完整的载客行为对应一条数据,当乘客下车时将单笔订单的数据记录上传至终端。
1.1 数据描述
出租车订单数据包含了出租车完成一笔订单后,设备终端上传的数据,包含了9个有效字段,每个月的数据大小为2 G左右,共包含全城每个月1 300多万条数据,主要包含字段:车辆车牌号、乘客上车经纬度、乘客下车经纬度、乘客上下车时间、订单行驶里程、订单最终价格。
1.2 数据处理
原始出租车GPS数据中由于GPS设备老化、GPS信号被屏蔽等因素,导致设备不能返回GPS数据或返回的GPS数据有误。根据数据真实情况,对订单数据的处理主要由以下步骤组成:(1)删除经纬度异常,GPS记录不在区域内数据;(2)根据完整字段的格式将不完整部分补充字段结构不完整数据;(3)删除一条数据中部分字段为0值或空值的数据;(4)只留下一条有用数据,删除其余重复数据。
2 出租车需求时间特征
选取2020年6~8月期间出租车订单数据作为研究数据,其中包括工作日58 d、周末22 d以及节假日3 d。
2.1 不同场景时均需求量
将三个场景的数据分别求取每小时时间段的平均值,不同场景需求量如图1所示。
图1 不同场景需求量
由图1可知,三场景在不同时间段的需求量皆不同,尤其是节假日需求量更特殊,原因可能是节假日期间居民对于高铁枢纽站以及商圈的需求在时间上更分散,没有规律性。综上所述,三个场景出租车在每个时段的需求量均不同,因此,不同场景对于出租车每小时的需求量均存在差异。
2.2 时间序列周期性
出租车需求量的周期性主要表现在当日出租车小时需求量与前n周(n=1,2,3,...,n)的需求量之间的关系,选取6月18日(周四)为研究日,对应的前一周相同星期属性(6月11日)和前两周相同星期属性(6月4日)的数据为对应,如图2所示。
图2 相同星期属性
出租车的需求量与前一周及前两周同星期属性的需求量有较强的关联性,部分时段相差较大,但变化趋势相似,因此,前n周的相同属性的需求量与当日需求量之间的联系也较强烈。
2.3 星期属性相关性
每天需求量如图3所示。
图3 每天需求量
周一~周五的需求量整体变化曲线较为相似,在8:00~10:00时间段内产生区别,但整体走势类似。周六和周日的出行需求不同,在大部分时间出行需求与周中相似的情况下,同样在8:00~10:00时间段内需求量相比周中形成了一个波峰的形势,此现象体现了周末两天居民购物或高铁出行,早上阶段对出租车的需求均明显大于周中的现象。
3 出租车需求空间特征
3.1 出入量
出租车的需求量不仅与时间序列相关,与当时区域所存在的出租车量也有关系,因此,可以使用出入特征表达此性质。出入差(Xgap)是用来表达某一时段研究区域内出租车到达(Xin)与出发(Xout)情况的量值:
式中:Xout——区域内每小时出租车的出发量;Xin——研究区域内每小时出租车的到达量。Xgap越高,表明当前时段内该地区越倾向于出租出行的目的地,越低则更倾向于出发地,接近0表示地区出租车的流入流出情况接近平衡。
3.2 交通状态
路段车速是体现路段拥堵程度的重要指标[5],根据交通工程相关理论,分别按照85%位、50%位、30%位、15%位车速对道路拥堵状况进行确定[6]。越拥堵的路段出租车的客运量越低,车速可以直观体现租车的运营状态。由订单数据行驶里程字段与出租车上下客时间得到的速度为行程车速,与出租车GPS数据包含的瞬时速度有所区别。区域小时平均行程速度可以宏观展示整个区域的交通状态,交通状态对居民选择出租车出行具有重要的作用。
通过对研究区域、速度对应拥堵状况的确定,取2020年6~8月区域内行驶里程小于4 km的速度,即85%位、50%位、30%位、15%位的车速为37、26.0、22.0、18.0 km/h,通过对每小时平均行程速度的区间划分进行分级。
4 出租车需求影响因素分析
出租车出行需求代表了乘客对以出租车为代表的小型公共交通的需求,结合上文所述,得到最终与研究区域内出租车需求量相关的时空特征分别为:(1)时间段;(2)前1 h需求量;(3)前2 h需求量;(4)前1 h出入差;(5)前1 h区域交通状态;(6)场景属性。
4.2 变量影响系数研究
通过数据标准化组成影响因素指标,本文使用XgBoost重要度分析算法对指标的重要程度进行排序,如图4所示。
图4 指标重要度排序
居民选择出租车出行是为了减少工作及生活出行的烦琐程度,但交通状况的拥堵对居民选择出租车出行具有决定性影响,拥堵状态下几乎不会选择乘坐出租车出行,因此,交通状态是决定出租车需求量的主要因素。其次,区域内出租车的出入量对于出租车需求的影响,区域内出租车出入量可直观反映区域内出租车的时段保有量,出入量可体现当前区域的出租车状态,如出租车大量驶入、出租车大量驶出或出入平衡状态,对出租车需求的影响较大。时间序列对出租车需求量同样属于较重要的影响因素,因此,前两个时间段的需求量在重要度分析中占据重要的地位。出租车需求量随机性较强,不同于高速公路车辆出行等现象,因此,时段、星期属性为排列最后两位的重要因素。
5 结语
本文主要针对高铁枢纽商圈进行了时间及空间的特征分析,并使用XgBoost对时空特征指标进行了重要度排序,分析了对高铁枢纽商圈出租车需求影响因素较靠前的指标,为高铁枢纽商圈的建设、出租车对高铁枢纽商圈的选型提供了理论依据。