基于出行特征的汽车客运站最高聚集人数测算研究
2023-07-14唐秋生张永辉孙龄波
唐秋生,许 浩,张永辉,熊 洋,孙龄波
(重庆交通大学 交通运输学院,重庆 400074)
0 引 言
汽车客运站设计初期,因缺乏原始客流、数据获取难度高、测算方法主观性较强,测算出的最高聚集人数存在偏差,导致在客运站后续运营中出现资源浪费或紧缺的问题。为此需确定一套在最高聚集人数定义上,避免使用在设计初期无法获取的数据进行人数测算的方法。
汽车客运站最高聚集人数是指按照设计年度平均日旅客发送量乘以固定百分比得出,何宇强等[1]在分析相关因素后提出概率法、最坏情景法、模拟法3种方法进行人数预测,其中概率法是一种根据发车时刻表,假定到达旅客分布从而计算的客观方法,也是后续相关问题研究中所使用的主流方法;叶玉玲等[2]对概率计算法进行补充,综合分析发车频率与聚集人数的关系;张天伟等[3]指出规范中定义所存在的歧义,并在实地调研分析问卷结果后指出,旅客到站时间基本服从正态分布,在考虑列车晚点和旅客出行习惯的基础上,采用概率法进行人数预测;C.DING等[4]在此基础上,继续构建客流预测模型,在考虑动态波动性后将其纳入ARIMA模型进行区间预测;王爱丽等[5]则继续前人在行车时刻表上入手预测的基础上认为旅客到站时间服从一种复合负指数分布,根据北京南站的客流时空特征和行车时刻表完成仿真;陈喜春等[6]提出了一种基于改进图解法的方法,将传统计算方法的图表法结合旅客聚集过程完成测算;姚加林等[7]认为同一车站因发车方向不同也将导致聚集人数产生差异。
从最高聚集人数研究中总结得出:概率法是一种比较科学的计算方法,但其中涉及旅客到达时间的概率分布函数以及参数等受其他因素影响。在此基础上,李兆丰等[8]认为日期和天气特征对旅客到站时间存在影响,并以LSTM神经网络为框架进行短时客流预测;狄智玮等[9]认为乘坐频率、行李量、流程熟悉度、出行目的等特征对旅客出行时间选择有较大影响;崔叙等[10]认为区域路网密度、容积率、办公设施、交通设施数量等环境因素与旅客出行时间存在非线性作用机制;J.LU等[11]认为旅客在车站内的聚集时间(到站时间)与站内的设施服务水平有重要关系,并定义了一种基于AFC数据和关键设施旅客步行时间的SSDC概念,进行旅客到站时间预测;T.STASKO等[12]认为旅客的到站时间偏好受列车拥挤程度影响作用明显,并尝试采用FW方法将旅客按照最短路径的思路分配至列车以此来计算旅客在站的逗留时间;V.CANTILLO等[13]认为航空旅客主要考虑时间的主观值、机票成本的弹性、旅行时间等因素进行出发时间的选择;LIU Yang等[14]在前人基础上,综合各方面因素,包括外部环境、时间相关性、空间特征和运营特性构建一种名为DEEPPF的深度学习模型进行旅客流量预测。
综上所述,针对最高聚集人数以及旅客出发时间(到站时间)的研究已存在较多成果,但在人数测算过程中可进一步综合考虑旅客到站时间对最高聚集人数产生的微观影响。为此,笔者提出一种结合旅客出行特征的最高聚集人数计算方法,以重庆市陈家坪汽车站为例进行计算。
1 最高聚集人数影响因素
采用概率法进行最高聚集人数测算时,主要考虑旅客在候车厅内的聚集和消散过程:其中旅客聚集过程主要与到站时间、概率分布、发车时刻相关;消散过程主要与站内设置的闸机数量、预留队列空间等客观因素有关。
1.1 集散规律
1.1.1 旅客聚集概率分布
旅客聚集概率分布是指旅客在何时到达客运站候车厅并开始候车直到进入发车程序开始登车的概率分布。为准确获得其分布密度函数,由陈家坪汽车站信息办公室通过调取站内闸机刷卡数据获得,包含乘客到达时间和所乘坐班车信息。笔者通过MySQL软件调取所选班次的刷卡数据信息,将乘客到达时间和所乘坐班车发车时间相减换算得出乘客候车时间,终而得到120名乘客的到达时间统计数据。同时为保证数据时效性,所选班次尽量紧凑,故选择3趟2021年8月15日由重庆始发的3趟客运距离大于200 km,定员40人以上,发车时间分别为12:00、13:00、14:00的班次作为乘客到达时间数据收集范围,如图1。
图1 旅客到站时间统计Fig. 1 Statistics of passenger arrival time
据观察,原分布逼近正态分布,针对统计数据以标准正态拟合如图2,拟合优度R2为0.837。
图2 旅客到站时间拟合Fig. 2 Fitting of passenger arrival time
拟合得到的正态分布概率密度函数为:
(1)
参数为:μ=42.96,σ=10.32。
1.1.2 旅客消散概率分布
旅客消散概率分布是指旅客在发车时间前,开始检票后由候车厅向班车内消散过程的概率分布,同时还存在部分陪站人员离站过程的概率分布。由于汽车客运班次单趟运输量较小,站内设置的检票闸机基本充足,近似认为是均匀分布。在汽车站工作人员帮助下对2021年8月15日3趟由重庆始发的班车旅客离站时间进行统计分析得到,旅客消散过程自检票时间开始起至发车时间,基本匀速进行。故认为,旅客消散函数为:
(2)
参数为:ε=3
1.2 发车时刻及上车人数
发车时刻表或行车计划表是客运站内反映行车调度计划的重要表单,其中可以获得发车时间、发车间隔、行车里程,车辆信息的重要数据,可根据发车时间表确定概率法中所需要的时间节点以此生成对应分布进行聚集人数的仿真计算;根据发车间隔可以粗略判断站内同时间聚集人数情况;针对车辆定员信息,可以确定到站人数;针对行车里程可以做出近中远途班车的基本判断,为后续确定出行特征提供数据基础。
1.3 旅客到站时间
笔者针对旅客聚集规律进行了一次实地调研,对3班列车的旅客候车时间进行拟合得出近似标准正态分布的概率分布密度函数。但是分别对3趟列车候车数据进行拟合发现,其μ取值存在差异,如图3,表明在不同客观条件下,旅客到站时间存在明显差异,该差异将直接导致站内聚集人数变化。
图3 分班次旅客到站时间拟合Fig. 3 Fitting of passenger arrival time in different shifts
结合相关文献,进一步探讨旅客到站时间与出行特征的影响机制,同时保证所选择出行特征在客运站设计初期的可获取性[10-12]。
1.3.1 日内时段影响
单日内的发车时间可以被划分为0:00—08:00区间的早间时段车辆,08:00—12:00区间的上午时段车辆,12:00—18:00的下午时段车辆,18:00—0:00的晚间时段车辆。根据旅客作为自然人的生理特性,在面对不同时段发车的班车时,会根据发车时间所在的具体自然时段调整到站时间。在面对早间时段发车的班车,因为城市公共交通还未开行,只能选择网约车或自驾车前往场站,并且早间时段道路交通状况良好,时间耗费容易掌握,该时段班次的旅客更倾向靠近发车时间到达场站。
1.3.2 周内日期影响
周内日期主要划分为工作日和非工作日。工作日开行的班车除开在通勤时间的早高峰和晚高峰时段,大部分时间交通状况较好,旅客倾向于靠近发车时间到站;非工作日开行的班车因节假日自驾出行比例较高、交通状况不易估计等原因,更倾向于提前发车时间到站。并且在工作日与非工作日的同一时段上,旅客到站时间也存在明显差异。
1.3.3 客运距离影响
客运距离可作为出行目的判断依据之一,同样也可作为随身行李量多少的判断指标。客运距离较短的班车主要服务于城市近郊,多为本地乘客周末出行度假、商务目的,其服务对象均对乘车流程以及时间掌握度较高,倾向于靠近发车时刻到站;客运距离较长的班车多为外地游客返乡,本地游客出远门目的,其服务对象从行李量、乘车时间等方面来说均长于普通旅客,更倾向于提前发车时间到站。
1.3.4 季节气候影响
季节气候主要与当地季节温度相关,以重庆亚热带季风性湿润气候为例,全年平均气温较高,单日温差变化大。当旅客在气温较高或较低的时刻出发时,更倾向于靠近发车时刻到达场站,以减少候车时刻。同理,在不同季节时,因温度原因导致旅客做出的出发选择不尽相同。
综上所述,笔者选取日内时段,周内日期,客运距离,季节,温度5个出行特征作为旅客到达时间预测依据,如表1。
表1 特征选取Table 1 Feature selection
为进一步探求该5个特征与旅客到站时间的影响机制,考虑到预测模型需要,于重庆市陈家坪汽车客运站开展4次实地调研,具体调研内容为旅客到站时间与所乘坐班次信息,在获取每一位受访旅客的车次信息后,通过到站时间与发车时间换算求得提前到站时间,同时记录每位旅客受访时当前时段、日期、季节以及当前气温,以完成样本数据收集。实际获得318份问卷,筛选部分缺失信息的问卷得到280份有效问卷。将各项特征数据按照表1进行严格数值转换,得到最终调研数据如表2。
表2 样本节选Table 2 Sample excerpt
根据有效样本进行Pearson相关性检验。由表3可得,日内时段对旅客到站时间影响最大,其次为客运距离、季节、温度等,周内日期相关程度最小但相关系数也达到0.882 5。结果表明笔者所选择的5个出行特征与旅客到站时间存在影响机制,为后文预测模型的建立提供理论基础。
表3 Pearson相关性分析Table 3 Pearson correlation analysis
2 考虑出行特征的最高聚集人数测算
2.1 符号定义
根据模型中出现的符号,现定义如表4。
表4 符号定义Table 4 Symbol definition
2.2 旅客到站时间预测模型
针对前文所述5个出行特征,其与旅客到站时间的具体影响机制难以直接描述,笔者选用BP神经网络预测模型进行建模。BP神经网络模型具有良好的分类识别能力,在足够的样本量支撑下也具有一定自适应能力,训练完成后的神经网络可认为是特征与结论的一个函数映射关系。因此,将日内时段、周内时期等5个特征作为输入,旅客到站时间作为输出,进行神经网络训练。
输入层:
(3)
隐含层:
(4)
其中,f(x)是激发函数,一般采用Sigmoid函数为:
f(x)=1/(1+e-x)
(5)
输出层:
(6)
2.3 聚集旅客量
根据旅客集散规律和行车时刻表,旅客到达分布为:
(7)
参数为:μ=Ti,σ=Ti/3
式中:σ=Ti/3是为了控制大部分旅客在此时间段内到达候车厅。因正态分布密度函数在无穷大时间轴上积分时总和为1的特性,故无法保证所有旅客按规定时间范围内到达。引入修正因子将原概率密度函数修正至指定时间范围总和为1,有修正过程为:
(8)
(9)
经修正后概率密度函数则有k时刻内进站人数为:
(10)
2.4 消散旅客量
按照旅客消散规律,乘坐i趟列车的旅客以及陪站人员消散函数为:
(11)
可分别获得旅客以及陪站人员在k时刻乘坐i趟列车消散人数为:
(12)
(13)
2.5 聚集人数测算
根据k时刻聚集旅客量和消散旅客量,可得:
(14)
H=max(Hk)
(15)
3 模型求解及算例
3.1 模型求解
Step1样本数据处理。在进行BP神经网络模型训练之前,需指定模型输出变量以及输入变量,本研究中该模型考虑出行特征对乘客到站时间的具体作用机制,故将样本数据的第1列定义为因变量,第2列~6列定义为自变量。
Step2训练网络。使用测试集数据训练神经网络,设置参数如下:训练方法为“Trainlm”,神经元个数3,训练集70%,验证和测试集各15%,验证方法选择均方差法,输出训练完成的网络以及训练情况。检验集拟合优度为0.930 6,训练结果较好,保留该网络。
Step3旅客到站时间预测。根据训练好的神经网络进行旅客到站时间预测,根据单日内行车时刻表,确定每班列车的5个特征取值,输入网络进行预测,得到每趟班车旅客倾向的到站时间。
Step4建立仿真模型。根据列车发车时刻以及旅客到站时间,生成若干符合发车条件的聚集正态分布和消散分布,以此模拟旅客到站的数量变化。
Step5计算聚集人数。导入班车定员、陪站人员系数、满载率等系数,最终计算得出日内人数变化。
3.2 算 例
结合笔者提出的聚集人数计算模型,针对陈家坪汽车客运站现有运行情况,选取年内发车班次较多的单日行车计划表进行仿真计算,共计发车215辆均由站内始发。根据车型统计和经验公式,满载率在运营高峰时取1,陪站系数取1.3,车次定员取值如表5。
表5 车型定员Table 5 Vehicle model seating capacity
根据模型计算得出12:57时刻出现旅客聚集最大值,旅客数量为867人,按定义计算得最高聚集人数788人,陈家坪汽车客运站单位时间旅客人数变化如图4,一日内旅客聚集数量变化如图5。
图4 旅客人数变化时刻统计Fig. 4 Statistics of changes in passenger numbers at different times
图5 聚集人数变化Fig. 5 Change in the number of the gathered people
图5中,08:00至11:00出现第1波高峰聚集,主因该时段有较多班次发车,于12:00至16:00出现日内第2波高峰,该时段发车班列车型多为大高一级和大高二级,单车辆乘坐旅客数较多且大部分为长途出行,导致站内人数保持在较高聚集水平。
如图6为根据站内刷卡数据绘制而成的人数变化图。实际情况中,最高聚集人数出现在14:00为766人,与测算结果相差约1 h;出现该情况主要考虑因测算模型中针对旅客的消散过程设定为匀速消散,而实际情况中旅客的消散多为非线性消散,由此而产生滞后作用的干扰;在整体趋势上,将原始数据列与测算数据列进行相关性分析,求得复相关系数为0.761 3,说明测算模型结果较准确,适用于汽车客运站最高聚集人数测算。
图6 实测人数变化Fig. 6 Changes in the measured number of people
4 结 论
1) 陈家坪汽车站旅客平均到站时间为29.7 min,提前15~20 min的旅客占21.07%,21~30 min的旅客占33.93%,31~40 min的旅客占30.71%,40 min以上的旅客占14.29%。
2) 汽车客运站的旅客到站时间与出发环境的不同存在一定影响机制。根据出行特征的差异从而确定旅客到站概率密度分布,构建适用于汽车客运站的最高聚集人数测算模型,以此来避免设计前期基础客流资料主观性较强等问题。在新建客运站无法确定行车时刻表时,同样也可利用规划发车线路、间隔等资料进行聚集人数测算。
3) 以陈家坪汽车客运站作为算例分析。陈家坪汽车站内聚集人数最大值在12:57出现,人数为867人,最高聚集人数为788人,考虑远景汽车客运站转型升级为旅游集散中心或是商务中心等因素带来的客流量上浮,可能出现的最高聚集人数为1 024人。