APP下载

基于数据拟合的铁路车站旅客最高聚集人数计算研究

2022-09-06钟绍林秦梦瑶廖时元

铁路计算机应用 2022年8期
关键词:检票正态分布对数

钟绍林,秦梦瑶,廖时元,帅 斌,杨 婷

(1. 中铁第四勘察设计院集团有限公司 线路站场设计研究院,武汉 430063;2. 西南交通大学 交通运输与物流学院,成都 610031)

根据《铁路旅客车站设计规范》(TB 10100—2018),铁路旅客车站最高聚集人数是确定铁路客站站房建筑面积的主要指标[1]。张天伟等人[2]、薛晓姣等人[3]研究了最高聚集人数的定义,并指出现有定义中存在的问题;诸多学者针对最高聚集人数的计算方法进行了研究,姚加林等人[4]结合概率统计法,通过计算机模拟对最高聚集人数进行预测;李建斌[5]使用概率统计法归纳分析了旅客出行特征及沿线旅客集散特性;张天伟等人[6]采用对数正态分布拟合旅客到达规律;叶玉玲等人[7]对原有的概率计算方法进行改进,论述高速铁路旅客候车时间分布规律符合对数正态分布;刘启钢等人[8]根据最高聚集人数的规律和旅客提前到站时间分布密度函数,对车站聚集人数进行解析计算;陈喜春等人[9]采用双参数威布尔分布对旅客到站时间进行曲线拟合,建立了铁路客运站旅客聚集人数通用公式;Oded等人[10]运用计算机建模的方法模拟了旅客进站流程及在车站内的活动情况。

综上,概率法具有普遍的适用性,且可较好地考虑旅客到站时间分布,未来工作中统计数据变更时也便于更新。既有文献中利用概率法计算车站最高聚集人数时,虽采用了各种拟合函数形式,但多以同一种分布为基础,计算整个车站的旅客聚集人数,未体现出对旅客到站规律差异的考量。

本文基于既有车站的旅客到站数据,探讨了旅客到站规律的差异性,通过对比研究的方式说明了概率法计算聚集人数时根据列车发车时刻等相关因素选取不同拟合函数的必要性。

1 旅客到站规律分析拟合

1.1 数据获取

本文通过提取售/取票机数据,搜集成都东站2019年2月2日的旅客乘车信息,共139385条记录,包含车次、到发站、票价及进站口等信息,并获得车站当日全部列车的实际出站时间。旅客在车站售/取票机取票即认为其进入车站范围,故本文以售/取票机显示的售取票时间,以及取票信息中对应车次的实际发车时间分别作为旅客在车站范围内滞留时间的起止点。

经统计,车站当日发送各类列车共202列。根据列车信息和旅客乘车数据中包含的车次号,将旅客乘车数据按所乘列车进行分类,考虑到其中6列列车当日上车总人数少于100,数据信息较少,易造成较大拟合误差,因此,筛选出旅客信息数据≥100条的196列列车的数据用于后续拟合分析。

1.2 旅客到站规律分析

旅客到站规律受到诸多因素的影响。乘坐不同列车的旅客其到站规律往往存在差异。本文根据收集的成都东站相关数据,分析了旅客到站规律与列车出发时间的关联。单独分析每一列列车的旅客提前到站数据可发现,随着发车时间的变化,对应列车的旅客提前到站时长也会发生变化,变化趋势如图1所示。

图1中给出了不同发车时刻对应列车的旅客提前到站时间(涵盖了发车时间5:50~23:52的196列列车)。横坐标为列车发车时刻,即以0:00为计时起点,列车发车时刻距计时起点的分钟数;纵坐标为乘坐该时刻出发列车的旅客提前到站时间。

图1 列车发车时间影响下的旅客提前到站时间变化趋势

从整体趋势上看,随着列车发车时刻的推移,旅客提前到站时间的平均值和中位数值总体上呈现增大趋势,与实际生活中旅客出行习惯具有一定关联[11]。通常乘坐早上出发列车的旅客更倾向于根据列车发车时间有计划地安排其出行时间,在避免错过列车的同时,尽可能缩短候车时间,因此,其到站时间通常更靠近所乘坐列车的发车时间;而乘坐傍晚尤其是晚上9:00之后出发列车的旅客考虑到晚餐用餐时长、城市交通状况等因素,更倾向于为市内交通、铁路车站内检票候车等预留足够长的冗余时间,因此相较于早上出发的旅客,出现了到站时间更早,候车时间更长的现象。

1.3 旅客到站规律拟合

综上,乘坐不同列车的旅客到站规律可能不同。旅客到站规律是车站旅客最高聚集人数的重要影响因素。因概率法在计算旅客最高聚集人数时较好地考虑了旅客到站的概率分布及车站旅客列车开行方案,本文以概率法对旅客到站规律进行拟合。以5 min为间隔,按不同列车分别统计每一时间段内提前到站旅客人数,并根据对应列车的乘车总人数计算该时段提前到站人数的百分比,以此作为拟合的原始数据。

本文主要选取了对数正态分布、威布尔分布及复合负指数分布3种拟合函数对每一列列车的旅客到站规律进行拟合。拟合结果即为不同分布的概率密度函数f(x), 则t时刻,已到站旅客占该列车总人数的比例为

且应满足

拟合旅客提前到站规律时,采用以下3种分布对旅客提前到站时间进行拟合。

表3给出了六个指数收益率序列的ARMA(p, q)-GJR-GARCH(m, n)模型估计结果。从表3来看,通过ARMA(p, q) - GJR-GARCH(m, n)模型,各收益率序列的自相关、条件异方差和杠杆效应得以消除,进而得到各个收益率序列的标准化残差序列η。

对数正态分布概率密度函数为

其中,σ、 µ为对数正态分布的形状参数。

威布尔分布的概率密度函数为

其中,a、b为 威布尔分布的形状参数。

复合负指数分布的概率密度函数为:

其中,c1、c2、c3是复合负指数分布的形状参数。

本文将对同一列列车旅客提前到站时间分别用上述3种分布进行拟合,通过对比拟合评价指标,选取最佳拟合分布形式。

2 最高聚集人数计算

2.1 算法流程

本文以成都东站数据为例,通过概率法确定车站旅客最高聚集人数的主要思路如图2所示,具体步骤如下。

图2 最高聚集人数计算思路

(2)确定单列车旅客集散过程。利用概率密度函数计算出单列车乘客到站人数,假设旅客匀速检票乘车,即可确定单列列车旅客集散人数序列。

(3)确定车站旅客集散过程。计算该车站一天发送的所有列车旅客集散人数序列,根据列车发车时间,汇总列车旅客集散人数序列,得到车站一天内旅客聚集情况,即可得到最高聚集人数。

在研究旅客检票出发规律时,张天伟等人[12-13]通过调研某实际候车室旅客检票数据绘制了检票速度随时间的变化曲线,认为在计算旅客聚集人数时可以考虑做匀速处理,建议取70人/min~90人/min,并可将匀速检票时间适当延长,以减小检票速度下降带来的误差。据此,本文采用匀速方式处理旅客检票上车过程,设检票速度为80人/min。

2.2 案例分析

本文基于成都东站2019年2月2日实际旅客进站数据及实际列车开行方案数据,绘制了当日成都东站实际旅客聚集人数曲线。将旅客通过检票闸机进站数据按车次分类,并计算每5 min该车次旅客聚集人数和聚集人数百分比,得到该车次的旅客聚集曲线;再将该工作日内所有车次的旅客聚集曲线进行叠加,得到整个车站在该工作日的旅客聚集人数变化曲线,如图3(a)所示,作为参照组,其旅客最高聚集人数为8887人,出现在14:45~14:50时间段内,图中用红色圆圈标注。

图3 车站旅客聚集人数

2.2.1 基于最优拟合分布

使用对数正态分布、威布尔分布及复合负指数分布分别对每一列列车的旅客提前到站数据进行拟合,计算不同拟合的拟合优度,即比较不同拟合条件下拟合优度评价指标,选取指标得分最高的拟合作为对应列车的最优拟合分布。本文以D5178次列车为例,分别采用1.3节中所述3种拟合方法对该列车的旅客到站情况进行拟合。拟合结果如图4所示,3种分布在一定程度上均可描述出旅客到站的大致趋势。拟合优度如表1所示,SSE、R2、RMSE分别表示误差平方和、可决系数和均方根误差。从表1可看出,3种分布均能较好地拟合D5178次列车旅客提前到站规律,且对数正态分布的拟合效果最好。

图4 3种拟合函数的拟合曲线

表1 D5178次列车拟合结果对比

根据该拟合分布确定不同列车各时段已到站人数占总乘车人数百分比,从而模拟旅客到站规律。拟合结果如图3(b)所示。基于最优分布的拟合结果显示,由196列列车计算得到的成都东站旅客最高聚集人数为9042人,最高聚集人数出现在14:45~14:50时间段内。

2.2.2 基于不同参数的对数正态分布

利用3种分布进行拟合后发现,对超过77%的列车而言,对数正态分布是最优分布。在拟合旅客提前到站时间分布规律问题上具有更强适用性。根据不同参数下的对数正态分布,确定不同列车各时段已到站人数占总乘车人数百分比,从而模拟旅客到站规律,拟合结果如图3(c)所示。

基于不同参数的对数正态分布的拟合结果显示,由196列列车计算得到的成都东站旅客最高聚集人数为9120人,最高聚集人数出现在14:45~14:50时间段内。

2.2.3 基于相同分布

若不考虑乘坐不同列车的旅客到站规律的差异性,以同一分布函数(对数正态分布)拟合所有列车的旅客到站时间,拟合参数取各参数的平均值,根据该分布确定不同列车各时段已到站人数占总乘车人数百分比,从而模拟旅客到站规律,拟合结果如图3(d)所示。

基于完全相同分布的拟合结果显示,由196列列车计算得到的成都东站旅客最高聚集人数为9280人,最高聚集人数出现在9:55~10:00时间段内。

2.3 对比分析

为更直观分析不同拟合方式下车站一天内的旅客聚集变化情况,绘制了不同拟合方式和实际车站旅客聚集人数对比图,如图5所示。

图5 不同拟合方式和实际车站旅客聚集人数对比

通过与原始数据对比可看出,3种拟合方式下基于最优拟合分布的计算结果更接近实际数据,能更准确地反应车站旅客最高聚集人数及其出现时间,为车站管理人员和相关工作人员合理安排组织工作提供更可靠依据。从整体趋势而言,基于最优拟合分布的计算方式在不同时刻的计算结果都较接近实际数据,且预测得到的车站全天最高聚集人数和实际数据出现时间一致,人数相近。因此,有必要分别拟合不同列车的旅客到站数据,以不同的最优拟合结果反应车站旅客聚集情况,从而更准确地计算车站旅客最高聚集人数。

3 结束语

本文分析了列车发车时间对旅客提前到站时长的影响,基于对数正态、复合负指数和威布尔3种分布对成都东站旅客聚集情况进行拟合分析,对比发现基于最优拟合分布的计算结果更接近实际车站旅客聚集数据,能够更准确地反应车站旅客最高聚集人数及其出现时间。揭示了对不同列车的旅客到站规律进行分别拟合的重要性,证明了后续研究不同列车旅客到站规律影响因素的必要性。

本文研究尚存在不足之处:(1)对旅客检票离开的处理相对简单,研究对象仅针对成都东站,未考虑不同车站、不同情况下检票闸机开放数量等因素;(2)仅在列车发车时间层面上对比了旅客提前到站时间的差异,后续可调研更多数据,从更多影响层面展开进一步研究。

猜你喜欢

检票正态分布对数
关于n维正态分布线性函数服从正态分布的证明*
指数与对数
指数与对数
北京天文馆智慧检票系统集成与实现
比较底数不同的两个对数式大小的方法
“佳联”检票系统为影院开业保驾护航
生活常态模式
基于AnyLogic 仿真的无纸质检票时间研究
神奇的对数换底公式
正态分布及其应用