APP下载

基于PSO-FSVR的城市轨道交通客流预测模型*

2023-11-07郝晓培张军锋王洪业毛子今

城市轨道交通研究 2023年10期
关键词:工作日客流量进站

孟 歌 郝晓培 张军锋 王洪业 李 永 毛子今

(中国铁道科学研究院集团有限公司电子计算技术研究所, 100081, 北京∥第一作者, 助理研究员)

目前,城市轨道交通(以下简称“城轨”)正向智慧化、绿色化方向发展,其中重要的前提之一就是使轨道交通系统具备预测能力,以达到自动化、系统化、智慧化的目标。智慧轨道交通需要强大的感知能力作为支持,准确掌握城轨车站的客流量是关键基础。只有精准预测未来车站客流量,才能够做出准确决策并进行快速响应,以提高城轨系统的智慧化水平。同时,在掌握客流变化趋势的基础上,可以合理安排资源配置,减少空置和浪费,达到绿色可持续发展的目标。

在交通预测领域,常用的方法主要包括专家意见法、回归分析法、支持向量机[1]、神经网络[2]及时间序列[3]等。其中:专家意见法依靠人工判断,结果较为主观,不利于城轨信息系统的自动化建设发展;回归分析法适用于变量间的相关性为线性或简单非线性的情况,不适用于复杂非线性情况;时间序列方法建立在线性平稳模型的基础上,但城轨客流并非正态分布的平稳序列,客流波动性强烈,会导致预测效果不佳;神经网络方法为非线性自回归模型,适用于大部分预测场景,但需要调整的参数较多,且网络的构建与构建者的经验有关,因此预测性能因人而异,泛化能力较弱;支持向量机具有坚实的理论基础和良好的泛化能力,尤其在解决小样本、非线性问题时具有许多优势,但由于其中参数选择的范围较大,难以获得最优参数,因此需要对其进行优化。基于此,本文提出了一种基于PSO(粒子群优化)-FSVR(模糊支持向量回归机)的城轨客流预测模型(以下简称“基于PSO-FSVR的城轨客流预测模型”),并将其应用在北京轨道交通线路的实际客流数据预测中。与常用的GRNN(广义回归神经网络)和BP(反向传播)神经网络相比,本文方法具有更加良好的预测性能,可以有效对城轨车站客流数据进行精准预测。

1 FSVR模型

SVR (支持向量回归机)是建立在有限样本SLT(统计学习理论)基础上的通用学习方法[4]。FSVR是将模糊数学和SVR相结合的一种新型的SVR,其通过引入模糊隶属度,来提高机器学习的鲁棒性和泛化能力。

FSVR的基本原理是依靠预测误差最小化寻找某一目标函数,利用非线性映射函数φ(·)将输入空间的数据点xi映射至高维空间H中,进而在H中采取线性回归方法进行计算,以获得原来低维空间中非线性回归的效果。

由于在真实环境中,数据点xi在训练过程中的贡献度有所不同,因此FSVR将模糊参数引入模型中,以消除歧义点对训练过程的影响,进而解决由其导致的过学习问题,即存在1个模糊隶属度si与任意数据点xi有联系,则最终产生的训练集含有模糊成员。

在FSVR构建时,设训练集S={(x1,y1,s1),(x2,y2,s2),…,(xi,yi,si),…,(xN,yN,sN)},其中:xi∈Rn(Rn为n维实数集),yi∈R(yi为真实值),si∈[0,1],i=1,2,…,N。在时间序列问题中,si是时间序列ti(i=1,2,…,N)的函数,模糊隶属度函数l(ti)是ti的二次函数,即:

si=l(ti)

(1)

(2)

式中:

λ——(0,1]区间内的实数。

si的边界条件为:

(3)

进而,求解二次规划问题:

(4)

(5)

式中:

ω——回归超平面权值向量;

b——偏差系数;

C——惩罚系数;

ε——回归超平面带宽;

φL(·)——拉格朗日目标函数;

式(4)的对偶形式为:

(6)

(7)

式中:

K(xi,xj)——核函数。

求解式(5),得到FSVR函数f(x):

(8)

2 PSO-FSVR模型概述

2.1 PSO算法

启发式算法在工程应用中越来越流行,且由于其易于实现和不需要梯度信息的优点,经常被用于处理优化问题。PSO算法具有快速、高效的特点[5],因此在启发式算法中脱颖而出。该理论由Eberhart等人提出,它是一种模仿飞禽寻觅食物的PSO算法,可用于对预测模型的参数进行优化。根据该理论,每只飞禽都可以被看作1个粒子,则空间中的所有粒子就会组成1个飞禽群体,任意粒子都拥有自身的位置和速度元素,粒子群中每个粒子的信息都是不断迭代和更新的,迭代中获得的粒子局部最佳位置xbest,i和全局最佳位置xbest,就是潜在的理想解。

(9)

式中:

vi(k)——经过k次迭代后粒子i的速度;

xi(k)——经过k次迭代后粒子i的位置;

τ——惯性权重;

r1、r2——[0,1]区间内的随机数;

c1、c2——学习因子。

式(7)中,vi(k)和xi(k)会不断进行改变。

2.2 PSO-FSVR模型

选择不同的核函数,可以生成不同的FSVR。选取多项式和高斯径向基两种核函数进行对比,就效果而言,高斯径向基核函数要优于多项式核函数。此外,在FSVR模型中需要确认C和ε。该模型参数的优化步骤如下:

1) 随机初始化粒子群,并对整个群体的xi(k)和vi(k)进行随机化。记录种群的全局最佳位置xbest和第i个粒子的局部最佳位置xbest,i,其中i=1,2,…,N。

2) 对于每次迭代,评估第i个粒子的适应度值。如果第i个粒子的适应度值大于记录值,则设置xbest,i为迄今为止的个体最佳位置;如果群体适应度值大于群体记录值,则设定xbest为迄今为止的群体最佳位置。

3) 计算惯性权重,并更新粒子的速度和位置。

4) 重复步骤2)、3),直到达到迭代最大值。

5) 根据最佳粒子,计算FSVR模型所需的入参值。

3 基于PSO-FSVR的城轨客流预测模型数值分析

3.1 客流量预测值与原始值对比分析

以北京地铁2号线(以下简称“2号线”)某车站2023年6月7日至2023年6月13日的进出站客流数据作为试验对象,以15 min为粒度对数据进行统计。由于地铁客流具有明显周期性,因此分别对工作日(周一—周五)及节假日(周六—周日)的进站和出站客流进行预测。经过数据清洗,筛选出1 050条数据进行数值试验,其中:训练数据975条,测试数据75条。2号线某车站节假日及工作日进出站客流部分原始数据如图1所示。

a) 工作日

由图1可以看出:地铁客流具有明显的周期特征,工作日客流量整体上大于节假日客流量;工作日高峰时段客流量可达2 500~3 000人次/15 min,节假日高峰时段客流量为1 000~1 500人次/15 min,且工作日客流具有明显的双峰值,分别为早、晚高峰时段;而节假日客流波峰不明显,基本呈现平铺波动趋势。通过观察还可以发现,进站客流与出站客流呈近似对称波动。通过基于PSO-FSVR的城轨客流预测模型对2号线某车站工作日进出站客流量预测结果见图2。节假日进出站客流量预测结果见图3。

a) 进站客流量

a) 进站客流量

由图2可以看出:2号线某车站工作日进出站客流规律明显,尤其在早晚高峰时段客流突出,其余时段客流波动相对平稳;基于PSO-FSVR的城轨客流预测模型在工作日的客流量预测结果与原始值基本吻合,尤其在客流极值点处表现较好,拥有较高的预测准确性。

通过图3能够发现:2号线某车站节假日客流量整体偏低,其峰值客流量明显小于工作日客流量;节假日各时段客流波动相对频繁,客流变化规律性较弱,预测难度相对较高。基于PSO-FSVR的城轨客流预测模型的客流量预测结果与原始值基本一致,且在客流量波动频繁的拐点处依旧能够较好地刻画出其波动规律,这证明基于PSO-FSVR的城轨客流预测模型在工作日和节假日均能够准确地对进出站客流量进行预测。

3.2 模型预测性能对比分析

为了验证基于PSO-FSVR的城轨客流预测模型的性能,引入常用的BP神经网络模型和GRNN模型作为对照组进行数值分析,分别对工作日、节假日进站客流量进行预测。其中:BP神经网络模型由正向和反向两种计算过程组成,该方法在网络理论和性能方面比较成熟,具有非线性映射能力强和网络结构柔性好等优点,但学习训练速度较慢且容易陷入局部极值,推广能力稍弱。GRNN是基于径向基函数网络的一种改进模型,学习收敛速度较快,非线性函数逼近能力强,同时克服了BP神经网络容易陷入局部极小值的问题,但解释性较差且参数确定困难。使用相同的训练集,利用3种方法分别对工作日、节假日进站客流进行预测。不同方法下2号线某车站工作日进站客流量预测结果如图4—图5所示。

图4 不同方法下2号线某车站工作日进站客流量预测结果

图5 不同方法下2号线某车站节假日进站客流量预测结果

通过图4可以发现:在工作日进站客流预测中,基于PSO-FSVR的城轨客流预测模型的客流量预测效果优于改进的GRNN和模型BP神经网络模型,且该模型在客流高峰和低谷时段的客流量预测均表现较好;GRNN模型在单调增长或下降区间内的客流量预测效果较好,但在客流高峰时段的极值点处表现不佳,BP神经网络模型的客流量预测数据虽然与原始数据相似,但整体准确率较低,尤其在客流低谷区域客流量预测结果偏小。

通过图5可以发现:GRNN模型整体客流量预测结果偏大;BP神经网络模型客流量预测趋势波动过大,且预测准确率较低;与两者相比,基于PSO-FSVR的城轨客流预测模型在节假日进站客流量预测中表现较为优秀,且该模型的客流量预测趋势更为准确,且预测精度更高。

为了更加直观地对比上述3种方法的预测性能,采用ERMS(均方根误差)、P值(显著性参数)及k(相关系数)作为指标对预测结果进行评价。其中:P值表示出现比预测结果更极端结果的概率,P值越小,预测结果越显著;k表示预测值与原始值间相关性的紧密程度,k越大,两者间的关系越紧密;ERMS表示预测值和原始值间的偏差与观测次数之比的平方根,用于体现两者间的误差,ERMS越小,预测精度越高。2号线某车站工作日客流量预测模型性能对比结果如表1和表2所示。

表1 2号线某车站工作日客流量预测模型性能对比

表2 2号线某车站节假日客流量预测模型性能对比

从表1和表2可以看出:基于PSO-FSVR的城轨客流预测模型下,2号线某车站工作日、节假日进站客流量的ERMS分别为7.010 4和8.778 5,且在3种方法中最小,代表该方法预测精度最高;基于PSO-FSVR的城轨客流预测模型下,工作日、节假日进站客流量的相关系数分别达到0.993 0和0.955 8,高于另外两种预测方法,表示PSO算法-FSVR的客流量预测结果与原始数据的趋势更加一致;在显著性上,一般认为P<0.05即为显著,3种方法下客流量预测结果的P均远小于0.05,证明3种客流量预测模型的结果均显著。由此可见,在2号线某车站工作日、节假日的进站客流量预测中,基于PSO-FSVR的城轨客流预测模型的客流量预测性能均表现得更加优异。

4 结语

通过本文分析可知,基于PSO-FSVR的城轨客流预测模型能够对城轨进出站客流进行精准预测,且性能良好。常用的GRNN模型和PB神经网络模型虽然能够预测客流量,但精度和趋势一致性均有不足;而基于PSO-FSVR的城轨客流预测模型整体预测效果稳定,且在客流极值点处的预测结果更加准确。基于PSO-FSVR的城轨客流预测模型有效地处理了客流数据的非线性情况,为城轨客流预测提供了创新的方法,并且可在类似情况下推广应用。

未来将对客流量预测方法的成本和复杂性做进一步深入分析,以期提高城轨客流量预测的效率,同时降低能耗,进一步向智能化、绿色化目标发展。

猜你喜欢

工作日客流量进站
进站口上下行载频切换时引起ATP制动问题分析
春运期间北京西站共有154.8万人次刷脸进站
地心游记(四)一位向导
基于嵌入式系统的商场客流量统计算法
关于休闲的量的问题的考察
基于AFC数据的城轨站间客流量分布预测
重庆轨道交通三号线列车进站警示功能接口电路的分析
从客流量推算公交出行PA矩阵的方法
新建旅游项目客流量分析方法初探
对《资本论》中工作日问题的哲学思考