APP下载

改良马尔可夫模型在节假日客流预测中的应用

2021-09-28徐熠明赵寿为

软件导刊 2021年9期
关键词:马尔可夫客流量客流

徐熠明,赵寿为

(上海工程技术大学数理与统计学院,上海 201620)

0 引言

随着我国城市轨道交通事业的蓬勃发展,居民开始更多地选择城市轨道交通作为出行方式,使得地面交通客流拥堵现象得到一定程度的缓解。然而,随着客流逐渐涌入城市轨道交通,导致客流规模持续攀升[1-4],给城市轨道交通部门的运营工作带来了一定压力,因此对于客流进行合理预测逐渐成为相关部门的工作重点。其中节假日作为一年中的特殊时期,地铁车站在短时间内容易出现大客流。地铁运营部门需要提前掌握节假日期间客流量变化趋势来缓解客流压力,以此制定合理的客流组织计划及各种应急方案,以预防一系列事故的发生[3-5]。

目前有许多预测节假日客流的方法,主要分为线性预测和非线性预测两种。线性预测包括时间序列模型[6]、卡尔曼滤波模型[7-8]等,非线性预测包括非参数回归、神经网络模型、支持向量机[9-11]等。由于节假日客流量呈现随机性、波动性大的特征,使用线性预测模型会使得预测性能变差,而非参数回归、神经网络等非线性模型对于样本量的要求较高,当样本较少时,预测性能会大大降低。因此,单一模型已无法满足对预测精度的要求,需要采用组合模型对客流量进行预测。

潘丽等[12]利用灰色模型预测上海铁路客运量,再结合马尔可夫链模型对预测值进行修正;蒋艳辉[13]分析经典马尔可夫链存在的缺陷,针对其缺陷引入DS 证据理论,建立改进的组合模型;杨小芬[14]利用无偏灰色马尔可夫模型预测出我国2018-2020 年的国内游客数;王一智等[15]利用历史数据建立灰色GM(1,1)模型,结合马尔可夫链过程将随机序列状态划分为3 类,并且通过安徽省公路客流量历史数据预测近两年的公路客流量;柴武越等[16]通过比较指数平滑模型与ARIMA 模型对上证指数的预测效果,以得到更精准的预测模型;周睿等[17]选取1986-2017 年的数据分别建立指数平滑模型、ARIMA 模型及灰色系统模型,对“十三五”期间(2018-2020 年)全国水产品产量进行预测分析,结果表明3 种模型的预测精度均较高,且预测结果差别不大。由于节假日期间客流量具有不稳定、随机性强的特征,同时数据样本较少,综合考虑上述因素,本文决定采用指数平滑法与马尔可夫链组合模型对城市轨道交通节假日客流量进行预测。

基于历史节假日客流量数据,本文分析了国庆假期上海轨道交通客流分布特征,首先建立指数平滑法与马尔可夫组合模型,再根据2018-2019 年度国庆假期数据,发现组合模型预测的不足之处,并结合影响客流预测的相关因素修正预测值,之后使用粒子群算法改进马尔可夫修正系数,从而提升模型预测精度,最后使用该模型对上海城市轨道交通2020-2022 年国庆假期客流量进行预测。

1 上海轨道交通节假日客流预测模型建立

1.1 指数平滑法

指数平滑法作为时间序列法的一种,由布朗所提出,其作为一种比较传统的预测方法,通常用于中短期预测。主要计算公式如下:

其中,St为在t时刻的平滑值,yt为在t时刻的实际值,St-1为在t-1 时刻的平滑值,a为平滑系数,取值范围为[0,1]。

根据平滑次数不同,指数平滑法可分为一次指数平滑法、二次指数平滑法和三次指数平滑法等。

本文拟使用指数平滑法研究上海市轨道交通节假日客流量预测问题,基本建模过程如下:

(1)选择平滑次数。在使用指数平滑法预测之前,根据上海市轨道交通节假日客流量序列特征选择不同的平滑次数。如果序列无明显趋势特征,一般选用一次指数平滑法;如果序列有一定的线性趋势特征,则适合选用二次指数平滑法;如果序列不仅具有一定的趋势特征,还带有一定的季节性,则适合选用三次指数平滑法。3 种平滑法具体公式如下:

(2)确定平滑初值。平滑初值是指指数平滑法的初始值,3 种指数平滑法的初始值在此用表示。一般情况下均取第一项观测值作为初值,即:

(3)使用式(2)-式(4)进行计算、拟合并预测。

1.2 Holt 指数平滑法

在布朗提出的指数平滑法理论基础上,霍尔特在1957年提出衍生的Holt 指数平滑模型[18-19],主要计算公式如下:

其中,a、β分别为两个平滑系数,xk+1为修匀后的预测序列,rk为修匀后的趋势序列。

Holt 指数平滑法本质上就是二次指数平滑法,可预测具有趋势的时间序列。由于其具有结构简单、整体效果好等优点,已被普遍应用于经济管理、控制科学、教育卫生等领域,适用于对含有线性趋势的序列进行修匀。Holt 指数平滑模型与简单指数平滑模型的区别在于,其可以处理具有长期趋势的时间序列,并在处理原始数据之后直接对数据进行预测。

根据上海市轨道交通节假日客流特征,本文使用Holt指数平滑法结合马尔可夫模型研究上海市轨道交通节假日客流量预测问题。

1.3 马尔可夫理论

1.3.1 马尔可夫模型

马尔可夫理论由俄国数学家马尔可夫在1906 年提出,后被称为“马尔可夫链”。“无后效性”是马尔可夫链的最大特点,即在已知系统目前所处状态的情况下,系统未来所处状态与过去所处状态无关,这即是马尔可夫过程。马尔可夫模型可表示为:

其中,Xk+1为第k+1 时刻的状态向量,Xk为第k时刻的状态向量,P为一步状态转移矩阵。

(1)状态、区间划分。根据Holt 指数平滑法预测结果,计算原始数据与预测结果的相对误差,并根据相对误差对状态的集中程度进行划分。

其中,Ei为划分的状态区间,ai为被划分在Ei的相对误差下限,bi为被划分在Ei的相对误差上限。

(2)构建状态转移矩阵。由状态Ei经过一个时期转移到Ej的一步转移概率为pij,将所有一步转移概率排列成一个矩阵,可得状态转移矩阵,即:

(3)修正预测值。在确定状态转移矩阵后,根据某一年所处状态预测下一年可能出现的状态,然后对结果用修正公式进行修正。修正公式如下:

1.3.2 传统马尔可夫理论

马尔可夫过程作为随机过程理论的重要组成部分,在对于随机性强和波动性大的时间序列预测上有着良好的适用性,但其具有以下不足:当出现一些影响客流预测的小概率异常情况(如台风、不定期的大型活动)时,会影响马尔可夫模型对下一步状态的预测,从而影响整个运营组织客流预测的工作效率。因此,需要结合影响客流预测的相关因素对下一步状态区间的预测进行适当修正。同时,传统马尔可夫模型对预测值的修正系数β一般取0.5,并不能很好地贴近现实情况,因此可通过粒子群算法计算出最优的修正系数β,从而提升整个组合模型的预测精度。

1.4 粒子群算法

粒子群优化算法(Particle Swarm Optimization,PSO)是一种进化计算技术(Evolutionary Computation),源于对鸟群捕食行为的研究。粒子群优化算法的基本思想是通过群体中个体之间的协作与信息共享来寻找最优解。其优势在于简单、容易实现,并且不用调节过多参数,目前已被广泛应用于函数优化、神经网络训练、模糊系统控制等领域。

粒子群算法基本流程如下:

(1)初始化。首先,设置最大迭代次数、目标函数自变量个数、粒子最大速度,并在速度区间和搜索空间上随机初始化速度和位置。设置粒子群规模为M,每个粒子随机初始化一个飞翔速度。

(2)个体极值与全局最优解。定义适应度函数、个体极值为每个粒子找到的最优解,从这些最优解中得到一个全局值,称为本次全局最优解,与历史全局最优解进行比较并更新。

(3)更新粒子速度和位置。具体公式如下:

其中,ω 为惯性因子,且ω>0。C1、C2为加速常数,C1为个体学习因子,C2为社会学习因子,random(0,1)为区间[0,1]上的随机数,Pid为第i个变量个体极值的第d维,Pgd为全局最优解的第d维。

终止条件如下:①达到设定迭代次数;②代数之间的差值满足最小界限。

1.5 改良的指数平滑马尔可夫组合模型建立

本文拟采用改良的指数平滑马尔可夫组合模型研究上海市轨道交通节假日客流量预测问题,具体运算步骤如下:①选取上海市节假日轨道交通客流量序列,使用Holt 指数平滑法拟合预测,得到相关数值;②计算上海市地铁节假日客流量预测值与实际值之间的相对误差;③根据相对误差大小划定相对误差对应的区间范围;④构建马尔可夫转移矩阵,并计算预测值对应的状态区间;⑤根据上海市地铁节假日客流量预测值对应状态,使用修正系数对Holt指数平滑法的预测值进行修正,得到预测结果;⑥结合影响客流预测的因素,对步骤⑤中求出的预测结果进行修正;⑦使用粒子群算法对马尔可夫链的修正系数进行优化,提升模型整体预测精度。

2 上海城市轨道交通节假日客流特征分析

鉴于组合模型的独特优势,本文拟采用Holt 指数平滑法首先对上海市轨道交通节假日短期客流量进行预测,然后使用马尔可夫链相关理论优化预测结果。本节主要分析近年来上海市轨道交通短期节假日客流量特征,为下一节的预测分析提供参考依据。本文数据来源于上海地铁微博平台(https://www.weibo.com/shmetro)。

我国节假日主要包括元旦、春节、清明3 日假期和国庆节7日假期等,本文选择国庆节7日假期进行客流特征分析。

2.1 国庆节客流分布特征

以上海2011-2017 年国庆假期轨道交通全线客流量分布为例,国庆假期各天客流量分布趋势及历年全线客流总量分布趋势分别如图1、图2 所示。

Fig.1 Passenger flow of Shanghai rail transit during each day of National Day holiday from 2011 to 2017图1 上海城市轨道交通2011-2017 年国庆假期各天全线客流量

Fig.2 Total passenger flow of Shanghai rail transit during the National Day holiday from 2011 to 2017图2 上海城市轨道交通2011-2017 国庆假期客流总量

从图1 可以看出,国庆假期客流量分布大致呈先减后增趋势,假期前一天和后一天的客流量明显高于国庆假期客流量,2011-2017 年节假日的客流量趋势也大致相同。

从图2 可以看出,自2011 年以来,在国庆假期选择上海市轨道交通作为出行方式的人数虽有波动,但总体上呈线性递增趋势。

根据以上客流特征分析可得,国庆假期的客流量不仅具有一定的波动性和随机性,也呈现一定的趋势性。同时,由于上海市轨道交通客流量数据样本较少,单一模型已无法准确预测客流量,因此本文使用Holt 指数平滑法与马尔可夫组合模型进行预测。

2.2 节假日客流预测主要影响因素

(1)天气变化。由于城市轨道交通具有独立的运行空间和相对封闭的候车环境,所以受天气变化的影响较小。然而,由于人们在节假日期间出行的自由性,在恶劣天气条件下,很多人会减少出行,从而使客流量大幅减少。因此,节假日客流量受台风、暴雨等恶劣天气的影响较大。

(2)大型活动的举办。在节假日期间举办的不定期的大型活动(如国庆期间的旅游节、祖国诞辰周年庆等)会使轨道交通出行客流量大幅增加,从而影响客流预测精度。

(3)外来人员返程日期的变化。随着城市生活节奏的加快,许多在节假日期间返乡的外来务工人员可能会提前1~2 天返回城市,客流量也会随之出现一定的转移,使得客流预测出现偏差,在预测过程中也应该注意这一点。

(4)其他因素。如地震、海啸、大型传染病等极其罕见的现象,虽然很少发生,但也可以适当考虑进客流预测工作中。

在上述影响因素中,天气变化等因素容易使模型预测结果偏大,而大型活动等因素容易使模型预测结果偏小。本文根据实际情况调整受到各因素影响的特定日期的相对误差状态区间,从而提高模型预测精度。

3 模型预测实例

3.1 数据选取与说明

本文选择上海城市轨道交通2011-2017 年国庆假期的各日客流量作为原始数据,构建Holt 指数平滑法与马尔可夫组合模型,并结合影响客流预测的相关因素对预测精度差进行修正,最后使用粒子群算法改良整个马尔可夫组合模型的修正系数,以提升模型预测精度。

3.2 Holt 指数平滑法预测

针对2011-2017 年国庆假期客流数据,使用Holt 指数平滑法进行参数计算及初步预测。具体预测过程如下:以2011-2017 年10 月1 日的历史数据为例,2011-2017 年国庆节第一天(10 月1 日)客流数据的原始序列为[577.0,587.8,683.4,735.7,605.2,748.6,751.0],对原始序列进行Holt 指数平滑,利用R 软件求得指数平滑拟合值及相对误差如表1 所示。

3.3 马尔可夫链优化

从表1 可以看出,国庆第一天客流量相对误差的最大值为14.96%,最小值为-14.14%。当Holt 指数平滑法拟合值与真实值十分接近时,不予修正,即误差在[-0.5%,0.5%]之间时,不对原来的预测值进行修正,由此划分3 个状态区间。国庆第一天客流量预测结果的状态区间分别为E1(-14.14,-0.50]、E2(-0.50,6.28]、E3(6.28,14.96],如表2 所示。

Table 1 Holt exponential smooth fitting value and relative error(first day of National Day)表1 Holt 指数平滑拟合值及相对误差(国庆第一天)

Table 2 State interval of relative error between exponential smooth⁃ing predicted value and real value(first day of National Day)表2 指数平滑预测值与真实值相对误差状态区间(国庆第一天)

3.3.1 各年状态区间划分

对各年状态区间进行划分,如表3 所示。

Table 3 Division of state intervals of relative errors between exponen⁃tial smoothed prediction and real values(first day of National Day)表3 指数平滑预测值与真实值相对误差状态区间划分(国庆第一天)

3.3.2 状态转移矩阵构建

根据表3 相对误差的状态区间划分,可得到相对误差序列的状态转移频数,然后计算由状态Ei转移到Ej的概率,得到国庆第一天客流量的一步状态转移矩阵为:

3.3.3 计算预测值与模型预测精度对比

根据以上的状态区间划分及构建的状态转移矩阵,可得到2018 年和2019 年国庆客流量相对误差最可能位于的状态区间,如表4 所示。单一Holt 指数平滑法与组合模型的预测精度对比如表5、表6 所示。

Table 4 National Day passenger flow relative error state interval表4 国庆客流量相对误差状态区间

Table 5 Comparison of prediction accuracy between single Holt exponen⁃tial smoothing method and combined model(National Day holiday 2018)表5 单一Holt指数平滑法与组合模型预测精度对比(2018年国庆假期)

Table 6 Comparison of prediction accuracy between single Holt exponential smoothing method and combined model(National Day holiday in 2019)表6 单一Holt指数平滑法与组合模型预测精度对比(2019年国庆假期)

综合表5、表6 可知,指数平滑法与马尔可夫组合模型对国庆假期中10 月1 号、10 月4 号、10 月5 号的客流预测严重失准,因此需要结合影响客流预测的相关因素对预测结果进行修正。通过调查历史天气、大型活动等信息,可整理得到影响上海当天客流预测的重要因素,如表7 所示。

Table 7 Factors affecting the accuracy of passenger flow forecast and passenger flow forecast changes表7 影响国庆客流预测的因素及客流预测值变化情况

由表7 可知,台风等恶劣天气会使客流量大幅减少,从而使得预测值偏大。大型动漫活动的举办会使预测值偏小,返沪客流的转移也会影响到客流预测,因此需要对客流量预测相对误差状态区间和预测结果进行一定的修正。以2019 年10 月1 日为例,由于受到台风影响,其预测相对误差状态区间应由E3 修正为E1。对2018、2019 年严重失准的预测值进行修正后,模型修正前后预测精度对比如表8 所示。

Table 8 Prediction accuracy comparison before and after model correction表8 模型修正前后预测精度对比

通过表8 可以看出,经过修正后的指数平滑法与马尔可夫组合模型的相对误差均明显低于修正前的组合模型,说明改良后的指数平滑法与马尔可夫组合模型的预测更加合理、有效,可适用于轨道交通客流量短期预测。

3.4 基于粒子群算法的马尔可夫组合模型优化

使用MATLAB 软件运行算法程序后,可得到优化修正系数后的模型预测结果。传统马尔可夫组合模型与粒子群算法改良模型预测精度对比如表9 所示。

Table 9 Prediction accuracy comparison of traditional Markov combination model and improved model of particle swarm algorithm(mean absolute error)表9 传统马尔可夫组合模型与粒子群算法改良模型预测精度对比(平均绝对值误差)

由表9 可知,经过粒子群算法优化修正系数后的马尔可夫模型取得了良好的预测效果,其平均绝对值误差均小于传统马尔可夫组合模型。改良模型的预测结果更贴近于真实值,预测精度也得到了进一步提升。将其应用于上海城市轨道交通节假日客流量预测中,可为预测工作提供一种新思路。

3.5 2020-2022 年国庆客流量预测

采用改良后的马尔可夫组合模型进行预测,得到上海城市轨道交通2020-2022 年国庆假期各天客流量如图3 所示。从图中可以看出,改良后的马尔可夫组合模型预测结果与2011-2017 年国庆假期的客流趋势走向大致相同,即均呈现两边高、中间低的趋势,表明修正后的组合模型预测精度较高。

Fig.3 Passenger flow of Shanghai rail transit during each day of National Day holiday from 2020 to 2022图3 上海市轨道交通2020-2022 年国庆假期各天客流量

3.6 建议

针对以上客流预测结果,本文给出如下建议:

(1)针对节假日期间出现由于大型活动导致客流量大幅增加的情况,运营组织需要提前作好应对措施,对客流进行疏导,避免因客流量过大导致线路瘫痪的情况发生。

(2)针对节假日期间出现因受到台风等恶劣天气影响导致客流量急剧减少的情况,运营组织应适当减少车辆的调配,或在行车计划中适当多安排一些大小交路,从而使运输能力最大化,节省运营车辆维护成本。

4 结语

本文采用指数平滑法与马尔可夫组合预测模型对上海城市轨道交通节假日客流量进行预测,并结合影响客流预测的相关因素和粒子群算法对预测结果进行优化。结果显示,修正后的马尔可夫组合模型在预测2018-2019 年上海城市轨道交通节假日客流量上具有更高的预测精度,该模型可应用于上海城市轨道交通节假日客流量预测。当然,本文只针对城市轨道交通全线客流量进行了预测,尚未对不同类型车站的客流量进行更详细的预测。因此,在目前研究的基础上,可进一步针对上海城市轨道交通不同类型车站的客流量进行分析与预测。

猜你喜欢

马尔可夫客流量客流
客流增多
基于嵌入式系统的商场客流量统计算法
保费随机且带有红利支付的复合马尔可夫二项模型
基于自学习补偿的室内定位及在客流分析中的应用
基于SOP的核电厂操纵员监视过程马尔可夫模型
基于AFC数据的城轨站间客流量分布预测
人工免疫算法在电梯客流时段划分的应用
应用马尔可夫链对品牌手机市场占有率进行预测
认知无线网络中基于隐马尔可夫预测的P-CSMA协议
城市轨道交通运营客流数据分析缺陷及应对