基于小波分析与ARIMA模型的城际高铁客流量预测
2020-08-13孙尹硕潘思敏耿立艳于建立
孙尹硕 潘思敏 耿立艳 于建立
摘要:城际高铁客流量序列呈现出不平稳和波动性特征,常规预测方法很难对其进行精准预测。为提高城际高铁客流预测精度,先通过小波分析对高铁客流量数据进行平稳化处理,再构建自回归差分移动平均(ARIMA)模型进行预测。应用该方法预测某城际高铁站日客流量,结果表明,本文提出的方法获得了更高的高铁客流量预测精度。
关键词:高铁客流量;小波分析;ARIMA模型;预测
由于城际高铁客运系统受到多种复杂因素的共同作用,其客流量数据序列呈现出不平稳与波动性特征。小波分析能够将具有波动性的城际高铁客流量数据进行分解重构的处理,既能精准的进行时频双分析,又能使城际高铁客流量序列变得平稳。自回归差分移动平均(ARIMA)模型[2]是一类用于分析时间序列数据随机模型,简单易操作,但对于不平稳波动性数据的差分损失了大量信息,使得数据的预测与真实值有较大偏差。本文将小波变换与ARIMA模型相结合(文中以下简称W-ARIMA模型)预测高铁客流量,充分发挥两者的优势,提升高铁客流量预测精度。
1. W- ARIMA模型
1.1小波分析
基于正交多分辨分析的小波变换将信号通过共轭滤波器进行分解和还原,通过Ingrid Daubechies正交小波构造方法构造具有紧支撑和较好正则性的Daubechies小波。在小波变换物理意义的分析中,小波变换将数据以图形方式表达,使信息更加紧凑。小波变换将原始像分解,得到“模糊像”和“细节像”。
1.2ARIMA模型
ARIMA模型是对数据进行差分后建立ARMA模型。由于建立ARMA模型的前提条件是时间序列的均值和方差没有发生系统变化,ARMA模型要求数据具有平稳性的特性。差分是对求导的近似,数据在差分后具有很好的平稳性。
ARIMA模型的差分能使数据更好地适用模型,但不能过多进行差分, 因为通常信息的加工会造成信息的损失,差分掉的数据没有参加模型拟合。
1.3W- ARIMA模型构建
对于变化较平滑的数据而言,被差分掉的信息之间的差异较小,适于建立ARIMA模型。而城际高铁客流量数据具有明显的不平稳性和波动性特征,不适合用ARIMA模型直接预测。W-ARIMA模型首先通过小波分析中的Mallat算法进行对城际高铁客流量数据进行分解处理,再对分解得到的小波系数建立ARIMA预测模型。
在mallat算法中,小波的低频分量相当于小波通过低通滤波器,是信号向低频基的投影,即得到的部分是小波变化缓慢的部分——“模糊像”。如,在haar小波中“模糊像”是以相邻两点的平均值来代替原来的两点的数值,由于“模糊像”留下的数据是相邻两点的平均值,所以它依然能近似地反映图像的整体状态[1]。“模糊像”降低数据的离散程度,“模糊像”的离散系数或在归一化消除量纲后的方差值均小于原数据的离散系数或在归一化消除量纲后的方差值。处理后得到的低频时间序列数据会变得平缓,进行差分时差分掉的数据所携带的信息减少,信号方差的系统变化减弱,此时则适合于应用ARIMA模型进行预测。
而高频部分的系数可看作是小波窗范围内数据的加权求和(权重和为零),是数据的差异平均,小波的高频分量相当于小波通过高通滤波器,得到的部分是小波变化迅速的部分——“细节像”。此变换与数据的差分处理效果相同,可通过数据的平稳性检验,同时由于正交小波变换的矩阵是酉矩阵,在进行信号重构时产生的误差微乎其微。
若低频“模糊”处理效果不明显时可继续进行下一级小波分解,当高频系数的拟合不好时,还可以对高频系数进行同样的小波分解,循环使用小波数据平稳化法。
2.实证研究
2.1数据描述
以某城际高铁站日客流量数据为例进行实证研究,时间区段为2017年2月27日至2017年12月30日,共306个样本。图1为高铁站日客流量的自相关和偏自相关图,从图1可看出,自相关图在约200阶后出现拖尾现象,而偏自相关图没有任何拖尾或截尾现象,表明原城际高铁站日客流量具有不平稳性,不适合直接建立ARMA模型。
2.2小波分解
用小波滤波器系数构造小波矩阵,时间序列向量与小波矩阵相乘得到时间序列数据的小波分解结果——低频系数和高频系数。图2、图3分别为高、低频系数的自相关和偏自相关图。从图2和图3可看出,自相关图出现拖尾现象,而偏自相关图出现截尾的现象,所以,高低频系数差分后的数据适合建立ARMA模型。
2.3预测过程
在306个样本中,从第1天至第50天,每次取当日及以后的256个数据,前256个样本用于模型构建和系数估计,后1个样本用于检验模型的预测精度。利用小波滤波器系数构造256阶和258阶方阵,对前256个样本数据进行一级小波分解和ARIMA模型预测,将数据的分解值和预测值进行小波重构可得到的2个预测数据,取第一个作预测结果。
2.4结果分析
同时利用ARIMA模型直接对城际高铁客流量进行预测,比较W-ARIMA模型和ARIMA模型的预测结果。选用均方根误差(RMSE)、平均绝对误差(MAE)、平均百分比误差(MPE)、西尔统计量(Theil)四项评价指标比较W-ARIMA模型和ARIMA模型的预测性能。
表1为W-ARIMA模型和ARIMA模型的预测结果,在所选取的样本期内,W-ARIMA模型的预测性能明显优于ARIMA模型,主要体现W-ARIMA模型的RMSE、MAE、MPE和Theil值均小于ARIMA模型的对应值。由此可见,经小波变换后,ARIMA模型能更有效利用数据信息,进而提高高铁客流量的预测精度。
图4为W-ARIMA模型和ARIMA模型的预测值曲线图。由图6可看出,W-ARIMA模型较好地预测出城际高铁客流量每日流量,客运量预测值均比较接近于实际值,而ARIMA模型的客流量预测值与每日实际值偏差较大。
3.结论
本文提出一种结合小波分析与ARIMA模型的高铁客流量预测模型。实证研究结果表明,该模型与ARIMA模型相比,能更好的利用非平稳数据信息,预测能力较强。
参考文献
[1]张旭俊.用小波矩阵分析Mallat算法的物理几何含义[J],江西电力,2010 ,34(1):18-22.
[2] BOX G E P, JENKINS G M. Time series analysis: forecasting and control[M]. San Francisco:Holden Day, CA,1976.
[3]耿立艳.基于波动聚集性的城际高铁客流量预测[J].铁道科学与工程学报, 2019,16(8) :1891-1892.
[4]杨叔子.时间序列分析的工程应用(上册)[M].2版.武汉:华中科技大学出版社,2007:236-237.
[5]珀西瓦尔.时间序列的小波方法[M].北京:机械工业出版社,2004.
基金项目:2019年度大学生创新创业训练计划项目“基于特性分析的城际高铁客流智能预测方法研究”(项目编号:201910107007);国家自然科学基金青年项目(项目编号:61503261);2019年度河北省人才培养工程項目(项目编号:A201901048);2019年中国物流学会、中国物流与采购联合会面上研究课题(项目编号:2019CSLKT3-020)。
通讯作者:耿立艳(1979-),女,天津人,教授,博士。