APP下载

基于主成分分析与GA-BP网络的铁路客运量预测研究

2017-03-08杨祺煊

军事交通学院学报 2017年2期
关键词:客运量权值神经网络

杨祺煊

(军事交通学院 研究生管理大队,天津 300161)

● 基础科学与技术 Basic Science & Technology

基于主成分分析与GA-BP网络的铁路客运量预测研究

杨祺煊

(军事交通学院 研究生管理大队,天津 300161)

针对铁路客运量影响因素众多、变量之间映射关系复杂的特点,使用主成分分析方法对客运量影响因素进行处理,降低相关变量维数,消除变量间的多重共线性关系,并将转换后的变量输入到基于GA-BP的神经网络模型中,完成对于铁路客运量的预测。仿真结果表明,该模型相较于BP神经网络模型,具有更好的预测精度和更简单的结构。

铁路客运量预测;主成分分析;神经网络

铁路客运量预测是指对客运量的发展进行动态分析,并在定性基础上进行定量计算。正确预测铁路客运量,对国家的经济发展格局和资源配置,以及对铁路企业内部的投资结构、经营管理等都有重要作用[1]。但现实中的铁路客运量呈现出较大的不确定性,在春运阶段的表现尤其突出,相关预测误差会使运力安排与各地区客流聚集程度不协调。由于客运量增长影响因素不仅包括人口结构、经济社会发展水平、消费水平,还易受到突发事件的影响,如何通过相关影响因素的变化分析出可能出现的客运量异常变化,显得十分重要。

预测精度和考虑的影响因素与使用的算法密切相关。常用的预测算法有时间序列法[2]、回归分析法[3]、马尔科夫预测法[4]、神经网络方法[5-7]、组合预测方法[8]等。各种方法在样本数据需求、预测精度、运算效率、预测偏差方面都有其各自的特点,而在数据处理方法上主要有标准化、小波分析、因子分析[9]、主成分分析等。本文将对铁路客运量的影响因素进行PCA处理,分析提取主成分,在此基础之上建立利用遗传算法优化的BP神经网络,对铁路客运量进行预测。

1 PCA与GA-BP原理介绍

1.1 PCA原理介绍

主成分分析(principal component analysis, PCA)是多元统计分析中一种简化数据、特征提取的方法。它通过分析样本数据中方差最大的特征,将原变量的一系列线性组合成新的变量,使组合后的变量互不相关且最大限度保留原有变量信息。这里利用该方法对原始数据样本进行处理,提取主成分,组合成新的输入指标,再利用简化后的数据集作为模型的输入。

设有m个样本,每个样本有n维度,则整个样本数据可表示为

式中单个样本数据可表示为Xi=[xi1,xi2,…,xin],i=1,2,…,m。

PCA完整计算步骤如下:

(1)样本数据均值化处理,以消除量纲的影响。

(2)矩阵分解。令X*=YTY,对X*求其特征值λj,特征向量vj。

式中:vj为Y的右奇异向量;σj为奇异值;uj为左奇异向量。

(3)选择主成分个数。将奇异值σj从大到小排列,求其方差贡献率ηj与累计方差贡献率ηk。

一般来说,当ηk>0.95时,即视为包涵样本的绝大部分信息,此时选取的主成分为前k个。

(4)数据变换。

1.2 GA-BP原理介绍

作为预测研究中重要的新兴技术,神经网络具有良好的自学习、自适应、分布式存储等特性,在处理模式识别、非线性回归及优化等问题时展现了较大的优势。尽管如此,其自身也存在一些缺陷:由于BP算法的权值调整原则是基于误差的梯度下降,这要求调整过程的每一步都取局部最优,因此,对于某些复杂的误差曲面,BP网络容易陷于局部极小点。此外,当网络结构复杂、学习样本数目较多时,网络初始权值的取值对网络收敛与否影响很大,而标准算法中随机确定的初始权值,增加了预测结果的不确定性。因此这里使用遗传算法对BP神经网络初始权值进行筛选优化,目的在于利用其启发式搜索能力排除掉不利于网络收敛的初始权值,提高网络寻优效率。

图1所示的BP神经网络中,X=(x1,x2,…,xn)T为网络的输入向量,x0=-1将隐含层阈值转化为权值;H=(h1,h2,…,hm)T为隐含层输出向量,h0=-1将输出层阈值转化为权值;Y=(y1,y2,…,yl)T为网络的输出向量,V=(V1,V2,…,Vm)为隐含层神经元权值,W=(W1,W2,…,Wl)输出层神经元权值,期望输出向量为T=(t1,t2,…,tl)T。

图1 BP神经网络拓扑结构

各层之间信号传递方式如下:从输入层到隐含层:

hq=f(netq)q=1,2,…,m

从隐含层到输出层:

yr=f(netr)r=1,2,…,l

基于遗传算法优化的BP神经网络运算过程如图2所示。

图2 GA-BP模型原理

2 天津铁路客运量预测因素的选取与主成分分析

2.1 预测影响因子选取

铁路客运量影响因素涉及面广,根据相关文献[10-12],综合考虑区域经济发展水平、产业结构、人口结构与消费、税收情况等,选取以下13个指标作为客运量影响因素(见表1)。本文算例数据出自天津统计年鉴。

选取较多的影响因素是为了尽可能地保留并发现影响因素与客运量之间的隐含映射关系,但输入矩阵规模的扩大,会导致网络冗余。输入变量间的多重共线性会导致网络参数变化怪异,进而降低网络泛化性能[3]。对输入矩阵的主成分提

取,能在保留绝大部分数据信息量的同时尽可能降低输入矩阵维数,以少数不相关的主成分作为维度对原始数据进行重新映射,将其投影到低维空间,作为神经网络的输入(如图3所示)。

表 1 铁路客运量的主要影响因素

图3 客运量预测模型

2.2 主成分分析与输入变量提取

为去除输入数据单位及量纲的差别,首先对数据进行均值化处理[13],然后求其协方差矩阵的特征根以及相应的特征向量,根据特征值的累计贡献率筛选主成分(主要结果见表2)。

表2计算数据表明,特征值最大的主成分占有全部信息的98.8%,而前两项主成分累计达到99%以上,符合选取标准[14],完全可以用前两项主成分作为新的维度对原有数据进行映射。

由表3可知,区域GDP、第二和三产业产值、新增固定资产投资、营业税、企业所得税在第一主成分中占有较大载荷,即该主成分以较大程度反映了这方面特征。对于第二主成分,企业所得税与个人所得税则占据绝大部分比重。

表2 各主成分特征值与方差贡献

表3 各影响因素的因子载荷矩阵

2.3 PCA-GABP预测方法的结果分析

(1)有PCA处理和无PCA处理的模型遗传收敛代数与误差曲线。图4、图5所示为两种GABP模型的预测误差与遗传代数曲线,其中神经网络部分隐节点数同为4,相关参数相同,遗传算法部分除个体长度外其余参数相同。可以看出,PCA处理过的模型无论是收敛代数、收敛速度、预测精度都优于非PCA模型。非PCA模型在遗传收敛初始阶段误差加大,这与其较大的网络参数数据相关。随着遗传代数的增加,误差下降较为缓慢,网络开销较大。而PCA模型得益于较小的网络规模,遗传初始阶段误差就已经优于前者的最终误差,且在第10代时完成收敛,收敛速度有很大提高。

图 4 PCA处理过的模型遗传进化过程

图5 未经PCA处理的模型进化过程

(2)最优隐节点取值时训练预测误差图。为考察PCA对于前馈网络训练情况与预测精度的影响,这里将两种模型平均绝对误差最小的结果加以比较。采用试凑法寻找网络预测误差最小时隐节点取值,仿真结果表明:基于PCA的网络最优隐节点数为4;非PCA处理的网络最优隐节点数为7。网络训练与预测情况如图6所示。

在网络训练阶段,PCA网络与非PCA网络差异不大,前者相对于实际值的偏差较为平均,而后者拟合值明显偏大。在预测阶段,PCA网络更准确且误差分布均匀;非PCA网络预测误差更大且显著偏小。这说明在同等精度水平下,PCA能够减少前馈网络的误差偏性,将误差控制在实际值两侧。主要原因在于输入数据维数的缩减,有利于神经网络参数的优化迭代,使参数变化更加简明有效;此外,主成分之间的相对独立性会提高网络效率,提高网络识别能力。

图6 两种模型训练、预测误差比较

3 基于PCA-GABP的天津铁路客运量预测与评价

将PCA处理过的样本输入到网络中,三层前馈网络隐节点数为4,网络结构为2-4-3;训练次数epochs=1 000,学习速率lr=0.1;遗传优化阶段个体数目NIND=50,最大遗传代数MAXGEN=50,交叉概率Px=0.8,初始变异概率Pm0=0.01,代沟GAP=0.95,选择操作为随机遍历采样,交叉操作采用单点交叉,变异操作使用离散变异算子;同时使用未经PCA处理的样本作为GABP网络输入建立对比模型,遍历实验表明其最优隐节点数为7,网络结构为13-7-3,其余参数不变。两个模型使用1999—2010年数据作为训练样本,2011—2013年样本作为预测样本,预测结果及误差分析见表4、表5、图7。其中:MAE为平均绝对误差,RMSE为均方根误差。

表4 两种模型预测结果对比

表 5 两种模型训练及预测误差分析

图7 两种模型训练均方误差比较

由表5可知,就训练误差而言,GA-BP比PCA-GABP拟合度更高,但其预测误差则远远大于PCA模型。尽管非PCA方法平均拟合度较好,由图7可以看出,个别点拟合偏差不稳定。训练次数过多或训练精度过高时,BP网络存在过拟合的趋势,可能导致网络泛化能力减弱。这里输入数据维度之间的冗余与线性关系,加上BP网络基于经验最小化的特点,会进一步降低其泛化能力[15]。若要减少过拟合的影响,就要控制训练数据输入次序与训练迭代步数,这会使模型预测能力带有较大的不确定性。相比之下,PCA-GABP模型由于其相对较少的输入变量、简单的网络结构,因而在寻优速度与预测精度方面具有明显优势。

4 与传统神经网络模型的比较

为探讨该网络模型与传统神经网络在客运量预测方面的性能,这里将广义回归神经网络(generalized regression neural network, GRNN)、BP网络和本文模型同时对算例进行预测,对比分析其性能优劣。以均方根误差最小化为原则确定GRNN其最优光滑因子(Spread)为0.4,BP网络最优隐节点数为31,GRNN网络隐层中心由K-MEANS聚类确定,隐层至输出层权值由最小二乘法确定,其余网络参数同PCA-GABP模型一致。具体仿真结果见表6。

表6 不同网络模型训练及预测结果分析

由表6可知:没有经过优化的BP网络在训练误差上有一定的优势,但在泛化性能上表现出较大劣势,这是由于网络误差面的结构和学习算法特性使其容易陷于局部极小,且训练结果还受到初始权值的影响,进而影响网络性能。GRNN以结构简单、训练速度快等特点著称,这里突出表现为较小的训练误差,但面对较多的输入变量时,其经验风险最小化的特点与过于简单的学习算法会使其泛化性能较差。相比之下,结合了PCA方法的GABP网络,在客运量预测方面表现出更强的泛化性能与较简单的结构。

5 结 语

本文利用主成分分析技术对影响铁路客运量的因素进行处理,将取出主成分并输入到利用遗传算法优化的BP网络中,从而对客运量进行预测。实验结果表明,该模型能有效降低输入数据规模并且具有较好的训练速度。不同模型的对比结果也说明该模型较一般网络模型具有更好的预测精度,印证了其在客运量预测方面的优势。由于这里使用的是各年份的数据,对于更细的客运量数据划分如季度、月,该模型的预测能力尚不可知,有待继续研究。

[1] 侯福均, 吴祈宗. BP神经网络在铁路客运市场时间序列预测中的应用[J]. 运筹与管理, 2003, 12 (4): 73-75.

[2] 潘迪夫,刘辉,李燕飞.风电场风速短期多步预测改进算法[J].中国电机工程学报, 2008, 28(26): 87-91.

[3] 李晓刚,贾元华,敖谷昌.基于主成分分析的公路客运量预测模型研究[J]. 公路标准化, 2009(5): 77-81.

[4] 芮海田,吴群琪,袁华智,等. 基于指数平滑法和马尔科夫模型的公路客运量预测方法[J]. 交通运输工程学报, 2013, 13(4): 87-92.

[5] 王卓,王艳辉,贾利民,等. 改进的BP神经网络在铁路客运量时间序列预测中的应用[J]. 中国铁道科学,2005,26(2): 127-131.

[6] 吴伟,符卓,王晓.运输通道客运量预测方法[J].铁道科学与工程学报,2012,9(5): 96-102.

[7] SPECHT D F. A general regression neural network[J]. IEEE Transactions on Neural Works, 1991, 2(6): 568-576.

[8] 刘纯,范高锋,王伟胜,等.风电场输出功率的组合预测模型[J].电网技术, 2009, 33(13): 74-79.

[9] 王学仁,王松桂.实用多元统计分析[M].上海:上海科学技术出版社,1990:270-344.

[10] 姚新胜,苏延川,孙金玲. 公路客运短期运量预测研究[J]. 公路交通科技, 2005, 22(11): 155-158.

[11] 陆化普.交通规划理论与方法[M]. 北京: 清华大学出版社, 1998:47-59.

[12] 杨洋.基于运输一体化的区域交通运输需求预测研究[D]. 长春: 吉林大学, 2006.

[13] 徐雅静, 汪远征.主成分分析应用方法的改进[J].数学实践与认识,2006, 36(6):68-75.

[14] SANDHYA S.神经网络在应用科学和工程中的应用—从基本原理到复杂的模式识别[M].史晓霞,译.北京:机械工业出版社,2009: 7.

[15] 周松林,茆美琴,苏建徽.基于主成分分析与人工神经网络的风电功率预测[J]. 电网技术,2011,35(9):128-132.

(编辑:史海英)

Prediction of Railway Passenger Volume Based on PCA and GA-BP Network

YANG Qixuan

(Postgraduate Training Brigade, Military Transportation University, Tianjin 300161, China)

Considering numerous factors influencing railway passenger volume and complex mapping relation among variables, the paper firstly deals with the influencing factors with PCA (principal component analysis) method and reduces the dimension of related variables to eliminate multiple co-linear relations between variables. Then, it enters the converted variables into neural network model based on GA-BP and predicts the railway passenger volume. The simulation result shows that this model is more accurate and simpler than BP neural network model.

railway passenger volume prediction; PCA (principal component analysis); neural network

2016-04-19;

2016-09-02.

杨祺煊(1991—),男,硕士研究生.

10.16807/j.cnki.12-1372/e.2017.02.021

U491

A

1674-2192(2017)02- 0084- 06

猜你喜欢

客运量权值神经网络
一种融合时间权值和用户行为序列的电影推荐模型
基于递归模糊神经网络的风电平滑控制策略
基于线网稳定期的地铁客运量预测方法研究
基于5G MR实现Massive MIMO权值智能寻优的技术方案研究
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
东北地区轨道交通日客运量探究
强规划的最小期望权值求解算法∗
程序属性的检测与程序属性的分类
基于Q-Learning算法和神经网络的飞艇控制