APP下载

基于ELM和LSSVM的客流量预测模型

2018-09-12张克申安俊峰孙二杰赵帅芦潇卢萌萌

电子产品世界 2018年8期
关键词:权重混合

张克申 安俊峰 孙二杰 赵帅 芦潇 卢萌萌

摘要:涉及一种基于滚动式地铁人流量混合预测方法,采用的是双预测算法,双预测通道的模式;双预测方法指的是预测用到了ELM神经网络和LSSVM两种算法混合组成。双预测通道指的是采用两个不同的滚动序列基数进行预测。最后根据不同方式确定权重大小,并且得到混合预测数据模型。

关键词:ELM;LSSVM;滚动;权重;混合

DOI: 10.396 9/j.issn.1 005-5 517.2 01 8.7.01 8

0 引言

地铁中,客流量分析是一个很重要的领域,客流量的多少直接影响到安全,城市的经济发展等重要因素。地铁的客流量多少对乘客的出行有很大的警示作用。

AFC(自动售检票)系统可以获得很大的客流量信息,可以进行设置,获得每分钟、每小时、每天、每月、每季度、每年的数据信息,并且可以按照车站每类整理,形成庞大的数据信息,信息量的充足和庞大足够支撑大家去进行分析和预测,并且因为数据量的充足和庞大,可以对感兴趣数据进行分类整合,组成想要的数据信息进行研究。

收集大量的客流量数据后,以每半年或者每年为单位作为数据统计,有效地去预测未来五年或者未来十年,甚至未来二十年的数据,对于地铁线路的规划,市政建设的布局都有着指导性的作用。

并且现有的预测算法都是针对于已知的数据进行分析和预测,进而研究一种预测方法去预测未知数据是有必要的。目前存在的预测方法是用已知的数据做研究,即知道数输入数据和输出数据,进行研究和挖掘,但是往往未来的的输入数据是未知的,那么带来预测很大的不方便,但是预测有着很重要的作用。因此针对未知数据的预测是个有力的应用。

本文提出一种基于滚动式地铁人流量混合预测方法,并且将数据传递给AFC系统,由AFC系统来完成相关的预警信号。

1 原理简介

1.1 ELM神经网络

ELM是一个神经网络的形式,结构由输入层、隐含层和输出层构成,具有局部记忆模块和局部反馈连接的前向形式的神经网络。具有训练速度快,误差不大,不容易陷入到局部最优值的特点。

其中带有m个隐含层节点的ELM的网络结构式(1)所示:

其中p.、q.是学习参数,n.是连接第i个隐含层节点与输出层之间的权重,g(pix+qi)表示的是当输入是X的时候,第i个隐含层节点的输出数值。

1.2 LSSVM介紹

LS-SVM和SVM有很重要的联系和区别,下面有所比较。

(1)优化问题的构造

SVM目标函数采用了误差因子的一次项,LS-SVM采用了误差因子的二次项,同时约束条件的先定下,SVM采用不等式约束,LS-SVM采用等式约束形式。

(2)优化问题的求解

SVM求解QP问题中,变量维数和训练样本的个数是一样的,而LS-SVM方法借助求解线性方程组达到了最终的决策函数,在某些方面上降低了求解难度,提高速度。

(3)解的稀疏性

SVM中,需要解决QP问题,目标条件是达到全局最优解,并且,大部分的Lagrange乘子均为0。在LS-SVM方法中,目标函数采取了误差平方项,约束条件是等式,通过一定的处理方式,把SVM的QP问题转化成线性问题,因此Lag range乘子与误差项成比例关系,但是LS-SVM方法通过对最终求解得到的Lagrange乘子进行排序,同样的情形下,可以实现解的稀疏性。

2 具体实施过程

2.1整体构架

本文主要涉及双通道、双预测模型,如图1所示,主要包括以下步骤:

(1)从AFC(地铁中的自动售票系统)获得整理出入流量数据。

(2)双通道预测的过程,具体操作如下:

(a)比如采样频率为1,组成序列为A,滚动序列[Al,A2,A3…An],预测第(n+1)个数据,然后用预测的结果A(n+1)与原来的序列[Al,A2,A3…An]组成新的序列[Al,A2,A3,.An,A(n+1)],用新的序列预测第(n+2)个数据。以此类推,得到一个通道的预测数据,此种方式记成通道1。

(b)开始选择的滚动序列基数是[A2,A3,……An]一共(n一1)个数据,预测第(n+1)个数据,然后用预测的结果A(n+1)与原来的序列[A2,A3,..An]组成新的序列[A2,A3,.An,A(n+1)],用新的序列预测第(n+2)个数据。以此类推,得到一个通道的预测数据,此种方式记成通道2。

值得一提的是,上述的(a)、 (b)步骤中选择的基数不一定是[Al,A2,A3,¨An]、[A2.A3…An]等这样的数列,也可以采用别的[A2,A3,.An]、[A3…An]等形式。

(3)进行决策获得未来预测数据的过程,具体操作如下:

通过上述步骤(2)的(a)、 (b)两个步骤,我们可以得到针对通道1通道2的两个预测数据序列。在这里,通道1的预测数据记成[A(n+1),A(n+2)……A(n+m)],通道2的预测数据记成[Ab(n+1),Ab(n+2)……Ab(n+m)];与上述的两个通道的序列求加权平均作为最后的预测结果,即(w1*[Ab(n+1),Ab(n+2)……Ab(n+m)]+w2*[A(n+1),A(n+2)……A(n+m)]),其中wl和w2是ELM神经网络和LSSVM的权重。

2.2通道预测模型和确定

假设滚动序列[Al,A2,A3,..An]预测第(n+1)个数据,用ELM得到的结果是AA (n+l),svm预测得到的是AB(n+l),取加权平均数作为第(n+1)个数据的预测结果,记A(n+1)=(AA(n+1)+AB(n+1))/2),然后用预测的结果A(n+1)与原来的序列[Al,A2,A3,¨An]组成新的序列[Al,A2,A3,.An,A(n+1)],用新的序列预测第n+2个数据;用ELM得到的结果是AA (n+2),LSSVM预测得到的是AB(n+2)。那么取加权平均数作为第(n+2)个数据的预测结果,记A(n+2)=(AA (n+2)+AB(n+2))/2),以此类推。

假设滚动序列[A2,A3…An]预测第(n+1)个数据,用ELM得到的结果是AA(n+l),LSSVM预测得到的是AB (n+l),那么取加权平均数作为第(n+1)个数据的预测结果,记A(n+1)=(AA(n+1)+AB(n+1))/2),然后用预测的结果A(n+1)与原来的序列[A2,A3,¨An]组成新的序列[A2,A3,¨An,A(n+1)],用新的序列预测第(n+2)个数据;用ELM得到的结果是AA (n+2),LSSVM预测得到的是AB (n+2),取加权平均数作为第(n+2)个数据的预测结果,记A(n+2)=(AA(n+2)+AB(n+2))/2),以此类推。

通过上述两个步骤,我们可以得到针对通道1通道2得到的两个预测数据序列,在这里通道1的预测数据记成[A(n+1),A(n+2)……A(n+m)];通道2的预测数据记成[Ab(n+1),Ab(n+2)……Ab(n+m)];与上述的两个通道的序列求加权平均作为最后的预测结果,也就是(w1★[Ab(n+1),Ab(n+2)-……Ab(n+m)]+w2*[A(n+1),A(n+2)……A(n+m)])。其中,wl和w2是ELM神经网络和LSSVM的权重,其中本文按照2.3的方法,得出的权重wl =0.49,w2 =0.51。

2.3关于权重的确立方法

(1)标准差法确定权重:其中s.是第i个模型的标准差。(2)误差平方和倒数法

其中模型的误差平方和如公式(3):

公式(4)中,qi-1表示第i个模型误差平方和的倒数。

本文确定权重的步骤如下:

(1)选取i个数据做训练,得到真实值和预测值,其中ELM的预测值看成El,E2,…Ei,LSSVM的预测值看成11 ,12,…li,真实值为Rl,R2,…Ri;

(2)按照公式(2).确定ELM和LSSVM的权重wl,w2;

(3)按照公式(4),确定ELM和LSSVM的权重w3,w4;

(4)计算混合模型的误差平方和,按照公式 (5) :

其中按照wl,w2两种权重得的混合模型的误差平方和是fl,按照w3,w4两个权重得到混合模型的误差平方和是f2。

(5)比较上述步骤fl、f2,如果flf2,那么最后权重选择w3. w402.4预测结果

图3、图4、图5是本文经过编程预测得到的数据结果,分别是通道1、通道2及最终决策的预测结果。3结论

采用本文方案与现有技术相比,具有以下的优点和积椴效果:

(1)有AFC系統提供相应的客流量数据信息,然后有预测方案进行双通道预测,预测得到的信息传递给AFC系统,并且如果客流量达到很大的高峰时候,进而进行相关的预警信息,由AFC系统提前告知乘客,或许有相关的拥挤预报,请乘客提前选择交通方式。

(2)本文采用网络的数据流量进行数据整合和挖掘,对于现有的数据进行整理,然后用这些数据进行对于未来未知的数据进行预测,是一个相当可观的使用方法。

(3)应用本文方案可以对五年、十年乃至二十年的城市地铁的人流量进行预测,提前做好规划,对于地铁设计和城市布置有着很重要的预测和导向作用。 本文所涉及的方法不是针对现在有的数据进行试验,而是对未来不知道的数据进行预测和分析,同样适用于相关的金融市场,比如股票未来的走势预测、基金的预测、未来人类的寿命预测等具有很大的参考价值和实际意义。

猜你喜欢

权重混合
混合宅
权重常思“浮名轻”
Lp-混合阵列的Lr收敛性
一起来学习“混合运算”
为党督政勤履职 代民行权重担当
基于公约式权重的截短线性分组码盲识别方法
油水混合
片烟混合干燥模型的建立
混合所有制
基于权重学习的图像最大权对集匹配模型