APP下载

基于小波和神经网络模型的邮电业务总量预测

2013-03-18代海波

郑州大学学报(工学版) 2013年3期
关键词:小波总量向量

单 锐,代海波,刘 文

(燕山大学 理学院,河北 秦皇岛066004)

0 引言

邮电业务总量是指以价值量形式表现的邮电通信企业为社会提供各类邮电通信服务的总数量.作为国民经济的基础性、先导性、支柱性产业,邮电业在经济增长方式转变和经济结构调整中发挥着巨大的作用,对就业、收入、消费、经济增长、产业调整、竞争力提高等宏观经济的关键因素都产生了积极影响.因此,邮电业务总量作为观察通信业务发展变化总趋势的综合性总量指标,科学地对其进行预测有利于邮电部门发展规划和政策的制定,及时解决邮电业存在的问题,对促进我国邮电业进一步发展将有着十分重要的现实意义.

邮电业务总量预测是根据通信需求发展的趋势,科学地确定通信需求随时间和空间发展的过程.已有许多方法用于邮电业务总量的预测:通过邮电业务总量与三大产业生产总值的关系,利用模糊推理、聚类分析或支持向量机进行预测的方法[1-3];建立灰色模型、回归模型、ARIMA 模型或它们的组合模型进行预测的方法[4-7]. 笔者将利用极大重叠离散小波变换(MODWT)和小波神经网络对时序数列指标值进行分析,得到最能反映数据变化的数学模型,从而对邮电业务总量进行合理预测.

1 极大重叠离散小波分解

设X 是N 维向量,它的元素是实值时间序列{Xt:t = 0,…,N -1},其中抽样尺寸N 是任意的正整数,对于任意正整数J0,X 的J0层极大重叠离散小波变换是一个由J0+1 个向量,…和组成的变换,所有这些向量都是N 维的.基于极大重叠离散小波变换系数的定义有:=和J0=J0X,其中向量包含了与尺度τj=2j-1上的变化有关的极大重叠离散小波变换小波系数,向量包含了与尺度λJ0= 2J0上的平均值有关的极大重叠离散小波变换尺度系数,和是N × N 阶矩阵.

令Xt=,则有:

(2)

利用矩阵记号上式可表示为

利用矩阵记号上式可表示为

通过上面的关系式我们将极大重叠离散小波变换的细节和光滑表示为

时间序列X 可由它的极大重叠离散小波变换恢复:

2 小波神经网络

小波神经网络是小波分析与神经网络相结合的产物,是结合小波变换理论与人工神经网络的思想而构造的一种新的网络模型[8]. 目前主要有两种结合方式:一种是“松散型”,即先用小波分析对数据进行预处理,然后再送入神经网络处理;另一种是“紧致型”,即将神经网络隐含层中神经元的传统激发函数用小波函数来代替,充分继承了小波良好的时频局部化性质及神经网络的自学习功能的优点.两种结合方式如图1 所示.

图1 小波变换与神经网络的两种结合方式Fig.1 The two different combination modes of wavelet transform and neural network

大多数紧致型小波神经网络是一种以BP 神经网络拓扑结构为基础,以小波基函数为隐含层节点的传递函数,信号前向传播同时误差反向传播的神经网络.笔者所使用的小波神经网络是以Elman 神经网络拓扑结构为基础的,小波基函数使 用Morlet 小波函数,其表达式为Ψ(t)=cos(1.75t)exp(- t2/2),网络结构如图2 所示.

图2 基于Elman 网络的小波神经网络紧致型结构Fig.2 The close-type wavelet neural network based on Elman neural network

笔者采用基于Elman 网络的小波神经网络,网络输出层节点数为1 个. 而隐含层节点的数目选择是一个较复杂的问题,往往需要根据经验和多次试验来确定,因而在理论上不存在一个理想的解析式来表示. 笔者采用“0.618 法”来确定隐含层的节点数,表达公式为:

其中,m 为隐含层节点数;n 为输入层节点数;t 为输出层节点数.时间序列数据x(t)根据小波神经网络结构划分为学习训练样本向量和测试样本向量,具体划分为:输入样本x(t)= [x(t - k),…,x(t -2),x(t -1)];输出样本y =[x(t)],其中k为网络输入层节点数.

3 预测方法与实例预测

近年来,基于小波分解的模型预测方法在时间序列预测中取得了良好的效果,它将复杂的时间序列分解为一定频段的子序列,然后分层预测以降低预测难度[9].笔者采用有别于离散小波变换(DWT)的极大重叠离散小波变换对邮电业务总量序列进行分解.即:

式中:Dj为极大重叠离散小波变换的细节项;SJ0为光滑项.

对时间序列预测的神经网络模型有很多,较为常见的有BP 神经网络模型,该模型为多层前馈网络模型并广泛应用于时间序列的预测,但它常常会忽略某些巨大噪音或非平稳数据;RBF 神经网络模型具有很强的生物背景和逼近任意非线性函数的能力,常应用于复杂的时间序列预测;小波神经网络兼容了小波变换与神经网络两者的优越性,但网络大多以BP 神经网络拓扑结构为基础,易陷入局部极小和引起振荡效应[10].笔者先对邮电业务总量序列进行极大重叠离散小波分解,再利用基于Elman 网络的小波神经网络分别预测光滑项和细节项,然后各项预测值进行重构得到序列的预测值.邮电业务总量预测流程如下:

图3 邮电业务总量预测流程Fig.3 Flowchart of the business total of posts and telecommunications forecasting

下面利用本文方法(记为MOWNN 方法)分析2000 年1 月到2010 年6 月中国邮电业务总量序列,在此基础上建立预测模型,并对2010 年6 ~12 月中国邮电业务总量进行预测.

3.1 邮电业务总量数据的MODWT 分解

先对邮电业务总量序列进行1 阶差分提取出线性趋势,差分后序列呈现出明显的周期波动性.选取C(6)小波,当分解层数增加到3 层时,邮电业务总量序列的多分辨分析如图4.

如图4 所示,分解得到的细节项D3的每个波动与原始序列X 经过1 阶差分后的每个完整波动相对照,光滑项S3和原始序列X 的轮廓相吻合.如果分解层数增加到4 层,细节项D4无显著周期波动且光滑项S4的趋势性变差,这说明MODWT分解到第3 层就已经分解充分了.

图4 邮电业务总量序列的极大重叠离散小波变换多分辨分析Fig.4 The MODWT multiresolution analysis of business total of posts and telecommunications sevies

3.2 分层预测

邮电业务总量序列的MODWT 分解为X =D1+ D2+ D3+ S3,为了减少预测的子层数,将所有细节项整合为一项,即D = D1+ D2+ D3.令S= S3,则邮电业务总量序列的MODWT 分解变为X = D +S.然后对光滑项S 和细节项D 用小波神经网络模型进行建模和预测,预测步数为6 步.

在用小波神经网络模型进行建模和预测中,序列数据输入层节点数是人为确定的,输入层节点数过多会造成网络学习次数较大;输入层节点数过少则不能反映后续值与前驱值的相关关系.经反复试验对光滑项S 和细节项D 预测的模型输入层节点数的最终确定为7 个和12 个,根据“0.618 法”得出相应的隐含层节点数分别为11个和19 个.表1 给出了预测结果.

4 预测结果比较及分析

为了验证MOWNN 方法的有效性,下面给出三种预测方法进行对比.一种是单纯用三层BP 神经网络模型对邮电业务总量进行预测的方法,记为BP 方法;另一种是用基于BP 神经网络的紧致型小波神经网络模型进行预测,该方法记为WNN方法;还有一种是离散小波变换与神经网络松散型结合预测的方法(分解过程中也选取C(6)小波,分解层数同为3 层,神经网络选取三层BP 神经网络),该方法记为DWNN 方法.为了检验各模型预测的性能,给出两种误差评价标准:规范化均方根误差NRMSE 和标准化误差NE.

表1 邮电业务总量6 ~12 月预测Tab.1 The forecasting value of business total of posts and telecommunications in June to december

式中:Xi为实际值为预测值=Xi,i =1,2,3,…,M.

表2 给出了MOWNN 方法、DWNN 方法、WNN方法、BP 方法4 种方法的误差评价.

表2 邮电业务总量预测误差评价Tab.2 The error evaluation of business total of posts and telecommunications forecasting

(1)MOWNN 方法对邮电业务总量序列的预测效果最好,单纯的BP 神经网络模型方法预测的最差,而且MOWNN 方法可以实现多步预测.

(2)WNN 方法和MOWNN 方法相对于BP 神经网络模型方法,其预测精度有了很大的提高,这说明小波神经网络模型充分发挥了小波分析与神经网络两者的优点,使其具有更灵活有效的函数逼近能力和较强的容错能力,可以有效地克服普通人工神经网络模型所固有的一些缺陷.

(3)MOWNN 方法是在WNN 方法的基础上引入小波分解的方法,它的预测效果比WNN 方法要好,这说明引入MODWT 进行时间序列预测是可行的.

(4)MOWNN 方法与DWNN 方法相比,小波分析与神经网络“紧致型”结合的预测效果比“松散型”的要好.

5 结论

针对邮电业务总量预测的需要,笔者提出了一种基于小波神经网络模型引入MODWT 分解知识的预测方法.预测结果表明,该方法能够实现多步预测并较好的预测出邮电业务总量的整体趋势.与BP 方法、WNN 方法和DWNN 方法相比,该方法的预测精度更高,预测效果更好,说明了该方法是有效的、可行的.对于小波神经网络隐含层的节点数,采用了“0.618 法”进行确定,其效果并不十分理想.如果引用遗传算法确定隐含层节点数,优化网络连接的权值及阈值,这将提高小波神经网络的预测精度,进而提高整个方法的预测效果.

[1] 高洁.应用多元模糊推理预测方法进行邮电业务总量预测[J].南京邮电学院学报:自然科学版,2000,20(1):58 -62.

[2] 高洁.可拓聚类预测方法及其在邮电业务总量预测中的应用[J].系统工程,2000,18(3):73 -77.

[3] 朱明放,王树勋.基于支持向量机的邮电业务总量的预测[J].微计算机信息,2008,24(1 ~3):284-286.

[4] 吴惠荣.应用灰色模型预测邮电业务总量[J].南京邮电学院学报,1990,10(2):91 -94.

[5] 王香柯,王金柱.邮电业务总量的预测研究[J]. 西安邮电学院学报,1999,4(3):56 -59.

[6] 明喆,宋向东,胡蓓蓓,等.基于ARIMA-GM 组合模型的邮电业务总量预测[J]. 数学的实践与认识,2010,40(10):118 -123.

[7] 王燕.应用时间序列分析[M].北京:中国人民大学出版社,2005.

[8] 吕淑萍,赵咏梅. 基于小波神经网络的时间序列预报方法及应用[J]. 哈尔滨工程大学学报,2004,25(2):180 -182.

[9] DONALD B P,ANDREW T W.时间序列分析的小波方法[M].北京:机械工业出版社,2006.

[10] 傅荟璇,赵红. MATLAB 神经网络应用设计[M].北京:机械工业出版社,2010.

猜你喜欢

小波总量向量
基于多小波变换和奇异值分解的声发射信号降噪方法
向量的分解
“十三五”期间山西省与10省签约粮食总量2230万吨
2020年全国农民工总量比上年减少517万人
构造Daubechies小波的一些注记
聚焦“向量与三角”创新题
基于MATLAB的小波降噪研究
为何化肥淡储总量再度增加
总量控制原则下排污权有效配置的实施
向量垂直在解析几何中的应用