基于云计算的RBF神经网络的预测与优化
2013-11-05刘坚强
刘坚强
(湖北省咸宁职业技术学院,437100)
神经网络能用于径流序列的描述,主要是基于神经网络的函数1F线性逼近功能,从这个角度来看,神经网络可分为全局逼近神经网络和局部逼近神经网络。全局逼近神经网络的权值和可调参数在输入空间的每一点对任何一个输出都有影响,对于每个输人输出数据对,网络的每一个权值均需要调整,从而导致学习速度很慢;局部逼近神经网络对于每个输人输出数据对,只有少量的权值需要调整,从而学习速度很快。径向基函数(RadialBasisFunction,简称RBF)是一种典型的局部逼近人工神经网络,是最近几年提出和开始研究并得到一定应用的新型前向神经网络,其结构和一般前向网络相同,只是网络隐层神经元的作用过程和一般的网络不同。径向基网络由一个输人层、一个径向基神经元的隐层及一个线性神经元的输出层组成,径向基网络能较好地拟合任意有限值函数[1]。
1 BP与RBP神经网络
Rumelhart等(1986)提 出 了 多 层 前 馈 网 络(multilayer feedforward neural networks,MFNN)的反向传播(back propagation,BP)学习算法。由于使用BP算法,所以称为BP神经网络。BP神经网络是一种具有一层或多层隐层的前向网络,通常由输入层、隐层、输出层组成,三层前向型BP网络的拓扑结构。
Powell(1985)提出了多变量差值的径向基函数(radial—based function,RBF)方法。Broomhead等(1988)对径向基函数和多层神经网络进行了对比,并将RBF应用于神经网络的设计;Jackson(1988)证明了径向基神经网络对非线性连续函数的一致逼近性;Moody等(1989)正式提出了径向基神经网络,即RBF神经网络。从结构上看,RBF神经网络属于前向型网络,由一个隐层(径向基层)和一个线性输出层两个神经元层组成。与BP神经网络相比,RBF神经网络往往需要更多神经元,但RBF神经网络的训练所需时间要少。
单变量人工神经网络非线性时序模型定义为[2]:
yp为径流序列经过小波分解后不同尺度的高频成分和低频成分的重构序列,p为模型的输入节点数;iv为输出层神经元与隐层神经元i的连接权;py为网络输出值;θ为人工神经网络非线性映射,在径向基网络中为径向基函数。
2 RBP神经网络控制的特点与预测模型
2.1 RBP神经网络控制的特点
神经网络是通过大量的神经元相互联系构成的。神经网络的结构按照拓扑结构属于以神经元为节点,以节点间有向连接为边的图,可以分为层状和网状两个大类。
1)前向网络(前馈)
前向网络可以包含很多层,这种网络的特点是相邻两层神经元之间相互连接,不存在跨层连接,神经元之间没有反馈。任一神经元只能从前一层接收多个输入,并统一输出给后一层的多个神经元。前向网络中具有计算功能的节点称为计算单元,输入节点不存在计算单元。前向网络具体形式如图1所示。
2)反馈网络
反馈网络指从输出层到输入层有反馈,也包括神经元引出又回到自身的自反馈。网络中的每一个节点都可接收外界输入和其他节点的反馈输入,每一个节点成为一个计算单元。
3)相互结合型网络
相互结合型网络是一个网状结构。每一个神经元既可以作为输入,也可以作为输出,神经元之间都可以进行相互的双向联接。网络中不存在固定的层次结构,也不存在固定的信号流动方向。当施加输入信号后,网络中的所有神经元必然相互作用,共同进行信息处理。当网络中所有神经元的输出值收敛到一定程度之后才结束信息处理过程。
4)混合型网络
混合型网络是介于层次结构和网状结构之间的一种联接方式。既存在层次结构也存在同层神经元之间的互联。这样做的目的是减少神经元数量或者避免同层神经元的同时兴奋[3]。
2.2 RBP神经网络的预测模型
根据神经网络在控制器中的作用不同,神经网络控制器可分为两类:
(1)神经控制:以神经网络为基础而形成的独立智能控制系统;
(2)混合神经网络控制:利用神经网络学习和优化能力来改善传统控制的智能控制方法,如自适应神经网络控制等。
在最优决策控制系统中,状态空间根据不同控制条件被分成特征空间区域,控制曲面的实现是通过训练过程完成的。由于时间最优曲面通常是非线性的,因此又必须使用一个能够逼近非线性的结构。一种可能的方法是将状态空间量化成基本的超立方体,在这个立方体中控制作用是一个假设的常数。这个过程可由一个LVQ结构实现,需要让另一个网络充当分类器,如果需要连续信号,则可以使用表针的方向传播结构。
图1 RBF神经网络的结构
在频率学派中,概率P(A)定义为:在一个重复性的随机试验中。当试验的次数趋于无穷时,事件A发生的相对频率,而在贝叶斯分析中,概率P(A)被定义为人们对命题A的相信程度。假设A与B相关,即B中包含关于A的信息,在观测到B之前对A的相信程度是P(A),在观测到B之后,根据贝叶斯理论。我们应修正对A的相信程度
如果A表示参数(或向量)θ。B表示样本y,用概率密度函数代替概率;则贝叶斯公式为:示观测到数据之前对θ的相信程度;p(θ |y)是θ的后验分布,表示观测到数据后对θ更新的相信程度;p(y)是样本数据的边缘分布;p(y|θ)是θ给定条件下的样本分布或样本似然,即[2]:
3 基于云计算的RBF神经网络的预测与优化
(1)检验at是否与at−1,at−2,…无关 ;
(2)检验at是否与xt−2,xt−3,…无关。
对于AR(n)模型进行参数估计和适用性检验后,就可以所建立的AR(n)模型对时间序列 进行预测。
在RBF神经网络中,输入样本经过隐层处理后,在输出层实现了线性组合。实际应用中RBF神经网络的训练步骤如下:(1)确定训练样本向量、目标向量和训练参数;(2)无教师学习,通过输入层和隐层之间的训练,确定权值;(3)有教师学习,通过隐层与输出层的训练,确定权值。实证部分采用MATLAB神经网络工具箱提供的 newrb(P,t,goal,spread,mn,df)函数,其中,spread是激励函数(径向基函数)的分布密度,其取值的不同会给网络的预测能力带来很大影响,spread取值越大,则预测性能的平滑程度越好;反之,spread取值越小,预测性能的平滑程度越差,但网络的逼近程度较高。故在预测过程中通过多次调整spread的取值,观察真实值与预测值之间的误差,从而可确定误差较小、较为合理的spread值作为预测使用。
时间序列预测就是通过收集和分析某一预测变量的历史数据,建立出可以反映其规律和关系的模型,再进行趋势外推的预测方法。这种建模方法适用于从数据中只能获得少量模型的信息,或者无法将预测变量和解释变量之问的关系用函数关系来刻画的情况。过去几十年中,关于时间序列预测模型的研究和改进已经取得了很多的成果。其中应用最广的时间序列模型是ARIMA模型,主要是由于其在建模过程中利用了Box—Jenkins建模方法的统计特性。虽然ARIMA模型可以表示多种不同类型的时间序列,但是它主要的限制条件是需要预先假设模型的形式是线性的,而且无法处理数据中存在的异常值的干扰。
人工神经网络由于其灵活的非线性建模能力和容错能力,在时间序列预测中的研究和应用已经越来越多。利用它就不再需要指定某一特殊的模型形式,而且能够基于数据的特点自适应学习和训练。因此,利用这种数据驱动的方法可以对那些无法预知建模机理的问题给出更精确的解决方法。一些实证研究也表明了使用神经网络进行时间序列预测的精度要高于传统的时间序列预测方法。神经网络模型和ARIMA模型有很多相似之处。它们按照模型自身的结构都可以划分出很多不同的类型,所以模型识别对它们来说都是非常重要的问题;为了得到更好的预测结果,在建模之前有必要对数据进行预处理的转换;都需要较多的样本数据;而且要确定模型的形式都需要反复试验而且有时还需要进行主观判断;它们建模总的原则是模型的结构越简单越好,一定要避免出现过拟合现象。
[1] 刘喜梅,魏婉韵,于飞.基于人工神经网络的变压器励磁涌流的鉴别 [J].低压电器,2007,20(19):102-103.
[2] 汪洋,宇仁德,闫建华.基于径向基函数神经网络的交通事故预测 [J].交通标准化,2009,15(21):67-68.
[3] 许杨文.基于RBF神经网络的水轮机故障诊断研究[J]. 光盘技术,2009,18(02):156-157.