APP下载

迟滞Elman网络模型的风速序列预测

2015-04-19修春波

天津工业大学学报 2015年4期
关键词:隐层风速神经元

修春波,王 柳

(天津工业大学电气工程与自动化学院 天津 300387)

迟滞Elman网络模型的风速序列预测

修春波,王 柳

(天津工业大学电气工程与自动化学院 天津 300387)

为提高风速序列预测的准确性,在双承接层Elman网络的基础上提出了迟滞Elman预测网络.网络具有输入层、隐层、隐层承接层、输出层以及输出承接层5层结构,并在隐层承接层和输出承接层的单元中增加了迟滞激励响应函数,从而将迟滞特性引入到Elman网络中,以提高网络处理连续信息的能力.选择梯度下降方法作为网络的学习算法,训练网络的权值及迟滞参数,利用该预测网络实现了风速序列的多步预测分析.仿真实验结果表明:迟滞特性的引入能够减小预测结果的随机波动性,有利于提高预测结果的可靠性,与现有预测方法相比,迟滞Elman网络的平均预测误差能够减小8%以上,整体预测性能以及波动较强的局部预测性能都能得到显著提高.

迟滞;Elman网络;风速序列;预测

风电作为一种新能源具有良好的发展和应用前景,但风速具有随机性、间歇性等不确定性特点,这给风电的大规模并网带来了巨大的困难,也是造成风电高成本的主要原因[1-3].目前认为,有效的短期风速预测可减少系统备用容量,降低风电成本,进而解决风电并网问题[4-5].目前短期风速预测可大致分为物理方法和统计方法[6].物理方法是利用数值天气预报系统得到风速、风向、气压、气温等天气数据,根据风力发电机组周围的物理信息得到风电机组轮毂高度的风速、风向等信息;统计方法即根据历史数据建立风速的预测模型,实现风速的短期预测.常用的统计方法有聚类统计分析法、人工神经网络法、灰色模型法(GM)、粒子群优化算法、小波分析法、组合预测法、空间相关性方法和支持向量机法等[7-10].由于很多情况下,数值气象预报模型无法获得,例如目前没有专门服务于风电场的数值气象预报模型可以利用,因此,基于历史数据的风速预测研究具有更重要的应用前景[6].在基于历史数据的风速序列预测中,自回归滑动平均模型(ARIMA)是经典的预测模型,但该方法对时间序列的平稳性等有较严格的要求,并且模型定阶过程比较繁琐[11].另外,风速序列产生机理不明确,许多基于数学模型的预测方法很难得到有效应用.神经网络方法特别适合于黑箱系统的建模,因此对于具有复杂非线性特性的风速序列预测问题,神经网络表现出了良好的适用性.以BP神经网络为代表的前向型神经网络在风速序列预测中取得了较好的应用效果[9-10].不过,由于BP神经网络实现的是输入与输出之间的静态映射,而风速序列具有复杂的非线性特性,静态映射网络很难获取被预测序列中蕴含的规律信息,因此,在波动剧烈的风速序列预测中,预测误差较大. Elman网络是一种具有映射动态特性的反馈型神经网络,在系统动态建模过程中具有良好的性质[12].因此,Elman网络在风速序列的预测中也取得了一定的进展.一般来说,网络的结构对系统的预测结果具有重要影响.Elman网络利用承接层将隐层状态进行反馈,使得隐层能够利用前一时刻的状态信息,从而提高信息的利用量,获得优于静态网络的预测性能[12].在此基础上,文献[13]将输出层也采用隐层连接的方式实现反馈,即增加了输出的延迟反馈,构造出了双承接层的改进Elman网络,进一步增加了网络的信息利用量,提高了网络的应用性能.现有生物实验表明,自然生物神经元具有迟滞响应特性,迟滞特性能够增强网络的记忆能力,减少神经元状态的错误改变,提高网络的稳定性[14-15].因此,本文将迟滞特性引入到上述双承接层Elman网络中,构造出迟滞Elman网络,并将其应用于风速序列短期预测中,利用迟滞特性提高Elman网络对历史状态的记忆能力,提高网络对连续信息的处理能力,减小输出结果的随机波动,改善网络的预测性能.

1 迟滞El ma n网络

1.1 网络结构

传统Elman神经网络具有4层结构:输入层、隐层、承接层和输出层.文献[13]提出的改进Elman网络在输出层也加入了承接层,构造出双承接层的Elman网络.其中,承接层1为隐层的承接层,承接层2为输出层的承接层,如图1所示,网络的输入层有m个单元(u1,u2,...,um),隐层有n个单元(x1,x2...,xn),隐层的承接层1也有n个单元,输出层有p个单元(y1,y2,...,yp),输出层的承接层2也有p个神经元两个承接层的作用分别是将隐层和输出层前一时刻的输出进行存储,并反馈给隐层和输出层,与传统的Elman网络相比,网络增加了输出层的延迟反馈,提高了网络的信息利用率.

图1 改进Elman网络结构Fig.1 Structure of improved Elman neural network

1.2 网络模型

风速序列的变化具有连续性,后一时刻的风速可看作是在前一时刻风速的基础上增加风速的变化量而获得的.尽管双承接层Elman网络增加了输出层的关联反馈,将输出的历史信息反馈回网络中,但在网络中却没有体现信息连续性的机制.这是由于目前神经网络中所用的神经元模型是忽略了各种非线性特性的简化模型,为了提高网络的信息处理能力,可有针对性地在现有神经元中增加必要的非线性特性.例如,现有的生物学实验研究表明,生物的神经元响应通常具有迟滞特性,迟滞特性体现了生物神经系统对连续性信息的记忆行为和记忆能力.因此,将迟滞非线性特性结合到现有的神经元中,构造出具有迟滞特性的神经网络,能够提高网络对历史信息及连续信息的利用率,从而改善网络的信息处理能力[14-15].

为此,本文在上述双承接层ELman网络的基础上,将2个承接层中的神经元改为具有迟滞激励响应特性的神经元,由此构造出适用于处理连续性信息的迟滞Elman网络.

所构造的迟滞Elman网络数学模型可表述为:

式中:u(lk)为神经网络第k时刻的第l个输入量;为神经网络输入层第l个输入单元与隐层第i个单元之间的连接权值;为承接层1第l个单元的输出为承接层2第t个单元的输出;xi(k)为隐层第i个单元在k时刻的输出;为神经网络承接层1的第l个输入单元与隐层第i个单元之间的连接权值;为神经网络隐层第i个单元与输出层第j个单元之间的连接权值;为神经网络承接层2的第i个单元与输出层第j个单元之间的连接权值;yj(k)为输出层第j个单元的输出;g()为输出层的激励函数;f()为隐层的激励函数;h()为承接层的迟滞激励函数.输出层与隐层选用传统的Sigmoid函数作为激励函数,而承接层的激励函数选式(5)的迟滞响应函数:

式(5)中,a和b为迟滞参数.承接层的激励函数是由2个发生了左右平移的Sigmoid函数构成的,该函数在(-∞,+∞)区间内构成一个迟滞环,函数的响应结果不仅与当前的输入有关,而且与历史状态有关,它可根据数据的变化趋势选择不同的分支进行响应.与直接反馈相比,迟滞响应能够保证神经元的状态是在上一时刻状态的基础上进行变化,从而减少状态变化的随机波动幅度,提高网络输出序列的稳定性.

网络的参数训练仍然采用梯度训练方法,与传统训练方法不同的是,被训练的参数还包括迟滞参数a和b.由于迟滞参数a和b分别决定不同的迟滞分支形状,而神经元每次只能有一个分支实现激励响应,因此迟滞参数a和b每次只有一个能够实现训练,即哪个分支实现激励响应,哪个迟滞参数就可被训练调节.

迟滞Elman神经网络的特点是隐层和输出层的输出分别通过承接层1和承接层2进行反馈,并作为隐层和输出层的一部分输入,提高网络对历史状态信息的利用率.迟滞反馈还可提高网络对历史状态的保持能力,提高输出结果的平滑性,减少输出的随机波动程度,提高预测结果的可靠性.

2 实验结果与分析

将本文方法应用于风速序列预测分析中,并与ARIMA模型、BP神经网络、传统Elman网络、双承接层Elman网络[13]等预测方法进行预测性能对比.风速数据来源于某风电场实测数据,风速数据每隔10 min采集一次.上述各种神经网络的训练样本构造一致,即输入层神经元数量为10,隐层神经元数量为8,输出层神经元数量为1.采用时间序列预测分析理论对ARIMA模型定阶,由于实际的风速序列波动较大,并且序列表现出明显的非平稳特征,最终确定的预测模型为ARIMA(3,2,3).采用平均绝对误差、最大绝对误差以及均方根误差作为预测结果的定量评价指标.

2.1 风速序列一步预测分析

采用上述方法实现的风速序列一步预测分析,结果如图2所示,预测性能指标比较如表1所示.

图2 风速序列一步预测结果Fig.2 One-step-ahead prediction results of wind speed series

表1 一步预测性能比较Tab.1 Performance comparison of one-step-ahead prediction results

由图2和表1可知,由于ARIMA模型具有较为完善的理论基础,模型的定阶方法也较为成熟,因此在一步预测分析中得到较好的预测结果,但其也表现出明显的预测滞后现象,在波动较大的数据段预测滞后造成预测误差较大,因此预测结果的最大误差很大,在波动较小的数据段预测误差较小,整体的平均误差和均方根误差都较小.神经网络可实现黑箱建模,但由于预测机理不解析,因此在一次预测中并未表现出特别明显的优越性能.与BP网络相比,Elman网络由于具有动态预测的性能,因此各项预测指标优于BP网络.双承接层的Elman网络由于在输出层也增加了承接层的反馈,利用了上一时刻的输出状态,综合了历史输出数据的作用,因此其预测性能得到进一步提升.而迟滞Elman网络将2个承接层的反馈进行了迟滞响应,根据不同的状态变化趋势选择不同的响应分支实现反馈,从而增加了网络对连续性信息的记忆能力,减小了预测结果的随机波动,平均预测误差减小了10%以上,进一步提高了网络的预测性能.

2.2 风速序列两步预测分析

采用上述各种预测方法实现风速序列两步预测分析,结果如图3所示,各项误差指标如表2所示.

图3 风速序列两步预测结果Fig.3 Two-step-ahead prediction results of wind speed series

表2 两步预测性能比较Tab.2 Performance comparison of two-step-ahead prediction results

由图3和表2可知,由于预测步长增加,ARIMA模型的预测滞后现象变得严重,预测误差增大,预测性能明显下降.而神经网络方法的预测性能虽然也有所下降,但与ARIMA模型相比,由于其可通过训练提高网络的适应能力,因此预测性能下降不严重.Elman网络的整体预测性能仍然略优于静态的BP神经网络,但少数预测点(如最大误差点)的误差较大,同样,改进Elman网络的整体预测性能比传统Elman网络略有提高,但波动较大的转折点处预测误差仍然很大.本文提出的迟滞Elman网络的迟滞特性由于能够提高网络处理连续性信息的能力,因此能够抑制预测结果的随机波动,平均预测误差减小了8%以上,整体预测性能及局部波动点处的预测性能都能得到明显改善.

2.3 风速序列三步预测分析

进一步地,采用上述各种预测方法实现三步风速序列预测分析,结果如图4所示,各项误差指标如表3所示.

图4 风速序列三步预测结果Fig.4 Three-step-ahead prediction results of wind speed series

表3 三步预测性能比较Tab.3 Performance comparison of three-step-ahead prediction results

由图4和表3可知,随着预测步长的增加,ARIMA模型的预测性能进一步下降,这是由于ARIMA模型采用线性预测机制,预测步长的增加造成信息丢失,预测滞后更加严重,因此预测误差变大.而神经网络由于具有学习能力,通过调整网络权值来获取数据中蕴含的规律信息,从而实现非线性预测,因此,预测性能虽然也有所下降,但优于ARIMA模型.其中BP静态预测网络不易跟随被预测的非线性系统的快速变化,因此其预测性能不高.而Elman网络及双承接层Elman网络虽然具有内部的动态反馈机制,但预测步长的增加也造成预测信息不足,预测结果的随机波动增加,因此预测性能与静态BP网络基本相当.本文提出的迟滞Elman网络对网络内部的反馈实现迟滞激励响应,能够提高网络对历史状态的记忆能力,增强网络对连续性信息的利用,从而平滑网络预测结果的输出,减少预测结果的随机波动,平均预测误差减小了10%以上,预测结果得到改善.

3 结束语

本文提出了一种迟滞Elman网络模型,即网络的隐层和输出层都具有承接层,并且2个承接层中的单元都具有迟滞响应特性,由此增加了神经元对历史状态的记忆和保持能力.该网络在风速序列预测中表现出了良好的预测性能,迟滞特性的引入提高了网络处理连续信息的能力,减小了预测结果的随机波动,平均预测误差能够减小8%以上,整体和局部预测性能都得到了明显的改善.

[1]BIGDELI N,AFSHAR K,GAZAFROUDI A S,et al.A comparative study of optimal hybrid methods for wind power prediction in wind farm of Alberta,Canada[J].Renewable and Sustainable Energy Reviews,2013,27(11):20-29.

[2]武峰雨,乐秀璠,南东亮.相空间重构的极端学习机短期风速预测模型[J].电力系统及其自动化学报,2013,25(1): 136-141.

[3]XIU Chunbo,GUO Fuhui.Wind speed prediction by chaotic operator network based on Kalman filter[J].Science China Technological Sciences,2013,56(5):1169-1176.

[4]李艳晴,成怡,刘新婷.风速时间序列混合预测方法研究[J].天津工业大学学报,2013,32(5):47-50,56.

[5]李艳晴,成怡.遗传混沌算子网络的风速序列预测研究[J].天津工业大学学报,2014,33(4):58-61.

[6]吕涛,唐巍,所丽.基于混沌相空间重构理论的风电场短期风速预测[J].电力系统保护与控制,2010,38(21):113-117.

[7]LIU D,NIU D Z,WANG H,et al.Short-term wind speed forecasting using wavelet transform and support vector machines optimized by genetic algorithm[J].Renewable Energy, 2014,62(2):592-597.

[8]修春波,任晓,李艳晴,等.基于卡尔曼滤波的风速序列短期预测方法[J].电工技术学报,2014,29(2):253-259.

[9]HUI L,TIAN H Q,PAN D F,et al.Forecasting models for wind speed using wavelet,wavelet packet,time series and artificial neural networks[J].Applied Energy,2013,107(7): 191-208.

[10]GUO Z H,ZHAO W G,LU H Y,et al.Multi-step forecasting for wind speed using a modified EMD-based artificial neural network model[J].Renewable Energy,2014,37(1):241-249.

[11]LIU Hui,TIAN Hongqi,LI Yanfei.Comparison of two new ARIMA-ANN and ARIMA-Kalman hybrid methods for wind speed prediction[J].Applied Energy,2012,98(12):415-424.

[12]姚传安,姬少龙,余沭昌.基于小波变换与ELMAN神经网络的短期风速预测组合[J].可再生能源,2012,30(8):42-46.

[13]程绪超,陈新宇,郭平.基于改进Elman网络模型的软件可靠性预测[J].通信学报,2011,32(4):86-93.

[14]LIU Xiangdong,XIU Chunbo.A novel hysteretic chaotic neural network and its application[J].Neurocomputing,2007,70(13/ 14/15):2 561-2 565.

[15]LIU Xiangdong,XIU Chunbo.Hysteresis modeling based on the hysteretic chaotic neural network[J].Neural Computing and Applications,2008,17(5/6):579-583.

Prediction of wind speed series based on hysteretic Elman network

XIU Chun-bo,WANG Liu
(School of Electrical Engineering and Automation,Tianjin Polytechnic University,Tianjin 300387,China)

In order to improve the prediction accuracy of the wind speed series,a hysteretic Elman network is proposed based on the Elman network with two context layers.The hysteretic Elman network is composed of input layer,hidden layer,context layer of the hidden layer,output layer and context layer of the output layer.The hysteretic characteristic is brought into the network by adding the activation functions into the two context layers,which can enhance the information processing ability for the continuous information.The gradient descent method is used to train the weights and the hysteretic parameters of the network.Multi-step ahead prediction of the wind speed series can be performed by the method.Simulation results show that the hysteretic characteristic can restrain the random fluctuation of the prediction results,and enhance the reliability of the prediction result.Compared with the conventional methods,hysteretic Elman network can get better prediction performance on not only the global trend but also the local region with the sharp fluctuation,and its average prediction error is reduced by more than 8%.

hysteresis;Elman network;wind speed series;prediction

TK89

A

1671-024X(2015)04-0042-05

10.3969/j.issn.1671-024x.2015.04.009

2015-04-21

国家自然科学基金资助项目(61203302);天津市应用基础与前沿技术研究计划项目(14JCYBJC18900)

修春波(1978—),男,博士,副教授,研究方向为神经网络与信息处理.E-mail:xiuchunbo@tjpu.edu.cn

猜你喜欢

隐层风速神经元
基于RTD可编程逻辑门的n变量函数实现算法
一种自适应确定隐层节点数的增量半监督超限学习机算法
邯郸市近46年风向风速特征分析
基于最优TS评分和频率匹配的江苏近海风速订正
基于时间相关性的风速威布尔分布优化方法
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
代价敏感正则化有限记忆多隐层在线序列极限学习机及图像识别应用
跃动的神经元——波兰Brain Embassy联合办公
快速评估风电场50年一遇最大风速的算法
ERK1/2介导姜黄素抑制STS诱导神经元毒性损伤的作用