基于EEMD—IGSA—LSSVM的超短期风电功率预测
2016-11-30江岳春杨旭琼贺飞陈礼锋何钟南
江岳春+杨旭琼+贺飞+陈礼锋+何钟南
摘 要:为了提高风电场输出功率的预测精度,在保证安全操作的前提下,建立了一种基于集合经验模态分解(EEMD)、改进引力搜索算法(IGSA)、最小二乘支持向量机(LSSVM)相结合的风电功率组合预测模型.首先运用EEMD算法将风电功率时间序列分解成一系列复杂度差异明显的子序列;其次利用相空间重构(PSR)对已分解好的子序列进行重构,对重构后的每个子序列分别建立IGSA-LSSVM预测模型,为分析不同核函数构造LSSVM的差异性,建立了8种核函数LSSVM预测模型,利用IGSA算法求解其模型;最后以中国内蒙古地区的某一风电场为算例,仿真及验算结果表明,利用IGSA算法寻优得到的指数径向基核函数核参数和惩罚因子构建的LSSVM模型具有较高的预测准确性;与EEMD-WNN,EEMD-PSO-LSSVM等5种常规组合模型相比,所提出的指数径向基核函数的EEMD-IGSA-LSSVM组合模型能有效、准确地进行风电功率预测.
关键词:集合经验模态分解;风功率预测;最小二乘向量机;改进引力搜索算法;指数径向基核函数
中图分类号:TU375 文献标识码:A
文章编号:1674-2974(2016)10-0070-09
Abstract: In order to improve the prediction accuracy of the output power of the wind farm under the premise of ensuring safe operation, a combination of wind power forecasting model based on Ensemble Empirical Mode of Decomposition (EEMD), Improved Gravitational Search Algorithm (IGSA) and Least Squares Support Vector Machine (LSSVM) was established. Firstly, the wind power time series was decomposed into a series of subsequences with significant differences in complexity by using EEMD algorithm. Secondly, the decomposed subsequence was reconstructed by the phase space reconstruction (PSR), and then, an IGSA-LSSVM prediction model of each sub-sequence reconstructed was established respectively. In order to analyze the differences of LSSVM which sets up different kernel functions, eight kinds of kernel function LSSVM prediction models were established, and the IGSA algorithm was adopted to solve those models. Finally, taking a wind farm in Inner Mongolia of China as an example, the simulation and calculation results illustrate that LSSVM prediction model based on the exponential radial basis kernel function and penalty factor obtained by using the IGSA algorithm has higher prediction accuracy. Compared with five conventional combined models such as EMD-WNN and EMD-PSO-LSSVM, the combined model EEMD-IGSA-LSSVM of exponential radial basis kernel function mentioned above can forecast wind power in an effective and accurate way.
Key words:ensemble empirical mode decomposition (EEMD);wind power prediction;least squares support vector machine (LSSVM); improved gravitational search algorithm(IGSA); exponential radial basis function(ERBF)
风电的随机性和波动性会导致风电功率输出的波动和不稳定,阻碍了大规模风力发电上网,导致制订发电调度计划和电力调度的困难,但是,通过提高超短期风电功率的预测精度,能有效地解决这些难题[1].
在时间尺度层面,风电功率的预测可分成中长期(数天),短期(数小时至数天)和超短期预测(几分钟至几小时).目前,风电功率预测方法划分为以下两类:一类是数值天气预报(numerical weather prediction,NWP)物理建模技术[2],另一类是历史数据的统计建模技术.前者需考虑地形、气压和气温等复杂因素,使预测运算量大,成本高.后者主要是智能学习算法,包括:以时间序列法[3-4]建立的预测模型、以卡尔曼滤波[5]建立的预测模型、以支持向量机法[6]构建的预测模型以及以最小二乘支持向量机法[7]构建的预测模型;最小二乘支持向量机(least squares support vector machine,LSSVM)对于非线性、小样本、高尺度识别等问题的解决,占据独特的优势,具有较高的泛化性能和较好的非线性拟合性能.但是,LSSVM的核函数和核参数选择会影响其预测精度和泛化能力.文献[7]在进行风速预测时,预测LSSVM模型选取高斯径向基核函数.文献[8-9]采用最小二乘向量机方法进行风速预测建模时,选择了径向基(radial basis function,RBF)核函数,但是上述方法预测风速时精度有待进一步提高.遗传算法[10]、蚁群优化算法[11]和粒子群算法[12]等已经逐渐应用到寻找LSSVM的最优参数中,对于常规模式寻优速度慢的困扰提供了解决办法.文献[13]详细介绍了GSA算法的收敛的精度、速度这两方面具有相对的优势.目前,有文献[14]将引力搜索算法(GSA算法)应用于支持向量机参数识别中,表明了采用GSA算法对支持向量机参数优化具有很好的效果.所以GSA算法应当对LSSVM的核函数、核参数的寻找和优化也同样的适用.
此外,风功率信号的非平稳性严重的制约预测模型的建立和预测精度的提高.目前,降低风电功率非平稳性主要有:傅里叶分解法[15]、小波分解法[16]和经验模态多尺度分解法[17].其中,傅里叶分解法得到的子序列在时域内没有分辨率,自适应性差;小波分解法则需要人为预先设定基函数,操作不便,分解结果含有多余信号;EMD多尺度分解具有较高的时频分辨性能,其基函数由原始数据驱动产生.但是,端点效应和模态混叠现象会降低EMD分解质量,进而影响预测准确性.
本文将EEMD,IGSA算法和LSSVM方法相结合,提出了基于EEMD-IGSA-LSSVM组合预测模型.通过EEMD将风功率时间序列分解成一系列差异复杂度明显的子序列,利用相空间重构对每个本征模态函数(intrinsic mode function,IMF)分量进行重构,对重构后的每个IMF变量分别建立IGSA-LSSVM预测模型.为分析不同核函数构造LSSVM的差异性,本文利用IGSA算法对8种核函数LSSVM预测模型进行对比分析.最后,以某风电场的风电实测数据进行仿真对比分析,仿真结果表明了基于指数径向基核函数的混合的EEMD-IGSA-LSSVM模型具有更高的精度.同时,与常见的EEMD-WNN,EEMD-LSSVM等5种组合模型对比,所提组合模型的预测结果最好;因此对于风电预测来说EEMD-IGSA-LSSVM组合模型能有效、准确地进行风电功率预测.
1 聚类经验模态多尺度分解(EEMD)
文献[17]介绍了经验模态分解(Empirical mode decomposition, EMD)是一种可将非线性非平稳的序列信号分解为各种不同尺度的本征模态函数(intrinsic mode function, IMF)和一个剩余分量的自适应信号的分解方法.EMD的分解结果如式(1):
在实际中,风电功率的时间序列往往会掺杂不纯净的白噪声,导致分解会丢失重要的时间尺度,出现模态混叠现象.文献[18]介绍了EEMD可以利用噪声特性来有效地抑制这一现象,其实现的详细步骤如下:
1)在风电功率数据上加入服从正态分布(0,(αε)2)的白噪声序列得到新的风功率序列{(t)},其中,α为噪声强度,ε为标准差.
2)利用EMD将新的风电功率时间序列{(t)}分解成若干IMF分量Ci(t)和一个余下的残差信号rn(t).
3)重复步骤1)、步骤2)r次,每次加入幅值不同的白噪声序列.
4)将r次分解得到的各个IMF分量整体求平均值,并将其作为原始风电功率时序的IMF分量.
当残差信号r=100,噪声强度α从[0.1,0.3]之间取值时能够得到较好地分解结果.因此本文取r=100,α=0.25.
2 相空间重构相关论述
文献[19]证明风功率时间序列具备混沌的特性,而相空间重构则是分析混沌时序的一种重要方法,已成为挖掘风功率时序非线性动力学特征和优化预测模型学习样本的新颖、有效地手法[20].已知风电功率时序为{x(i)},i=1,2,…,n.可通过重构相空间向量X(t)来构造一个m维吸引子.
本文采用关联积分(correlation-integral ,C-C)法[21]来对章节1分解得到的风电功率子时序进行重构向量.C-C法中的嵌入维数m和延
迟时间τ是相互关联的,通过关联积分函数能够同时估计最优时延τ和嵌入窗τw,根据嵌入窗时间公式τw=(m-1)τ求出嵌入维数m.
3 基于IGSA优化的LSSVM预测模型
3.1 最小二乘支持向量机的相关理论
对于数据回归的处理,支持向量机(SVM)通过结构风险最小化代替之前的经验风险技术,克服了过度拟合的问题,提高了泛化能力.LSSVM改进和扩展了SVM的数学模型,LSSVM 是将误差二范数作为损失函数,将 SVM 的不等式约束变为等式,而且LSSVM在求解线性系统代替二次规划问题的训练方面,减少了模型学习的计算时间.LSSVM最终用于表示回归的LSSVM预测模型为:
虽然LSSVM在解决诸如小样本、非线性、高尺度等方面问题上取得了更好的效果,但是LSSVM依然受到惩罚因子γ、核函数类型和核参数的影响.文献[20]指出核函数及其参数的组合不同会对LSSVM 回归性能有很大的影响,也会影响它的泛化能力.因此,如何正确的选择核函数及其参数对最小二乘支持向量机的模型具有重大的研究意义.
目前,常用的核函数有RBF核、POLY核、Sigmoid核和高斯(Gaussian)核以及线性核[7-9]共5种;本文除了采用以上5种基本的核函数之外,还将采用以下的3种核函数[22-23]来构建LSSVM模型;核函数的公式如下:
4 EEMD-IGSA-LSSVM相结合的风电功率超短期预测模型
风功率时间序列具有非稳态性、非线性和混沌特性,只采用一般的预测方法难以取得较高的预测精度.基于EEMD降低风功率信号非稳态性的优势以及IGSA-LSSVM模型预测非线性系统的良好性能,本文建立了一种基于EEMD-IGSA-LSSVM组合模型预测风功率,其建模流程如图2所示.具体流程如下:
1)对原始的风功率时间序列{x(t)}进行EEMD分解,得到不同时间尺度的n个IMF分量和1个残差余项rn.
2)根据相空间重构方法,确定各个本征模态分量函数和残差项函数的延迟窗τω,延迟时间τ和嵌入维数m,显然,不同分量函数的延迟窗τω、延迟时间τ和嵌入维数m均不相同.
3)针对每个IMF分量和残差余项rn.分别建立各自的IGSA-LSSVM模型并进行预测,得到全部IGSA-LSSVM模型的预测值.
4)叠加不同尺度下风功率预测值,将其作为最终的风功率预测值.
5)误差分析.
5 算例及结果分析
5.1 风电功率模型的样本选择及处理
以中国内蒙古扎鲁特一期风电场夏秋季2015年5月12号~7月10号的连续1 440 h的实测数据为例,该风场由58台丹麦Vestas(维斯塔斯)生产的V58~850 kW机组组成,装机总容量49.3 MW,每15 min进行采样;该机组在6月14号~6月16号3 d的输出功率达到功率800 kW左右.为进一步数据处理的方便,以小时为单位将其平均化处理,并且以额定功率850 kW为基值进行归一化处理,如式(19):
式中:yi为原始数据值;i为归一化后的数据值,Pcap为风机的额定功率850 kW.对归一化后的实测数据进行了再次选择,将实测功率的负值和大于1的功率值进行了剔除;剔除处理完成后取其中的1 000个数据,如图3所示.取总数据的前900个作为LSSVM模型的训练部分,余下的数据作为LSSVM模型测试部分.通过EEMD 分解风电功率原始数据,仿真平台可得到IMF1-IMF9这8个固有模态函数以及唯一一个R(t)余量函数,其结果如图4所示.IGSA-LSSVM的参数预先设定为:粒子规模为30,维数为3,万有引力常数为G0=100,最大迭代次数TMAX=300,适应度方差给定数值α=0.000 1,参数γ、核参数σ的范围分别为[0,1 000],[0.000 1,10].
样本个数
选用归一化的两种指标:绝对平均误差指标ENMAE、均方根误差指标ENRMSE和最大的相对误差指标EMAE用来对预测结果进行误差分析,这3种指标具体表达式如下:
5.2 超短期风电功率EEMD-IGSA-LSSVM模型
的样本选择及处理
针对EEMD处理所得到的9项风电功率子序列进行相空间重构,9项风电功率IMF序列的关联积分法参数,如表1所示.得到的EEMD-IGSA-LSSVM组合模型预测值,如图5所示.表2为通过IGSA算法优化8种核函数的LSSVM模型所得到的最优参数组合结果.表3为8种不同种类的核函数构建的LSSVM风功率预测模型的性能差异.从表 3可以看出:选择的8种核函数获得的预测效果是相差甚远的.由表3分析可以得到,指数径向基函数(ERBF核函数)的LSSVM风功率模型预测性能指标ENMAE为2.787 1%和ENRMSE为3.601 2% ,相对于其余7种核函数指标性能较小,且优于其它核函数构建的LSSVM预测模型,可提高LSSVM预测精度.因此本文采用ERBF核函数作EEMD-IGSA-LSSVM的风电预测模型的基本核函数.
为检验使用表2的基于指数径向基函数(ERBF核函数)最优参数组合构建EEMD-AGSA-LSSVM模型的预测性能.本文同时与目前5种已经在风电预测中应用的模型(LSSVM,GSA-LSSVM,EEMD-LSSVM、采用文献[9]方法的组合模型EEMD-PSO-LSSVM以及EEMD-WNN)进行对比分析.
为更加方便地计算预测结果的数据,对全部的预测结果的脏数据进行了约束.约束方法:将预测的负功率按等于0处理,将预测相对值高于1的(即额定功率850 kW),则按等于1处理.处理后预测结果和预测误差,分别如图6和图7所示;6种模型的风电功率预测指标如表4所示.
从图6、图7和表4观察对比发现,6种模型在预测风功率方面都表现出较好地效果,同时6种模型预测性能也有很大差异.
1)可以看出,提出的EEMD-IGSA-LSSVM组合模型是能够对原始的风电功率曲线进行有用的追踪、拟合,证明了模型是正确的.
2)可以看出,EEMD-IGSA-LSSVM方法与单一的LSSVM法相比预测精度有了一定的提高,这证明EEMD分解可以降低风功率时间序列的非平稳性特征,提高了风功率预测的准确性,解决了预测效果不佳的问题.
3)与GSA-LSSVM,EEMD-PSO-LSSVM的对比,表明了IGSA算法选择出来的最优LSSVM参数,提升了预测精度的比例,同时也说明了该算法对风功率预测是有效的、可行的.
4)EEMD-IGSA-LSSVM模型误差指标明显低于其余的5种模型,避免了选取核函数的盲目性和随意性,从而实现了对非线性系统的精确建模和高精度预测.
综上,从预测精度方面,可以看出本文提出的基于EEMD-IGSA-LSSVM模型具有极高的预测精度和较好的预测性能,极具工程开发意义.
6 结 论
1)EEMD法可以明显提高分解结果的规律性和平稳性,为进一步预测提供基础.
2)对比文中所选的8种核函数所建的IGSA-LSSVM模型,可以得出基于指数径向基函数(ERBF核函数)的LSSVM风功率模型预测性能指标相对较小,预测精确性也相对于其他7种核函数建立模型要好,亦能为LSSVM模型选择核函数方向提供一种新的借鉴.
3)选择指数径向基函数(ERBF核函数)作为核函数,根据改进搜索算法优化参数的思路进行LSSVM模型的预测,从结果上与单一模型相比分析得知,这种新型建模方式一定程度上削减了风电功率预测的精度,取到了更好地风电功率预测效果.
4)与另外的5种模型进行对比研究,可以清楚地发现EEMD-IGSA-LSSVM模型可以提高风电功率的预测精度,能够明显地改善预测效果.因为预测模型需要采用IGSA算法来优化LSSVM的参数,所以在实现过程中,存在时间的花费相比于单一预测的时间长,硬件实现有一定难度的缺点,这也是今后需要研究改进的方向.
参考文献
[1] BLONBOUl R, MONJOLY S, DORVILLE J F. An adaptive short-term prediction scheme for wind energy storage management[J]. Energy Convers Manage, 2011;52:2412-2418.
[2] 冯双磊,王伟胜,刘纯,等.风电场功率预测物理方法研究[J].中国电机工程学报,2010,30(2):1-6.
FENG Shuang-lei,WANG Wei-sheng,LIU Chun,et al.[J].Proceedings of the Csee,2010,30(2):1-6.(In Chinese)
[3] PEIYUAN C,PEDERSEN T,BAK J B,et al.ARIMA-based time series model of stochastic wind power generation[J].IEEE Transactions on Power Systems,2010,25(2):667-676.
[4] 蔡凯,谭伦农,李春林,等.时间序列与神经网络法相结合的短期风速预测[J].电网技术,2008,32(8):82-90.
CSAI Kai,TAN Lun-nong,LI Chun-lin,et al.Short-time wind forecasting combing time series and neural network method[J].Power System Technology,2008,32(8):82-90.(In Chinese)
[5] LOUKA P, GALANIS G, SIEBERT N,et al.Improvements in wind speed forecasts for wind power predictionpurposes using Kalman filtering[J].Journal of Wind Engineering and Industrial Aerodynamics,2008,96(12): 2348-2362.
[6] SANCHO S,EMILIO G,ANGEL M,et al.Short term wind speed prediction based on evolutionary support vector regression algorithms[J].Expert Systems with Applications,2011,38(4):4052-4057.
[7] 杜颖,卢继平,李青,等. 基于最小二乘支持向量机的风电场短期风速预测[J]. 电网技术,2008,32(15):62-66.
DU Ying,LU Ji-ping,LI Qing,et al.Short-term wind speed forecasting of wind farm based on least square-support vector machine [J]. Power Grid Technology, 2008,32(15):62-66.(In Chinese)
[8] 曾杰,张华. 基于最小二乘支持向量机的风速预测模型[J]. 电网技术,2009,18:144-147.
CENG Jie, ZHANG Hua. Wind speed forecast based on least squares support vector machine (SVM) model [J]. Power System Technology, 2009, 19:144-147.(In Chinese)
[9] 王贺,胡志坚,张翌晖,等. 基于聚类经验模态分解和最小二乘支持向量机的短期风速组合预测[J].电工技术学报,2014(4):237-245.
WANG He,HU Zhi-jian,ZHANG Li-hui, et al .Based on clustering empirical mode decomposition and least squares support vector machine (SVM) of short-term wind speed forecasting models [J]. Journal of Electrotechnics, 2014(4):237-245.(In Chinese)
[10]尚万峰,赵升吨,申亚京.遗传优化的最小二乘支持向量机在开关磁阻电机建模中的应用[J].中国电机工程学报,2009,12:65-69.
SHANG Wan-feng, ZHAO Sheng-dun, SHENYa-jing.Application of LSSVM optimized by genetic algorithm to modeling of switched reluctance motor [J]. Proceedings of the Csee, 2009, 12:65-69.(In Chinese)
[11]姜慧研,宗茂,刘相莹.基于ACO-SVM的软件缺陷预测模型的研究[J].计算机学报, 2011, 34(6):1148-1154.
JIANG Hui-yan,ZONG Mao,LIU Xiang-ying. Research of software defect prediction model based on ACO-SVM[J].Chinese Journal of Computers ,2011,34(6):1148-1154.(In Chinese)
[12]高昆仑,刘建明,徐茹枝,等.基于支持向量机和粒子群算法的信息网络安全态势复合预测模型[J].电网技术,2011,35(4):176-182.
GAO Kun-lun,LIU Jian-ming,XU Ru-zhi,et al.A hybrid security situation prediction model for information network based on support vector machine and particle swarm optimization[J].Power System Technology,2011,35(4):176-182.(In Chinese)
[13]RASHEDI E,NEZAMABADI-POUR H,SARYAZDI S.GSA:A gravitational search algorithm[J]. InformationScience, 2009, 179(13): 2232-2248.
[14]ZHANG W,NIU P,LI G,et al. Forecasting of turbine heat rate with online least squares support vector machine based on gravitational search algorithm[J]. Knowledge-Based Systems, 2013, 39(2):34-44.
[15]桑丙玉,王德顺,杨波,等.平滑新能源输出波动的储能优化配置方法[J].中国电机工程学报,2014,34(22):3700-3706.
SANG Bing-yu,WANG De-shun,YANG Bo,et al.Optimal allocation of energy storage system for smoothing the output fluctuations of new energy[J].Proceedings of the CSEE,2014,34(22):3700-3706.(In Chinese)
[16]MONFARED M, RASTEGAR H, KOJABADI H M. A new strategy for wind speed forecasting using artificial intelligent methods[J]. Renewable Energy, 2009,34(5): 845-848.
[17]HUANG N E, SHEN Z, LONG S R. The empirical mode decomposition and the Hilbert spectrum for nonlinear and-non-stationary time series analysis [J].Proceedings of the Royal Society Soc Land, 1998,454(1971): 903-995.
[18]WU Z,HUANG N E.Ensemble empirical mode decomposition: a noise-assisted data analysis method[J].Advances in Adaptive Data Analysis, 2009,1(1): 1-41.
[19]王丽婕,廖晓钟,高爽,等.并网型大型风电场风力发电功率-时间序列的混沌属性分析[J].北京理工大学学报,2007,27(12):1077-1080.
WANG Li-jie,LIAO Xiao-zhong,GAO Shuang,et al.Wind power grid type large wind farms-time series of chaotic properties analysis [J].Journal of Beijing Institute of Technology,2007,27(12):1077-1080.(In Chinese)
[20]张雪清,梁军.风电功率时间序列混沌特性分析及预测模型研究[J].物理学报,2012,61(19):190507.
ZHANG Xue-qing,LIANG Jun.Chaotic characteristics analysis and prediction model study on wind power time series[J].Acta Physica Sinica,2012,61(19):190507.(In Chinese)
[21]陆振波,蔡志明,姜可宇.基于改进的C-C方法的相空间重构参数选择[J].系统仿真学报,2007,19(11):2527-2538.
LU Zhen-bo,CAI Zhi-ming,JIANG Ke-yu.Determination of embedding parameters for phase space reconstruction based on improved C-C method[J].Journal of System Simulation,2007,19(11):2527-2538.(In Chinese)
[22]GUO X,YANG J,WU C, et al. A novel LS-SVMs hyper-parameter selection based on particle swarm optimization[J]. Neurocomputing,2008,71(16/18):3211-3215.
[23]ZHANG X, LIU X, WANG Z J. Evaluation of a set of new ORF kernel functions of SVM for speech recognition[J]. Engineering Applications of Artificial Intelligence, 2013, 26(10):2574-2580.
[24]戴娟.引力搜索算法的改进及其应用研究[D].苏州:江南大学控制理论与控制工程学院,2014.
DAI Juan.The improved and applied research of gravitational search algorithm[D].Suzhou:Control Theory and Coutrol Engineering Southern Yangtze University, 2014.(In Chinese)