基于相关向量机和残差分析的短期风速预测
2018-09-05平善明赵玲玲苏小红
平善明 赵玲玲 苏小红
文章编号: 2095-2163(2018)03-0240-04中图分类号: 文献标志码: A
摘要: 关键词: (School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China)
Abstract: With the depletion of fossil energy, renewable energy such as wind power is in development in recent years. Due to the intermittence and variability of wind speed, wind power generation is also intermittent and unstable, and wind power integration in electrical power systems will do harm to the electrical power systems. Accurate short-term wind speed forecasting could be a guide to wind farm management. Using machine learning method to predict wind speed is popular, and it creates residual sequence. If it is not a white noise, information could be extracted from it, which could lead to a two-layer model. Experimental results show compared with single-layer machine learning method such as SVR(Support Vector Machine), RVM(Relevance Vector Machine), the proposed method in this paper is efficiently improved.
Key words:
作者简介:
收稿日期: 引言
由于化石能源储量有限,而需求不断增加,化石能源面临着枯竭的困境。同时,由于化石能源引起的气候变暖以及环境污染问题也日益严重,对生态系统、社会经济以及人类健康均构成严重威胁。相较于化石能源,太阳能和风能等绿色可再生能源有许多优势,发挥着越来越重要的作用。2016年结束后,全球风力发电装机容量已达到486.7 GW。
由于风本身的不稳定性等问题,风力发电具有波动性和间歇性,风电入网将对电力系统造成危害,阻碍了风能的进一步发展。随着风力发电在电力供应中所占比例越来越大,这一问题愈加突出。目前,解决该问题的重要方向就是对未来的风电输出进行预测。短期预测的结果能够为电网的合理调度、机组组合操作以及在合适阶段对风机实施维护提供基础、及重要依据[1]。
根据预测过程使用数据的不同,风速预测可以分为两类。一类是用历史风速数据预测未来的风速,另一类是使用更多种类的数据进行风速预测,如压力、温度、湿度等。本次研究只使用风速的历史数据,后续研究将探讨使用更多种类的数据预测风速,可以预期,更多种类的数据将带来更好的预测结果,因为其中包含了更多的信息。
根据建模原理的不同,短期风速预测方法可分为物理方法、统计方法和学习方法三大类。具体来说,物理方法使用数值天气预报[2]预测风速。统计方法基于随机过程理论和数理统计方法对风速序列的统计规律进行分析[3]。持续法是最简单的统计方法,通过使用当前风速作为风速的预测,随着预报时间的增加其性能迅速降低,但在短期风速预测中,其效果尚可,因此通常被用来作为衡量其他模型性能的一个基准方法。学习方法是利用机器学习方法实现数据建模,如人工神经网络(Artificial Neural Network,ANN)[4-7]、支持向量机(Support Vector Machine,SVM)[8-11]等,通常这些机器学习模型都是非线性模型。
目前,人工神经网络和支持向量机的应用正日趋广阔。研究可知,支持向量机在解决小样本、非线性和高维模式识别方面占据独特优势,受到众多研究者的推崇与青睐。但却也呈现出一些内在缺陷,例如,其效果高度依赖于超参数的调整,只能使用梅西核函数,不能给出分类的概率等不足。而相关向量机(Relevance Vector Machine,RVM)[12]是一个基于贝叶斯框架的稀疏概率模型,是机器学习领域中的研究熱点。与其他机器学习算法相比,具有更强的非线性映射能力与泛化能力。因此,正逐渐普及应用于各个领域的设计研发中。
在本文中,使用一个基于相关向量机和残差分析的双层模型预测下一时刻的风速。过程中使用相关向量机作为第一层进行风速预测,用另一种方法来处理残差,作为第二层,最后将这两层组合在一起,得到最终结果。第二层使用的方法不是确定的,因而研究建立了多种不同的模型来探索不同方法的性能。
1技术设计方法
1.1相关向量机
综上论述可知,与支持向量机存在的方案缺陷不同,Tipping提出了相关向量机的方法,就充分改善了支持向量机的性能不足,且已取得了良好运行实效。
对于输入向量{xn}Nn=1 和目标向量{tn}Nn=1,使用训练集,可以学习得到一个模型。该模型能够刻画输入和输出的关系,因此,可使用这个模型来对从未见过的输入x进行预测得到t。假设p(t|x)服从高斯分布N(t|y(x),σ2),并且对于一个给定的x,这个分布的均值可以被y(x)建模,y(x)的数学定义如式(1)所示:y(x)=∑Nn=1wnK(x, xn)+w0(1)其中,wn是权重,K(·,·)是核函数。这和支持向量机是相同的。
数据集的似然函数可以写成公式(2),如下所示:p(t|w,σ2)=(2πσ2)-N/2exp{-12σ2‖t-Φw‖2}(2)其中,t=(t1,…,tN),w=(w0,…,wN),Φ是N×(N+1)维的矩阵,数学定义是 Φnm=K(xn,xm-1),Φn1=1。
模型参数可以通过最大化这个似然函数来得到,但是这通常会导致严重的过拟合。为此,在权重上定义一个自动相关决策机制高斯先验如公式(3)所示:p(w|α)=∏Ni=0N(wi|0, α-1i)(3)其中,α是N+1维的超参数。
通过贝叶斯法则,可以得到权重的后验概率,计算公式如下:p(w|t, α, σ2)=(2π)-(N+1)/2|Σ|-1/2·
exp{-12(w-μ)TΣ-1(w-μ)}(4)
Σ=(ΦTBΦ+A)-1(5)
μ=ΣΦTBt(6)其中,A=diag(α0,α1,…,αN), B=σ-2IN。
将权重带入,推导得到超参数的边际似然函数,其数学表述如下:
p(t|α,σ2)=(2π)-N/2|B-1+ΦA-1ΦT|-1/2·
exp{-12tT(B-1+ΦA-1ΦT)-1t}(7)
最大化公式(7)就可以得到α和σ2的值,但是最大化公式(7)不能以封闭形式得到,所以就采取了一种实用程序的方法。在实践中,研究发现很多αi会趋向于无穷,根据公式(4),p(wi|t,α, σ2)就会无限趋近于0,对于剩下的权重不趋于0的向量,则称其为相关向量。
1.2提出的模型
有很多原因导致单一模型不能准确预测风速,研究人员正在转向到使用复合模型对风速进行预测。构造复合模型的方法多种多样,如先将信号分解,并展开预测后再将结果组合在一起。但在实际中发现,使用单一模型对风速进行预测时,如果其性能较差,那么仍有信息存留在残差里。残差也是一个未知的序列,通过深入分析可以获得更多的信息,从而使预测臻至理想。同时,使用LBQ(Ljung-Box-Pierce Q-Test)检验来测定残差是否为白噪声:如果不是白噪声,就使用机器学习的方法来预测残差,然后结合这2次预测的结果,就可以得到最终的预测;如果是白噪声,就使用模型一的结果作为最终预测。模型的结构流程如图1所示。
图1中的2个模型可以是各种机器学习模型。本文构建了4个两层预测模型,分别是RVR-RVR、RVR-SVR、SVR-RVR和SVR-SVR,并针对不同模型的性能给出了研究对照。
2实验
2.1数据
本文研究使用从美国国家数据浮标中心[13]检索到的风速数据,这些监测站点都位于美国。实验中使用了2个数据集,属于不同的位置。一个是在夏威夷北部的51 000站,另一个是位于普利茅斯岛西南部的42 060站,这2个监测站都在海洋里。数据集中的物理量包括WDIR、WSPD、GDR和GST。WDIR是每10 min的平均风向,使用从正北开始的顺时针角度度量;WSPD是每10 min的平均风速,单位是m/s。GDR和GST数据值多为99或999,这意味着数据丢失了,所以可利用的数据只有风向和风速。如果考虑风速,这是风速矢量预测的问题。但是,这里首先不考虑风速,而只研究标量风速预测的问题,因此,待研究的数据是风速序列。
过程中,对每个位置选择5段数据进行实验。每段数据被划分成2部分:90%用于训练,10%用于测试。在训练集中有5 400个样本,在测试集中有600个样本。预测下一时刻的风速,即10 min后的风速。
2.2实验结果
在训练RVR和SVR时,使用网格搜索法提高泛化能力和避免过度拟合。在测试时,使用均方根误差(RMSE)度量模型性能。这些模型在2个位置的预测误差分别可见表1和表2。为了使分析简单,进一步计算每个模型在所有组实验中的平均相对误差,可见表3。
3分析
从表1和表2可以看到,RVM和SVR的结果大部分时候是类似的,在某些情况下,RVM比SVR好。从表3则可以看出,单层模型中,RVM比SVR好。RVM-RVM和RVM-SVR性能最好,两层模型都优于单层模型。
3结束语
在本文中,设计提出了一个两层模型来预测短期风速,通过从残差中提取信息,以提高风速预测的准确性。论文研究了4个两层模型和2个单层模型,根据RMSE对这些模型进行了比较,并可推得结论如下:
(1)RVM-RVM和RVM-SVR性能最好。
(2)RVM优于SVR。
(3)从平均意义上来说,两层模型好于单层模型。
本文只使用了历史风速数据进行预测,在后续研究中,将使用更多数据如气温、气压和湿度等气象信息,以及其它站点的数据,共同预测某一个站点未来的风速,旨在从这些数據中挖掘出更多信息,从而对风速做出更为科学、准确的预测。
参考文献
[1] LOWERY C, O'MALLEY M. Impact of wind forecast error statistics upon unit commitment[J]. IEEE Transactions on Sustainable Energy, 2012, 3(4): 760-768.
[2] CASSOLA F, BURLANDO M. Wind speed and wind energy forecast through Kalman filtering of numerical weather prediction model output[J]. Applied energy, 2012, 99: 154-166.
[3] CADENAS E, RIVERA W. Wind speed forecasting in three different regions of Mexico, using a hybrid ARIMA–ANN model[J]. Renewable Energy, 2010, 35(12): 2732-2738.
[4] AKINCI T C. Short term wind speed forecasting with ANN in Batman, Turkey[J]. Elektronika ir Elektrotechnika, 2015, 107(1): 41-45.
[5] WANG Jianzhong, HU Jianming, MA Kailiang, et al. A self-adaptive hybrid approach for wind speed forecasting[J]. Renewable Energy, 2015, 78: 374-385.
[6] YOUSEFI M, HOOSHYAR D, YOUSEFI M, et al. An artificial neural network hybrid with wavelet transform for short-term wind speed forecasting: A preliminary case study[C]//Science in Information Technology (ICSITech), 2015 International Conference on. Yogyakarta, Indonesia:IEEE, 2015: 95-99.
[7] SHUKUR O B, LEE M H. Daily wind speed forecasting through hybrid KF-ANN model based on ARIMA[J]. Renewable Energy, 2015, 76: 637-647.
[8] MOHANDES M A, HALAWANI T O, REHMAN S, et al. Support vector machines for wind speed prediction[J]. Renewable Energy, 2004, 29(6): 939-947.
[9] ZHOU Junyi, SHI Jing, LI Gong. Fine tuning support vector machines for short-term wind speed forecasting[J]. Energy Conversion and Management, 2011, 52(4): 1990-1998.
[10]DU Ying, LU Jiping, LI Qing, et al. Short-term wind speed forecasting of wind farm based on least square-support vector machine[J]. Power System Technology, 2008, 32(15): 62-66.
[11]LIU Da, NIU Dongxiao, WANG Hui, et al. Short-term wind speed forecasting using wavelet transform and support vector machines optimized by genetic algorithm[J]. Renewable Energy, 2014, 62: 592-597.
[12]MICHAEL E. Sparse Bayesian learning and the relevance vector machine[J]. Journal of machine learning research, 2001, 1(3): 211-244.
[13]National Data Buoy Center. Historical Data [EB/OL]. [2017-12-05]. http://www.ndbc.noaa.gov.(上接第239頁)