基于遗传算法的最小二乘支持向量机风速预测模型研究
2021-12-20曾杰朱宜飞陈卫鹏
曾杰 朱宜飞 陈卫鹏
摘要:由于风速具有随机波动性,使得对其预测的准确度不高。针对此,采用最小二乘支持向量机(LS-SVM)方法对风速进行预测分析。考虑到LS-SVM的参数选取方面尚无有效手段,尝试结合遗传算法对LS-SVM进行参数选取。选取山西省阳泵市风场前15 d的实测风速数据,采用遗传算法优化LS-SVM参数后的预测模型,对第16天的风速进行预测分析。经过模型计算,风速的预测值与实测值的平均绝对百分比误差只有5.95%。结果表明:模型计算结果理想,验证了采用遗传算法优化LS-SVM参数后用于风速短期预测的有效性。研究成果可为风电场实际运行中风功率短期、中长期预报提供理论支持。
关键词:风速预测;遗传算法;最小二乘支持向量机; 风电场
中图法分类号:TK81 文献标志码:A DOI:10.15974/j.cnki.slsdkb.2021.12.017
文章编号:1006 - 0081(2021)12 - 0097 - 04
0 引 言
2020年全国两会提出了2030年前实现碳达峰、2060年实现碳中和的目标承诺。清洁能源利用已成为实现该目标的重要手段,而风能作为清洁能源的一类,风能资源开发受到日益关注。风能资源具有很大的间歇性和随机波动性,因此大规模的风电场接入电网,势必对电网的稳定、安全运行有着较大影响。同时,风电场的前期规划、选址和风电机组的安全稳定运行都与风速变化有着直接关系。因此,如何高效、准确地对风电场风速进行短期、中长期预报成为重点研究方向[1]。对于风速预测的方法,主要有时间序列算法[2]、人工神经网络算法[3]、小波分析法[4]、卡尔曼滤波法和遗传算法等。目前用于预测风速的最小二乘支持向量机(LS-SVM)在參数选取方面暂时没有较好的方法。因此,本文以风电场历史测风数据为基础,采用遗传算法(Genetic Algorithm, GA)优化LS-SVM模型参数,再对风速进行预测分析,探讨遗传算法用于LS-SVM风速预测模型中参数优化的可行性。
1 LS-SVM基本理论
最小二乘支持向量机LS-SVM[5-6]是对标准向量机(SVM)[7]理论的扩展改进,其约束条件将原来传统的不等式约束优化变为等式约束形式,同时损失函数采用的是最小二乘线性函数,降低了SVM理论的复杂性。该方法将标准支持向量机二次规划问题优化调整为线性方程式的求解,同时优化了SVM的求解速度和精度[8]。采用非线性函数映射来实现最小二乘支持向量机输入值的高维空间转换,在完成高维空间转换后再实现计算的优化处理。
设定数据样本集{(x1,y1),(x2,y2),…,(xt,yt)},其中xi∈Rn,yi∈R,映射成高维空间的最小二乘支持向量机函数为
[yx=wTφx+b] (1)
式中:φ(x)为非线性映射函数;b为常数值;w为权向量值。通过高维空间转换,最小二乘支持向量机函数的优化问题可以转化为求解下式:
[minw,b,eJpw,e=w22+γ2k=1te2k] (2)
其中转换的约束条件为
[yk=wTφxk+b+ek] k=1,2,…,N (3)
式中:γ为规划参数,且γ>0;ek为松弛变量。拉格朗日转换函数L为
[Lw,b,e,a=Jw,e-k=1Nak[wTφ(xk)+b+ek-yk]] (4)
式中:ak为拉格朗日乘子。通过KKT优化条件计算可知:
[∂L∂w=0⇒w=k=1Nakφxk] (5)
[∂L∂b=0⇒k=1Nak=0] (6)
[∂L∂ek=0⇒ak=γek] ,k=1,2,…,N (7)
[∂L∂ak=0⇒wTφxk+b+ek-yk=0],k=1,2,…,N
(8)
通过计算,可得到如下公式:
[0ITIΩ+γ-1Iba=0y] (9)
式中:a=[a1,a2,…,aN],y=[y1,y2,…,yN],I=[1,1,…,1],Ωki=φ(xk)Tφ(xi),k,i=1,2,…,N。
通过Mercer条件计算,高维度映射函数φ和核函数k(xk,xi)计算式为
[kxk, xi=φxkTφxi] (10)
最小二乘支持向量机函数式为
[yx=k=1Nakkx, xk+b] (11)
式中:a,b由公式(9)计算所得。
2 遗传算法理论
2.1 遗传算法
20世纪60年代末,受遗传理论启示,Holland提出了一种优化计算方法,即遗传算法[9-11](Genetic Algorithm, GA)。在生物遗传进化过程中,按照自然选择与最优适应性,生物种群进行不断的进化,以适应自然环境。遗传算法理论核心就是生物遗传进化理论。遗传算法具有良好的全局优化性和随机搜索特点,在各行业的优化计算中都有广泛的应用[12-14]。
2.2 遗传算法框架构成
遗传算法计算框架主要分以下几个步骤:编码、评价函数、遗传运算、初始化种群、选择控制参数和终止条件。
2.2.1 编 码
遗传算法无法直接处理空间参数,须通过编码方式将求解的问题转换为遗传中的染色体或个体,这个转换过程就是遗传编码。遗传编码常见的处理方法有实数编码、二进制编码及Gray编码。
2.2.2 评价函数
进化论中适应度是衡量个体对周边环境适应性大小的参数,也表示生物繁殖能力大小。遗传算法中的适应度函数也叫评价函数,用于判断个体优劣程度,根据所需求解问题的目标函数进行评估。评价函数的设计直接决定着遗传算法的优劣。
2.2.3 遗传运算
遗传运算是遗传算法的主要优化计算过程,主要是用于形成新的后代种群,实现计算的延续。遗传运算的主要方式有:选择运算、交叉运算和变异运算。其中选择运算是选择合适的算子用于群体,选择运算的目是把进化后的个体特性遗传到下代或通过交叉配对产生新个体再遗传到后代。选择运算方式有:基于排名先后的运算、基于局部竞争的运算和基于适应值的运算。交叉运算是将交叉算子应用于群体中,在遗传算法理论中起到至关重要的作用。变异运算是对群体中个体基因值作变动而形成新的个体。变异运算主要有二进制变异运算和实值变异运算等。
2.2.4 初始化种群
主要是设置进化代数,随机生成N个个体作为初始群体。
2.2.5 选择控制参数
在优化迭代计算前,需对遗传算法的运算参数进行设置。通过设置遗传迭代次数、种群规模大小、变异概率值和交叉概率值等来控制遗传计算。
2.2.6 終止条件
当遗传的最优个体适应度达到设定值,或者群体适应度不再提高,或迭代次数达到设定值时,遗传算法终止计算。
3 遗传算法优化LS-SVM模型参数
3.1 遗传编码
受温度、气压和湿度等气象因素影响,同时在不同风电场地形、地貌条件下,风速大小和风向变化与各影响因素形成复杂的非线性关系,风速是非稳定的数据。在采用LS-SVM进行模型预测时,需对原始数据进行均一化处理,减少原始数据非稳定性对模型预测结果的影响。
设定原始数据序列x={x(t),t=1,2,…,n},对x进行均一化处理,均一化处理公式如下所示[13]。
[xi=xi-xminxmax-xmin+b] (12)
式中:b为偏差值,取值为0.1。xmax和xmin为原始数据序列中的最大值和最小值。
LS-SVM模型需要对均一化处理后的数据序列进行高维空间转换,如前文提到的,LS-SVM模型通常采用非线性函数映射实现高维空间转换。
经均一化处理的数据序列为Xi,Xi={xi-n,xi-n+1,…,xi-1};输出序列Yi,Yi=xi。
3.2 模型评价参数
通常需要设定评价模型参数标准,风速是随机变化量,采用预测值与实测值的相对偏差量作为LS-SVM模型预测准确度评判标准。相对偏差量计算式如下:
[EMAPE=1Ni=1NPi-PiPi×100%ERE=Pi-PiPi×100%] (13)
式中:[EMAPE]为平均绝对百分比误差;[ERE]为相对误差;N为预测风速样本数量;[Pi]为实测风速;[Pi]为模型预测值。
3.3 LS-SVM模型参数优化
核函数的选取对LS-SVM模型计算的准确度至关重要。对于核函数及其参数的选取也是研究的重点,核函数可以通过很多算法结合,但核函数复杂,需适当简化。为了简化模型计算,适应风速预测需要,选用函数参数较少的RBF径向基核函数。
RBF函数训练LS-SVM时,需考虑两个参数:惩罚系数C和Gamma。C的较小值能使得决策计算平滑,较大值能准确分类所有样本数据。Gamma对单一样本训练能有较大影响。对于C和Gamma暂无高效的处理方法,拟采用遗传算法优化核函数的选取。
设定惩罚系数C的计算区间为[1,100],Gamma计算区间为(0,100]。遗传算法初始种群规模设为20,评价函数采用均方误差倒数形式,最高迭代次数40次。
[EMSE=1Ni=1NPi-Pi2] (14)
[fit=1EMSE] (15)
式中:N为计算样本量;[Pi]为模型预测值;[Pi]为实测数据;fit为评价函数。
3.4 模型计算结果
预测模型的基础数据样本为前15 d的实测风速,共计360个数据样本。基础数据如图1所示。
采用遗传算法对LS-SVM风速预测模型进行参数优化。其中,由遗传算法优化得到LS-SVM的RBF径向基核函数的两个参数为:惩罚系数C为91.2,Gamma值为0.466。利用优化参数后的LS-SVM风速预测模型对第16天的风速进行预测。
在山西省阳泵市风电场前15 d实测风速样本的基础上,通过利用优化模型参数后的LS-SVM风速预测模型对第16天风速进行预测,表1和图2为风速预测结果。结果显示预测值与实测值间的相对误差较小,整体平均绝对百分比误差为5.95%,预测结果较好。通过上述计算,验证了遗传算法优化模型参数后的LS-SVM预测短期风速是可行的,具有一定的实用性。
4 結 论
LS-SVM模型核函数及其参数的选取具有多样性和复杂性。如何有效得出核函数及其参数,对LS-SVM计算的准确性及高效性有着至关重要影响。对于风速这种随机变化的数据量,选择合适的预测模型存在一定的困难。结合遗传算法的优势,将其应用于LS-SVM模型参数的选取,通过实例进行计算,发现预测风速值与实测风速值相对偏差较小,从而验证了本文方法的可行性。结果表明:利用遗传算法优化LS-SVM风速预测模型参数的方法在短期风速预测中具有较好的效果,为风电场中长期风速预测和风功率预报等提供了理论方法支撑,具有较好的实用性。
参考文献:
[1] FLORES P,TAPIA A,TAPIA G. Application of a control algorithm for wind speed prediction and active power generation[J].Renewable Energy,2005,30(4):523-536.
[2] 蔡凯,谭伦农,李春林,等.时间序列与神经网络法相结合的短期风速预测[J].电网技术,2008,32(8):82-85.
[3] 范高锋,王伟胜,刘纯,等.基于人工神经网络的风电功率预测[J].中国电机工程学报,2008,28(34):118-123.
[4] 杨延西,刘丁.基于小波变换和最小二乘支持向量机的短期电力负荷预测[J].电网技术,2005,29(13):60-63.
[5] SUYKENS J A K,VANDEWALLE J. Least squares support vector machine classifiers[J]. Neural Process Lett., 1999,9(3):293-300.
[6] HIKMET E,FILIZ O,MEHMET E,et al. Modelling of a new solar air heater through least-squares support vector machines[J].Expert System with Applications,2009,36(7):10-673-10682.
[7] PARK S,INMAN D J,LEE J J,et al. Piezoelectric sensor-based health monitoring of railroad tracks using a Two-step support vector machine classifier[J].Journal of Infrastructure Systems,2008,14(1):80-88.
[8] POLAT K,AKDEMIR B,GUNES S. Computer aided diagnosis of ECG data on the least square support vector machine[J].Digital Signal Processing,2008,18(1):25-32.
[9] HOLLAND J H. Adaptation in natural and artificial systems[M].Michigan:University of Michigan Press,1975.
[10] POOJARI C A, BEASLEY J E. Improving benders decomposition using a genetic algorithm[J].European Journal of Operational Research,2009,199(1):89-97.
[11] VALENTE J M S, GONCALVES J F. A genetic algorithm approach for the single machine scheduling problem with linear earliness and quadratic tardiness penalties[J].Computers & Operations Research,2009,36(10):2707-2715.
[12] GEORGIEVA A, JORDANOV I . Global optimization based on novel heuristics, low-discrepancy sequences and genetic algorithms[J]. European Journal of Operational Research,2009,196(2):413-422.
[13] 文常保,马文博,刘鹏里. 基于改进遗传算法的RBF神经网络结构优化研究[J].计算机工程与科学,2019, 41(5):917-923.
[14] 朱苗苗,潘伟杰,刘翔,等. 基于BP神经网络代理模型的交互式遗传算法[J]. 计算机工程与应用,2020, 56(2): 146-151.
(编辑:江 文)
Wind speed prediction model of least squares support vector machine based on genetic algorithm
ZENG Jie,ZHU Yifei,CHEN Weipeng
(Changjiang Survey, Planning, Design and Research Co., Ltd., Wuhan 430010, China)
Abstract: In view of poor accuracy of wind speed prediction due to random fluctuation of wind speed, this paper uses least squares support vector machine(LS-SVM) method to predict and analyze the wind speed. Considering that there is no effective method for selecting LS-SVM parameters, this paper adopts genetic algorithm theory to select LS-SVM parameters. The wind speed data measured in the first 15 days in a wind farm in Shanxi Province are selected and LS-SVM model with the parameters optimized by genetic algorithm is set to predict wind speed of the 16th day. The calculated mean absolute percentage error is 5.95%, showing that the calculation results is ideal, and the effectiveness of LS-SVM with the parameters optimized by genetic algorithm is verified . The analysis results can provide theoretical support for short-term, medium and long-term wind power prediction of wind power in the actual operation of wind farms.
Key words:wind speed prediction; genetic algorithm; least squares support vector machine; wind farm