APP下载

基于特征优选和麻雀搜索优化门控循环单元短期风电功率预测

2023-12-12胡道波陈芳芳张倩倩文博罗银榕

应用科技 2023年6期
关键词:电功率特征选择关联度

胡道波,陈芳芳,张倩倩,文博,罗银榕

云南民族大学 电气信息工程学院,云南 昆明 650504

风电功率具有一定的不稳定性和随机性。随着风电并入电网,会给电力系统的安全带来极大的挑战[1],风电功率预测是解决该挑战的方法之一,可以作为电网调度的重要依据。因此,准确预测风力发电机组出力具有非常重要的意义。

基于数值天气预报的风电出力预测仍然是目前的研究热点之一,有效的特征选择能提高模型的预测精度。近年来,国内外研究工作人员对预测模型输入特征优选做了大量的研究。文献[2]引入灰色关联度分析法测算各影响因素与工时的关联度,并验证该方法的有效性。文献[3]提出一种基于灰色关联分析法分析历史数据与预测日间的关联程度,将灰色关联系数大于0.9 的特征数据作为模型输入特征,实验结果表明该方法提高了模型的预测精度。文献[4]指出Kendall 秩相关系数可检测出2 个变量之间的非性相关性。文献[5]使用互信息用来提取风电预测模型的输入特征向量,提高了模型的预测精度。上述文献有效解决了建模过程中特征选择的问题,显著提高了预测精度。但多数研究使用一种特征选择方法,很少从不同角度运用多种方法选择输入特征,进而导致输入特征选择不充分,影响模型的性能。基于上述存在的问题,本研究运用3 特征选择方法横向对比进行特征选择,选择有效特征,剔除冗余信息。

神经网络方法对具有序列特征的数据非常有效,可以充分从数据中提取时间序列信息。门控循环单元(gated recurrent unit,GRU)神经网络是在长短期记忆(long short-term memory,LSTM)神经网络基础上改变的一种神经网络,也具有门控机制,其结构比LSTM 简单,所需参数少[6-7]。文献[6]通过注意力(attention)机制优化GRU 的输入权重和基于麻雀搜索算法(sparrow search algorithm,SSA)优化GRU 的超参数,建立了Attention-SSA-GRU 的短期负荷预测模型,在短期负荷预测方面取得了很好的预测结果。文献[7]建立了基于粒子群优化GRU 的故障诊断模型,通过粒子群优化GRU 的超参数,提高了模型的诊断精度。因此,本文选用GRU 神经网络进行短期风电出力预测,并引入SSA 对GRU 神经网络的初始隐含层节点数和学习率进行优化。

1 特征选择

特征选择是从众多影响因子中优选部分有效影响因子,对原始数据进行降维处理的同时能够降低模型的训练难度,提高模型的预测精度。影响风电出力的影响因子有很多,风力机组输出功率的表达式为

式中:P为风轮机输出功率,kW;Cp为风能利用系数;A为转轮旋转截面面积,m2; ρ为空气密度,kg/m3;V为风速,m/s。

1.1 灰色关联度分析法

灰色关联度(grey relation analysis,GRA)[8]是对风电出力的影响因子进行分析,以原始数据为基础提取对风电功率影响具有强相关性的数据特征,灰色关联分析具体步骤如下。

1)将历史风电出力数据X0=[X0(1),X0(2),···,X0(m)]T设为参考系列, 将影响因子向量X1,X2,···,Xn构成的矩阵设为比较矩阵:

式中:m为影响因子维数,n为样本数。

2)对数据进行无量纲处理,使所有数据取值都位于0~1 之间:

式中:i=0,1,···,n;k=1,2,···,m。

3)计算影响因子序列和目标系列之间的灰色关联度系数:

式中:i=1,2,···,n;ε=0.5。

4)计算关联度 γi,并将得到的关联度系数由高到低进行排序。

根据上述计算得到灰色关联度值,关联度值越大,得到比较序列和参考序列的变化趋势越相同。

1.2 Kendall 秩相关系数

Kendall 秩相关系数又称Kendall 系数,是一个基于秩的相关性指标,用来衡量2 组非线性数据之间的有序关联统计量,它是以Maurice Kendall 命名的一种数据处理算法[9-10],其计算公式为

式中:n为输入风电数据的采样点,x为数值天气预报(numerical weather prediction,NWP)数据特征,y为风电功率数据。Kendall 秩相关系数的取值区间为[-1,1]。其中相关系数绝对值表示2 组随机向量之间一致和不一致关系,当这些变量相互独立时,Kendall 秩相关系数值为0。在此定义Kendall 秩相关系数值在[0.6,1]表示强相关,[0.4,0.6]表示中等相关,[0,0.4]表示弱相关。

1.3 互信息算法

互信息(mutual information,MI)是信息熵理论中一种有用的信息度量,用来表示2 个或多个系统间的相关信息量[11]。文中用来表示原始风电特征数据X和风电功率数据Y之间的相关信息,X、Y之间的互信息I(X;Y)定义为

式中:p(x,y)为联合概率密度,p(x)p(y)分别为x、y的边缘概率密度函数。MI 法是通过计算所有影响因子与风电出力的互信息度量,选取n个MI 最高的特征,达到特征优选的目的。

1.4 最优输入特征选择

基于上述3 种特征选择方法,搭建最优特征选择模型,具体思路如下:基于灰色关联度分析法、Kendall 秩相关系数法和互信息理论用于计算各个特征对风电功率的灰色关联度系数、相关系数和互信息量,基于3 种特征选择方法选择出3 个最佳特征子集,通过取交集的方式得到预测模型输入的最佳特征集。特征选择模型如图1 所示。

图1 最优输入特征集选择

2 预测模型

2.1 门控循环单元神经网络

GRU 神经网络是传统循环神经网络(recurrent neuron network,RNN)[12-13]的一种变形,能够充分利用历史信息,具有计算效率高、拓扑性强等优点。GRU 模型结构如图2 所示。

图2 GRU 神经网络结构

GRU 神经网络的最终输出由输出门与门控单元共同决定,公式如下:

式中: σ为sigmoid 函数,rt为遗忘门,为更新门,ht为隐藏层,wr、wz、wc和wh˜分别为对应变量的权重矩阵,xt为输入,yt为输出,br、bn和bm分别为rt、zt和的偏置向量,zt为重置门。

2.2 麻雀搜索算法

SSA 是根据麻雀觅食和反捕食行为的启发而提出的新型群体智能优化算法[14-15]。在种群中,每只麻雀都有3 种行为,分别为发现者、加入者和警戒者[16-17]。在麻雀搜索算法中,发现者的位置迭代表达式如下:

式中:t为当前迭代次数,j=1,2,···,d,rmax为最大迭代次数,为第i只麻雀在第j维中的位置信息,α ∈(0,1]为随机数,R2∈(0,1]为预警值,TS∈[0.5,1]为安全值,Q为服从正态分布的随机数,L为1×d的矩阵。

跟随者的位置迭代更新表达式为

式中:XP为发现者所处最优位置;Xworst为发现者所处最差位置;A为1×d的矩阵,其中每个元素随机赋值为1 或者-1,且A+=AT(AAY)-1;当i>n/2,表示适应度较低的第i个加入者没有得到食物。

在麻雀反捕食过程中会有一部分麻雀具有警戒侦察能力,这部分群体的表达式为

式中:Xbest为当前最优位置, β为步长控制参数,K∈[-1,1]为均匀的随机数,fi为第i个个体适应度值,fg和fw为当前全局最优和最差适应度值, ε为常数。

2.3 构建SSA-GRU 组合预测模型

为了提高GRU 预测模型的精度,本文提出了一种混合模型SSA-GRU,利用SSA 优化GRU 的初始隐含层节点数和学习率。SSA-GRU 预测模型主要步骤如下,预测模型如图3 所示。

图3 短期风电出力预测整体框架

1) 初始化。初始化种群规模、最大迭代次数、参数取值范围,初始化GRU 的参数,以GRU模型的隐含层节点数和学习率作为优化目标。

2) 将参数代入训练模型,计算麻雀种群个体适应度值,找出最优适应度个体及最劣适应度个体。

3) 根据种群的当前状态,判断是否满足停止条件:若是,则输出最优适应度值;若不是,则返回步骤2)。

4) 将SSA 寻找的最优学习率、隐含层神经元个数赋值给GRU 网络,建立最优的SSA-GRU 短期风电出力预测模型。

3 算例仿真分析

为验证所构建模型的有效性,选取西北某风电场2017 年7 月4 日—2017 年8 月10 日的风电历史数据进行分析和计算,数据每15 min 采样一次,共得到3 648 条数据,其中采用8 月10 日整天实际数据共96 个数据点作为测试集,7 月4日—8 月9 日共3 552 个数据点作为训练集。采集的数据参量包括风速、风向、湿度和温度等,具体见表1。

表1 原始数据特征表

为了能更好地评价预测模型精度,本实验将均方根误差ERMS、平均绝对误差EMA和拟合优度系数R2作为评价标准,表达式如下:

3.1 最优特征子集选择

采用灰色关联度、Kendall 秩相关系数和互信息分别计算各特征数据对风电功率影响的程度,得到的相关系数如图4~图6 所示。其中Kendall秩相关系数强相关取值范围为[0.6,1],灰色关联度强相关的取值范围为[0.65,1]。

图4 基于灰色关联度各特征相关系数

由图4 可知,灰色关联度为强相关的特征为不同距离点的风速和天气湿度,说明风速和湿度与风电功率具有很强的关联度。由图5 可知,Kendall 秩相关系数为强相关的特征为不同距离点的风速和0 m 处风向,再次说明风速与风电功率具有很强的相关性。由图6 可知,不同距离点风速特征和0 m 处风向互信息量远远大于其他影响特征的互信息量。其中灰色关联度湿度特征的关联度为0.662 8,但是风速特征和0 m 处风向的关联度均大于0.78,很显然湿度特征的影响程度远远没有风速特征和0 m 处风向高。综合灰色关联度、Kendall 秩相关系数和互信息,取三者交集作为最佳特征集。

图5 基于 Kendall 各特征相关系数

图6 基于互信息各特征相关系数

上述3 种特征选择方法都验证风速对风电出力有着重要的影响。因此,最终选择最优输入特征为:10、30、50、70 m 处风速和0 m 处风向5 个特征作为本文预测模型的输入特征。

3.2 基于SSA-GRU 短期风电功率预测分析

为了防止采用SSA-GRU 模型时参数之间的单位不统一,要消除参数之间的量纲影响,在训练模型就必须先对风电的历史数据进行归一化分析处理:

式中:xmin和xmax分别为数据中的最小值和最大值,x为实际数据值,x′为归一化分析处理后的值。

为验证SSA-GRU 风电功率预测模型的预测性能,在保持同一特征集的前提下,采用GRU、极限学习机(extreme learning machine, ELM)、LSTM和SSA-LSTM 模型得到的风电出力预测效果并进行对比,得到各预测模型的风电功率预测图和误差评价指标值如图7 和表2 所示,其中均方根误差和平均绝对误差误差评分越小表示预测效果越好,而拟合优度系数值越大说明模型预测性能越好。从图7 和表2 可以得出,不管是均方根误差、平均绝对误差还是拟合优度系数均比未优化前效果更好,其中均方根误差和平均绝对误差分别下降了54.3%和62.5%,拟合优度系数提高了39.2%,且与其他预测模型相比,均方根误差和平均绝对误差平均下降了25.3%和31.3%,拟合优度系数平均提高了10.2%。综上实验数据可知本文所构建预测模型预测效果最好,在短期风电功率预测方面能取得很好的预测精度。

表2 不同模型的误差评价指标值

图7 不同模型的功率预测效果

4 结论

本文提出基于特征优选和SSA-GRU 的短期风电功率预测,经过仿真验证得出以下结论:

1)利用灰色关联度、Kendall 秩相关系数和互信息量3 种方法对输入特征进行选择,在保留有效信息的同时避免冗余信息。

2)针对GRU 人工调参量大且准确性差的问题,利用麻雀搜索算法寻找最优超参数,充分发挥GRU 的性能。

通过对比实验发现,本文构建的模型与其他传统模型相比,具有更好的预测精度和泛化能力。

猜你喜欢

电功率特征选择关联度
基于PCC-CNN-GRU的短期风电功率预测
轻松上手电功率
你会计算电功率吗
解读电功率
基于灰色关联度的水质评价分析
Kmeans 应用与特征选择
联合互信息水下目标特征选择算法
基于灰关联度的锂电池组SOH评价方法研究
基于特征选择和RRVPMCD的滚动轴承故障诊断方法
基于二元搭配词的微博情感特征选择