APP下载

利用SVM-LSTM-DBN的短期光伏发电预测方法

2022-05-11卿会郭军红李薇亢朋朋王金明潘张榕

华侨大学学报(自然科学版) 2022年3期
关键词:辐射强度隐层出力

卿会,郭军红,李薇,亢朋朋,王金明,潘张榕

(1.华北电力大学 环境科学与工程学院,北京 102206;2.华北电力大学 资源环境系统优化教育部重点实验室,北京 102206;3.国网新疆电力有限公司,新疆 乌鲁木齐 830002;4.国网新疆电力有限公司 阿勒泰供电公司,新疆 阿勒泰 836500)

2020年9月,国家主席习近平在第七十五届联合国大会一般性辩论会上宣布,我国二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和.为实现这一目标,最主要的路径是使用可再生能源、减少碳排放,提升电气化水平.太阳能是可再生能源的重要部分,利用太阳能发电是实现碳中和目标的重要路径.然而,太阳能独特的随机性、间歇性和波动性,随着光伏装机容量需求逐渐增大,给电网安全带来了诸多考验.精准的光伏发电出力预测对光伏电站制定发电计划、保证电网稳定运行有着重要作用.

国内外诸多学者在光伏发电出力预测上展开了大量研究,如BP(back propagation)神经网络[1-2]、梯度下降决策树(gradient boosting decision tree,GBDT)[3].de Giorgi等[4]采用多元线性回归方法,以光伏发电系统的太阳能辐射等气象因素来预测发电功率;Ahmad等[5]提出了基于随机森林算法和额外树算法组合光伏发电预测模型,以气象因素预测下一小时的光伏输出功率.支持向量机(support vector machine,SVM)以结构风险最小化原则为优势取代了传统机器学习中的经验风险最小化,广泛应用于光伏出力预测.如姜恩宇等[6]基于支持向量机以某一天数据为训练样本预测出力,结果表明,支持向量机能够明显提高小样本预测精度;张雨金等[7]引入集成学习的思想和方法,提出Stacking-SVM短期光伏发电预测方法,通过次级SVM对多个预测结果输出耦合得到最终预测结果.

循环神经网络(recurrent neural network,RNN)具有跨多时间步长传递信息的能力,被广泛应用于各领域[8].Du等[9]证明了RNN具有较强记忆性且图灵完备.然而,在实际应用中,RNN模型对变量序列间的时间依赖关系较强,使得其对于具有关联性的点序列输入具有好的预测效果,造成偏差较大.为了解决RNN模型的这个问题,以RNN为基础的长短期记忆网络(long short-term memory,LSTM)模型应运而生[10].LSTM以记忆单元取代传统人工神经元,目前已被应用于空气质量指数[11]、语音识别[12]等领域,并表现出良好的预测性能.陈卓等[13]基于LSTM以电力负荷为短期预测对象,效果良好,该算法有望用于预测光伏发电功率.Hintion在2006年提出深度信念网络(deep belief network,DBN).该算法具有强大的特征提取能力,并可通过玻尔兹曼机(restricted Boltzmann machine,RBM)的预训练有效解决局部最优等问题[14].Yun[15]和耿博等[16]的研究表明,对影响光伏出力特征信息进行有效挖掘,并结合混合模型仿真,可有效提高预测精度.

基于上述分析,本文利用DBN耦合SVM和LSTM模型,提出一种新的光伏功率组合预测方法,根据实际出力和预测结果的误差利用DBN动态调整以获得最优值,并验证SVM-LSTM-DBN模型的有效性和准确性.

1 数据来源

1.1 初始数据处理

采用新疆某光伏电站2019年2月16日-9月7日的每日15 min实测气象数据,如表1所示.表1中:θ为温度;φ为相对湿度;Dth为太阳散射强度;Hth为太阳直接辐射强度;P为实时发电功率.

表1 某光伏电站的部分历史实测数据

模型构建中,初始数据通过z-score进行标准化处理,从而消除不同特征的量纲的影响和提高模型的计算能力和收敛速度.具体计算公式为

(1)

式(1)中:x为标准化前的数据;z为标准化后的数据;μ为样本的均值;σ为样本的标准差.

数据经过z-score标准化后呈标准正态分布,预测模型完成训练后,对预测的输出数据进行反标准化处理,即x=zσ+μ,则可得到预测功率数据.

1.2 气象因素筛选

光伏出力与气象因素间具有一定的相关性,即使是相同天气状态下也会因为云层的变化导致光伏板受太阳辐射的面积与强度产生变化.光伏组件仅在太阳升起至降落的时间段内工作,为了避免大量光伏出力零值数据对分析造成影响,考虑到光伏组件的敏感程度,结合该光伏电站所在新疆省当地的实际气候情况.因此,文中以正午时刻(12:00)为例,对温度、相对湿度、太阳直接辐射强度、太阳散射强度等4种气象参数,在不同时间点采集的数据分别进行相关性分析.

光伏出力数据与各气象因素经预处理后的结果,如图1所示.图1中:θ为温度;φ为相对湿度;Dth为太阳散射强度;Hth为太阳直接辐射强度;Pout为光伏出力.

(a)太阳散射强度 (b)太阳直接辐射强度

从图1可知:太阳散射强度、太阳直接辐射强度与出力值变化的拟合性较高,散点图分布较为集中,正相关较明显,其中太阳直接辐射强度与出力的相关性更强;同一时刻,相对湿度、温度与出力值的关系较为分散.从图1还可知:当出力值较大时,相对湿度偏低而温度偏高.整体来看相对湿度的拟合曲线呈负相关,温度与出力值的拟合曲线较为平缓,相关性较不明显.

对温度、相对湿度、太阳散射强度、太阳直接辐射强度与光伏出力进行协方差和Pearson相关性分析,得到结果见表2.表2中:θ为温度;φ为相对湿度;Dth为太阳散射强度;Hth为太阳直接辐射强度;r为Pearson相关系数.

表2 相关性计算结果

从表2可知:协方差与Pearson相关系数所得相关性结果趋势大致相同,与图1初步分析结果一致.结合图1、表1分析可知:在所有影响因素中,太阳直接辐射强度、太阳散射强度、相对湿度与光伏出力显现出较明显的相关性,其中太阳直接辐射强度正相关性最强.太阳散射强度和太阳直接辐射强度反映了太阳热辐射能,当太阳热辐射能较强时,半导体材料在界面层获得的能量较强,产生更多的电子-空穴对,进而光伏出力较大;相对湿度与光伏出力表现出负相关性,相对湿度较高往往是阴雨天气,太阳热辐射能较弱,光伏发电受到影响出力变小,相关系数计算结果与物理解释一致.

1.2 评价指标

为验证模型的预测精度,采用均方根误差(RMSE)和平均绝对误差(MAE)作为模型性能的评价指标,其具体计算公式[17]为

(2)

(3)

2 预测模型的构建

2.1 SVM单项预测模型构建

设xλ∈Rn为训练样本中的各项气象参数,yλ∈Rn为光伏出力,两者共同组成样本集合(xλ,yλ)∈Rn×R.其中,n为样本的个数,λ=1,2,…,n.通过线性回归函数对样本集合拟合,可得

f(x)=ωTφ(x)+b.

(4)

式(4)中:ω为权值矢量;φ(x)为非线性映射关系;b为阈值.

核函数的选择对预测效果起重要作用,常用的核函数有线性核函数、多项式核函数、高斯径向基核函数等.其中,高斯核函数具有计算效率高和计算结果可靠等优点,较适合表示气象参数与光伏出力间的复杂非线性关系.其具体表达形式为

(5)

式(5)中:σ为高斯核函数的核宽度.

由此,构建以高斯径向基为核函数的SVM单项预测模型,采用滚动预测,Lookback取值为7,Delay取值为1,以序列号前50个预测点为例,比较SVM的单项预测值与实际出力值之间的偏差,结果如图2所示.图2中:Pout为光伏出力.从图2可知:支持向量机在不同时刻显示出不同的预测精度,整体有一定的重合度,但预测精度有一定的提升空间.

图2 某地区光伏发电SVM预测结果

2.2 LSTM单项预测模型构建

LSTM常见的块结构包含输入、遗忘、输出三个门,以及块输入、块输出、记忆细胞、输出激活函数和窥视孔连接,而块输出反复连接块输入和所有门,如图3所示.LSTM训练过程包括信息的向前传递和误差的反向传播.

图3 RNN网络隐层中的LSTM块

1)信息向前传递.设t时刻的输入向量为xt,LSTM块的数量为N,输入数量为M.即一个LSTM网络层的各权值向量为

zt=g(Wzxt+Rzyt-1+bz),

(6)

(7)

ft=σ(Wfxt+Rfyt-1+pfect-1+bf),

(8)

ct=zteit+ct-1eft,

(9)

ot=σ(Woxt+Royt-1+poect+bo),

(10)

yt=h(ct)eot.

(11)

2)误差反向传播.LSTM块内部的增量δ,其计算式为

(12)

(13)

(14)

(15)

(16)

(17)

式(12)中:Δt为上一层向下传递的增量向量.

与经典神经网络相比,LSTM训练最大区别在于若预测t时刻的值pt,则前面的n个样本{pt-n,…,pt-1}都需要通过网络训练.因此,在设置网络时对时间步数n进行定义来满足预测精度,记忆细胞将根据训练状态存储并输出预测值pt.

LSTM模型结构的搭建与参数的设置,对于样本训练过程的优化、训练时耗、预测精度起关键性作用.通过大量迭代过程,对2~6层隐层的网络进行对比分析,最终确定最佳的网络深度.比较不同隐层模型训练完成时间与训练后的评价指标MAE和RMSE,如表3所示.隐层层数增加与训练时间的关系,如图4所示.表3,图4中:N为隐层层数;t为训练时间;γRMSE,γMAE分别为RMSE值和MAE值.

图4 隐层层数与训练时长增加关系图

表3 不同隐层模型训练后的评价指标

从表3可知:当隐层层数少于4层时,MAE和RMSE值随隐层数目增加而减小;而当隐层层数大于4时,MAE和RMSE值随隐层层数增大而增大.随着隐层层数的逐渐增加,训练时长呈指数型增加,当隐层层数为4时,模型训练时长较长并出现过拟合现象.综上所述,当隐层数目为4时,MAE和RMSE值均最小,训练时间较合理,预测精度最高.因此,文中选用隐层为4层的LSTM网络.

2.3 基于SVM-LSTM-DBN的光伏发电组合预测模型

通过支持向量机和长短期记忆神经网络分别建立单项预测模型,以气象参数相对湿度、太阳散射强度、太阳直接辐射强度等为特征向量输入,以光伏出力为输出.单项模型的预测结果进一步深度信念网络训练,优化后输出.图5为光伏发电出力预测组合模型示意图.图5中:V为DBN显层;H为隐层;W为V和H的连接权重.

图5 光伏发电出力预测组合模型示意图

光伏发电出力预测具体流程,如图6所示.单项预测模型构建完成后,通过DBN对预测结果优化,具体过程有如下3个方面.

图6 光伏发电出力预测流程图

1)以各单项模型的预测值作为DBN的输入向量,分别由X1,X2,X3表示.

2)通过枚举法[18]选取DBN隐层的层数及单元数,然后通过训练样本确定各单项模型的最优权重.此训练过程有两步:

(a)通过无监督的逐层训练来训练DBN中的RBM.设RBM中的显层、隐层神经元的数目分别为n,n,而vi,hj分别为显层第i个、隐层第j个神经元的状态,它们对应的偏置分别为ai,bj;wi,j为显层第i个、隐层第j个神经元之间的连接权重.设β=(wi,j,ai,bj)为RBM的参数;则RBM在状态(v,h)上的能量函数可表示为

(18)

当显层单元向量v=(v1,…,vi,…,vn)随机给定后,隐层第j个单元hj被激活的概率为

(19)

式(19)中:Sigmoid(x)=(1+e-x)-1为激活函数.

当隐层单元向量h=(h1,…,hi,…,hn)(x)随机给定后,显层第i个单元vi被激活的概率为

(20)

采用对比散度法对RBM的参数β=(wi,j,ai,bj)寻优.

(21)

Δai=σCD(〈vi〉-〈vi′〉),

(22)

Δbj=σCD(〈hj〉-〈hj′〉).

(23)

式(21)~(23)中:σCD为对比散度法的学习速率;〈·〉为变量的数学期望.

(b)根据BP算法进行反向微调,以DBN的输出值反向更新其网络和权重.

3)将待测日的气象数据代入算法训练,输出预测值Pi.

3 实验结果与分析

使用Python语言(V3.6)编写,运行环境前端为Keras,谷歌第二代人工智能学习系统TensorFlow为后端[19],以新疆某光伏发电站为例,将预处理后的样本代入SVM,LSTM和SVM-LSTM-DBN模型中.2019年2月16日-9月7日的全时间序列光伏发电的组合预测结果,如图7所示.不同算法模型的光伏发电功率预测结果逐点(序列号前50预测点)对比,如图8所示.图7,8中:Pout为光伏出力.

图7可知:SVM-LSTM-DBN组合预测模型具有一定的预测精度,其预测曲线与实际曲线变化趋势基本一致,具有较好的预测效果.由图8可知:LSTM模型的预测精度与SVM-LSTM-DBN组合模型相比较低,SVM模型预测精度最低.

图7 全时间序列光伏发电预测结果 图8 不同算法光伏发电功率预测结果逐点对比

不同预测模型的光伏发电功率预测性能比较,如表4所示.表4中:γRMSE,γMAE分别为RMSE值和MAE值.从表4可知:文中所提出的SVM-LSTM-DBN组合预测模型具有最小的MAE值及RMSE值,分别为1.073及1.840,即具有最高预测精度,降低了整体预测误差.

表4 不同预测模型预测性能比较

4 结论

文中利用DBN提出SVM-LSTM-DBN组合模型进行短期光伏出力预测.以新疆某光伏电站实测数据为例,将SVM-LSTM-DBN模型与单一模型实验效果对比,得出如下3点主要结论.

1)文中提出的SVM-LSTM-DBN模型将SVM与LSTM模型采用枚举法加权组合,修正单一模型中误差较大的时序值,以降低误差.实验结果表明,SVM-LSTM-DBN模型能有效提高短期光伏出力预测精度.

2)通过SVM-LSTM-DBN模型与单一模型实验效果对比,表明单一模型的出力预测精度是组合模型精度有效提高的前提,因此正确选择或调节参与组合的单一模型参数至关重要.

3)数据基础是实现预测精准的基石.在后续研究中,应重点关注光伏电站运行的稳定性,有利于挖掘更多有效信息,从而提升预测精度以制定发电计划,进一步提高太阳能利用率,减少碳排放的同时保证电网稳定运行.

猜你喜欢

辐射强度隐层出力
氧气A(O,O)波段气辉体发射率和临边辐射强度模拟与分析
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
风电场有功出力的EEMD特性分析
要争做出力出彩的党员干部
基于模拟太阳辐射强度对自然循环式PV/T系统的实验研究
风电场群出力的汇聚效应分析
基于近似结构风险的ELM隐层节点数优化
最优隐层BP神经网络的滚动轴承故障诊断
红外地球敏感器辐射强度在轨数据分析*
BP神经网络隐层单元数确定方法