APP下载

基于随机森林和卷积神经网络的风-光伏-抽水蓄能电站联合优化运行

2023-09-14曹锦阳李嘉铮孙博宁蒲梓宁何再雨吴凤娇

水利与建筑工程学报 2023年4期

曹锦阳,刘 梦,李嘉铮,孙博宁,蒲梓宁,何再雨,吴凤娇

(1.西北农林科技大学 水利与建筑工程学院,陕西 杨凌 712100;2.北京科东电力控制系统有限责任公司,北京 100000)

近年来,以风电、光电为代表的可再生能源发展迅速,极大地缓解了我国能源压力。由于风光具有间歇性、随机性等缺陷,输出功率不易控制,给电网有功、无功平衡调度带来困难。如何提高风光发电利用率,减小风光发电对电网安全稳定的影响,是迫切需要解决的问题。

抽水蓄能作为一种储能技术,具有灵活启停、爬坡率高等优点,与风光发电配合,可显著降低对电网波动性的影响[1]。文献[2]建立以联合运行系统发电并网收益最大和向外部电网输出功率最平滑为优化目标的风光抽水蓄能电站联合运行模型,利用MSSA(Multi-objective Salp Swarm Algorithm)对模型进行多目标优化求解,并在同等条件下与单独考虑联合运行系统发电并网收益最大或向外部电网输出功率最平滑的单目标下优化结果进行对比。文献[3]考虑多种不确定性,包括风能、太阳能输出、负载变化、发电机故障以及风光抽水蓄能系统的供应和储备,将不确定性分为连续和离散。建立容量中断概率表和制定储备与可靠性指标负荷损失概率之间的关系。采用可调鲁棒优化方法来处理离散和连续的不确定性,提出应对多重不确定性和传输约束的方法,可以在经济的程度上保证系统的可靠性。文献[4]以最小的风光能减排为目标,考虑风光发电机组和抽水蓄能发电机组的运行约束,建立了协调调度模型,为制定风光伏抽水蓄能协调调度输出方案提供理论依据。文献[5]将综合系统的投入成本作为目标函数,分析了风光抽水蓄能的基本约束条件,提出一种自适应模糊粒子群优化算法来求解单目标约束优化问题。文献[6]介绍了一个利用统计方法和神经网络方法,设计了一个多神经网络的数据融合算法来预测未来一年逐小时的风速发电量数据。利用张北、内蒙地区两风电场的数据进行训练和测试,最终预测结果平均绝对误差小,预测模型效果较好。文献[7]介绍了针对影响风电中长期预测的气象、地理等因素众多且复杂,及无法解决长期依赖时间序列的问题,提出一种基于多维特征融合网络和长短期记忆的预测方法。目前,对于风光抽蓄联合优化运行内容的研究理论基础较为成熟,但模型实际操作的可行性、误差大小还有待提高。

本文基于风光发电的天然互补性,以及抽水蓄能的灵活性特点,针对风光发电输出功率并网不稳定问题提出了风、光和抽蓄联合运行的优化模型。最后对光伏风电输出功率数据进行训练优化,得到最终的发电目标,使最终出力均匀。此模型可用于拟建抽水蓄能电站地区,筹建时根据该地区风电光电出力确定抽水蓄能电站发电功率参数。风电与光伏发电联合抽水蓄能的优化运行可以实现输出功率稳定,对缓解风力发电和光伏发电的功率波动带来的影响,提高风光这种清洁能源的利用效率,以及电网的稳定性和经济性具有十分重要的意义。

1 光伏发电预测模型

1.1 光伏发电相关理论

光伏发电前期投资成本低,建设速度快,后期维护简单。但受光照条件、温度和气候影响,输出具有间歇性和波动性的缺陷[8-9]。

在装机容量、建筑面积相同情况下,平面单轴光伏发电跟踪系统比固定光伏支架系统发电效率高20%~25%。因此本文采用单轴追踪方式下的数据。由于单个电池电压只有0.5V~0.7V,所以光伏电池由大量电池串联而成。

物理表达式为:

(1)

式中:I为光伏电池板的电流;U为光伏电池板的电压;Iph为光伏电池板的光生电流;RS为等效串联电阻;I0为饱和电流;m为波尔兹量常数;q为电荷量;T为温度;n为二极管常数。

由于并联等效电阻较大,不考虑等效并联电阻,串联得到的等效电阻可以忽略。设Isc=Iph,可得光伏输出功率:

(2)

(3)

(4)

式中:Uoc为开路电压;Isc为短路电流;Um为最大电压;Im为最大电流;ppv为输出功率。

1.2 预测模型建立

RF(Random Forest)分类模型构建过程的主要步骤如下:

(1)利用Bootstrap进行重采样:采样过程利用Bootstrap法,设初始的训练样本集合为T,进行随机地、有放回地L次抽样,抽样得到L个样本子集,这些样本子集用于训练决策树每个子集的样本数量相同,将其表示为{T1,T2,…,TL},在进行抽样时,一个子集St(t∈1,2,…,L)中,不含有某一样本的概率P为:

(5)

当L→∞时,有:

(6)

未被抽中的约38%的样本数据称为袋外数据,在生成每一棵决策树时,都可以同时计算得到一个袋外样本OOB(out of bag)误差估计,将所得到的所有的OOB误差估计取平均值,从而得到RF的泛化误差估计。

(2) 构建决策树:决策树的构建用到了CART算法,将得到的决策树组合成一个随机森林。利用随机子空间的思想,从m个特征变量中,进行随机地等概率地抽取,从而得到d个子变量,并组成分裂特征的变量子集,根据基尼系数值最小原则,在其中选出一个最优的分裂特征变量,利用相应的最优分裂值对该节点进行分裂,进行递归法建树,结束的标志是每一个特征变量都被用作分裂节点,重复进行上述过程共N次,最终建立N棵决策树,从而组合成为一个随机森林[10]。其中定义一个Gini系数:

(7)

式中:di表示当前所选的特征变量;k为特征变量;pk为样本点属于第k类的概率。

特征的重要性评估是通过Gini系数得出的,通过计算每个特征的重要性评分,可以识别并去除不相关的特征,从而提高模型的准确性。

(3) 投票表决阶段:对于所输入的样本集,这些决策树共同构成了一个随机森林,每个决策树都相应有一个分类结果,对其结果进行投票,将投票结果为最多的类别选作最终决策,相应公式如下:

(8)

式中:Y(x)表示的是测试样本最终分类结果;yn(x)=i表示的是第n棵决策树的输出为i;λ为表达式的个数;z表示的是类别的数量。

本文进行短期预测,同时考虑其受云层运动等影响可能会发生突变,因此太阳辐射度分为地表水平辐射,直接辐射和散射辐射三个方面。本文构建样本表示为:Xi={xti,xdi,xzi,xsi},即{i时刻的环境温度,i时刻的地表水平辐射,i时刻的直接辐射,i时刻的散射辐射}。

1.3 光伏预测结果

通过羲和能源大数据平台获得2022年5月18日00∶00至6月16日00∶00逐小时环境温度、地表水平辐射、直接辐射、散射辐射和输出功率数据(如图1)。其中环境温度指高地面约1.5 m~2.0 m处百叶箱中的温度;地表水平辐射指地表水平方向获得的太阳辐射;直接辐射指垂直于太阳能方向的直接辐射;散射辐射指太阳光在穿过大气层到达地面过程中通过云、空气中气体分子以及尘埃等产生散射,最后通过漫射到达地球表面的辐射能。

图1 环境温度、地表水平辐射、直接辐射、散射辐射、输出功率参数曲线

可见,在这一个月内每天的发电功率呈一定规律,在中午附近达到高峰,两边呈下降趋势。用这一个月内时间点的数据作为训练集代入程序,结合被预测当日的环境温度、地表水平辐射、直接辐射、散射辐射,即可得出预测的输出功率,如图2所示。

图2 功率预测

1.4 预测结论与模型评价

光伏功率预测误差客观存在且不可避免,究其原因主要是云层的剧烈变化所引起的光伏功率曲线的波动,所以待预测日的类型是影响误差分布的主要因素。随机森林算法的性能高度依赖于随机性,因此可以通过改进随机化过程来减少误差,本文采用了RandStream 类,可以创建随机数流,来有效减少误差。一般来说,子树的数量越多,误差就越小,预测的准确性也越稳定,但是同时也会延长计算时间,所以在综合误差性能和速度上,本文选择的子模型数量为800。

选取平均绝对值误差(MAE),均方根误差(RMSE)和相关系数(R)用于评估预测模型的预测性能和数据特征。其中MAE和RMSE越小,表明预测结果的精确度越高,R值越接近于1,说明预测功率值与实际功率值线性关系越高,表明预测功率曲线与实际功率曲线趋势越接近。

将提出的预测模型与DP-决策树、DP-Bagging、DP-Boosting三种经典方法进行了比较分析[11],结果如表1所示。

表1 预测性能比较

本文方法的MAE与RMSE误差指标均低于其他三种方法,同时相关系数最大,由此验证了该模型在短期光伏功率预测中具有较高的预测精度和良好的适应性。

2 风力发电预测模型

2.1 风电场特性

风能具有不确定、波动、低密度能量等特点。随着风力发电的迅猛发展,风电在电网中的比例不断增加,当其并网功率占电网总功率比例超过一定量时,并网的风电会对电力系统的安全稳定以及电能质量产生影响,严重时可能会导致系统失去稳定[12]。

本文选择陕西北部经度109.39°、纬度35.32°某风场数据研究风电场输入对功率输出的影响。风机型号为GoldWind-GW_1.5_70(轮毂高度为70 m,装机容量为1.5 MW),数据选取2022年5月18日00∶00至6月16日00∶00逐小时的数据,四个输入参数分别为气压、地面风速、风向、风速,输出参数为输出功率。

由风电场数据曲线(见图3)可知在气压变化幅度增大的同时,地面风速变化也变大,该时间段平均地面风速约为3.4 m/s,地面冷空气较为活跃,风速较大。由该风电场参数曲线对比可知,最大发电量为1.19 MW,最小发电量为0,其波动性与间歇性明显,不确定性强,使得接入电网的风电对电网造成较大冲击,大规模接入更会影响电网系统的可靠性和电能质量,这使得风电站不得不弃风,造成了能源浪费。为了解决上述问题,就要实现风力发电功率合理精确预测,将风电站、光电站与抽水蓄能电站联合运行,利用抽水蓄能“削峰填谷”作用,将具有一定波动性、质量不高的风电转换为比较稳定的、质量较高的电能,从而减少风、光能源的浪费,提高发电的效率。本文探讨如何将风电、光电与抽水蓄能电站联合运行并优化,实现其发电效率提升。

图3 风电场气压、地面风速、风向、风机轮毂风速参数曲线

2.2 模型介绍

本文利用卷积神经网络(Convolutional Neural Networks,CNN)预测风力机组的输出功率,基本结构如下。

(1) 输入层

输入层可以处理多维数据,同时对输入数据进行归一化标准化后,有利于提升卷积神经网络的学习效率。本文输入层为二维数据,类似于一个4*698大小的图像,输入数据为风机转轴处的风速、风向、地面风速和气压四个参数,训练集占比85%,剩下15%用于测试。

(2) 隐含层

其中卷积层对输入的数据进行特征提取,卷积层的内部包含很多卷积核,每个卷积核都有权重系数和偏差量。其内部每个神经元都与上一层中位置接近区域的其他多个神经元相连,输出的每个神经元与输入进行局部连接,利用连接权值与局部输入加权求和再加上偏置值从而得到该神经元输入值,该过程等同于卷积过程[13-14]。

卷积层的参数包括:卷积核大小、填充以及步长,三个参数共同决定了卷积层最终输出特征图的尺寸大小,是CNN的超参数。卷积核大小可以为小于输入图像尺寸的任意值,其越大,可提取的输入特征情况越复杂。卷积步长表示卷积核相邻两次扫过特征图时相邻位置的距离,因为本文输入数据较小,故卷积步长设为1,卷积核会逐个扫过特征图的元素,有利于特征的准确提取 。考虑本文输入数据为4*698大小,为了更加准确提取,本文卷积核大小选为3*3,数量为32,为了不丢弃原图信息以及保持特征图的大小与原图一致,同时保持边缘信息,让更深层的layer的input依旧保持有足够大的信息量,填充方式设定为相同填充,通过加入padding函数来实现。加入激励函数以协助表达复杂特征,本文选用计算简单,导数恒定,具有稀疏性的非饱和激活函数ReLU激励函数。

全连接层是隐含层的最后部分,其作用是向其它的全连接层传递信号,可以对提取的数字特征进行相应的非线性组合,也就是利用现有的高阶的特征完成相应的学习目标。本文全连接层神经元个数为2,长度取值为32。

(3) 输出层

本文因为输出只有一个,故输出层神经元设置为1。

2.3 训练测试结果

通过风机发电功率历史数据对模型进行训练,训练最大迭代次数是20次,批处理样本为16,学习率(控制梯度下降的速度)为0.005,梯度阈值为1,同时使用ValidationData函数防止过度拟合。在训练数据时,加入Adam函数对随机梯度下降算法进行一定的扩展,其作用是计算梯度的一阶矩估计以及二阶矩估计,因此可以为不同的参数设计不同的独立的自适应的学习率。图4为模型训练实际数据与测试数据结果对比。据图分析,测试数据较接近实际数据,预测整体效果良好。

图4 CNN模型测试结果与真实值比较

2.4 预测结论与模型评价

本文选取4个指标用于评估预测模型的预测性能和数据特征,包括平均绝对值误差(MAE)、平均绝对值误差百分比(MAPE)、均方根误差(RMSE)和相关系数(R)。其中MAE和RMSE越小,表明预测结果精确度越高。

预测数据的主要来源是天气预报和风电场的实际测试得到的数据,受气象地理等诸多不确定条件影响,地面风速、轮毂处风速以及风向的变化都非常复杂,具有很强的随机性,因此预测误差无法避免。并且由于梯度会逐渐地衰减,误差的强度会乘上权重后相应的向后传播,这将导致强度衰减,因此导致CNN预测时出现误差。CNN模型测试误差大致在0.04以内,相对误差在0.9以内,误差较小,模型预测精度较高。训练过程共迭代740次,随着训练轮数的增加和训练误差的降低,风电功率预测模型的特性不断接近实际功率的变化特性,从而实现功率的预测。

为验证模型的预测性能,选取了四种预测模型做对比,将提出的预测模型与GRU、Arima、SVM、LSTM四种经典方法进行比较分析[15],结果如表2所示。

表2 预测性能比较

本文方法的MAE与RMSE误差指标均低于其他四种方法,同时相关系数为0.9969,由此验证了此模型在短期风电功率预测任务中较高的预测精度和良好的适应性。

3 风光抽水蓄能联合优化系统

本文研究在抽水蓄能电站参数未确定的条件下,以无约束条件的优化算法,结合风光电的预测结果,选用容错率较高的BP神经网络,对抽水蓄能电站的短期出力进行预测。

3.1 优化目标

本模型为单目标优化模型,考虑系统出力在以一个月为尺度的时间段内出力均匀、波动最小为目标,建立目标函数。

(9)

此目标函数表示了时间尺度内系统出力的波动性,函数值越小,表示系统出力越均匀,其出力曲线越接近光滑直线。

3.2 BP神经网络优化建模

以某地历史上每年某个月的风光预测出力数据,求和取平均值即Pav,作为某地该月的系统平均出力。

(10)

以Pav作为该月的系统平均出力,可以保证该月内抽水蓄能电站用电发电近似相等,实现抽蓄平衡。

(11)

式中:当Yt为正数时,抽水蓄能电站放水发电;当Yt为负数时,抽水蓄能电站抽水耗电。

(1) 输入层

以该代表月为例,采用小时为单位,共计2 091组数据。选择前300组数据用来构建模型,采用比例70%的训练集以及30%的测试集,剩余的数据作为检验模型的依据。对数据进行归一化处理从而将原数据映射到选择的区间。本模型归一化范围为[-1,1]。

(2) 隐含层

隐含层的节点个数对于识别率的影响不大,但为了避免节点个数过多导致运算量增加的问题,本模型选择双隐含层结构,节点个数第一层为10,第二层为20。神经网络训练的目标误差是模型是否结束的判断条件之一,当目标误差到达设定值时,停止迭代,得到最终的BP神经网络模型。本模型设置目标误差为1×10-6。综合考虑网络收敛以及识别效果,将学习率设置为默认值0.1。激励函数主要有三个,分别为tansig、logsig、purelin。purelin函数是输出层的默认函数,即线性传递函数。tansig只是在logsig的基础上进行拉伸平移操作。在该模型的建立中,输入层到第一隐含层使用tansig,第一隐含层到第二隐含层使用logsig,第二隐含层到输出层使用purelin。LM算法首先是一种非线性规划方法;其次其主要用于无约束的多维非线性规划问题;根据实际模拟效果分析,发现数据通过LM算法可以得到更为合理的模拟结果。故模型选择利用LM算法作为训练的激励函数。

(3) 输出层

最大代数是模型是否结束的判断条件之二,当迭代次数达到最大代数时,停止迭代,得到最终的BP神经网络模型。本模型设置最大代数为1 000。

数据集划分为训练集、验证集和测试集,训练集、验证集用来进行网络的训练和验证,测试集用前者训练所得的模型进行预测,并与期望值比较,至模型达到误差及拟合优度容许范围之内,使得目标函数接近最小值,模型训练完成。

此模型的最小单位为1 h,也可根据需要自行构建更高或更低级的时间模型。据此模型结果,可对当地拟建的抽水蓄能电站参数进行设定和评估,例如爬坡率、最大出力等。

3.3 仿真分析

本文采用误差逆向传播的BP神经网络对优化模型进行求解。

(1) 结构组成

输入层包含风电功率和光电功率参数,通过具有10个节点的第一隐含层、具有20个节点的第二隐含层,输出层即可得到抽水蓄能发电功率[16]。

(2) 训练结果分析

根据系统自动生成得到最终训练结束的各种参数。该模型迭代10次结束训练,训练结束时,误差达到8.16×10-8,符合原定的1×10-6。

图5选用MSE(均方误差)来分析模型的训练构建过程,依次为训练集过程、验证集训练过程、测试集训练过程。由这三条曲线走向与对比效果可以看出,三条曲线走势基本重合,该模型对该种情况预测具有一定代表性。

通过训练集、验证集、测试集及全集等四个集合模型的拟合训练,训练集的效果良好,拟合的相关系数达到1,该BP神经网络具有良好的模拟预测性能。

(3) 预测数据的进一步验证

通过前300个数据作为构建模型所需要的数据,剩余数据进一步验证模型的预测效果。

(4) 预测数据的评估

抽水蓄能电站的预测数据如图6。横坐标代表数据的时间序号,纵坐标代表抽水蓄能电站的BP神经网络预测出力(正值代表放水发电,负值代表蓄水耗电)。可以看出,图像大体呈波浪形,发电段和蓄能段时间分布均匀。周期约23.69 h。在午后13∶00—16∶00时风光发电功率总和达到低谷,而抽水蓄能电站发电达到高峰;在午夜1∶00—3∶00时风光发电功率总和达到高峰,而抽水蓄能电站发电达到低谷,符合日调节抽水蓄能电站一般发电规律。最大爬坡速率47.6%/h,低于一般水轮机组爬坡速率峰值,故可验证联合系统建模的正确性。

图6 抽水蓄能电站出力图

预测数据集的均方根误差(RMSE)为0.020,平均绝对百分误差为1.02%,误差较小,模型预测精度较高。

选择已经建立好的模型集合,并调出其中的预测数据,见图7。横坐标代表数据的时间序号,纵坐标代表联合系统的总预测出力。可以看出,风电、光电、抽水蓄能的总输出功率接近我们在模型建立时期望的42.27%。

图7 联合系统总出力图

4 结 论

利用随机森林预测光伏发电输出功率,利用环境温度,地表水平辐射,直接辐射和散射辐射四个参数进行功率预测,一天最大输出功率在中午,夜间输出功率为0,预测与实际数据误差在可控范围。

通过卷积神经网络算法以风电机组的输出功率为目标进行预测,综合考虑地面风速、风机轮毂中心风速、风向以及气压,预测误差小,预测模型较为准确。

利用风力发电、光伏发电与抽水蓄能发电的互补性,建立风光抽蓄联合优化运行模型,通过BP神经网络对风力发电和光伏发电输出功率联合进行优化,得到最终稳定的发电目标以及抽水蓄能出力数据。模型预测误差小,预测速度快,操作简单,联合优化运行消除了风、光发电功率的波动性造成的并网困难的问题,使得输出功率更加平稳可利用,减少了资源的浪费,并且可为拟建以及已有抽水蓄能电站出力参数的确定提供参考。