基于风速波动幅度动态划分区间的ISSA-BP风电功率预测
2024-04-29唐杰,刘琳,刘白杨,邵武,管烨,易资兴
唐杰,刘琳,刘白杨,邵武,管烨,易资兴
摘要:为了解决传统风电功率预测精度不高的问题,采用一种基于风速波动幅度动态划分区间的风电功率组合预测方法。首先,对清洗后的风速数据进行卡尔曼滤波得到去噪后的风速曲线图,计算该曲线中相邻元素的差值向量并归一化处理,完成风速波动幅度的可视化分析,依据波动幅度曲线的第一、二、三时间点将全年数据动态划分为4个区间;其次,利用Tent混沌映射算法初始化麻雀种群位置得到改进麻雀搜索算法(improvement sparrow search algorithm,ISSA),对误差反向传播算法(back propagation,BP)的连接权和阈值进行优化,建立ISSA-BP风电功率组合预测模型;最后,运用MATLAB仿真软件进行仿真验证。仿真结果表明,动态划分区间的ISSA-BP风电功率预测方法能显著提高预测精度,对提高电力系统经济运行水平,促进风电消纳具有一定的理论实际意义。
关键词:改进麻雀搜索算法;反向传播算法;卡尔曼滤波;风电功率预测
中图分类号:TM614 文献标志码:A
ISSA-BP wind power prediction by interval based on dynamic division of wind speed fluctuation range
TANG Jie, LIU Lin, LIU Baiyang, SHAO Wu, GUAN Ye, YI Zixing
(Hunan Provincial Key Laboratory of Grids Operation and Control on Muti-Power Sources Area, Shaoyang University, Shaoyang 422000, China)
Abstract: In order to solve the problem of low accuracy of traditional wind power prediction, a wind power combination prediction method based on dynamic interval division of wind speed fluctuation amplitude was proposed. Firstly, Kalman filtering was applied to the cleaned wind speed data to obtain the noise-reduced wind speed curve, The difference vector of adjacent elements in the curve was calculated and normalized to complete the visual analysis of the wind speed fluctuations. Secondly,the improvement sparrow search algorithm (ISSA) was obtained by initializing the sparrow population location using the Tent chaotic mapping algorithm, and the connection weights and thresholds of back propagation (BP) algorithm were optimized.The ISSA-BP wind power combination forecasting model was established. Finally, MATLAB simulation software was used for simulation verification. The simulation results show that the proposed dynamic interval division ISSA-BP wind power prediction method significantly improves the prediction accuracy, and has certain theoretical and practical significance for improving the economic operation level of power system and promoting the consumption of wind power.
Key words: improved sparrow search algorithm; back propagation; Kalman filtering; wind power forecast
截至2022年底,我國风电装机容量突破3.65亿kW[1-2]。预计2030年前,我国装机容量将达到8亿kW,2060年达到30亿kW[3]。然而,风力发电受自然气候影响较大,风电功率具有较强的随机性,导致电力系统风电大规模消纳面临挑战。同时,风电随机性直接影响电力系统电能质量,严重威胁电力系统安全稳定运行[4]。因此,准确预测风电功率,不仅给电力调度部门提供较准确的调度决策依据,而且为风电企业提高经济效益,降低运营维护成本。
为提高风电功率预测精度,以机器学习模型为代表的风电功率预测模型研究成为一大研究热点。现有模型改进方法包括单一模型改进和模型组合。在模型改进方面,群体智能算法被广泛应用于风电功率预测,大幅提升了模型预测性能,然而,群体智能算法普遍存在初始种群,随机分布不均匀,影响种群多样性与个体收敛速度的问题。为此,学者们进一步提出了多种改进群体智能算法,主要是与智能优化算法的组合、与改进策略的融合,常见改进策略有反向学习、重选精英个体和混沌映射法[5]。文献[6]利用混沌映射融合反向学习方法,实现初始化多元宇宙算法、增加寻优能力。文献[7]通过引入精英个体重选策略,降低陷入局部最优风险,提高求解效率。在模型组合方面,文献[8]通过长短期记忆(long short-term memory,LSTM)与极限梯度提升树(eXtreme gradient boosting,XGBoost)加权组合预测,调整2个模型预测值的误差权值,减小风电功率预测误差。
综上所述,可通过模型改进与组合提高预测精度,然而,除预测算法选择和改进外,原始数据的划分是影响风电功率预测精度的另一大主要因素[9]。
常见传统的数据划分方法有季节划分法和月划分法,均是按照固定时间点单一地划分数据区间,操作简单。但未考虑风速的地区差异性,没有对风电场具体分析确立出适合当地风电场的预测方法。本文提出一种考虑地区性的动态划分风电功率预测方法,在模型算法的选择上结合动态区间划分方法,共同提高风电功率预测准确度。
1ISSA-BP的预测模型建立
1.1卡尔曼滤波(kalman filtering,KF)
KF是一种结合先验经验、当前测量值以及测量更新的状态估计算法,也是最优化自回归数据处理算法,由式(1)~式(3)得到卡尔曼滤波估计值。KF具有良好的平滑滤波和削减噪声的数据处理能力,KF后的曲线作为可视化分析的直接依据,实现区间动态划分。
1)根据上一时刻状态值估计当前状态值及其协方差:
Xi=X′i-1Pi=Pi-1+vi(1)
式中:X′i-1为i-1时刻后验状态估计值,作为KF得到的最优估计值,即最终滤波结果;Pi为先验估计协方差;vi为状态过程噪声V的协方差。
2)计算卡尔曼增益矩阵:
Ki=PiPi+wi(2)
式中:wi为测量噪声W的协方差。
3)用测量值修正状态估计值及其协方差:
X′i=Xi+ki(Yi-Xi)P′i=(1-Ki)Pi(3)
式中:P′i为后验估计协方差。
1.2可視化分析及动态划分区间
对上节所述后验估计曲线进行幅度波动的可视化分析,并确定动态划分区间的第一、第二以及第三时间点。可视化步骤如下,流程图见图1。
1)计算后验估计曲线的相邻元素差值向量以及变向点的索引向量,并归一化处理。
2)绘制出后验估计曲线的波动幅度曲线,其中X轴为样本编号N,Y轴为波动幅度。
3)找出波动幅度曲线中数值排前三的3个极大值点,它们所对应的横坐标值确定为第一、第二以及第三时间点,从而将后验估计曲线在X轴动态划分为4个区间。
1.3改进麻雀搜索算法(improvement sparrow search algorithm,ISSA)优化反向传播算法(back propagation,BP)算法
1.3.1ISSA
麻雀搜索算法(sparrow search algorithm,SSA)是从麻雀的觅食行为与反哺行为中得到启发而提出,利用生物特性进行迭代寻优。根据麻雀在觅食中的角色,分为两类:从不同空间搜索食物的发现者;从发现者获得食物的加入者。所有麻雀中能成功觉察到捕食者的麻雀称为觉察者。
由n只麻雀组成的种群表示为X=[x1,x2,…,xn]T。每个麻雀对应的适应度值构成的适应度矩阵为:F=[f(x1),f(x2),…,f(xn)]T。其中,每个麻雀的适应度函数为BP神经网络训练后网络结构的均方误差平均值,误差越小其适应能力越强。适应度函数是通过多次迭代更新麻雀个体位置,筛选出达到设定收敛精度的适应度值,从而实现权重与阈值的参数优化。
第t次迭代时,发现者麻雀根据R2与ST的大小关系,按式(4)更新位置:
Xt+1i,j=Xti,j·exp(-iα·itermax),R2
式中:Xti,j为第i只麻雀的第j个维度位置值;itermax为最大的迭代次数;R2、ST分别为警报值、安全阈值,取值范围对应为[0,1.0]、[0.5,1.0];α、Q为随机数;L为内部元素全为1的1×j矩阵。R2>ST为捕食者出现,需转移至安全位置;R2 加入者为了增加捕食率,会与发现者进行争夺食物。加入者更新位置如式(5)所示: Xt+1i,j=Q·exp(Xtworst-Xti,ji2),i>n2Xti,j+Xti,j-XtP·A·L,i≤n2(5) 式中:Xt+1p为发现者的最优位置;Xtworst为最劣位置;A为1或者-1的1行j维矩阵,且A*=AT(AAT)-1;n为加入者数量。当i>n/2时,代表适应度较差后一半的加入者i争夺食物失败,移动到其他位置觅食;当i≤n/2时,代表在最优位置附近跟随发现者继续移动。 第i个觉察者的适应度值与当前总麻雀中最高适应度值进行比较,觉察者位置更新如下: Xt+1i,j=Xtbest+β·Xti,j-Xtbest,fi≠fgXti,j+K·(Xti,j-Xtworst(fi-fw)+μ),fi=fg(6) 式中:Xbest、Xworst为当前全局最优、最劣位置;β为步长控制参数,β~N(0,1);fw为最差的适应度函数值;μ取值极小,避免分母无意义;fi为当前麻雀个体的适应度值,fg为全局最佳适应度值,fi≠fg,代表麻雀在群体边缘,易受到捕食者攻击;fi=fg,代表种群中间的麻雀察觉到了危险,需靠近其他麻雀,避免被捕食;K为麻雀移动的方向,K∈[-1,1]。 利用Tent混沌映射法优化麻雀搜索算法的初始种群,增加初始种群的分布均衡性和多样性,解决因起始搜索点选择不当导致的搜索时间过长的问题,计算式为 xt+1=xtu,0≤xt 式中:t为映射次数;xt为第次映射函数值;Tent映射一般取u=0.5,为最经典的形式。 1.3.2BP算法 BP算法是目前应用最广泛的多层前馈神经网络,有d个输入、l个输出、q个隐藏层神经元,见图2,通过适应度函数不断优化网络各层连接权值(V1h、Vih、Vdh、W1j、W2j、Whj及Wqj)和神经元内的阈值(隐含层阈值,输出层阈值)。参数如下:训练次数为1 000、学习速率为0.01、训练目标最小误差取0.000 001。利用ISSA优化BP算法的连接权和阈值,建立ISSA-BP的预测模型。 2基于区间动态划分的ISSA-BP预测方法 2.1模型的评价指标 通常选用均方根误差(eRMSE)、平均绝对误差(eMAE)2个误差评价指标来评估风电功率的预测精度,计算公式如下[10]: eRMSE=1n∑ni=1xi-yi2(8) eMAE=1n∑ni=1xi-yi(9) 式中:n为样本数;xi为真实值;yi为预测值。 2.2模型预测的实施步骤 动态划分区间的ISSA-BP算法流程图见图3,具体步骤为: 1)历史的风电功率、气象数据,作为原始数据并进行异常值剔除、缺失值填补的清洗。鉴于皮尔逊相关性分析中风速与风电功率相关性最大,因此,提取风速数据进行KF。 2)提取KF后的后验估计曲线,进行波动幅度可视化分析,通过确定的第一、第二以及第三时间点将一年数据动态划分为4个区间。建立动态区间的4组数据集,同一组训练、测试样本来源于每一区间对应时间内数据,所选数据仅与区间有关,与年份无关,既可来源于同一年相同的区间,也可以是不同年份相同的区间。 3)确定每个区间中BP網络的拓扑结构:由经验公式N=(m+n)+a确定隐含层节点数,其中,m为输入层节点个数;n为输出层节点个数;a为1~10之间的整数。当网络输出层误差小于设定误差时,将更新最佳的隐含层节点,从而构建最佳隐含层节点的BP神经网络。 4)初始化SSA参数:初始种群规模取20;最大进化代数为20;发现者比例为0.7;加入者比例为0.3;觉察者比例为0.2。 5)Tent混沌映射使种群位置分布均匀,计算出最高适应度的个体作为初始种群。 6)对每只麻雀初始适应度值进行排序,确定当前最优、最差适应度值的麻雀及与之对应的位置。种群中的每个麻雀个体的位置代表BP网络中的初始权重和阈值。 7)发现者、加入者和觉察者位置更新,排序更新,并将更新后的适应度值与最优适应度值比较,达到最初设定的收敛精度后输出最高适应度的最优麻雀个体的位置,实现优化BP神经网络的权重和阈值。 8)计算网络误差,权值的更新,判断误差是否满足要求,直到相邻两次误差之间的差别小于设定值结束训练。 9)运用训练好的ISSA-BP神经网络模型进行区间预测。 3仿真分析 3.1数据来源 原始数据为南方某地区风电场站提供的 2021年9月1日至 2022年8月31日的实测风电功率数据以及所对应的风速、气温、风向、湿度和气压5项气象数据。原始数据经数据清洗后,得到共15 328组实验数据,采样点以15 min为间隔进行预测。图4展示的是风电机组正常运行时连续125 h的风电功率数据,共计500个点。 3.2KF以及波动幅度可视化分析 将清洗后的风速实验数据采用KF后,剔除了原风速变化中的随机扰动噪声,使得风速数据更加接近场站的真实工作状态,风速曲线更加平滑、精度更高,增强了风速数据的趋势性特征,更加真实与直观,提取出变化趋势明显的风速曲线(后验估计曲线)见图5。对后验估计曲线进行波动幅度可视化分析得到图6,曲线中A、B和C点的X轴刻度值4 621、7 904和9 096确定为第一、第二以及第三时间点,进行4个区间分段预测。 3.3模型预测结果及分析 为了验证所提基于风速波动幅度动态划分区间预测风电功率的有效性,将原始数据按传统的固定时间点划分为传统季节划分法、阳历月份划分法与所提动态划分区间法分别建立4组、12组与4组数据样本集,将每个数据集导入ISSA-BP模型进行训练,每组数据样本按照8:2(训练集:测试集)划分为训练样本和测试样本。不同划分方法下预测集的平均预测误差指标结果见表1。 由表1可知,所提动态划分区间法的均方根误差eRMSE比季节划分法和阳历月份划分法分别减少2.634%和6.701%;平均绝对误差eMAE相应分别减少4.236%和7.964%。证明了样本数据的动态划分区间法可明显提高预测精度。 为了验证所建ISSA-BP预测模型的有效性,与传统BP、SSA-BP、SSA-XGBoost模型进行对比,采用动态划分区间法,模型参数一致,其预测集在4个区间下的平均误差结果对比如表2所示。由表2可知,采用ISSA-BP模型的eERME比BP、SSA-BP、SSA-XGBoost分别减少37.834%、9.557%和23.456%;eMAE相应分别减少30.854%、8.900%和18.860%。经过数据对比,所提模型在预测精度上比其他模型大幅提高。 将ISSA-BP模型与传统BP、SSA-BP、SSA-XGBoost模型在动态划分法的4个区间进行分段预测,得到预测集中预测值和真实值结果对比局部图,见图7~10。 4结论 基于不同地区KF后风速波动情况不同,即风速波动幅度曲线中第一、第二以及第三时间点出现的位置有所偏差,如果按传统划分法中固定时间点划分一年数据,按一刀切的时间点进行分段预测时,易出现预测精度不高的问题,本文提出基于风速波动幅度动态区间划分的ISSA-BP风电功率预测方法,通过对风速波动幅度可视化分析,由第一、第二以及第三时间点动态划分全年数据,能够解决地区性的误差,有效处理原始数据样本,减小风电的预测功率与期望的误差值。在模型的选择与数据集的划分上共同提高模型的预测精度,主要结论如下: 1)建立的ISSA-BP模型与BP、SSA-BP、SSA-XGBoost模型进行对比,均方根误差eRMSE分别减少37.834%、9.557%和23.456%,大幅度提高了风电功率预测的精度。 2)提出的动态划分区间法与季节划分法、阳历月份划分法相比较,平均绝对误差eMAE分别减少了6.701%和7.964%。 参考文献: [1]王新宝, 葛景, 韩连山, 等. 构网型储能支撑新型电力系统建设的思考与实践[J]. 电力系统保护与控制, 2023, 51(5): 172-179. [2]中国可再生能源学会风能专业委员会. 2022年中国风电吊装容量统计简报[J]. 风能, 2023(4): 40-56. [3]李梦洁. 基于风电信号特性分析的风电功率预测研究[D]. 徐州: 中国矿业大学, 2023. [4]聂永辉, 吴永庆, 蔡国伟, 等. 基于随机预测理论的双馈风电机组参与电网调频控制策略研究[J/OL]. 中国电机工程学报: 1-13[2023-06-27]. [5]项长生, 施昊, 杨睿. 基于模态频率应变能熵和Tent—SSA—BP神经网络的桥梁损伤识别方法的研究[J]. 公路, 2023, 68(3): 143-150. [6]何鑫, 雷勇, 王进武, 等. 基于变分模态和改进多元宇宙优化的短期风电功率预测[J/OL]. 现代电力: 1-10[2023-04-24]. [7]黎素涵, 叶春明. 重选精英个体的非线性收敛灰狼优化算法[J]. 计算机工程与应用, 2021, 57(1): 62-68. [8]王愈轩, 梁沁雯, 章思远, 等. 基于LSTM-XGboost组合的超短期风电功率预测方法[J]. 科学技术与工程, 2022, 22(14): 5629-5635. [9]唐新姿, 顾能伟, 黄轩晴, 等. 风电功率短期预测技术研究进展[J]. 机械工程学报, 2022, 58(12): 213-236. [10]朱宗玖, 刁海岸. 基于深度神經网络算法的风电功率短期预测模型[J]. 邵阳学院学报(自然科学版), 2022, 19 (4): 1-9.