基于改进CEEMDAN-BO-LSTM的短期电价预测
2025-01-25秦昆刘立群吴青峰何俊强
摘 要:电价预测对于国家电力市场的销售价格,电力调度和市场波动管理具有重要意义,但现有方法在电价预测的准确性上不理想.为了进一步提升电价预测的准确性,提出一种基于改进完全自适应噪声集合经验模态分解(ICEEMDAN),贝叶斯优化(BO)和长短时记忆网络(LSTM)的短期电价预测模型.ICEEMDAN将原始数据分解为多个本征模态函数(IMF)和一个残差序列,然后将IMF分量重构为高频,中频和低频三个子序列,将子序列和残差序列分别与相关因素结合,重构为四个多维特征矩阵,输入BO-LSTM模型进行训练,最后得到预测结果.用西班牙国家电网公司Red Electric Espaa运营数据进行算例分析,结果表明ICEEMDAN-BO-LSTM模型具有更高的准确度,在电价跳跃点和峰值点处预测结果表现出色,与其他方法相比预测效果更好,对能源企业和国家电力市场调控策略具有实用价值.
关键词:电价预测; 完全自适应噪声集合经验模态分解; 贝叶斯优化; 长短期记忆网络
中图分类号:TM715
文献标志码: A
Short-term electricity price prediction based on improved CEEMDAN-BO-LSTM
QIN Kun, LIU Li-qun*, WU Qing-feng, HE Jun-qiang
(School of Electronic and Information Engineering, Taiyuan University of Science and Technology, Taiyuan 030024, China)
Abstract:Electricity price prediction is crucial for the sales pricing,power dispatch,and market volatility management in the national electricity market.However,existing methods are often inadequate in terms of accuracy.To enhance the accuracy of electricity price predictions,a short-term electricity price prediction model based on Improved Complete Ensemble Empirical Mode Decomposition with Adaptive Noise (ICEEMDAN),Bayesian Optimization (BO),and Long Short-Term Memory networks (LSTM) is proposed.ICEEMDAN decomposes the original data into multiple Intrinsic Mode Functions (IMFs) and a residual sequence.The IMF components are then reconstructed into three sub-series:high-frequency,mid-frequency,and low-frequency.These sub-series and the residual sequence are combined with related factors to form four multi-dimensional feature matrices,which are then input into the BO-LSTM model for training.The final prediction results are obtained from this process.Case studies using data from Red Eléctrica de Espaa,the Spanish national grid operator,demonstrate that the ICEEMDAN-BO-LSTM model has higher accuracy.It performs exceptionally well in predicting price jumps and peak points,and it outperforms other methods,making it valuable for energy companies and national electricity market regulation strategies.
Key words:electricity price prediction; CEEMDAN; bayesian optimization; long short-term memory
0 引言
可再生能源,如太阳能和风能,在国家电力系统中所占比例越来越高,这使得平衡电力供需关系,追求更高经济性变得更加困难[1].这就需要能够分析消费者需求模式的电力需求响应策略,准确预测电价的变化是该策略的核心要素[2].可靠的电价预测能够把握电力市场的运行状态,推动市场主体,合理配置资源,提高效率.
目前对短期电价的预测方法研究中,数据分析挖掘预测方法成为热点研究方向[3].深度学习和机器学习在当前的研究中表现出了比较好的预测精度.其中,机器学习包含支持向量机回归(SVR)[4],随机森林回归(RF)[5]等算法,深度学习中包含循环神经网络中的门控循环单元网络(GRU)[6],长短时记忆网络[7]等算法.以上方法对短期电价的预测通过输入多维特征,如负荷、不同燃料类型的发电量、天气特征等信息对模型进行训练.模型对数据集中各项特征的关系进行提取和分析,实现了对未来电价更准确的预测[8].
研究人员为提高神经网络模型的预测性能,文献[9]提出一种基于最大信息数法(MIC)、集成经验模态分解(EEMD)和改进informer的短期电价预测模型,能更好地捕捉数据的时序特性.文献[10]将改进的自适应噪声完备集合经验模态分解与卷积神经网络叠加稀疏去噪自动编码器模型结合,但忽略了一些可能会有明显影响的输入特征.文献[11]提出一种基于改进变分模态分解(VMD),粒子群算法(PSO),卷积神经网络(CNN)和长短期神经网络的短期电价预测模型,提高了电价预测的精度.
以上方法都针对初始电价数据的非线性和非平稳性做了处理,但在实际操作中,当输入新一天的数据时,经过分解得到的IMF分量数量可能会发生变化,导致模型需要重新训练.本文根据过零率(ZCR)将IMF分量组合为高频,中频和低频序列进行训练,结合相关数据重构为多维矩阵,从而提高了模型的可用性并减少了训练时间.LSTM网络在时间序列预测方面具有精度优势[12],但LSTM存在输入特征量较大时易出现过拟合问题,过拟合会导致模型的预测效果不好[13],因此采用皮尔森相关系数法(PCC)先对数据集的输入维度进行特征提取,筛选出具有较强相关性的输入特征以提高预测的精准度并避免过拟合问题[14].同时针对传统方法依靠经验选取超参数,导致预测精度不高且比较繁琐的弊端,用贝叶斯算法(BO)优化LSTM的两个超参数.采用西班牙电力市场运营数据进行验证,结果证明ICEEMDAN-BO-LSTM在短期电价预测上具有更高的有效性和精准度.
1 模型介绍
1.1 改进CEEMDAN原理
1.1.1 CEEMDAN
CEEMDAN算法是经验模态分解算法(EMD)的改进版本[15],引入自适应噪声算法,能有效解决EMD模态混叠的问题,提供更准确和稳定的分解结果[16].给定输入信号表示为f(t),定义Ei(°)表示使用EMD分解得到的第i个模态分量,计算公式如式(1)~(6)所示:
(1)向待分解信号f(t)中添加高斯白噪声序列,其中δ0为信噪比,ωi为第i次添加的白噪声序列:
1.1.2 ICEEMDAN
由于CEEMDAN分解的数据是历史数据,考虑到未来数据的输入,分解结果的数量可能会发生变化[17],这意味着在分解历史数据后训练的模型可能难以处理未来的输入数据.同时,考虑到分量越多,所需时间越长.因此,本文通过计算每个分量的过零率(ZCR)来调整模型,ZCR公式如式(7)、(8)所示:
式(7)、(8)中:x(n)是第n个数据值,N是一帧数据的总长度.
ZCR表示每个分量数据中符号变化的比率,可以大致反映数据的波动频率.各IMF分量的ZCR值如表1所示,IMF1的ZCR高于40%,属于高频分量;IMF2到IMF4的ZCR在10%到40%之间,属于中频分量;IMF5到IMF8的ZCR低于10%,属于低频分量.
将IMF分量按不同过零率组合进行实验,求得最适合BO-LSTM模型预测电价数据的组合方式.实验一将IMF分量分为高频和低频,再加上残差序列;实验二将IMF分量和残差序列分为高频,中频和低频;实验三将IMF分量分为高频,中频和低频再加上残差序列,使用BO-LSTM模型进行验证.选用RMSE,MAE和MAPE作为算法的评价指标,RMSE描述了预测值与实际值的差异,MAE描述了预测值与实际值之间差异的平均绝对值,MAPE描述了模型预测的相对误差,其计算公式如式(9)~(11)所示:
式(9)~(11)中:Ti为实际电价;ti为预测电价;m为电价数量.
实验结果如表2所示,ICEEMDAN-BO-LSTM模型在利用高频,中频,低频和残差序列四个分量时表现最佳.因此将预测模型的输入数据固定为四个,如图2所示,只需训练四个分量,使得预测时间仅需394秒,相较于九个分量时的837秒,缩短了52.9%.
1.2 贝叶斯优化算法
贝叶斯优化算法是一种基于贝叶斯理论的全局优化算法,采用高斯过程建立概率代理模型,在先前参数信息的基础上不断更新先验,利用采集函数寻找下一个评估点,从而在尽可能少的评估次数下找到最佳参数.贝叶斯优化算法的核心分为高斯过程回归和采集函数两个部分[18].
1.2.1 概率代理模型
高斯过程是一种非参数模型,其核心思想是不假设目标函数g的特定形式,而是通过数据来定义函数的分布,这一过程的公式如式(12)所示:
μ(a*)=c*T(C+σ2nI)-1bcov(a*)=c-c*T(C+σ2nI)-1c*
(12)
式(12)中:μ(a*)表示函数在a*处的均值;a*表示目标预测函数预测值对应的输入点;c*为测试点与训练数据点的协方差向量;C为训练数据点之间的协方差矩阵;σ2n为高斯噪声的方差;I为单位矩阵;b训练数据点的目标值向量;cov(a*)表示函数在a*处的协方差;c为测试点自身的协方差.
1.2.2 采集函数
期望改进采集函数(EI)是根据后验概率分布构造的,通过最大化采集函数来选择下一个最有“潜力”的评估点.同时,有效的采集函数能够保证选择的评估点序列使得总损失最小.EI采集函数公式如式(13)、(14)所示:
EI(x)=(μ(x)-f(x*))φ(z)+σ(x)φ(z),σ(x)gt;0
0,σ(x)=0
(13)
z=μ(x)-f(x*)σ(x)
(14)
式(13)、(14)中:f(x*)为函数的最优值;μ(x)为均值;σ(x)为标准差;φ为标准正态分布概率密度函数.
神经元个数和正则化系数这两个超参数对于LSTM神经网络的收敛性和性能至关重要,合理调整这两个超参数可以帮助模型达到更好的性能,提高其对新数据的预测能力,并减轻过拟合问题的影响,因此采用BO对神经元个数以及正则化系数这两个超参数进行寻优.超参数寻优范围见表3所示.
1.3 LSTM网络模型
LSTM作为一种特殊的循环神经网络(RNN),保留了RNN网络的自反馈结构,使其在处理时间序列上具有明显优势,而且LSTM独特的“门”结构能有效解决传统RNN在处理长时间序列时出现的梯度消失与梯度爆炸等问题[19],其结构见图3所示.
长短期记忆神经网络方法包括三个门[20]:遗忘、输入和输出.遗忘门使用sigmoid函数过滤记忆信息和前一刻新输入的信息,当门的值为1时,保留所有信息,当门的值为0时,丢弃所有信息.这个特性对于LSTM在顺序数据中保持长期依赖关系的能力至关重要;输入门用来控制当前时刻的网络输入进入单元的多少;输出门用来控制单元状态进入当前单元输出的多少,其具体公式如式(15)~(20)所示.
(1)遗忘门:从单元状态中删除信息
ft=σ(wf[ht-1,xt]+bf)
(15)
(2)输入门:向单元状态添加信息
it=σ(wi[ht-1,xt]+bi)
(16)
ct=tanh(wc[ht-1,xt]+bc)
(17)
更新单元状态:
ct=ftct-1+itct
(18)
(3)输出门:从单元状态中选择有用的信息,并将其作为输出进行传输
ot=σ(wo[ht-1,xt]+bo)
(19)
ht=ottanh(ct)
(20)
式(15)~(20)中:w为权重矩阵;b为偏置项;f为遗忘门;i为输入门;o为输出门;σ为sigmoid函数;tanh为双曲正切函数.
1.4 ICEEMDAN-BO-LSTM模型
为提升电价预测的准确性,提出一种基于ICEEMDAN-BO-LSTM的短期电价预测模型,提高了电价预测的效率和准确性,其流程见图4所示.
第一步:采用PCC找出原始数据中与电价数据相关性较高的影响因素,以降低后续训练模型的输入维度;第二步:将原始电价数据输入CEEMDAN算法进行分解,随后将IMF分量按ZCR值分类为高频,中频和低频序列,提高预测的效率和准确性;第三步:是将高频,中频,低频和残差序列分别与第一步中寻找出的相关因素进行重构,提高电价预测的准确性和泛化性;最后,将第三步中重构所得多维特征矩阵运用滑动窗口的方式输入BO-LSTM模型,其原理如图5所示,根据后续需要,设置滑动窗口宽度为8,步长为1.
以2018年数据作为示例,展示ICEEMDAN-BO-LSTM模型超参数寻优结果,详见表4所示.预测完成后将各预测结果叠加得到最终期望电价预测值.
2 算例分析
2.1 数据处理
本实验所用数据集如表5所示,前四个数据集为西班牙2016年12月至2018年11月的春夏秋冬四季的电价数据及相关因素,第五个数据集为2018年电价及相关因素.样本中的消耗和发电数据来自ENTSOE,结算价格来自西班牙电网公司Red Electric Espaa.
预测短期电价需要准确识别相关影响因素,这些因素对预测的准确性有显著的影响.PCC通常用于评价两个正态连续变量之间的线性相关性,本研究利用PCC来确定与实际电价相关的影响因素.皮尔森相关系数法的相关性强弱标准见表6所示.
基于PCC,将燃气发电量,燃煤发电量,水电抽水蓄能消耗发电量,实际总负荷作为模型的输入参数,其相关系数见表7所示.可以看出,这些因素与实际电价的相关系数的绝对值均大于0.5,与实际电价具有较强相关性.
2.2 预测结果对比
为验证本模型的有效性及准确性,以SVR、LSTM、BO-LSTM和遗传算法优化的反向传播神经网络(GA-BP)[21]作为对比,评价指标采用RMSE、MAE、MAPE,其公式见式(9)~(11).
预测结果如图6所示,其中图6(a)~(d)依次为春季、夏季、秋季和冬季的预测结果对比,图6(e)为2018年的预测结果对比.分析图6可知,ICEEMDAN-BO-LSTM的曲线拟合结果更好,相较于其他模型与实际电价数据的误差更小,在电价跳跃点和峰值点处拟合结果也具有优越性,说明采用ICEEMDAN-BO-LSTM模型在电价预测上具有更高的精准度.各模型预测结果的评价指标详见表8所示.
根据表8中的数据,可以看出ICEEMDAN-BO-LSTM在春季、夏季、秋季、冬季和2018年五种不同数据集上预测结果的RMSE值分别为1.11、1.17、1.17、1.66、1.13,远低于BO-LSTM、LSTM和SVR.而BO-LSTM的RMSE值分别为2.15、2.02、1.81、2.45和1.99,仅次于ICEEMDAN-BO-LSTM;在春季、夏季、秋季、冬季和2018年ICEEMDAN-BO-LSTM预测结果的MAE值分别为0.83、0.86、0.92、1.35和0.95,预测效果优于BO-LSTM、LSTM和SVR.而BO-LSTM的MAE值分别为1.72、1.53、1.44、1.9和1.57,优于LSTM和SVR模型;ICEEMDAN-BO-LSTM在春季、夏季、秋季、冬季和2018年预测结果的MAPE值分别为1.17%、1.15%、1.34%、2.04%和1.38%,显著低于BO-LSTM、LSTM和SVR.而BO-LSTM的MAPE值分别为2.48%、2.05%、2.07%、2.87%和2.3%,在对比模型中表现较好.综上所述,ICEEMDAN-BO-LSTM在短期电价预测上具有更高的准确性.
为了进一步验证算法的普适性,将2018年数据集结构重新划分,95%作为训练集,5%作为测试集,再次进行预测,曲线拟合图见图7所示,评价指标见表9所示.
根据表9中的结果,可以看出BO-LSTM、GA-BP和LSTM模型在重新划分数据结构的数据集上预测效果均有改善,SVR表现效果变差.ICEEMDAN-BO-LSTM仍是表现最好的模型,与原数据划分方式相比,变化不大,RMSE为1.2,MAE为0.93,MAPE为1.37%.可见ICEEMDAN-BO-LSTM在结构重新划分的数据集上预测效果良好,具有普适性.
2.3 尖峰点、跳跃点预测结果对比
电价数据具有短期内可能出现显著波动的特点,为进一步验证本文所提模型在电价跳跃点和峰值点处的有效性和准确性,在各数据集预测结果中选取50个具有代表性的点,与2.2中在对比模型中预测效果较好的BO-LSTM模型进行对比,对比结果如图8所示,评价指标见表10所示.
分析表10可知,ICEEMDAN-BO-LSTM的RMSE、MAE和MAPE相较BO-LSTM模型分别下降了0.85、0.7和1.06%.可见基于ICEEMDAN-BO-LSTM的电价预测模型在跳跃幅度大,变化速度快的电价跳跃点和峰值点处的预测结果与真实值差别不大,具有良好的性能.
3 结论
(1)针对现有方法短期电价预测效果差的问题,提出了一种ICEEMDAN-BO-LSTM模型.通过西班牙电价数据进行模型准确性验证.
(2)采用改进CEEMDAN算法将原始电价数据分解为IMF分量和残差序列,再将IMF分量按ZCR重构为高频,中频和低频序列.最后将高频,中频,低频和残差序列与相关因素重构为四个多维特征矩阵,输入BO-LSTM模型中进行预测,使混合模型预测有效性和准确性得到提高.
(3)基于同样的数据集使用SVR、LSTM、BO-LSTM进行对比实验,选取RMSE、MAE、MAPE作为评价指标.对比结果证明ICEEMDAN-BO-LSTM模型预测准确率更高,在电力市场中具有一定的应用价值.
(4)后续研究中可综合考虑能源价格等因素,进行必要的特征选择,进一步提高电价预测准确率.
参考文献
[1] Ghimire S,Deo R C,Casillas Pérez D,et al.Two-step deep learning framework with error compensation technique for short-term,half-hourly electricity price forecasting[J].Applied Energy,2024,353:122 059.
[2] 胡艳美,王 品,丁亦新,等.基于MKELM的智能电网短期电价预测与分类[J].高电压技术,2023,49(S1):47-52.
[3] 万 灿,崔文康,宋永华.新能源电力系统概率预测:基本概念与数学原理[J].中国电机工程学报,2021,41(19):6 493-6 509.
[4] Sarwar S,Aziz G,Tiwari A K.Implication of machine learning techniques to forecast the electricity price and carbon emission:Evidence from a hot region[J].Geoscience Frontiers,2024,15(3):101 647.
[5] 魏 勤,陈仕军,黄炜斌,等.利用随机森林回归的现货市场出清价格预测方法[J].中国电机工程学报,2021,41(4):1 360-1 367,1 542.
[6] Haolin Yang,Kristen R.Schell.HFNet:Forecasting real-time electricity price via novel GRU architectures[C]//2020 International Conference on Probabilistic Methods Applied to Power Systems(PMAPS).Liege:IEEE,2020:1-6.
[7] 殷 豪,丁伟锋,陈 顺,等.基于长短时记忆网络-纵横交叉算法的含高比例新能源电力市场日前电价预测[J].电网技术,2022,46(2):472-480.
[8] Brynjolefsson E,Mitchell T.What can machine learning do:Workforce implications[J].Science,2017,358(6 370):172-176.
[9] 许 越,李 强,崔 晖.基于MIC-EEMD-改进Informer的含高比例清洁能源与储能的电力市场短期电价多步预测[J].电网技术,2024,48(3):949-958.
[10] Tan Y Q,Shen Y X,Yu X Y,et al.Day-ahead electricity price forecasting employing a novel hybrid frame of deep learning methods:A case study in NSW,Australia[J].Electric Power Systems Research,2023,220:109 300.
[11] 郭雪丽,华大鹏,包鹏宇,等.一种基于改进VMD-PSO-CNN-LSTM的短期电价预测方法[J].电力科学与技术学报,2024,39(2):35-43.
[12] 张 扬,李晓杰,马兹林,等.锂离子电池故障诊断算法研究综述[J].重庆理工大学学报(自然科学),2023,37(9):49-61.
[13] 吉兴全,曾若梅,张玉敏,等.基于注意力机制的CNN-LSTM短期电价预测[J].电力系统保护与控制,2022,50(17):125-132.
[14] Li W,Becker D M.Day-ahead electricity price prediction applying hybrid models of LSTM based deep learning methods and feature selection algorithms under consideration of market coupling[J].Energy,2021,237:121 543.
[15] 牛群峰,袁 强,王 莉,等.基于CEEMDAN-RVM-LSTM模型的锂电池剩余寿命预测[J].电源技术,2023,47(10):1 313-1 318.
[16] 江 莉,向世召.基于CEEMDAN-VSSLMS的滚动轴承故障诊断[J].计算机集成制造系统,2024,30(3):1 138-1 148.
[17] Wang J,Zhang T,Lu T,et al.A Hybrid forecast model of EEMD-CNN-ILSTM for crude oil futures price[J].Electronics,2023,12(11):2 521.
[18] 刘新宇,蒲欣雨,李继方,等.基于贝叶斯优化的VMD-GRU短期风电功率预测[J].电力系统保护与控制,2023,51(21):158-165.
[19] 李家豪,王青于,范玥霖,等.鲸鱼优化算法-双向长短期记忆神经网络用于断路器机械剩余寿命的预测研究[J].高电压技术,2024,50(1):250-262.
[20] 史加荣,王双馨.基于VMD-BiLSTM-WOA的短期风电功率预测[J].陕西科技大学学报,2024,42(1):177-185.
[21] 柏 睿,罗 刚,唐 林,等.基于遗传算法的高比例风电短期电价预测[J].人民长江,2022,53(S1):119-124.
【责任编辑:蒋亚儒】