APP下载

基于CEEMDAN 的综合能源系统负荷预测研究

2023-02-08黄世超郭永强龙本锦闫江峰

智能计算机与应用 2023年1期
关键词:复杂度神经网络负荷

黄世超,郭永强,龙本锦,杜 纤,闫江峰

(贵州大学 电气工程学院,贵阳 550025)

0 引言

提高能源综合利用效率、发掘新能源、实现可再生能源规模化开发,已成为解决日益凸显的能源需求增长与能源紧缺之间矛盾的必然选择。传统的能源系统规划所表现出的能源利用效率低、无法发挥能源间的优势互补等问题日益突出,而综合能源系统是解决这些问题的有效方案。精确的负荷预测,对能源系统安全、经济运行起到重要的作用。

综合能源系统不同于传统单一能源系统,其可灵活地将区域内的各种能源整合起来,通过能源转换装置和储存设备等,实现能源之间的耦合与转换,最终提供给用户电、冷、热、气等不同需求的能源。由于综合能源系统与传统能源系统在能源利用方面有着本质的差别,导致两者的负荷预测有着较大的差异。在综合能源系统中,不仅要考虑气象、日历信息等外部因素的作用,还要兼顾各类型负荷之间的内在耦合关系。目前已有的电力、热、冷、气联合负荷的预测方法主要有以下方法:一是将温度、湿度等气象因素视为外生变量,不同负荷的历史资料视为一种内生变量的方法,得到了不错的预测效果[1-4]。如文献[4]中提出了一种基于注意力的卷积神经网络(CNN)与LSTM、双向长短期记忆(BILSTM)模型相结合,用于综合能源系统中的短期负荷预测,将过去5 天的历史负荷、温度、冷负荷和天然气消耗量用作输入特征,输入到预测模型中,最终得到较高精度的预测结果。二是基于多任务学习(MTL)的预测[5-6],其将不同类型能源负荷的信息通过多任务学习的共享机制进行处理,取得了比单任务学习更有效的预测结果。如文献[6]中梳理了不同集成能量子系统之间的耦合关系、在多任务学习中的权重共享机制,以及在最小二乘支持向量机的帮助下,构建了基于多任务学习和最小二乘支持向量机的电、热、冷、气的多元负荷组合预测模型。此外,还有文献提出先分解后预测的方法。此类方法将随机性高的负荷数据分解为多个相对平稳的子序列,降低原始序列高随机性对预测的影响。如:文献[7]针对综合能源系统中负荷具有较大的随机性和较大的波动性,采用核主成分分析(KPCA)、二次模态分解和深度双向长短期记忆(DBiLSTM)和MLR 组合而成的多模型预测方法。但此方法在分解过后的预测模型计算规模太大,需简化其模型。因此,为提高模型的预测速度,应尽可能对电力数据分解后的模型进行简化。

为使综合能源负荷数据分解更加彻底并简化数据分解后的预测模型,本文提出一种基于自适应噪声的完全集成经验模态分解--样本熵,以及BP 神经网络和Transformer 模型组合而成的短期综合能源负荷预测方法。通过对亚利桑那州立大学坦佩校区负荷数据进行建模预测,并与多种方法进行对比,结果表明本文提出的组合预测模型精度高、计算量小。

1 CEEMDAN-SE-BPNN-Transformer 组合预测模型

本文将数据分解算法与BP 神经网络、Transformer 模型结合,提出了基于CEEMDAN-样本熵-BPNN-Transformer 的组合预测模型。利用CEEMDAN-样本熵将综合能源系统负荷分解为一系列复杂度差异明显的子序列,之后利用BP 神经网络和Transformer 模型分别对复杂度低与复杂度高的子序列进行建模预测,最后将各子序列预测结果进行叠加得到负荷预测结果。

本文所提预测方法的主要步骤如下所示:

(1)收集历史数据;

(2)对电、冷、热负荷数据进行CEEMDAN 分解,得到分解后的子序列;

(3)计算分解后子序列的样本熵值,根据样本熵值进行重组得到新的子序列,并划分为复杂度高与复杂度低的子序列;

(4)结合天气、日历信息数据,使用BP 神经网络对复杂度低的子序列进行训练并预测;使用Transformer 模型对复杂度高的子序列进行训练并预测;

(5)叠加各子序列的预测结果,得到最终的多元负荷预测结果。由于多元负荷受许多因素影响,单一预测方法难以学习其中规律,因此采用CEEMDAN 算法将非线性的非平稳时间序列预测问题转化为多个平稳的时间序列预测问题,把复杂的多元负荷分解为相对简单的子序列CIMF;同时利用样本熵对分解得到的平稳子序列进行复杂度分析,并将其重组,形成新的子序列NIMF,从而减少计算量并降低模型复杂度。针对复杂度较高的子序列,基于注意力机制(Attention)的Transformer 模型能给予较高的关注,最大程度的挖掘其中的规律,得到较为准确的预测结果;而对于复杂度较低的子序列,其周期性较强,故采用结构简单的BP 神经网络进行预测,从而减少训练时间并避免耗费资源较多的问题。

1.1 自适应噪声的完全集成经验模态分解

CEEMDAN[7]作为EMD[8]的一种改进方法,克服了EMD 模态混叠现象,同时也解决了EEMD 处理过程中加入的白噪声难以去除的问题,并且其重构误差很小。CEEMDAN 主要改进的地方是通过向原始信号添加自适应的白噪声,分别使用EMD 进行分解,并对分解所得的分量求均值进而得到最后的本征模态函数(intrinsic mode functions,IMF)。CEEMDAN 算法的步骤如下所示:

(1)向负荷原始序列x(t)中添加白噪声ωm(t),添加白噪声后的序列为:

其中M为添加白噪声的次数。

(2)对xm(t)进行EMD 分解,分解后对其取平均得到第一个分量c1(t):

然后得第一个余项:

(3)向余项中加入白噪声后进行EMD 分解,对结果取平均得到第二个分量c2(t):

然后得第二个余项:

(4)循环步骤2 和步骤3 直到余量不能再分解,CEEMDAN 算法的实现步骤可总结为

其中:ci(t)为第i个IMF 分量,r(t)为残余项。

1.2 样本熵

近似熵可以衡量序列的复杂度,并且只需要一个序列中的少部分数据就可以得出结果,但是由于近似熵有着一致性差和计算结果易产生偏差的缺点[9]。因此,针对近似熵的缺点,Richman[10]于2000 年提出样本熵理论,相比于近似熵,样本熵拥有更好的精度。样本熵的大小直接反应出序列的复杂程度,序列越复杂,其样本熵值就越大;若序列越简单,样本熵值就越小。样本熵的值用SE(n,α,K)表示,可以描述为

其中,K为时间序列的长度;n为维数;α为相似容限;Rn+1(α)和Rn(α)表示α阈值情况下,两个时间序列匹配n或n +1 个点的概率。当K取有限值时,通过式(7)得到的样本熵估计值为

1.3 BP 神经网络

BP 神经网络[11]是一种应用广泛的预测方法,其结构简单,泛化性能较好,相比SVR 和差分整合移动平均自回归模型(ARIMA)算法,能更准确的预测周期性强、平滑的负荷,故本文选择BP 神经网络来预测复杂度低的子序列。

由于BP 神经网络结构简单,针对复杂度高的子序列,则无法得到精确的预测结果。而基于注意力机制(Attention)的Transformer 模型[12],具有较强的特征提取能力,对于复杂度高的时间序列,会给予较高的关注,复杂度高的时间序列在Transformer 模型中会得到更高的注意力权重,故预测结果也相对准确。因此,本文采用Transformer 模型来预测负荷复杂度高的子序列。

1.4 Transformer 模型

基于Attention 的Transformer 模型[12]由编码器与解码器两部分组成,其结构比Attention 更加复杂。Transformer 模型结构如图1 所示。

图1 Transformer 模型结构图Fig.1 The structure of Transformer Model

Transformer 模型在编码器和解码器中引入Attention 机制,使其拥有更好的特征提取效果。输入层通过全连接网络,将输入的时间序列数据映射成向量,通过使用具有正弦和余弦函数的位置编码,将输入向量与位置编码向量逐元素相加,来对时间序列数据中的顺序信息进行编码。所得到的向量被送入6 个编码器层,每个编码器层由一个自注意力子层和一个完全连接的前馈神经网络子层组成。为了构建一个更深的模型,每个子层都应用了残差连接,后面紧跟一个规范化层。编码器产生一个向量反馈给解码器。解码器采用了与原始Transformer模型[12]结构相似的解码器设计。该解码器由输入层、6 个相同的解码器层和一个输出层组成。

Transformer 模型采用自注意力机制来学习不同时间步长的长期关系,引入注意力机制就是为了解决信息过长导致信息丢失的问题。其中,注意力机制根据键(Key)值K∈和Query值Q∈得到Value值V∈RN ×d V,如下式为:

式(9)中,X为输入的序列,WQ、WK、WV为初始化的Query、Key和Value值,式(12)中A()的规范化作用可用以下式子表示为

为提高标准注意力机制的学习能力,文献[12]中提出了多头注意力机制。用不同的头部来表示子空间,如式(14)所示:

其中,W(h)K、W(h)Q、W(h)VQ分别表示Key、Query、和Value值的权重,WH线性地结合了从头部Hh来的所有输出。

Transformer 模型通过使用注意力机制来挖掘复杂度高的子序列的内在规律,使其能够更加精确拟合复杂度高的子序列,实现对复杂度高的子序列的准确预测,提高负荷的预测精度。

2 实例分析

本文选取美国亚利桑那州立大学坦佩校区的综合能源系统2020 年1 月1 日~2 月29 日的数据作为实验数据,按照8 ∶1 ∶1 的比例来划分训练集、验证集和测试集。其中,预测集为2020 年2 月24~2 月29 日的电、热、冷负荷。

2.1 数据归一化及预测结果评价指标

为了使预测模型更好的提取到负荷数据的内部特征,采用归一化对数据进行处理,其计算公式为:

式中,xg为归一化处理后的数据;x为需要归一化的数据;xmax、xmin分别表示负荷数据的最大值和最小值。

为了更好地评估预测模型,本文采用均方根误差(RMSE)以及平均绝对百分比误差(MAPE)作为评价指标。各评估指标的计算公式为:

其中,y(k)、x(k)分别为k时刻的预测值和真实值,m为样本总数。

为更加全面地评估多元负荷预测结果,采用综合MAPE对预测效果进行评估:

其中,α电=1/3,α冷=1/3,α热=1/3。

2.2 负荷数据分解及复杂度分析

将电负荷、冷负荷、热负荷分别进行分解,CEEMDAN 参数取值:高斯白噪声标准差为0.2,加入噪声次数为500 次。

电负荷被分解为10 个CIMF 和1 个残余项,并对这11 个子序列进行ADF(Augmented Dickey-Fuller)检验。结果表明,11 个子序列均没有单位根,为平稳序列。通过CEEMDAN 分解处理,把随机性较强的非平稳时间序列预测问题,转化为多个相对平稳的时间序列预测问题,充分挖掘了原始负荷数据中的信息。

采用样本熵理论,分别对分解得到的电负荷子序列、冷负荷子序列和热负荷子序列复杂度评估,其中电负荷子序列样本熵分析结果如图2 所示。

图2 电负荷子序列的样本熵Fig.2 Sample entropy of electrical load subsequence

由图2 可知,前两个CIMF 的样本熵值均大于1,表明这两个CIMF 的复杂度都比较高。且第一个CIMF 和第二个CIMF 电负荷子序列的样本熵值很接近,差值仅为0.067 4,表明这两个CIMF 产生新模式的概率大小基本相同,故可以将这两个CIMF 叠加,作为一个子序列进行训练并预测,将叠加产生的新序列简称为NIMF1;第三个CIMF 的样本熵值为1.048,表明该序列复杂度高,本文把该序列作为一个单独的序列进行训练和预测,简称该序列为NIMF2;第四和第五个CIMF 的样本熵值的差仅为0.015 8,表明这两个CIMF 产生新模式的概率大小基本相同,故可以将这两个CIMF 叠加作为一个子序列进行训练并预测,简称该新序列为NIMF3;第六、第七与第八个CIMF 的样本熵值差值较小,故把这3 个CIMF 叠加得到新序列NIMF4。NIMF1、NIMF2、NIMF3、NIMF4 均使用Transformer 模型进行预测。第九、第十个CIMF 以及余项的样本熵值均小于0.1,表明这3 个序列复杂度低,且3 个序列的样本熵值的差值很小,故把这3 个序列叠加得到新的序列NIMF5。由于这3 个序列的复杂度较低,故使用结构简单的BP 神经网络进行预测,从而减少训练时间并避免耗费资源较多的问题。叠加后的电负荷子序列及其使用的预测模型,见表1。

表1 电负荷子序列重组结果Tab.1 Recombination results of electrical load subsequences

同理对冷、热负荷分解得到的子序列,也使用样本熵进行复杂度评估。

2.3 预测结果及分析

按照产生的电、冷、热重组新序列使用对应的预测模型进行训练并预测。其中,电、冷、热负荷经过重组产生的子序列如果序号相同,则将此电、冷、热负荷的对应新序列输入到同一个模型进行预测。Transformer 模型采用8 头注意力机制,学习率为0.001,正则化dropout 参数为0.1。为体现多元负荷预测的优势,利用单一负荷预测的结果与多元负荷预测结果进行对比,其对比结果见表2。

表2 单一负荷预测与多元负荷预测误差对比Tab.2 Error comparison between single load forecasting and multiple load forecasting

由表2 可知,多元负荷预测结果的误差明显小于单一负荷的预测误差,验证了多元负荷预测方法的优越性。综合能源系统中若对电负荷、冷负荷以及热负荷使用单一负荷预测方法进行分别预测,那么相比于多元负荷预测,单一负荷预测情况下会消耗3 倍的时间成本。若将多元负荷放在一起预测,则使预测模型能更好地挖掘学习多元负荷的内在信息,得到更加准确的预测结果。

为了充分验证多元负荷预测方法的有效性及优越性,选取4 种方法对多元负荷进行预测,并对比分析预测结果。

方法一:使用Transformer 模型对电、冷、热负荷进行预测。

方法二:使用EEMD 算法对电、冷、热负荷进行分解,再使用样本熵来进行复杂度分析并重组分量,之后分别使用BP 神经网络和Transformer 模型对复杂度低的子序列和复杂度高的子序列进行预测,方法简称为ESBT。

方法三:使用EEMD 算法对电、冷、热原始负荷进行分解,并使用文献[13]中提出的过零率作为划分高频分量和低频分量的依据,将分解得到的序列划分为高频部分和低频部分,再分别使用MLR 和GRU 对低频部分和高频部分进行预测,最后将预测结果进行重构得到最终预测结果,此方法简称为EGM。

方法四:首先,运用CEEMDAN 分别对电、冷、热负荷进行本征模态分解后,运用KPCA 对天气、日历规则特征集提取主成分,实现数据降维;将分解得到的分量结合特征集主成分,用深度双向长短记忆(DBiLSTM)神经网络进行预测,最后将预测结果进行重构,得到最终预测结果,此方法简称为CKD。

各模型2 月24 日~2 月29 日的电、冷、热负荷预测结果如图3 所示,各模型预测误差详见表3。

图3 负荷预测结果Fig.3 The results of load forecasting

由图3 与表3 可知,相比于其它方法,本文方法在此实验数据集上表现最优,能更加准确地预测出多元负荷的趋势,并且在负荷的峰谷位置比其它的方法更加准确。另外,不同算法对此实验数据集多元负荷预测时,冷负荷预测的效果最好,这是由于2月的冷负荷周期性较强,并且波动性较小,各算法能很好地学习到其中的规律。

表3 各模型预测误差Tab.3 The forecasting error of each model

在对多元负荷预测时,各种预测方法的表现如下:

(1)KCD 方法能预测出负荷的大致趋势,但是在一些峰谷的位置,还是存在较大误差。KCD 方法运用CEEMDAN 分别对电、冷、热负荷进行本征模态分解后,运用KPCA 对天气、日历规则特征集提取主成分实现数据降维;将分解得到的分量结合特征集主成分,用DBiLSTM 神经网络进行预测。此方法对原始数据的降维处理,在一定程度上减少了数据冗余,提高了运行效率,但却导致部分隐藏的耦合信息被抹去,使得此方法对负荷的学习不够充分,最终预测效果欠佳。

(2)ESBT 方法在周期性较强的冷负荷预测上表现不错,但在随机性较强的热负荷上表现不佳,热负荷的MAPE 为3.394%,综合MAPE 为2.856%。ESBT 方法使用EEMD 算法对电、冷、热负荷进行分解,再使用样本熵来进行复杂度分析并重组分量后,分别使用BP 神经网络和Transformer 模型对复杂度低的子序列和复杂度高的子序列进行预测。此方法中EEMD 虽能对原始负荷进行分解,但是在分解过程中加入的白噪声难以去除,使得序列的重构误差过大,导致最后预测结果误差不理想。

(3)Transformer 模型整体表现不佳。由于多元负荷序列多为非平稳的序列,单一的预测模型难以挖掘负荷内部信息,从而导致预测结果不理想。

(4)4 个对比方法中整体表现最差的是EGM 方法,EGM 方法使用EEMD 算法对电、冷、热原始负荷进行分解,并使用过零率来作为划分高频分量和低频分量的依据,将分解得到的序列划分为高频部分和低频部分,再分别使用MLR 和GRU 对低频部分和高频部分进行预测。此方法在分解过程中加入的白噪声难以去除,使得序列的重构误差过大;另外使用GRU 对高频部分进行预测误差也较大,导致最后预测结果误差不理想。

(5)本文所使用方法的电、冷、热负荷的MAPE分别为1.808%、1.551%、2.143%,综合MAPE 仅为1.834%,电、冷、热负荷的RMSE 分别为0.372 MW、69.467 Ton、0.249 mmBTU/h,比KCD 方法的电、冷、热负荷RMSE 分别减少了0.138 MW、23.164 Ton、0.109 mmBTU/h;比EGM 方法的电、冷、热负 荷RMSE 分 别 减 少 了 0.517 MW、95.407 Ton、0.390 mmBTU/h。

3 结束语

本文针对综合能源系统负荷随机性较强的特点,提出了一种基于CEEMDAN-样本熵-BPNNTransformer 的综合能源系统负荷预测方法。将本文所提方法与多种方法的预测结果进行对比,得到以下结论:

(1)相比于单一预测方法,本文所提方法具有更高的预测精度,说明基于CEEMDAN-样本熵-BPNN-Transformer 的综合能源系统负荷预测模型能深度挖掘负荷内在信息并学习其规律。

(2)相比于其他的分解方法,CEEMDAN 能将负荷充分分解,使得模型可深度挖掘负荷信息。

(3)相比于GRU、DBiLSTM,Transformer 能更加有效地挖掘多元负荷存在的耦合关系并学习其规律,最终得到精确的预测结果。

猜你喜欢

复杂度神经网络负荷
3项标准中维持热负荷要求对比分析
Opening flexible resources by integrating energy systems: A review of flexibility for the modern power system
神经网络抑制无线通信干扰探究
一种低复杂度的惯性/GNSS矢量深组合方法
基于神经网络的中小学生情感分析
求图上广探树的时间复杂度
主动降负荷才是正经事
基于神经网络的拉矫机控制模型建立
某雷达导51 头中心控制软件圈复杂度分析与改进
出口技术复杂度研究回顾与评述