APP下载

基于VMD与MOGOA-LSTM的短期负荷预测模型

2022-04-07欧阳孟可沈卫康

计算机与现代化 2022年3期
关键词:蝗虫分量模态

欧阳孟可,沈卫康,成 徽,石 凯

(南京工程学院,江苏 南京 210000)

0 引 言

电力系统的短期负荷预测是利用已知的原始负荷数据,研究其内在的变化规律,结合天气、经济等因素对未来某段时间进行科学的预测。精准的电力负荷预测可以为电力市场调度提供重要的依据,保障电力系统的供需平衡。因此,需要研究科学合理的预测模型来提高预测的精度,得到更好的拟合效果,满足工程的需求[1]。

目前用于电力负荷预测的方法主要分为物理模型方法和统计方法。物理模型方法需要考虑天气、湿度等众多物理因素预测负荷,其中数值模拟预测是最常见的一种。物理模型方法依靠大量不同的数据预测负荷,预测过程中计算时间较长[2-3]。统计学方法通过学习历史数据构建数据间的映射关系,实现短期负荷预测。统计学方法主要有:自回归移动平均模型[4]、多元线性回归[5]、支持向量机(Support Vector Machine, SVM)[6]、极限学习法[7]等。统计学方法原理简单,使用范围广,但负荷预测的精度不高。为了改善这一问题,许多研究学者提出了基于统计学的混合预测模型,对比研究结果,混合预测模型比单一方法更容易获得精度较高的预测效果。文献[8]提出了经验模态分解(Empirical Mode Decomposition, EMD)与SVM组合用于短期负荷预测,在短期负荷分解预测上取得了突破,预测精度得以提高。文献[9]提出了变分模态分解(Variational Mode Decomposition, VMD)技术结合长短期记忆(Long Short-Term Memory, LSTM)神经网络的预测模型,有效解决了EMD存在的模态重叠现象。文献[10]提出了VMD结合PSO优化LSTM网络的预测模型,有效改善网络预测的性能,提高了预测的准确度。文献[11]提出了基于GOA优化的SVM预测模型,有效解决了粒子群优化过程中消耗大量时间问题。文献[12-13]提出了相间重构(Phase Space Reconstruction, PSR)优化各模态分量的方法,进一步提升网络模型对负荷数据的学习,增强了网络的预测性能。

本文提出一种新的混合预测模型,该模型主要是由数据清洗、智能预测、多目标优化和综合评价4个部分组成。在数据清洗方面,设计一种基于变分模态分解方法,进一步挖掘原始负荷数据中的不确定性特征,剔除高频噪声。在智能预测方面,设计基于C-C方法的PSR,以确定合适的训练测试比和神经层数。在多目标优化方面,引入多目标蝗虫智能优化算法(Multi-Objective Grasshopper Optimization Algorithm, MOGOA)来提高预测的稳定性和精度。在综合测评方面,采用多种评价方法对预测结果进行综测测评。

1 理论基础

1.1 变分模态分解

VMD是一种新的非线性信号分解估计方法,能够解决EMD存在的模态重叠问题。VMD可以将原始的输入信号通过非递归的方式分解成K个有限带宽模态函数uk(t)。每个分量带宽的计算过程如下[14-15]:

1)采用希尔伯特对各分量uk(t)进行计算,得到单侧频谱。

2)将分解后的各个分量uk(t)与其对应的中心频率的指数e-jwkt进行混合,并转移到对应的基频带。

3)通过高斯平滑度和梯度平方的L2范数,得到各分量的信号带宽。其变分约束计算公式为:

(1)

其中,δ(t)为狄拉克函数,*为卷积操作符,k为模态分量的总数;f(t)为原始负荷的输出信号。

通过引入二次惩罚项α和Lagrange乘子项λ(t),将公式(1)的约束极值问题转化为非约束性问题进行求解,计算公式为:

(2)

采用ADMA法求解拉格朗日函数的鞍点,实现模态变量的更新。更新方法为:

(3)

其中,f(ω)、ui(ω)、λ(ω)分别是f(t)、ui(t)、λ(t)的傅里叶变化,n为迭代的总次数。

1.2 相间重构(PSR)

PSR是提取混沌时间序列中有价值特征的方法。经过PSR之后,可以在高维空间中显示域的特征[16]。给定一个时间序列x={xi|i=1,2,3,…,N},经过PSR构造处理之后的序列分量如公式(4):

(4)

其中,M=N-(m-1)τ,Xi(i=1,2,…,M)是指PSR和M构造的矩阵X的第i列。2个参数τ和m分别代表相间重构的延迟间隔时间和嵌入的维数。本文采用一种基于2个相关积分的C-C方法,获得合适的输入隐藏形式和训练实验比[17]。相关计算公式为:

(5)

其中,dij为欧几里得距离,δ为空间距离。δ的值可以描述为:

(6)

1.3 长短期记忆网络模型

LSTM是在递归神经网络的基础上提出的改进模型,该模型保留了RNN网络高效处理时序数据的能力,通过添加细胞核处理器,缓解了训练过程中梯度消失的问题。其内部结构由3个门控制结构和1个细胞记忆单元组成[18-19]。LSTM单元结构如图1所示。

图1 LSTM单元结构

1)遗忘门。决定上一时刻哪些信息保留到当前状态:

ft=σ(Wf[ht-1,xt]+bf)

(7)

2)输入门。决定哪些信息加入到本单元中:

(8)

3)单位状态更新。决定哪些新的信息保存到st当中:

st=ft×st-1+it×gt

(9)

4)输出门。决定当前状态有多少信息被过滤掉:

(10)

在式(7)~式(10)中,Wf、Wi和Wo分别为各个门的权重矩阵,bf、bi、bo分别为各个门的偏置向量。σ、tanh为激活函数。

2 改进的长短期记忆网络模型

2.1 MOGOA算法

为了解决LSTM模型在训练过程中无法到达全局最优解的问题,本文采用多目标优化算法优选LSTM模型的隐藏层数、迭代次数与学习率。MOGOA是根据蝗虫觅食的行为提出的一种多目标的智能优化算法[20]。在整个算法中,蝗虫主要由幼虫和成虫2个部分组成,成年蝗虫负责探索整个全局空间,幼年蝗虫负责开发局部邻域[20]。蝗虫行为的数学表达式为:

Yi=Si+Gi+Ai

(11)

其中,Yi表示种群中第i只蝗虫所处的位置,Si表示第i只蝗虫受到种群中其它蝗虫的互动力的影响,Gi、Ai分别表示种群中第i只蝗虫受到的重力、风力。蝗虫运动过程中影响最大的因素是种群之间的交互力。计算公式为:

(12)

s(r)=fe-r/ι-e-r

(13)

(14)

其中,ubd、lbd分别为函数s(r)在d维空间中的上下边界。Τd为当前蝗虫在d维空间中最佳解的位置。在搜寻过程中,为了保证成年蝗虫探索和幼年蝗虫开发的平衡,蝗虫优化算法在更新每个粒子位置时,加入一个随迭代次数增加而比例系数减小的系数c,其计算公式为:

(15)

其中,cmax、cmin分别为系数c的最大值和最小值;m、M分别为当前迭代的次数和所需迭代的总次数。

2.2 LSTM模型参数优化

本文选取LSTM作为短期负荷预测的主要网络模型,其中学习率、迭代次数、隐藏层及神经元数量这4个超参数的设置对网络的预测性能有很大的影响。将这4个参数作为蝗虫寻优的特征,利用MOGOA对LSTM超参数进行调整优化。在LSTM网络搭建过程中,前一个隐藏层的输出作为后一个隐藏层的输入,最后连接一个全连接层,构成预测结果的输出。

MOGOA优化LSTM模型参数的步骤为[21]:

1)对获取到的负荷数据及相关影响因素进行数据归一化操作。

2)进行参数设定。MOGOA算法需要初始化的参数有:最大迭代次数、种群的规模、蝗虫的上下边界的限定区间、cmax、cmin;LSTM网络中待优化变量:每一个隐藏层的节点个数、学习率、迭代次数等。根据文献[3,10]对所有参数进行了设定。

3)进行粒子初始化。利用随机初始化函数生成蝗虫种群的位置。

4)蝗虫适应度计算。将带有LSTM模型参数的种群个体的适应度定义为:

(16)

5)根据公式(14)和公式(15)分别更新蝗虫的位置和参数c。计算更新后的适应度,并与历史最优进行比较,若优于历史最佳,则更新,否则不更新。

6)若迭代次数达到设置的上限值时,将当前求得的参数作为LSTM的最优解,并进行参数保存。否则返回步骤4。

MOGOA算法优化LSTM网络参数流程如图2所示。

图2 MOGOA算法优化LSTM网络参数流程

3 基于VMD-MOGOA-LSTM短期负荷预测模型

3.1 模型构建思路

1)首先对非线性、随机波动的负荷数据及影响因素进行数据归一化处理操作。

2)将数据预处理的结果通过VMD技术分解成若干不同频率的模态分量。

3)对分解后的每个分量按照7:3的比例分成训练集和测试集。

4)将分解后的每个模态分量通过基于C-C的PSR方法,动态确定负荷预测的训练验证比,构成神经网络的输入。

5)对分解后得到的每个分量分别建立MOGOA优化LSTM网络参数的模型,求解出最佳网络参数。

6)根据步骤5求解的最佳参数,建立LSTM神经网络模型。

7)对各自模态分量的预测结果进行累加,得到短期负荷预测的结果。实验流程如图3所示。

图3 VMD-PSR-MOGOA-LSTM组合预测的流程

3.2 数据预处理

为了消除数据之间因量纲不同而导致的误差,一般在模型训练之前对原始数据进行归一化操作,即将数据的取值范围转换到(0,1),计算公式为:

(17)

其中,x′i、xi、xmin、xmax分别为归一化值、负荷值、负荷中的最小值、负荷中的最大值。

3.3 评价指标

评价指标为模型的性能度量提供了重要的依据,模型的比较和评价却没有统一的标准规则,为了更加准确、科学地评价所提模型的预测性能,本文采用多种评价标准,分别是MAE、RMSE、MAPE和R2。具体计算公式如下:

(18)

(19)

(20)

(21)

4 实验结果与分析

4.1 实验环境搭建

实验计算机配置:操作系为Ubuntu20.04,CPU为i7-9300H,GPU为GeForce GTX1060Ti,内存为16 GB DDR4,运行环境为Python3.7及Tensor2.4。

4.2 数据来源

为了验证本文所提模型的有效性,实验数据选取江苏省某地区2018年3月1号—2018年5月20号实测负荷值。该数据采样频率为1次/h,共计2328个负荷值。部分原始负荷序列如图3所示,从图中可以看出负荷数据具有波动性与不稳定性。

图4 原始负荷序列

4.3 VMD分解

变分模态分解过程中所需要设置的参数有:模态数K、惩罚因子α、精度收敛判据ε、噪声容忍度τ。研究表明VMD算法中的难点是确定分解的模态个数K,而α、ε、τ通常可以取默认值。模数K取值过大将导致模态重复,取值较小将导致模态未完全分离[22]。

(a) 模态分量图 (b) 频谱图图5 K=9和K=10时江苏某地区负荷 VMD模态分量与对应的频谱图

本文采用观察中心频率的方法来确定K的值[23],预设模数K的取值范围为[4,12],经过多次实验,发现模态分量在K=10时(如图5(a)所示),中心频率开始出现模态重复的现象,即不同频率的尺度未完全分离(如图5(b)所示)。因此K值选9。

从图6中可以看出,原始负荷序列通过VMD分解后转换成从高频到低频的周期模态分量,挖掘出负荷序列中隐藏的信息,即周期振荡变化和趋势。这种方式使模型能更好地理解周期性信息,同时增加了模型训练的数据量。

图6 短期负荷预测VMD分解

4.4 预测结果

VMD-MOGOA-LSTM短期负荷预测模型得到的预测结果如图7所示。从图中可以看出,预测模型预测的结果与实际结果拟合程度较高,故将本文建立的模型用于短期负荷预测是可行的。

图7 所提模型5月18日—5月20日的预测效果

4.5 模型测试集精度分析

将本文VMD-MOGOA-LSTM方法与SVR、BP、VMD-BP、LSTM等其他典型短期负荷预测方法进行对比。对比结果如图8所示,它们的评价指标如表1所示。

从图8中的预测结果可发现,VMD-PSR-MOGOA-LSTM短期负荷预测能够更好地拟合真实结果,具有更高的预测准确度。相对于单一的模型,采用变分模态分解,并对各分量建立混合预测模型,预测准确度都有不同程度的提高。

为了更好地验证本文所提方案的有效性,对5月18日—5月20日进行多步预测,预测结果的评估如表1所示。从表1和图8可知,本文所提方案预测精度更高,拟合效果更好。其中MAE、RMSE、R2的平均值分别为0.75、1.01、99.4%。基于VMD分解的BP、LSTM模型相较于BP、LSTM模型有较大的预测性能提升,其中MAE的平均值分别提高了0.54、0.24,RMSE的平均值分别提高了0.35、0.31,R2的平均值分别提高了6.7%、1.5%。

图8 不同方法5月19日负荷预测结果对比

表1 7种方法的评价结果比较

将本文提出模型用于5月18日—5月20日共72个数据进行多步预测,图9~图11提供了7种负荷预测模型的指标比较,从中可以看出VMD-PSR-MOGOA-LSTM模型有更好的预测精度。

图9 7种模型MAPE指标比较

图10 7种模型RMSE指标比较

图11 7种模型MAE指标比较

5 结束语

本文提出了一种基于VMD-PSR-GOA-LSTM的新型混合短期负荷预测方案。通过与VMD-SVM、LSTM、VMD-LSTM模型对比,再实例计算和评价指标分析得到以下结论:

1)采用VMD技术能够将非线性、随机波动的负荷数据分解成多个分量,有效降低了负荷序列的复杂度;采用中心频率法判断模态分量的个数,可以避免过分分解。

2)在LSTM建模过程中,引入MOGOA智能优化算法,计算出LSTM网络中的超参数值,提高了预测的准确率。

3)研究分析表明,该模型充分利用了每一个模块的优势,克服了目前智能电网系统的局限性。实验结果表明,本文所提出的预测模型在预测和测试方面基本有别于其他模型,为以后进行智能电网的管理提供了指导决策。

猜你喜欢

蝗虫分量模态
基于BERT-VGG16的多模态情感分析模型
你真的认识蝗虫吗
多模态超声监测DBD移植肾的临床应用
跨模态通信理论及关键技术初探
都2020年了,人类为啥还拿蝗虫没辙?
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
人多势众的蝗虫
论《哈姆雷特》中良心的分量
蝗虫