基于VMD-LSTMQR的滚动母线负荷区间预测

2021-12-01董新伟卜智龙陈鸣慧鹿文蓬年珩

电力工程技术 2021年6期

董新伟，卜智龙，陈鸣慧，鹿文蓬，年珩

(1.中国矿业大学电气与动力工程学院，江苏徐州 221116；2.浙江大学电气工程学院，浙江杭州 310058)

0 引言

准确的负荷预测不仅能为电力调度提供依据，而且对电网的规划和稳定运行具有重要意义[1—3]。传统的负荷预测可分为点预测和区间预测[4—7]。点预测是用来预测某一时刻具体的数值[8]，通常以预测值和实际值的误差最小为目标；而区间预测是预测某一时刻出力区间，通常以低区间带宽和高区间覆盖率为目标[9]。传统的负荷预测大多是确定性点预测，但由于电力系统受不确定性因素影响，负荷功率也具有不确定性。单纯的点预测无法应对负荷的不确定性。区间预测以概率的形式有效地应对出力的不确定性，通过预测负荷功率上下界，为决策者提供更多信息。因此提高电力负荷的区间预测精度成为目前研究的热门方向。

国内外人员对区间预测进行了广泛的研究。区间预测主要有统计方法[10—11]、上下区间估计[12—13]以及组合预测方法[14]等。文献[9]采用长短期记忆(long short-term memory,LSTM)网络进行点预测并且构建误差的核密度估计，构造不同置信区间下的负荷区间。文献[15]利用分位数回归(quantile regression,QR)构建不同模型从而得到概率预测结果。单纯利用QR很难以非线性拟合的方式去拟合复杂的函数。因此，为了提高区间预测效果，常将神经网络模型和QR一起构建概率预测模型。文献[16]将分位数回归和随机森林(random forest，RF)结合在一起以预测负荷的概率密度，效果远高于传统QR。除了随机森林与分位数相结合，还有支持向量机(support vector machine,SVM)[17]以及径向基函数(radial basis function，RBF)[18]等常见负荷预测方法。

为提高负荷预测的精度，常采用数据分解从数据本身出发对数据分解得到子数据，然后对子数据进行预测重构得到最终的预测结果。对数据进行分解的常见方法有小波分解(wavelet decomposition,WD)[19]、经验模态分解(empirical mode decomposition,EMD)[20—22]等。文献[23]采用经验模态分解将负荷分解为多个模态，然后分别进行预测,但EMD易受模态混叠的影响。

传统分解、求和预测的方法大多运用在点预测上，较少运用在区间预测上。同时，传统的分解方法由于存在模态混叠的现象，导致预测精度较低。为进一步提高预测精度以及模型分解的泛化能力，文中利用变分模态分解(variational mode decomposition,VMD)提升分解效果，采用深度学习网络长短期记忆神经网络分位数回归(long short-term memory neural network quantile regression,LSTMQR)提升预测精度，提出一种基于VMD-LSTMQR的滚动母线负荷区间预测。首先，采用中心频率法确定VMD母线负荷的最佳分解数量，并将原始的母线负荷分解成一系列不同频率特征的子序列；其次，采用区间预测指标确定不同子序列的最佳滚动步长；然后，分别对各子序列进行LSTMQR区间预测，得到不同子序列的预测结果；最后，将各子序列的区间预测重构，得到原始负荷序列的区间预测。

1 负荷区间预测核心模型

1.1 VMD的基本原理

VMD能够自适应地对信号进行分解[24]。不同于传统EMD的递归方式求解模型，VMD通过采用非递归的方式将信号分解成若干层，有效消除欠包络和过包络问题，对噪声具有更好的自适应性。对于一段时间序列x(t)，通过迭代搜寻变分模型将时间序列分解成有限带宽的模态分量。设第i个模态分量为ui(t)，对应的中心频率为ωi，具体的实现步骤如下。

(1)各模态的带宽计算。对于每一个分解得到的模态分量ui(t)，采用Hilbert变换得到单侧谱。

(2)将每一个模态函数的中心频率ωi的指数项进行混叠，将模态函数的频谱调制到基频带。

(3)利用高斯平滑法对已经解调的信号估计其带宽，即计算解调信号的L2 范数。转化为求解带约束的变分问题，目标函数为：

(1)

式中：∂t为t的偏导；δ(t)为Dirac分布函数；K为分量个数；⊗为卷积运算。为了实现上述目标函数求解，引入二次惩罚项α和拉格朗日乘子λ将极值约束问题转换为无约束问题，如式(2)所示。

(2)

对式(2)采用交替方向乘子法更新各模态量以及中心频率，如式(3)所示。

(3)

1.2 基于QR的LSTM模型

基于QR的LSTM将QR作为LSTM中的一层。通过改变LSTM不同分位点下的损失函数，构建LSTM的不同条件分位数函数模型，其结构见图1。

图1 LSTMQR模型Fig.1 The model of LSTMQR

在不同分位点τi下的LSTM的损失函数，即：

(4)

式中：W(τi)，b(τi)分别为LSTM的权重和偏置在分位点τi的集合；γ为正则项惩罚系数；Xt，Yt分别为LSTM的输入和输出；g(·)为映射函数；ρτi(a)为检验函数，如式(5)所示。

(5)

式中：a为整体性变量。

为获得不同分位点τi下的最优W(τi)，b(τi)，采用梯度下降法进行求解[25]。

2 基于VMD-LSTMQR的滚动负荷区间预测模型

2.1 滚动预测模式

文中采用滚动模式对不同子序列区间预测。对于N维的负荷序列，采用VMD分解之后，各子序列的长度也为N维。

滚动模式的步骤为：已知第i个子序列的前n时刻真实数据序列为yi,1,yi,2,…,yi,n，根据已知的子序列前n时刻数据去预测n+1时刻的子序列数据出力区间；当达到n+1时刻，将该时刻的数据加入真实数据中并剔除离数据点最远的那个数据，此时时间序列为yi,2,yi,3,…,yi,n+1；之后采用该时刻的时间序列去预测n+2时刻子序列的出力区间，按照这种滚动预测模式，完成子序列区间预测。

假设第i个子序列的滚动步长为Ni，采用LSTMQR方法进行区间预测，那么训练集的输入与输出如式(6)所示。

(6)

式中：XTR,i为第i个子序列的训练输入样本，训练维度为m×Ni；YTR,i为第i个子序列的训练输出样本，训练维度为m维。

在进行LSTMQR区间预测时，根据所设置的分位数预测区间与输入、输出训练集，得到不同分位数下的结果。在进行模型测试的过程中，根据不同的分位数得到所预测数值的区间。测试模型的90%置信区间含义为测试集区间输出由0.05至0.95的分位数预测结果，如式(7)所示。

(7)

式中：XTE,i为第i个子序列的测试输入样本，训练维度为(N-Ni-m)×Ni；YTE,i为第i个子序列的测试输出样本，训练维度为(N-Ni-m)×2。

2.2 基于VMD-LSTMQR负荷区间预测流程

基于VMD-LSTMQR负荷区间预测是先将负荷时间序列分解成K个子序列，然后分别对K个子序列进行LSTMQR的滚动区间预测，根据各子序列区间预测结果进行子序列重构，得到最终的预测结果。基于VMD-LSTMQR负荷滚动预测的流程图如图2所示，具体的步骤如下：

图2 基于VMD-LSTMQR滚动负荷区间预测流程Fig.2 The process of rolling interval load prediction based on VMD-LSTMQR

(1)对历史的母线负荷数据进行VMD。采用中心频率法确定最佳的分解数量K，并将原始负荷序列分解成K个不同频率特征的子序列。

(2)根据区间预测指标分别确定不同子序列最优的滚动预测步长。

(3)采用滚动预测模式对分解的K个子序列分别进行LSTMQR区间预测。

(4)对预测完成的子序列进行子序列重构，得到原始的负荷区间预测。

2.3 评价指标

文中用3个区间指标评价区间预测性能[13]。

(1)预测区间覆盖率(prediction interval coverage probability，PICP)用于评估预测区间的可靠性。PICP越大表示越多的实际值落入区间概率中，预测效果越好，其表达如式(8)所示。

(8)

式中：N为预测样本数量；ηi为布尔值，当所预测的区间包含实际功率数值时，记为1，否则记为0。

(2)预测区间平均带宽(prediction interval normalized average width，PINAW)用于反映预测区间的清晰度。结合预测区间覆盖率指标，PINAW越窄，区间覆盖率预测越高，预测效果越好,其表达如式(9)所示。

(9)

式中：ymax为预测样本中的最大值；Li为第i个样本下边界值；Ui为第i个样本上边界值。

(3)归一平均偏差(normalized average deviation，NAD)用于评估实际功率远离预测区间带的程度。NAD越小表示未落入点离预测区间带越近,其表达如式(10)所示。

(10)

其中：

(11)

式中：yi为第i个样本的实测值。

3 算例仿真

文中以220 kV与10 kV的母线负荷数据分别验证文中所提方法的有效性。所选取的220 kV母线数据时间是从2017年5月1日到2017年5月31日，采样间隔为5 min。10 kV母线负荷数据时间从2017年1月1日到2018年1月1日，采样间隔为1 h。220 kV和10 kV母线负荷时间序列如图3所示。文中将220 kV母线负荷前25 d作为训练数据，后6 d作为测试数据；10 kV母线负荷前300 d作为训练数据，后65 d作为测试数据。文中所设置的分位数区间为[0.05,0.95]，间隔为0.05。

图3 220 kV和10 kV母线负荷Fig.3 Bus load power of 220 kV and 10 kV

从图3可知，10 kV母线和220 kV母线的整体波动性比较大，具有非平稳性。因此，采用VMD将负荷序列进行分解得到K个不同频率特征的子序列，以提高整体的预测效果。在分解前，采用中心频率法确定最佳分解数量K，模态过多将导致模态重复，模态过少将导致模态分解不够。为确定最佳分解数量K，文中将设定K的取值范围，按照分解的模态数计算其中心频率。若分解到K+1时，有2个模态的中心频率比较相近，则说明出现了多模态的情况，最佳的分解个数为K。文中以220 kV母线负荷为例进行分析。不同分解数量下220 kV母线负荷中心频率结果如表1所示。

表1 220 kV母线负荷不同分解个数下的中心频率Table 1 The center frequency of different decom-position numbers of 220 kV bus load powe Hz

由表1可知，当分解到模态数为7的时候，模态2的中心频率为61 Hz，模态3的中心频率为92 Hz，2个模态的中心频率比较接近。而分解到模态数为6的时候，6个模态之间的中心频率相差比较大。因此，220 kV母线负荷的最佳分解模态数为6。并且，模态的中心频率按照模态高低进行排序，模态1的频率最低，模态6的频率最高。图4是经过VMD之后的模态1和模态6子序列能量。

图4 经过VMD之后的模态1和模态6子序列结果Fig.4 The subsequence results of mode 1 and mode 6 after VMD

由图4可见，模态1的子序列比较平稳，与原负荷序列的趋势走向一致。并且分解之后的数值功率比较大，与原负荷功率的数值比较接近。而模态6的分解频率最高，波动性比较大，分解之后的数值也比较小。因此，模态1的预测结果对最终原始负荷序列的影响最大，而其他模态影响相对较小。

在对不同的分解序列进行预测时，需找到合适的滚动步长。滚动步长过大，数据冗余；滚动步长偏小，无法体现数据的特征。合理的数据长度不仅能包含数据的特征，而且能够避免无效信息。因此，文中设定不同的步长范围，根据最优指标选取最后的滚动步长。不同子分解序列所设定的步长范围为2～6。不同子序列的各步长指标见图5。

图5 不同步长下各模态区间数值指标Fig.5 Index values of each mode under different steps

图5反映的是不同步长下不同模态的3个评价指标数值。由于模态1和模态2比较平稳，所以预测区间覆盖率比较高，而模态3至模态6波动比较大，整体预测区间效果不佳。

根据3个指标选取最为合适的步长。在模态1中步长3在最窄的区间带宽下有着更高的区间覆盖率，偏离程度也最低。在模态2中，步长4的区间宽度略低于步长6，但预测区间覆盖率以及偏离程度优于步长6，因此，模态2的最佳步长为4。

在模态3中，步长3的3个指标最佳。在模态4中，虽然步长5的覆盖率比步长3的覆盖率略高，但区间的宽度以及偏离程度比步长3小，故模态4的最佳步长为3。步长4在模态5和模态6中的3个指标最优。由于模态3到模态6的波动比较大，且数值也比较小，其预测效果不佳，可选取任一步长，文中仅挑选不佳结果中最好的步长。综上，模态1到模态6的最佳滚动步长分别为3，4，3，3，4，4。

根据各模态的最佳滚动步长分别对各模态序列进行区间预测，根据区间预测结果进行重构，得到原始负荷序列的区间预测结果。为了验证所提方法的有效性，文中将选取另外3种区间预测方法进行对比。3种区间预测方法分别采用LSTMQR直接对原始负荷序列进行区间预测、采用LSTMQR对EMD分解的负荷序列进行预测、采用非参数核密度误差分布的概率区间进行预测。采用4种方法分别对10 kV和220 kV的母线负荷进行预测，不同置信区间3个指标数值如图6、图7所示，不同方法下置信区间的平均值如表2所示。

图6 10 kV母线负荷下不同预测模型精确性比较Fig.6 Accuracy comparison of different prediction models for 10 kV bus load power

结合图6和图7可知，随着置信区间变大，4种方法的区间宽度都在增大，越来越多的功率点落入区间带内，区间覆盖率增加，偏离区间带的程度在不断减小。对比图6的4种方法可见，无论在哪一个置信区间，采用VMD-LSTMQR区间预测的区间宽度最窄，但区间的偏离程度最低。除了40%置信区间略低于EMD-LSTMQR外，余下任意置信区间下的区间覆盖率均高于其他方法。

图7 220 kV母线负荷下不同预测模型精确性比较Fig.7 Accuracy comparison of different prediction models for 220 kV bus load power

从表2的10 kV平均预测结果可知，采用VMD-LSTMQR方法的平均区间宽度相较其余3种预测方法低0.01～0.03的同时，平均预测区间覆盖率要高出3%～4%，平均偏离区间带降低了0.1左右。而基于非参数核密度误差分布的概率区间预测方法，虽然平均区间宽度最宽，但平均预测精度相比于VMD-LSTMQR要低3%左右。虽然LSTMQR的平均区间宽度要高于VMD-LSTMQR和EMD-LSTMQR，但平均预测精度最低，整体的平均偏离程度也最高。

表2 220 kV和10 kV母线平均预测结果Table 2 Average prediction results of 220 kV and 10 kV bus load

对比图7的4种方法，除了在10%置信区间，VMD-LSTMQR的区间宽度要略大于非参数核密度误差区间预测的区间宽度，其余无论在哪一个置信区间，VMD-LSTMQR区间预测的区间宽度均要小于其余3种方法。由表2的220 kV平均预测结果可知，文中方法在平均区间宽度低于其他3种方法0.01～0.03的同时，平均的预测精度整体上提高了2%～4%。而采用EMD-LSTMQR虽然平均区间宽度最宽，但预测精度最差。

综上，采用VMD-LSTMQR的区间预测方法无论对10 kV母线负荷进行预测，还是对220 kV母线负荷进行预测，都能保证在最低的平均区间宽度下有着更高的区间覆盖率及更低的偏离程度。相对于传统的区间预测方法，预测效果有明显的改善。

图8为90%置信区间下220 kV母线负荷某一天区间预测结果。

图8 90%置信区间下的负荷预测Fig.8 Load prediction of 90% confidence level

由图8可知，90%置信区间下实际的负荷功率大部分能很好地落入4种方法所预测的区间带内。90%置信区间下的4种方法整体预测效果均较好，但对比图8(a)、(b)、(c)、(d)可以发现，该天实际功率与所预测的区间带下边界更接近，而采用VMD-LSTMQR区间预测方法在样本点50～100 以及200～288 的区间段内所预测的下边界相比于其他3种方法低了5～10 MW，使得所预测的下边界更偏离实际功率。其余3种方法的下边界围绕着实际功率上下波动。对比4种方法预测的上边界可以看出，VMD-LSTMQR上边界预测功率在240～260 MW，而其余方法上边界预测在250～280 MW，下边界预测4种方法预测均在210～220 MW，这也就意味着，采用VMD-LSTMQR预测的区间宽度更小，整体的预测效果更好。