APP下载

基于LSSVM的超短期负荷区间预测①

2021-03-19杜雅楠齐敬先施建华王亚鹏

计算机系统应用 2021年3期
关键词:噪声负荷区间

杜雅楠,齐敬先,施建华,王亚鹏

(南瑞集团有限公司(国网电力科学研究院有限公司),南京 211106)

电力系统负荷预测是电网调度管理、发电计划制定的前提条件和关键环节,精准及快速的负荷预测能够给电网企业带来显著的经济效益,目前智能电网技术的快速发展需要电力系统具备更快的响应速度和更高的负荷预测效率,而超短期负荷预测具有耗时短、迭代频率快、准确度高等特性,因此更加契合未来智能电网系统的发展趋势和要求.通过超短期负荷预测可以使电力调度人员及时掌握电网负荷的变化趋势情况,为电力调度人员管理用电计划、实现电力电量平衡调度提供更加科学的指导和依据[1].

目前电力负荷预测的主要研究方向包含点预测[2-5]和区间预测[6-14],而近年来国家经济的迅速增长使电力系统负荷构成更加复杂[3],各种不确定因素增多会使点预测负荷模型的复杂度增加、预测精度下降,而相比于点预测方法,区间预测方法能够对负荷波动范围进行比较精确的估计,更有利于负荷调度的评估与决策,也更加符合未来智能电网发展的需要.区间预测方法目前已有众多学者研究,文献[6-9]是基于概率性的区间预测方法,而概率性区间预测模型对样本完整性要求较高,需要大量统计数据用于实验,同时难以验证预测模型是否符合工程实际.文献[10-14]是基于机器学习的区间预测方法,常用预测方法有神经网络(Artificial Neural Network,ANN)[10-13]、支持向量机(Support Vector Machine,SVM)[14]等.基于神经网络的预测模型通常存在模型收敛速度较慢的问题,很难应用于实时性要求较高的实际工程应用中,文献[14]提出一种基于SVM的区间预测模型,但其应用对象为贸易数据,而贸易数据与负荷数据特征差异较大.作为SVM的一种改进模型,最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)[15]模型具备更低的模型复杂度和更快的求解速度,将其应用于负荷预测能够极大提升算法运算速度,其应用成效已有大量论文论证.

针对上述分析,本文提出一种基于LSSVM 模型的超短期负荷区间预测方法,该方法继承了LSSVM预测模型计算简单且快速的优点,计算成本较小.而在基于LSSVM的预测模型中,另外一个值得注意的问题是模型参数的选择,由于在实际电网运行过程中统计出的负荷数据通常会含有大量噪声,针对数据含有大量噪声的特点,如果能够合理地估计出数据的噪声,将为此类数据驱动模型的参数优化工作提供良好的依据.Gamma Test[16]作为一种独立于模型的基于数据的噪声估计方法,可在不知道具体的输入输出的数学模型的情况下估计出样本的最小有效噪声,文献[17]提出用Gamma Test 估计LSSVM 参数范围,然后用于预测,取得了较好的效果.综上所述,本文将使用Gamma Test方法计算的最小有效噪声作为模型参数优化的训练停止准则,最后通过优化后的参数和估计噪声来计算预测区间.

为验证本文方法的有效性,以某电网全网负荷数据为对象,使用所提的区间预测方法进行超短期负荷区间预测,并与文献[14]方法进行实验比较与分析.

1 基于噪声估计的LSSVM 区间预测模型

1.1 LSSVM 回归

LSSVM 回归模型已发展较为成熟,本文仅做简单介绍,其模型表示如下:

式中,x是模型输入,y是输出;φ (x):Rl→Rp是样本空间到高维特征空间的映射;其中w∈Rp,b∈R分别表示高维特征空间中的系数和偏差.

基于LSSVM的回归模为:

式中,γ是正则化参数,i表示第i个数据样本,样本总数为N,ei∈R是第i个样本的拟合误差.

引入拉格朗日乘子,将式(2)转换为无约束优化问题并求解下列条件:

最终计算可得:

式中,K是核矩阵,Ki,j=k(xi,xj)=φ(xi)Tφ(xj),I是单位矩阵,并且=[1,1,···,1]T.y是包含输出样本的列向量.

求解式(4),可以得到回归模型如下:

在核函数的选择上,综合考虑计算效率和预测效果,本文使用高斯径向基函数[18]:

1.2 LSSVM 区间预测模型

由式(2)~式(4)可得,LSSVM的输入输出模型为:

式中,w∗=[α1,···,αN,b],i=1,···,N.

由式(5)可知,f(xi,w∗)一阶可导,因此对给定数据集中的任意一点其在很小的局部范围里的一阶泰勒展开式如下:

在LSSVM 模型中:

根据式(6)和式(7),系统真实值和一阶泰勒公式估值的误差可表示如下:

其中,ε0为拟合误差,基于 ε0和的统计独立性:

其中Jacobian 矩阵F有如下的一阶微分形式:

通过式(11)和式(12),计算可得总方差为:

算法1.LSSVM 区间预测算法1)初始化LSSVM 模型的参数;2)通过式(4)求解LSSVM 回归模型,得到核函数矩阵K 以及和,用式(5)计算出在样本上的拟合值,同时通过对预测出的结果进行迭代,计算出未来一段时间的样本输出预计值 ;,α=0.05 t1−α/2 n−1 α b ˆyin ˆyout 3)给定置信度,如,查t-分布分位数表得到的值;4)通过式(9)、式(13)、式(14)、式(16)计算出最终预测区间.

1.3 模型参数优化

基于LSSVM 模型的区间预测方法中,超参数的选取是否合理会极大影响预测精度,而电网运行过程中的负荷数据在采集终端精度不足、汇总计算误差、电网事故异常等因素的影响下,通常含有固有噪声,针对含有噪声的样本数据,往往很难在不考虑噪声影响的情况下选取出最优参数组合.

根据式(16)可以证明,通过本文方法预测出的区间,其区间的宽度与样本拟合误差成正比,由于替代的是样本噪声方差,若以Gamma Test 估计出的样本最小噪声方差 v ar(r)作为样本的噪声方差,不仅能使模型的拟合程度最好,而且预测区间的宽度也较小.

基于上述分析,本文建立模型参数的优化目标函数为:

根据式(3),在LSSVM 回模型中,误差ei可表示为:

假设ei均值为0 可以得出:

采用Gamma Test 来估计样本的噪声方差,记为var(r),则参数优化模型可表示为:

参数优化的算法步骤如算法2.

算法2.基于噪声估计的参数优化算法1)计算在不同训练样本个数、嵌入维数 以及邻近点个数 条件下使得Gamma Test 计算的噪声方差最小的参数组合.并取、时的噪声方差作为最小噪声方差;n=n0m=m0 γ σ(γ0,σ0)nmP(n0,m0,P0)n=n0m=m0 2)在LSSVM 输入输出模型中,取初始化参数、,用网格搜索的方法确定在=1~800、=10~500 范围下使式(20)取得最小值的点,并用其作为LSSVM 区间预测模型的最优超参数.

2 算例分析

常用于评价预测区间的指标有预测区间覆盖率、区间平均宽度以及考虑区间覆盖率和区间宽度的综合评价指标,具体描述如下:

(1)预测区间覆盖率:PICP(Prediction Intervals Coverage Probability):

式中,

(2)平均区间宽度:NMPIW(Mean Prediction Intervals Width):

式中,R=Tmax−Tmin.

(3)考虑覆盖率及宽度的综合评价指标:CWC(Coverage Width-based Criterion)

式中,

其中,η是跳变点,µ是跳变幅度,本文实验中选取η=50,µ=0.95.

PICP统计真实样本落在预测区间内的概率,NMPIW统计预测区间上界和下界之间的平均宽度,通常在同一置信水平的条件下,预测结果的PICP越大、NMPIW越小,则认为预测效果越好[20].而PICP和NMPIW是一对相互矛盾的评价指标,因此可以使用两种指标同时兼顾的CWC作为一种更为均衡的评价指标,CWC是一个负评价指标,其值越小越好.在本文实验中,将使用以上3 个指标来量化预测区间的效果.同时,为验证模型预测效率,实验将统计区间预测耗时CT(Cost Time of interval forecasting).

2.1 实验数据及流程

取某省级电网调度负荷从2019年11月1日至2019年11月30日之间数据作为实验样本进行实验(采样频率为5 分钟),其负荷数据由省级电网从各地市局汇总计算生成,数据曲线如图1所示.从图中可以看出电网调度负荷随时间变化呈现出一定的波动性和周期性特征,同时由于在采集、计算、汇总和上报等过程中的各种不确定性因素影响下,最终统计的负荷数据会含有大量噪声.

图1 某电网全网负荷曲线图

为说明本文所提方法的有效性,实验将本文区间预测方法(Least-squares Support Vector Interval Prediction,LSVIP)与文献[14]所提区间预测方法(Support Vector Interval Prediction,SVIP)进行比较,实验流程如图2所示.

2.2 实验分析

(1)参数优化

首先根据章节1.3的模型参数优化步骤对实验样本数据进行参数优化,通过算法2的步骤1)计算得到使噪声方差最小的参数组合为n=600,m=72,P=14,通过算法2的步骤2)中网格参数优化方法进行搜索,可得LSSVM 模型的最优超参数为(γ,σ)best=(91.2,5.9).

图2 实验流程

(2)LSVIP 区间预测

选取置信度为95%,通过LSVIP 方法预测区间,其中一次区间预测结果如图3所示.

图3 区间预测结果

(3)比较实验

根据图2实验流程,将本文LSVIP 方法与SVIP方法通过区间评价指标进行比较,结果如表1.

表1中比较实验的统计结果表明,本文所提的LSVIP 区间预测方法在区间宽度、区间综合评价指标和预测速度上均优于SVIP 方法.

表1 区间预测比较结果(20 次平均值)

(4)误差分析

为更进一步说明本文预测方法的效果,取SVIP和LSVIP 预测区间的中值作为预测期望值,并计算平均绝对百分比误差(MAPE),20 次试验的误差曲线如图4所示.

图4 误差曲线

图4误差分析实验结果表明LSVIP 方法在期望值的预测精度上也优于SVIP 方法.

3 结论与展望

负荷预测对电力系统的平衡调度和安全稳定运行具有重大意义,在未来电网智能化发展的趋势和背景下,其重要性愈加凸显.本文针对此问题,提出了一种基于LSSVM的超短期负荷区间预测方法,该方法具有LSSVM 模型计算速快速的特点,同时使用基于Gamma Test 估计出的最小有效噪声作为优化目标来计算模型参数,在大大减少预测耗时的同时提高了预测区间的准确度.

通过电网用户负荷数据的仿真实验结果表明,本文提出的区间预测方法在预测区间的准确度和时效性上都能满足实际工程应用的要求,将其应用于负荷预测系统可极大提升系统精度和灵敏度,可为电力调度工作者管理和分配发用电计划提供更为合理的依据和参考,从而保障电网安全高效运行.

猜你喜欢

噪声负荷区间
“白噪声”助眠,是科学还是忽悠?
3项标准中维持热负荷要求对比分析
MIV-PSO-BP神经网络用户热负荷预测
基于声类比的仿生圆柱壳流噪声特性研究
生如夏花
V型函数在闭区间上的最大值只可能在端点取到
要减少暴露在噪声中吗?
分析师一致预期大幅调高个股
一种基于小波包变换的双模噪声中信号检测
单调区间能否求“并”