APP下载

基于ICOA和SVR的短期负荷预测

2022-12-24陈昱吉成贵学

计算机仿真 2022年11期
关键词:群组组内向量

陈昱吉,成贵学

(上海电力大学计算机科学技术学院,上海 201306)

1 引言

短期负荷预测为未来数天或一天的生产计划和机组安排提供重要的参考依据,也是电力系统安全预警和市场交易的重要指标[1]。短期负荷预测的方法主要有神经网络、随机森林和支持向量回归等。神经网络[2-3]是常见的短期负荷预测方法,当样本容量较少时,依赖大量历史负荷数据训练的神经网络模型已不是最优解;文献[4]采用随机森林模型进行短期负荷预测,但易出现过拟合现象,降低模型的泛化能力;文献[5]使用的支持向量回归模型的目标函数是根据结构风险最小化而建立的,从而降低了模型对数据规模的需求,可以有效地处理负荷数据。支持向量回归模型是参数依赖型模型,模型参数的选取会直接影响模型的预测精度和泛化能力。群智能算法在参数优化方面具有良好的并行处理能力,在支持向量机方面取得很多重要的成果[6]。文献[7,8]在负荷预测方面分别利用GOA算法和IGA算法优化选取SVR参数的方法,有效提升了短期负荷预测的精度。

为进一步提高短期负荷预测精度和降低算法的运行时间,文中提出一种基于改进郊狼优化算法的支持向量回归模型,通过对郊狼的成长方式进行改进并使用组外贪心选择策略改进郊狼优化算法的成长和适应度更新过程,提高了基本郊狼优化算法的收敛速度和寻优精度,可以得到更优的SVR模型的惩罚参数C和核参数gamma,并用于建立ICOA-SVR模型,从而实现短期电力负荷预测。

2 郊狼优化算法及其改进

2.1 基本郊狼优化算法

郊狼优化算法由Pierezan等人[9]等人于2018年提出,通过模拟北美郊狼出生、成长、死亡以及离群与加入新群组等活动来更新郊狼的社会适应能力并对郊狼个体进行优胜劣汰,从而确定社会适应能力最佳郊狼的社会状态,即问题的最优解。郊狼优化算法先将整个种群随机分成Np个组,每个组有Nc只郊狼。现以第p组的第c只郊狼为对象进行说明郊狼优化算法的过程。

2.1.1 郊狼的成长

郊狼的成长是其社会状态在组内最优郊狼的引导与组内文化趋势的共同作用下进行更新的过程。郊狼的成长可以表示为

(1)

(3)

(4)

式中Op表示对p组内郊狼按照社会状态从小到大顺序的排序的中位数。

2.1.2 郊狼的出生和死亡

在每组郊狼成长之后,都伴随着郊狼个体的出生和死亡。p组新生个体pup的社会状态受到父母郊狼的遗传作用和环境变异的共同影响。pup的第j维社会状态计算公式为

(5)

式中soca和socb代表新生个体pup的父母郊狼的社会状态;Rj是第j维社会状态变量范围内的随机数。发散概率Ps和关联概率Pa均为问题维度D的函数,其表达式如下

Ps=1/D

(6)

Pa=(1-1/D)/2

(7)

郊狼死亡个体的确定是通过判断新生郊狼pup是否是组内社会适应能力最差的郊狼来决定。当组内其它郊狼的社会适应能力比pup差时,组内社会适应能力最差的郊狼死亡,否则pup死亡。

2.1.3 郊狼的离群和加入新群组

组中的每只郊狼都有一定概率离开这个群组并加入新群组,这种离开原群组并加入新群组的行为概率可以通过下式进行计算

Pe=0.005Nc2

(8)

郊狼从原组中离开以后不会单独存在,而是加入一个新组,这种行为可以增加郊狼群体的组间交流,从而有利于提高算法的全局寻优能力。

2.2 改进郊狼优化算法

郊狼优化算法是一种兼顾全局探索和局部开采平衡性的新型群智能算法,但在一些复杂问题上其寻优精度、收敛性能会受限于自身模式的影响,其在稳定性方面也存在一定不足。郊狼优化算法的缺陷主要来自算法的以下三个方面:在郊狼成长过程中,郊狼成长缺乏高效的成长因子,从而导致郊狼成长过程缓慢;在整个算法过程中,成长因子的权重系数配置不合理,影响算法的搜索和收敛速度;在郊狼成长后,在较优郊狼个体的选择上使用组内贪心选择策略增加了算法的运行时间并影响其稳定性。根据以上缺陷,针对郊狼个体的成长方式和郊狼成长后的选择过程进行算法改进。

2.2.1 改进郊狼的成长方式

文献[10]提出利用最优郊狼引导和改进最差郊狼的成长方式,提高了全局寻优能力和种群多样性;文献[11]在郊狼成长过程中引入反时限衰减权重,从而保证算法全局开发能力和局部开采能力的平衡。文中针对基本郊狼算法中郊狼成长因子牵引力不足以及成长因子之间的权重系数配置不合理等问题,在郊狼的成长过程中引入全局最优郊狼因子、组间文化趋势以及自适应权重来改变郊狼的成长速度和方向。

在基本郊狼优化算法中,根据式(1)-(3)可知,郊狼个体的成长主要依赖组内最优郊狼和组内文化趋势的引导,从而导致算法易陷入局部最优。为避免算法陷入局部最优并提升全局搜索能力,在此基础上引入全局最优郊狼因子δ3来引导郊狼成长

(9)

为提升算法的稳定性和保持算法全局探索和局部开采能力的平衡性,仿照组内文化趋势,引入组间文化趋势。组内文化趋势是组内郊狼社会状态按从小到大顺序排序的中位数,可以避免郊狼成长受到某一个极端个体的影响。组间文化趋势通过每个组当前最优郊狼的社会状态的中位数确定,其具体形式为

(10)

式中A表示各个组的组内最优郊狼按照社会状态从小到大顺序排序的中位数。

为增强郊狼优化算法的前期寻优能力和后期收敛速度,根据每种成长因子分别设置不同的权重。在算法前期,郊狼优化算法以全局搜索为主,尽可能扩大搜索范围,提高候选解的多样性;而在算法后期,以局部开采为主,尽量缩小范围,提升局部开采能力,加快算法的收敛速度。因此,在前期对反应全局寻优能力的全局郊狼优化算法赋予较大的权重,同时对反应局部开采能力的组内文化趋势和组内最优郊狼因子赋予较小的权重。组间文化趋势在前期搜索过程可以增加种群多样性,有利于算法搜索广度的增加,进一步降低算法陷入局部最优的可能性并增加算法的稳定性;而在算法后期局部收敛过程中,组间文化趋势反而会对局部收敛过程形成一定干扰,影响算法的收敛速度。因此,组间文化趋势ex_cult的权重系数re可设为

(11)

式中t是当前迭代次数;n是设定的迭代次数上限;nrand(0,1)表示在[0,1]范围内服从正态分布随机数。结合上述分析,改进算法中第p组的第c只郊狼的成长公式可以表述为

+(1-t/n)×(r2×δ2+r3×δ3)+re×ex_cult

(12)

2.2.2 组外贪心策略

为保证郊狼优化算法可以向最优解的方向发展,需要在每轮迭代后将适应能力较好的个体选择出来并参与下一轮成长,这种方法称为静态贪心选择策略(组内贪心选择策略)。基本郊狼优化算法中采用组内贪心选择策略进行优胜劣汰,即在每个郊狼成长之后,计算其适应度值并与更新前的适应度值进行比较,若更新后的适应度值较高则对郊狼的社会状态用新值替换旧值,并将更新后的社会状态参与到组内其它郊狼的成长过程中。改进算法采用组外贪心选择策略替代组内贪心选择策略。组外贪心算法是在组内所有郊狼都成长之后再与原先的社会适应能力进行比较,并根据贪心选择策略来更新郊狼的社会状态。组外贪心策略中的更优郊狼的社会状态不会进入到组内其它郊狼的成长过程,提高了算法的稳定性和提高了算法的速度。

2.2.3 改进算法的步骤

在基本郊狼优化算法的基础上,通过对郊狼成长方式进行改进并使用组外贪心策略替代组内贪心策略,其步骤可以总结如下:

1) 初始化算法参数和郊狼的社会状态并随机分组;

2) 组内郊狼根据(12)式进行成长,在组内所有郊狼成长之后,通过组外贪心选择策略进行优胜劣汰选择较优郊狼;

3) 确定组内最优郊狼和全局最优郊狼。计算新生郊狼的社会适应能力并确定死亡郊狼;

4) 组内郊狼根据(8)式的概率离开原先群组并加入新群组,进行组间交流;

5) 现有的郊狼的年龄均增加一岁,判断算法是否满足收敛精度,若满足,则输出当前最优郊狼对应的社会状态;否则,返回步骤2继续循环。

3 ICOA-SVR预测模型

3.1 支持向量回归

支持向量回归(support vector regression, SVR)是一种处理回归预测问题的重要模型,通过映射函数使用升高维度的方式将非线性问题转化为线性问题,并通过使用核函数简化问题的求解运算。

支持向量回归的目标是实现样本点到最优超平面的距离最小。设样本集S和线性回归函数f(x)如下

S={(xi,yi)},i=1,2,…,n

(13)

f(x)=wTφ(x)+b

(14)

式中xi和yi分别是样本的输入、输出向量;n是样本容量;w是权重系数;b是偏差项;φ(x)是低维空间变换到高维空间的映射函数。

根据结构风险最小化原则,其目标函数可以表述为

(15)

式中C为惩罚系数;L是损失函数,L(f(x),y)可以表述为

(16)

其中ε是不敏感损失因子,表示预测值f(x)与实际值y在一定范围可忽略的最大误差。引入拉格朗日乘子λi将(15)式对偶化得到

(17)

式中K(xi,xj)是核函数,文中选用RBF核函数

(18)

根据KKT条件可以求出偏置项b,SVR的解可以表述为

(19)

SVR是参数依赖型模型,因此SVR参数的选取对模型预测效果有很大的影响。文中采用ICOA优化算法来选取SVR的惩罚参数C和RBF核函数参数gamma的最优值。

3.2 模型框架

ICOA-SVR模型是以支持向量回归为基础的预测模型,其负荷预测流程如图1所示。先将样本数据归一化后进行k折交叉验证训练并建立SVR模型,其模型参数C和gamma使用ICOA算法优化选取,然后利用ICOA-SVR模型对负荷进行预测,最后对预测结果进行反归一化并比较模型负荷预测能力。

图1 ICOA-SVR模型框架

4 算例实验与分析

4.1 实验环境与数据来源

实验所用的硬件运行环境为Intel(R) Core(TM) i5-8300H CPU @2.30GHz处理器和16GB RAM的电脑,软件平台基于Matlab和LIBSVM工具箱。

文中数据集来自第九届电工杯数学建模竞赛数据,选用2011年11月2日至12月2日的每日整点负荷数据作为训练集,结合其对应的气象数据与星期类型,预测2011年12月3日整点负荷数据。参考文献[12]并根据实际情况,文中使用k折交叉验证方式训练样本,取k次训练的均方误差的平均值作为适应度函数

(20)

4.2 参数设置和评价指标

ICOA-SVR模型参数设置如下:惩罚参数C、核参数gamma的寻优范围分别为[0.1,100]和[0.01,10]。COA-SVR的参数设置相同,即组数Np=5,每组郊狼个数Nc=6,郊狼种群规模为30, 最大迭代次数100。

预测模型的评价指标选用均方根误差RMSE和平均绝对误差MAPE,其计算公式如下

(22)

式中N是测试集样本的数量;y*和y分别是测试集负荷数据的预测值和真实值。

4.3 结果分析

图2给出了COA与ICOA算法在优化SVR模型参数C和gamma的收敛曲线,通过对比收敛曲线可以看出COA算法在迭代次数达到100次时仍未完全收敛,而ICOA算法在迭代20多次时就已经完全收敛,而且寻优精度更高,符合改进预期。通过利用ICOA优化得到的惩罚参数C=40.38和核参数gamma=2.403建立ICOA-SVR模型进行负荷预测,并与COA-SVR进行比较,其相对绝对误差和预测结果如图3和表1所示,COA-SVR的预测结果误差较大,多个时间点的相对绝对误差高于3%且稳定性较差;而ICOA-SVR整体误差较小且始终保持在3%以下,表明ICOA-SVR的预测精度整体上显著高于COA-SVR模型。

图2 COA与ICOA对SVR参数寻优收敛曲线

图3 预测结果的相对绝对误差

表1 ICOA-SVR与COA-SVR的预测结果对比

为更加直观地说明ICOA-SVR负荷预测效果和进一步比较ICOA-SVR模型与其它模型的预测结果,分别如图4和表2所示。图4给出了三种模型的预测结果,可以看出BP神经网络(BPNN)不仅在负荷预测趋势上与真实值曲线出现多处相反的情况,而且预测值与真实负荷的差异最大;LSTM负荷预测曲线与真实值曲线差异较小,但在4-6h、10-11h等时间段出现与负荷真实值变化趋势相反的问题;ICOA-SVR模型的预测曲线与真实负荷曲线变化趋势一致且差异最小。表2给出上述四种预测模型的评价指标,BPNN在预测精度和运行时间方面均表现不佳,COA-SVR模型运行时间最长,ICOA-SVR不仅预测误差最小而且所需时间最少,表明文中所提改进方法可以有效地降低基本郊狼优化算法的运行时间和提高寻优精度,验证了ICOA-SVR对提高负荷预测精度和降低负荷预测时间的有效性。

图4 预测结果比较

表2 预测模型的评价指标

5 结论

为提高短期负荷预测的预测精度和速度,提出一种基于改进郊狼优化算法的支持向量回归预测方法。文中通过改进郊狼的成长方式和使用组外贪心选择策略对基本COA算法进行改进,并用于SVR模型的参数选择,利用选取的SVR参数建立ICOA-SVR模型用于负荷预测,经算例分析表明,所提模型在负荷预测精度和时间上优于BP神经网络、COA-SVR以及LSTM模型,证明ICOA-SVR是一种有效的短期负荷预测方法。

猜你喜欢

群组组内向量
向量的分解
聚焦“向量与三角”创新题
用心说题 提高效率 培养能力
Boids算法在Unity3D开发平台中模拟生物群组行为中的应用研究
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
合作学习组内交流讨论时间的遵循原则
合作学习“组内交流讨论时间”注意问题
合作学习组内交流讨论时间探究
群组聊天业务在IMS客户端的设计与实现