多变量相空间重构的多核最小二乘支持向量机电力负荷预测优化策略
2020-11-24陈家乾肖艳炜余泽骎
陈家乾, 肖艳炜, 李 英, 卢 冰, 余泽骎
(1.国网浙江省电力公司湖州供电公司, 湖州 313000; 2.国网浙江省电力公司, 杭州 310007)
电力负荷预测对电力系统供应计划的制定以及电力系统运行保障都有着很重要的参考价值,准确的电力负荷预测能够极大地提升电力使用的效率,因此,电力负荷预测研究得到了极大的关注[1-3]。
相空间重构与支持向量机由于其各自的优点在预测领域得到了广泛应用,文献[4]利用曹氏方法求得相空间重构参数,然后利用粒子群算法优化的支持向量回归对电力负荷进行了预测,结果证明该方法具有一定的预测精度。文献[5]通过基于C-C(construction-conversation)方法与遗传算法优化的相空间重构最小二乘支持向量机(least squares support vector machine,LS-SVM)对网络时延进行了预测,结果证明该方法具有较好的精度与实时性。上述研究均是将相空间重构与支持向量机的参数独立进行选择,此种方式存在一定的保守性,无法使得参数达到预测最优。针对这一问题,文献[6-7]分别对均粒子群算法相空间重构参数与支持向量机(support vector machine, SVM)参数进行联合寻优,得到交通流量预测模型及碳市场价格预测模型,结果证明了该联合优化方法的优越性。但是电力系统是一个复杂的动力学系统,很难由一维时间序列通过延迟嵌入法重构出该系统的相空间[8]。其次,单一核函数支持向量机预测性能具备一定的局限性,而且电力负荷预测的研究通常为离线预测,对在线预测的研究较少。
为实现在线电力负荷预测,并进一步提升预测精度,现结合多变量相空间重构以及组合核函数LS-SVM,提出一种基于混沌人工鱼群算法短期电力负荷滑动时窗在线预测综合优化方法,并利用实际数据对该方法进行验证。
1 在线预测模型
1.1 多变量相空间重构
电力负荷时间序列具有极强的混沌特性,如果依照传统的预测方法进行研究可能会使预测误差较大。在实际应用中,基于单变量时间序列的混沌预测模型无法全面地描述系统的混沌特性,从而使预测结果误差较大,无法得到有效的应用[9]。为进一步还原复杂混沌系统特性,提升预测精度,利用多变量相空间重构进行预处理[10]。
若影响电力负荷的时间序列为{Ai,i=1,2,…,D},其中,Ai=[Ai(1),Ai(2),…,Ai(N)]T,N表示时间序列的长度,可以得到D维多变量时间序列的相空间表达式:
(1)
式(1)中:xi(t)={xi(t),xi(t-τi),…,xi[t-(mi-1)τi]}T,τi和mi分别代表第i维时间序列的延迟时间与嵌入维数,t代表时间变量,
设D维多变量相空间的维数为ζ,则存在:
(2)
1.2 组合核函数LS-SVM
最小二乘支持向量机由于其优越性得到了广泛应用[11]。给定样本序列(x1,y1),(x2,y2),…,(xi,yi),…,(xl,yl),假设xi∈Rn代表输入向量,yi∈Rn代表输出向量,R代表向量空间,Rn代表n维向量空间,则最小二乘支持向量机求解问题可以表述为
(3)
式(3)中:φ(·):Rn→Rnh代表映射函数,Rnh代表具有nh维的向量空间;w∈Rnh表示权值系数,ei∈R代表误差向量,b∈R表示偏置系数;γ>0表示惩罚因子。根据LS-SVM相关理论可得基本方程为
(4)
式(4)中:
代表单位阵;Ω=Ωl×l,Ωi,j=K(xi,xj)=φ(xi)φ(xj),i,j=1,2,…,l;K(xi,xj)为核函数。
相应的回归函数为
(5)
定义特征矩阵:Q=Ω+γ-1I,其中:
(6)
对式(4)求解,即可得到系数α和b,从而得到最小二乘支持向量回归模型:
(7)
定义特征矩阵:Q=Ω+γ-1I,其中:
(8)
根据SVM的原理可知核函数的选取对最后的回归预测有重大影响。核函数在针对确定的特征空间和对应映射,可以大幅度地减少计算复杂性[12]。常见的3种核函数形式如下。
(1)多项式核函数:
Kp(x,y)=[λ(xTy)+c]d
(9)
(2)Sigmoid核函数:
Ks(x,y)=tanh(ηxTy+k2)
(10)
(3)高斯核函数:
(11)
式中:x、y代表输入空间向量;λ、c、d、η、σ为核函数的参数。
已知核函数满足如下性质[13-14]:①假设K1和K2都是核函数,α1和α2都是正实数,则K=α1K1+α2K2一定是核函数;②假设K1和K2都是核函数,则K=K1K2一定是核函数;③假设K1为核函数,则K=expK1也一定是核函数。
根据上述3条性质,可以得到无数个不同的核函数,其组合关系如图1所示。
图1 核函数组合示意图Fig.1 Kernel function combination diagram
(12)
式(12)中:Ki为利用上述3条性质的单个核函数任意排列组合得到的新核函数;ωi表示各个组合核函数的权重系数。该多核函数综合了各种核函数的特点,且通过权值系数大小调整不同核函数对预测精度的影响大小,从而将核函数的选择问题转换为核函数权值的求解问题,从而综合各个核函数的特征,提升支持向量机的精度[15]。
1.3 滑动时窗策略
图2 滑动窗口策略示意Fig.2 Sliding window strategy
基于滑动窗口多核函数LS-SVM在线预测算法的具体步骤如下。
(4)计算出Q′new的值,更新相应矩阵以及系数。
(7)样本和误差向量进行更新代换,xi=xi+1,yi=yi+1,ei=ei+1,i=1,2,…,L-1;xL=xnew,yL=ynew,eL=enew。
对上述过程进行循环处理,即可实现滑动窗口的在线移动。
2 电力负荷预测同步优化策略
2.1 混沌自适应人工鱼群算法
人工鱼群算法是一种新型群智能优化算法,该算法通过模仿鱼群的觅食、聚群、追尾等主要行为,从而实现优化[16-17]。但是,基本人工鱼群算法存在诸如收敛速度慢、易陷入局部最优等诸多弊端,为提升算法的优化效果,学者们提出一种自适应步长与视野的人工鱼群算法[18-19]。为进一步解决陷入局部最优问题,利用文献[20]提出的混沌自调整人工鱼群算法对相关参数进行优化。
2.2 优化步骤
定义单个人工鱼为F=(τi,mi,C,δ,λ,c,d,η,δ,w1,w2,…,wn),该电力负荷预测综合优化可以转换为寻找最优人工鱼Fopt,使得适应度函数Fitness接近0,适应度函数的表达式为
Fitness=
(13)
(14)
基于混沌自适应人工鱼群的多变量相空间重构多核LS-SVM电力负荷预测的综合优化步骤如下。
步骤1 确定人工鱼群算法的基本参数,并确定多核函数的组成以及个数。
步骤2 即给定(τi,mi,C,δ,λ,c,d,η,δ,w1,w2,…,wn)该向量代表人工鱼群的初始状态。
步骤3 判断是否符合约束条件,若满足,则利用延迟时间τi与嵌入维数mi对多影响因素进行多变量相空间重构。若不满足,则直接跳至步骤5。
步骤4 重构后的向量作为多核支持向量机的输入,根据给定的多核支持向量机的个数以及核函数权值对训练样本进行训练预测,求出反映预测精度的适应度函数。
步骤5 人工鱼执行行为得到新的人工鱼状态。人工鱼执行觅食、追尾、聚群以及随机等行为。
步骤6 重复步骤3和步骤4,求出此时人工鱼的适应度函数,并与初始适应度函数进行比较,将较优的人工鱼个体计入公告板。
步骤7 进行混沌映射。
步骤8 将混沌映射得到的人工鱼与公告牌上人工鱼进行适应度比较替换。
步骤9 判断是否达到最大迭代次数,若满足,则停止算法并输出最优值;否则返回步骤5,再进行下一次迭代寻优。
3 预测结果分析
为简化优化参数,根据文献[22],令不敏感系数ε=0.01,多项式核函数参数d=3,其他参数满足λ∈[0,3],c∈[0,3],σ∈[0,1]。已知影响电力负荷的因素包括温度、风速、湿度3个因素,所以令变量维数D=3,为减少计算量,相应的子核函数个数n=6,其组成如表1所示。
表1 核函数组成Table 1 Composition of kernel functions
相应的设人工鱼条数NUM=20,最大迭代次数Iterate_times=170,初始化视野Visual=5,拥挤度因子φ=0.5,觅食尝试次数Try_number=5,衰减因子α=0.9,β=0.6,阈值δ=0.2。
所有数据均来自湖州市电力局,训练数据为湖州市2015年12月7日至12月14日的负荷数据,考虑到休息日与工作日负荷数据差异,利用不同的预测模型分别对工作日2015年12月15日以及休息日12月20日的电力负荷进行在线预测。利用工作日的电力负荷训练数据进行参数优化得到的优化结果如图3、表2所示。
从图3、表2中可以看出,混沌人工鱼群算法优化的适应度函数Fitness相对于其他两种优化方法最接近0,说明该种算法的收敛精度更高。另外,其收敛迭代次数为26,较基本人工鱼群与自适应人工鱼群分别减少了58次和8次,证明混沌自适应人工鱼群算法在多参数寻优问题中依旧能够保证较快的收敛速度以及较高的收敛精度。相应的各个核函数的权值优化曲线如图4所示,同理可以得到其他参数的大小。
图3 优化对比结果Fig.3 Optimized comparison results
表2 优化对比结果Table 2 Optimized comparison results
图4 核函数权值优化结果Fig.4 Weight optimization results of kernel functions
利用上述优化得到的参数首先对预测数据进行相空间重构,进一步将得到的多变量相空间作为支持向量机的输入参数,从而得到相应的预测模型。分别利用传统PSR-LSSVM参数独立选取、MPSR-LSSVM参数独立选择、MPSR-MKLSSVM参数综合优化以及MPSR-MKLSSVM参数综合优化4种预测方法对工作日2015年12月15日湖州市电力负荷进行在线预测,图5、图6所示为预测结果及绝对误差。可以看出,MPSR-MKLSSVM联合优化最靠近真实负荷曲线,且绝对误差曲线最接近理想误差线。
图5 工作日在线预测结果Fig.5 On-line forecast result of working day
图6 工作日预测误差Fig.6 Workday prediction error
为更直观地比较各个方法之间的优劣,表3显示了4种方法在不同时间点的预测值与实际值平均绝对误差与平均相对误差,可以看出,PSR-LSSVM参数独立优化方法的平均相对误差为4.35%,而MPSR-LSSVM独立优化方法与MPSR-MKLSSVM独立优化的平均误差分别减小了1.21%和2.12%,证明了多变量相空间重构能够提升预测精度,多核函数相对于单一核函数来说对预测精度也有提升作用,而且对比MPSR-LSSVM独立优化方法与MPSR-MKLSSVM独立优化方法可知,多核函数在提升预测精度的影响上明显强于多变量重构。另外,MPSR-MKLSSVM联合优化相比MPSR-MKLSSVM独立优化的平均相对误差减少了0.72%,进一步说明了联合优化相对于独立选择优化,其预测精度更高。
表3 工作日预测误差Table 3 Workday prediction error
再利用上述4种方法对休息日12月20日湖州市的电力负荷进行预测。图7、图8所示为休息日的电力负荷预测结果以及绝对误差。可以看出,预测结果与工作日类似,MPSR-MKLSSVM联合优化相对于其他优化方法来说最靠近真实负荷曲线,且绝对误差曲线最接近理想误差线。
图7 休息日预测结果Fig.7 Forecast results for rest days
图8 休息日预测误差Fig.8 Prediction error of rest days
同理,表4显示了4种方法在不同时间点的预测值与实际值平均绝对误差与平均相对误差,可以看出,PSR-LSSVM参数独立优化方法的平均相对误差为5.03%,而MPSR-LSSVM独立优化方法与MPSR-MKLSSVM独立优化的平均误差分别减小了1.89%和2.51%,同样说明了多变量相空间重构与多核函数对预测精度均有提升作用,而且多核函数在提升预测精度的影响上明显强于多变量重构。另外,MPSR-MKLSSVM联合优化相比MPSR-MKLSSVM独立优化的平均相对误差减少了1.31%,同样说明了联合优化相对于独立选择优化的预测精度更高。
表4 休息日预测误差Table 4 Prediction error for rest days
4 结论
针对短期电力负荷预测提出了一种基于混沌自适应人工鱼群算法的滑动时窗多变量相空间重构多核LS-SVM综合在线预测优化方法,最后利用测量数据进行预测对比得到如下结论。
(1)多变量相空间重构相比于单变量相空间重构能够更真实地反映系统的混沌特性,能够有效提升在线预测精度。
(2)将多核支持向量回归的组合核函数构造问题转换为系数优化问题,为多核函数的构造提供了一种普遍方法,并且多核函数的引入能够有效提升预测精度,且对精度的影响大于多变量相空间重构。
(3)多变量相空间重构与多核支持向量回归的参数综合优化相较于参数独立选择能够进一步提升预测精度,且解决了参数选择的主观性,最大程度地从提升预测精度的角度上考虑参数的选取。
(4)所提出的滑动时窗多变量相空间重构多核LS-SVM综合在线预测优化对电力负荷预测精度明显较高,说明了该方法能够较为有效地实现电力负荷的在线预测,且对工作日与休息日电力负荷预测均能保证较大精度,进一步证明了该综合优化方法的应用具备一定的鲁棒性。