基于优化核极限学习机的光伏出力短期预测
2018-01-05田德,张琦
田 德, 张 琦
(广东工业大学 自动化学院,广东 广州 510006)
基于优化核极限学习机的光伏出力短期预测
田 德, 张 琦
(广东工业大学 自动化学院,广东 广州 510006)
光伏出力的精确预测有利于确保电力系统的可靠运行,减小投资者的利益风险。考虑到光伏出力的不确定性和非平稳性,首先采用自适应白噪声的完整集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)将原始光伏出力序列分解为一系列相关性较强、较平稳的子序列,再使用核极限学习机(Kernel Extreme Learning Machine,KELM)分别对每一子序列进行预测。由于KELM学习参数选取对其预测性能有较大影响,提出了基于改进蝙蝠算法(Improved Bat Algorithm, IBA)对KELM模型参数进行寻优。最后,将每一子序列预测结果通过求和相加获取最终的预测值。实际算例表明,该IBA算法收敛速度快,全局搜索能力强,所提的CEEMDAN-IBA-KELM组合方法能有效提高光伏出力的预测精度。
光伏出力预测; 自适应白噪声;集合经验模态分解; 核极限学习机; 参数优化; 改进蝙蝠算法
0 引言
绿色清洁能源特别是太阳能和风能是目前最具商业发展前景的发电方式之一,已受到了越来越多的重视。然而,随着并网光伏发电技术的不断发展,给电力系统的运行稳定性带来了严峻的挑战。因此,并网光伏出力的准确预测不仅能有效降低大规模光伏发电接入对电网的影响,提高电网对光伏的接纳能力,而且太阳能资源的充分利用可以获得较高的经济效益和社会效益。
目前,光伏输出功率预测方法主要集中于单一的人工智能预测方法,包括人工神经网络、支持向量机等。但以上单一预测的方法均受到自身特性的限制,根据相似日原理选取预测样本,建立径向基神经网络预测模型,虽然径向基神经网络优于一般的BP神经网络,但其仍存在中心矢量和隐层节点数难以确定的问题[1-3]。文献[4-5]根据光伏出力及其影响因素建立了基于支持向量机回归预测模型,适合于多变的复杂天气情况下光伏预测,但支持向量机模型参数选取对预测性能存在较大影响。组合预测方法结合了各单一预测方法的优势,因此受到了越来越多的关注。现阶段,组合预测方法主要有:1)将各单一模型预测值根据某种权重关系筛选出最佳的权重组合系数,从而建立权重组合预测模型[6]。2)基于单一预测模型参数优化的组合方法,如文献[7]采用遗传算法对人工神经网络的权值和阈值进行优化。3)基于信号分解技术的组合预测方法,其中,信号分解技术主要包括小波分解[8-9](Wavelet Decomposition,WD)、经验模态分解[10](Empirical Mode Decomposition,EMD)和集合经验模态分解[11](Ensemble Empirical Mode Decomposition,EEMD)等,即通过将原始数据信号分解为一系列子序列,对其分别采用人工智能算法进行预测并求和得到最终的预测结果。
考虑到光伏出力序列的波动性和随机性特点,本文采用一种自适应白噪声的完整集合经验模态分解[12](Complete Ensemble Empirical Mode Decomposition with Adaptive Noise, CEEMDAN) 方法,通过在分解的各个阶段添加自适应白噪声,并根据计算剩余的余量信号以得到各个分量信号,该方法克服了传统EMD方法模态混叠缺点以及EEMD分解低效率的问题,且可以有效降低光伏序列的非平稳性。基于此,提出一种基于CEEMDAN与IBA-KELM组合预测方法, 充分考虑了KELM模型参数选取对预测结果精度的影响[13],采用改进的蝙蝠算法对其参数进行优化。最后,以美国俄勒冈州某光伏电站数据为例,验证了本文采用的CEEMDAN-IBA-KELM组合预测方法具有优良的预测精度。
1 光伏出力影响因素分析
光伏功率预测[14-16]是一个复杂的非线性问题,因此决定功率大小的因素有许多。实际工程中,光伏输出功率可表示为[17]:
P=ηIsA[1-0.005(T+25)]
(1)
式中:η为光伏阵列的转化效率;Is为辐照强度,(W/m2);A为阵列的总面积,(m2);T为大气温度,(℃)。
通常对既定的光伏电站其安装角度及光伏阵列转换效率已包含在历史输出功率数据中,因而无需考虑。因此,从上式可知光伏功率输出受太阳辐照强度和环境温度的影响。而实际中,除了这2个影响因素外,对于光伏出力预测还需考虑天气类型、风速、季节等。
1.1 气象因素对光伏功率的影响
为分析太阳辐照、环境温度和风速对光伏输出功率的影响,以美国某光伏电站的历史数据为例,随机选取2015年某3天的历史数据绘制光伏输出功率与太阳辐照强度、温度和风速的关系示意图,如图1~3所示。由图可知,太阳辐照强度与光伏输出功率曲线变化趋势基本一致,耦合程度高,说明太阳辐照是影响光伏功率输出最为主要的因素;图2和图3中温度、风速均与光伏输出功率呈现一定的相关性,且风速随机性较强,对光伏输出功率影响较弱。因此,本文将光伏辐照强度、温度均作为IBA-KELM模型的输入变量[18-19]。
图1 光伏输出功率与太阳辐照曲线图
图2 光伏输出功率与温度曲线图
图3 光伏输出功率与风速曲线图
1.2 不同天气类型下光伏输出功率大小
图4为2015年5~6月某3天的晴天、突变天气、雨天3种主要天气类型下的光伏输出功率。从图中可以看出,晴天的光伏输出功率曲线相对平稳;而突变天气、雨天的光伏功率曲线波动性、随机性较强,这一情况不仅增加了光伏功率预测的难度,而且对光伏电站运行的安全稳定性造成影响[20]。因此,针对不同天气类型数据分别进行预测尤为重要。
图4 不同天气类型下的光伏功率曲线
1.3 不同季节下光伏输出功率大小
以晴天为例,选取春、夏、秋、冬四季下的光伏功率曲线如图5所示。由图可知,春季与夏季日照时间长,其光伏功率输出值相对较大;秋季与冬季温度低、日照时间相对较短,其光伏功率输出值相对较小。因此,不同季节的光伏输出功率对预测存在一定的影响。
图5 不同季节下的光伏功率曲线
2 相似日选取
考虑到光伏输出功率在不同天气类型下差别较大,为准确选取与预测日最为相似的历史功率输出日以减小预测误差,采用数据挖掘中应用较广泛的K-means算法[21]。
假设原始光伏功率数据样本为xi={x1,x2,…,xn},将样本聚类为c类,其具体过程如下[22]:
(1)从原始样本中随机选取c个输入样本作为初始聚类中心,c即代表1.2节中3种不同天气类型。
(2)以距离中心最近原则,计算样本xi与kc间的欧氏距离,将该样本分配至最邻近聚类集合εk中。
(3)计算εk中各样本的平均值,重新生成新的聚类中心。
(4)重复步骤(2)、(3),直至相邻2次计算中的聚类中心不变时算法结束。
3 组合预测模型
3.1 CEEMDAN方法
(2)
因此,根据CEEMDAN将原始u(t)信号分解为:
(3)
式中:i=1,2,…,K,K为模态分量的总数。
3.2 KELM算法
KELM算法[24]是依据传统极限学习机(Extreme Learning Machine, ELM)的基础而提出的。因传统ELM的输入层权值及隐层权值均随机设定,其预测性能较差,因此,根据支持向量机的原理引入核函数,从而提出了KELM算法,其具体证明过程可参见文献[25]。其中,KELM模型的输出及其核函数公式为:
(4)
K(μ,ν)=exp(-(μ-ν2/g))
(5)
式中:C为惩罚系数;I为单位稀疏矩阵;核函数K(μ,ν)一般采用为RBF核;g为核系数。
该算法克服了传统ELM在处理低维数据时线性不可分的缺点并提高了算法的学习速率和泛化能力。但KELM模型的预测性能仍受其学习参数的影响较大,所以本文采用全局搜索能力强的IBA进行参数优化。
3.3 IBA优化KELM
fi=fmin+(fmax-fmin)·rand
(6)
(7)
(8)
(9)
式中:ωini、ωter分别为惯性系数的初始值和最终值;c为惯性权重相关系数;τ为当前迭代次数;τmax为最大迭代次数。
根据改进后的BA优化KELM的步骤描述如下:
1)设置IBA相关参数,主要包含:种群数目N,最大迭代次数τmax,最小频率fmin、最大频率fmax,最大音量A,最大脉冲率r,惯性系数的初始值ωini和最终值ωter;惯性权重相关系数c1。
2)随机初始化蝙蝠位置xi,其由惩罚因子C和核参数g组成,并根据适应度函数f(xi)值寻找当前最优位置x*。
3)位置更新。根据公式(6)~(9)更新每一个体脉冲频率、速度与位置。
4) 设定随机数rand,若rand>r,则随机产生新解。
克什米尔地区一直是印度和巴基斯坦的争议地区,其归属权之争由来已久,导致政局一直不稳定。20世纪中期的两次印巴战争使得矿区无法勘探和开掘,本计划于1990年实施的新矿区开发项目也因政治动乱而没能进行。同时由于地理环境也比较特殊——平均海拔超过4000米,人类生存条件恶劣,常年处于低温严寒状态,适宜开采的时间每年仅2-3个月。加之山上基本设施匮乏,大型开采机械又无法运到山上,这些因素都造成克什米尔蓝宝石开采成本巨大。以至于克什米尔矢车菊、皇家蓝,很多人也只闻其名不见其物!