基于改进相似日的光伏系统日发电量预测
2018-08-03陈国栋罗素芹刘文斌朱翔鸥
陈国栋,罗素芹,刘文斌,朱翔鸥
(温州大学物理与电子信息工程学院,浙江 温州 325035)
引言
太阳能LED路灯具有发光效率高、环保节能、无需铺设管线、无需人工操作等优点,应用广泛。然而,太阳能路灯每天充电量存在不确定性,依赖于天气状况,当遇上连续阴雨天时,太阳能LED路灯因蓄电池充电不足,电能快速被用完,进而导致无法正常照明。对于这个问题,一种可行有效的方案是,运用通信手段实现对太阳能LED路灯的远程监控,如图1所示。在远程数据监控中心,通过历史天气信息和太阳能板历史发电量信息,建立起太阳能板发电量预测模型,并结合从气象台得知的天气预报信息,预测未来5天内的太阳能LED路灯总发电量,并通过数据通信网络将预测的发电量发送给太阳能LED路灯控制器。太阳能LED路灯控制器根据预测的发电量并结合蓄电池的剩余电量,采用调整亮度,亮灯时长优先的控制策略,实现对太阳能LED路灯照明工作状态的最优化管理,提高了道路照明的高效与稳定。
图1 太阳能LED路灯的智能控制系统Fig.1 Intelligent control system of solar LED lamp
然而,目前国内外对光伏系统的超短期或短期输出功率研究较多,而对其中长期发电量预测的少有研究。太阳能LED路灯的日发电量直接受其发电输出功率决定,因此本文借鉴了当前光伏发电系统短期输出功率的研究,通过对预测太阳能LED路灯的日发电量进行准确来确定太阳能LED路灯未来5天的总发电量。光伏发电系统输出功率预测方法可以归纳为两类:间接预测和直接预测[1]。间接预测法首先对地表太阳辐照强度进行预测, 然后根据光伏发电系统的出力模型得到系统的输出功率[2]。此方法依赖于太阳辐射强度信息,由于气象部门提供的气象信息缺乏光照辐射数据,不适用于太阳能LED路灯的日发电量预测。直接预测利用光伏发电系统历史输出功率数据和天气预报信息直接预测其输出功率。文献[3]把天气类型划分为晴天、阴天、多云、雨天,选择与预测日相似的历史日的作为训练数据集,利用Elman神经网络建立相应预测模型;文献[4]把天气类型划分为晴天、阴天、多云、雨天,并利用支持向量机回归分别建立了4个子预测模型;以上方法对天气分类仅依赖于气象预报中给出的1个综合性的天气类型信息,分类不够全面。文献[5]应用自组织特征映射模型(self-organizing map, SOM),根据云量预报信息对气象类型聚类识别,再根据识别的天气类型选用相应的 BP神经网络进行预测,提升了模型对复杂天气的预测准确性;然而,该方法在使用时未考虑总云量对光伏系统的发电量非线性影响,使得聚类识别天气类型的效果不佳。
光伏系统日发电量受多元气象因素影响,其预测精度与天气状态密切相关[6]。本文针对类似于太阳能LED路灯等离网光伏系统对日发电量精准预测的需求,分析了影响光伏系统日发电量的气象因素,提出了一种量化日天气类型的方法以改进选取相似日的方法,采用支持向量机回归方法对光伏系统的日发电量进行预测,将模型预测结果与某地太阳能LED路灯实际运行数据进行比较分析,结果表明该方法具有较高的预测精度,具有有效性和实用性。
1 选取相似日
1.1 影响光伏系统发电量的主要因素
光伏系统日发电量直接受其发电输出功率决定,光伏系统输出功率的工程模型为
P=ηPVSI[1-0.005(T0+25)]
(1)
式中ηPV为光伏阵列的转换效率;S为光伏电池阵列的面积;I为太阳辐照强度,与气象因素密切相关;T0为环境温度。
对于既定的光伏设备,在进行日发电量预测时,光伏阵列的转换效率、安装角度等都是不变的,为一常数,其影响已经隐含在历史发电量数据中,可以不用考虑。为了提炼出与光伏系统日发电量相关性大的气象因素,采用距离分析法[5]中Pearson相似度分析某太阳能LED路灯发电量系统和当地气象站同期气象数据的相关性,选取温度T、风速w、湿度H、气压p、总云量C和发电量F为变量,时间尺度为3,结果如表1所示。由表1知,太阳能LED路灯发电量与温度呈较强的正相关性,与湿度和总云量呈较强的负相关性。文献[4]证明了天气类型、季节等对光伏系统发电功率的影响,季节类型与环境温度密切相关,而天气类型则与总云量密切相关。因此,为了选取与预测日季节类型、天气类型一致的相似日,以总云量、环境温度、环境湿度作为依据。
表1 气象因素与发电量的距离分析法结果Table 1 Distance analysis result of weather and power
1.2 相似日选取原理和训练样本确定
1)构造气象特征向量。总云量是指观测时天空被所有的云遮蔽的总成数。根据光伏系统数据库,对大量有效的历史发电量数据进行统计分析知:当总云量达90%以上时,光伏系统发电量很低;当处于多云、少云天气时,光伏系统发电量与晴天环境下相近。因此,总云量对光伏系统的发电量影响是非线性的。本文提出以总云量来量化日天气类型,考虑总云量对光伏系统的发电量非线性影响,结合历史数据分析,将总云量重新映射为0~1之间的具体数值来表明总云量对光伏系统发电量的影响程度,具体规则如表2所示。
表2 总云量编码表Table 2 Total cloud encode
光伏系统在晴天环境下,日发电量遵循着上升—保持—下降这一规律,定义日加权平均总云量以量化日天气类型:
(2)
[wi(j)]|i=5,8,11,14,17,20=
[0.03,0.05,0.35,0.4,0.15,0.02]
(3)
为了选取与预测日季节类型、天气类型一致的相似日,分别构造每日的气象特征向量
Y=[Tp,Tmax,Tmin,Hp,Cp]
(4)
式中Tp、Tmax、Tmin、Hp、Cp分别为第i日的平均温度、最高温度、最低温度、相对湿度、加权平均总云量。
2)计算相似度与相似日的选取。确定了各因素构成的向量后,利用灰色关联系数法[7]来求得预测日与第个历史日的相关系数,具体算法如下。
(a)采用“极差法”对各分量进行归一化:
(5)
式中yi(j)是第i日的第j个分量;m(j)、M(j)分别为第j个分量的最小值和最大值,j=1,2,3,4,5。归一化后基准日和第j日的特征向量为
x0=[x0(1),x0(2),x0(3),x0(4),x0(5)]
(6)
xj=[xj(1),xj(2),xj(3),xj(4),xj(5)]
(7)
(b)计算x0和xj在第个因素的关联系数:
(8)
式中ρ为分辨系数,其值一般取0.5。
(c)综合各影响因素的关联系数,定义x0和xj的相似度[7]为
(9)
采用连乘方式定义相似度,可以简单、自动地识别主导因素,并解决各因素权重设定问题。
(d)逐日计算m个历史日数据中,第日与预测日的相似度值Fj,选取满足条件相似度Fj>r(r∈[0,1]为一定的数值)的k日作为第i日的相似日,或者相似度最高的t日(t=1,2,…)作为第i日的相似日。
3 支持向量机回归预测模型
根据上文可知,预测模型的训练数据集为预测日的相似日属于小样本,支持向量机有着在有限训练样本的求解问题中仍能得到较小的误差的优点,克服了人工神经网络训练时间长、泛化能力差、易陷入局部极小等缺点,兼顾训练误差和泛化能力[8],因此选用SVR方法建立日发电量预测模型。
3.1 支持向量机回归(SVR)算法
SVR方法用于函数回归中,给定样本容量{xi,yi}(i=1,2,…,m),m为样本容量;xi为输入向量;yi为目标函数输出数据。考虑到大多数情况下样本呈非线性关系,估计函数f(x)可通过以下方法确定:将每一个样本点利用非线性函数Φ(x)映像到高维特征空间,再在高维特征空间进行线性回归,从而取得在原空间进行线性回归的效果。函数f为
f(x,w)=wΦ(x)+b=(w,Φ(x))+b
(10)
(11)
最后引入拉格朗日乘子,利用Wolf对偶技巧将上述问题转换为下面的对偶问题:
(12)
则式(11)给出的回归表达式可写成
(13)
3.2 日发电量的预测
根据上文分析,以预测日的相似日作为训练数据集,建立SVR模型预测光伏系统预测日的日发电量。SVR的输入为相似日5:00—20:00之间每3 h的温度Tj,总云量Cj数据(j=5,8,11,14,17,20)以及日平均湿度,共13个输入变量;输出为对应的日发电量,共1个输出变量。具体有以下3个步骤:
1)对光伏系统的历史数据进行平滑处理, 消除其中的奇异数据。
2)建立训练样本集和预测样本集, 同时对样本数据按式(14)进行归一化处理:
(14)
式中p为样本数据;pmax、pmin为其样本数据中的最大值和最小值;p′为归一化之后的样本数据。
3)采用RBF函数作为核函数, 同时选取SVR的参数c、ε和δ进行训练,得到回归函数表达式后对未来某一时刻的光伏出力进行预测,即
(15)
4 结果分析
选取某地100 W太阳能LED路灯在2016年7月1日—2017年6月30日之间共1年的历史数据和气象数据当作样本,并结合预测日期的当日天气信息情况,利用上述建立支持向量机回归预测模型为,得到日发电量预测值。为验证总云量重映射编码后的影响以及该模型对光伏系统日发电量预测的有效性和准确性,增加了没有经过总云量重映射的对比模型M1和运用文献[3—5]中方法建立的预测模型M2~M4进行对比分析。模型M2为文献[3]中的相似日-Elman神经网络预测模型;模型M3为文献[4]中的SVR预测模型;模型M4为文献[5]中的SOM-BP神经网络预测模型。根据式(18)、(19),选用均方根误差eRMSE和平均绝对百分比误差eMAPE对预测模型的日发电量预测能力进行评价[9],其结果如表3所示。
(16)
(17)
式中N为数据总数;Pf为预测值;P为真实值。
表3 M0~M4预测模型的预测效果 Table 3 Forecast result of M0~M4 forecast models
图2 日发电量预测模型的预测值和实际值的关系图Fig.2 Relationship between the forecast and actual value of the forcast model
从表3可知,运用相似日SVR方法建立起的;M0与M1预测模型的均方根误差eRMSE和eMAPE平均绝对百分比误差均为远小于其余模型,可见基于相似日的SVR预测模型具有良好的建模效果。图2为M0、M1模型的预测值和实际值的关系图。因此,若试验数据点越集中在对角线附近,则表明拟合模型的预测效果越好。通过线性回归求得模型M0、M1的拟合直线,结果见式(18)、(19),模型M0的拟合直线斜率更接近1,而且数据点更集中于对角线附近,可见,总云量经过重映射编码后的预测模型具有更高的预测精度。
M0模型:预测值=实际值×0.92+0.01
(18)
M1模型:预测值=实际值×0.88+0.02
(19)
5 结束语
光伏系统的日发电量存在着不确定性,依赖于天气状况。本文针对类似于太阳能LED路灯等离网光伏系统对日发电量精准预测的需求,着重分析了总云量对发电量的影响,通过量化日天气类型并结合诸多气象因素来重新构造选取相似日过程中的天气特征向量的构造,建立起SVR预测模型,对光伏系统的日发电量进行预测。通过某地太阳能LED路灯的1年的实测数据对模型进行验证,结果表明,预测模型有较好准确度,具有可行性与实用性。