APP下载

主成分分析结合神经网络的光伏发电量预测

2013-06-07张国江

电力系统及其自动化学报 2013年6期
关键词:输入量发电量权值

蒋 浩,洪 丽,张国江

(1.东南大学电气工程学院,南京 210096;2.江苏省电力公司,南京 210024)

主成分分析结合神经网络的光伏发电量预测

蒋 浩1,洪 丽1,张国江2

(1.东南大学电气工程学院,南京 210096;2.江苏省电力公司,南京 210024)

针对光伏发电量预测模型主要以气象因素、历史发电量等作为BP神经网络的输入,输入量多、数据冗余、网络难以收敛。利用主成分分析法PCA(principal components analysis)分析原来多个输入变量反映的个体信息,提取较少的几项综合性变量,减少预测模型的输入量。同时利用遗传算法优化BP网络的权值阈值建立预测模型,克服了神经网络算法的局部收敛、训练速度慢等问题。实验结果表明,该方法提高了预测精度,为解决光伏系统发电量预测提供了一种可行方法。

光伏发电;发电量短期预测;神经网络;遗传算法;主成分分析法

光伏发电系统的发电量与天气状况密切相关具有随机性,主要受太阳辐射量影响,对天气变化敏感,并网后将会对电网造成一定的冲击,目前对光伏发电的随机性以及光伏阵列发电预测技术的研究较少,是光伏发电大规模应用的难点之一。因此,加强光伏系统发电预测的研究,预测出光伏系统的日发电量曲线,对提高光伏发电利用小时数、协调电力系统部门制定发电计划、减少光伏发电的随机化问题对电力系统的影响具有重要意义。

目前光伏发电预测的方法主要有神经网络法、灰色预测法、多元线性回归法、ARIMA预测法等。文献[1]中考虑影响太阳逐时总辐射的气象、地理等因素,对宝山站太阳逐时总辐射建立了混沌优化神经网络预测模型,文献[2]采用每小时的测量信息(太阳辐照强度、温度、压力、湿度、时间)作为输入,来预测每小时的日类型信息,然后由日类型信息计算光伏阵列的输出电能,过程比较复杂。文献[3]在理论上比较了多元线性回归、灰色理论和神经网络模型用在光伏出力预测中的不同效果,多元线性回归、灰色理论虽然方法较为简单,但预测误差也较大,在天气变化时预测能力也较弱。文献[4]按季节分别建立4个预测子模型,子模型中将相同日类型的光伏发电功率的历史数据和天气情况一同作为样本,对模型进行训练和发电功率预测,模型将历史发电功率和日平均气温作为输入变量。文献[5]利用聚类法将天气类型进行分类,将气温、湿度、风速、辐射量等作为BP神经网络的输入量,获得了较好的预测结果,但数据维数较大,冗余度比较高。

本文通过对发电量与气象因素的相关性分析,提出采用主成分分析法对原始数据进行处理,全面分析原来多个输入变量所反映的个体信息,提取出较少的几项综合性变量,即对多维矢量数据提取特征分量,压缩数据维度,降低数据冗余度,得到主成份分量;利用遗传算法优化神经网络的初始权值、阈值,构造网络结构,将得到的主成份分量作为输入量进行预测,并对模型在突变型天气时的准确性进行检验。

1 光伏发电系统的主成分分析

1.1 主成分分析模型

主成分分析法是一种多元统计分析方法,将多项指标尽可能压缩为几项互不相关的综合指标(即原始变量的线性组合),降低数据维度。主成分分析通过全面分析原来多个可观测指标所反映的个体信息,提取出较少的几项综合性指标;提取出的综合性指标互不相关,保留了原始变量的绝大部分信息,并能最大限度地反映原始变量所反映的信息,进而利用较少的几项综合性指标来描述个体,通过降维大大简化了问题的分析及资料的搜集整理过程。其主要分析步骤如下。

对某一问题的研究涉及k个指标,共有n个样本,观测得出的样本矩阵X为n×k维。对原始矩阵X进行标准化处理,消除指标变量间由于数量级的不同而产生的影响。

(1)根据标准化矩阵x1,x2,…,xk计算样本的相关系数矩阵R;

(2)求相关系数矩阵的k个特征值λ1,λ2,…,λk和相应的特征向量e1,e2,…,ek;

(3)求各个主成分的方差贡献率,计算累积方差贡献率,筛选主成分,当前m个主成分的累计方差贡献率达到指标信息反映精度的要求,一般为85%,求得m个主成分y1,y2,…,ym代替原始变量,将m个主成分作为遗传神经网络模型的输入。

主成分表达式为

式中:ei=[ei1ei2… eik],eik为原始变量的相关矩阵的第i个特征值所对应的k维特征向量;X为k维的初始输入变量,X=[x1x2… xk]T。

1.2 光伏系统发电量相关性因素分析

本文收集整理了国内某光伏电站的发电量与气象信息,包括每小时发电量、环境温度(环温)、环境湿度(环湿)、风速、风向、辐射量、发电量等指标。将以上因素进行相关性分析,相关系数r计算式为

由此得到的各因素与发电量的简单相关系数,如表1所示。

表1 光伏发电量与气象因素相关系数分析Tab.1 Correlation of meteorological elements and PV generation

由表1可知,发电量与太阳水平总辐照度相关性最大为0.997;与气温相关性为0.36,次之;与湿度成负相关性为-0.37。因此选择太阳水平总辐照度、温度、湿度作为预测模型的输入量,且各变量间存在较强的相关关系因此有必要进行主成分分析。

2 主成分分析的遗传优化神经网络预测模型设计与评估

2.1 预测模型结构及工作流程

基于主成分分析的遗传神经网络光伏系统发电短期预测模型结构如图1所示。首先对历史数据整理,剔除坏数据,将处理好的数据进行主成份分析,提取主成分,求得的主成分作为GA-BP预测模型的输入,建立GA-BP预测模型,设定初始种群数、遗传代数,遗传算法得到BP网络最优权值阈值,BP网络训练,最后得到预测结果。

图1 光伏发电预测模型结构Fig.1 Structure of PV generation forecasting model

2.2 光伏系统发电量预测模型的主成分分析

采集整理国内某光伏电站发电量数据及气象监测数据,以夏季数据为例,对预测模型原始输入数据进行主成分分析,寻取主成分。原始数据为:预测日前一天7∶00—18∶00,每小时的发电量;预测日前一天7∶00—18∶00,每小时的辐射量;预测日的平均温度、平均湿度。共计26个输入量,主成分分析结果见表2。

表2 特征值及方差贡献率Tab.2 Eigenvalue and variance contribution of the input variables

由表2可确定前5个特征值的累积方差贡献率已经大于85%,所以选择5个主成分,选定5个主成分后,利用式(1)计算出新的输入变量,将得到的输入变量输入遗传神经网络中进行预测。

2.3 遗传神经网络结构

2.3.1 遗传算法优化BP神经网络

BP神经网络的函数逼近能力强,通过对训练样本的学习,反映对象的输入、输出间的复杂非线性关系,而不必预先知道输入变量和预测值之间的数学模型,可以方便地计入温度、天气情况、湿度等对光伏发电量有影响的因素作用。

单独使用神经网络有许多缺陷,如训练速度慢、易陷入局部极小点和全局搜索能力弱等。遗传算法擅长全局搜索,而神经网络在用于局部搜索时显得比较有效,因此本文将遗传算法和BP算法相结合,取两种方法各自的特点。首先用遗传算法对神经网络初始权值进行优化,在解空间中定位出一个较好的搜索空间;然后再采用BP算法在这个小空间中搜索出最优解。

使用遗传算法对BP网络进行训练优化权值步骤如下。

(1)随机产生一组具有M个个体的种群,每个个体代表一个神经网络的初始权值分布,每个基因值表示一个神经网络的一个连接权值与阈值,则个体的长度为神经网络权值阈值的个数。

(2)根据适应度函数值对个体进行评价,对每个个体进行解码得到一组BP神经网络权值阈值,计算出神经网络的输出误差值E,然后根据适应度函数计算出各个个体的适应值。

(3)选择、交叉、变异遗传操作。

(4)终止条件,达到最大进化代数,或者误差小于设定值。

遗传操作完成后,取在整个遗传操作中得到的最优个体作为神经网络的初始权值,再运用BP神经网络进行训练,计算其误差,并不断修改其权值阈值,直至满足精度要求。

2.3.2 预测模型设计

图2为本文提出主成分分析的遗传神经网络发电短期预测子模型Model1,输入量y1,y2,…,y5主成分法分析计算后提取的主成份;目标量p1,p2,…,p12为预测日每小时的发电量。

图2 基于主成分分析的遗传神经网络发电短期预测模型Fig.2 Short-term PV generation forecasting model by GA-BP neutral network based on PCA

图3为光伏电站BP神经网络发电量预测模型Model2,输入量x1~x12为预测日前一天7∶00—18∶00每小时发电量,kW·h;x13~x24为预测日前一天7∶00—18∶00每小时辐射量,W/m2;x25为预测日的平均温度,℃;x26为预测日的平均湿度,%。

2.4 光伏系统发电量预测性能评估

采用每天平均相对误差MAPE(mean absolutepercentage error)和均方根误差RMSE(root mean square error)RMSE对发电预测结果评估,MAPE可以避免正负抵消,评估整个系统的预测能力,RMSE评估整个系统预测值的离散程度。

图3BP神经网络发电量预测模型Fig.3 Short-term PV generation forecasting model by BP neutral network

3 预测结果分析

利用主成分分析法提取5个主成分,将输入量输入图1的预测模型中,从而得到预测日7∶00—18∶00每小时的发电量。

表3为4个模型的组合表,表中×代表不含有该项,√代表含有该项。

为验证主成分分析法对光伏发电短期预测的有效性,增加了没有经过主成分分析的对比模型;为了说明遗传神经网络预测模型的优势,增加了没有优化的BP预测模型作为对照,共计4个模型。采用两组数据进行测试,其中第1组测试数据为天气类型没有变化(预测日前一天与预测日皆为晴天),第2组测试数据为突变型天气(预测日前一天为晴天,预测日为多云)。

表3 预测模型组合表Tab.3 Combination of forecasting models

表4为同一天气类型下预测模型的性能评估,图4为天气类型没有变化时模型1预测结果图。由图可以看出Model1(b)的预测曲线与实际发电量曲线趋势相同。采用主成份分析法后,输入量由26个减少为5个,运算速度相应提高。同时从表4中可以发现Model1(b)相对于Model1(a)的EMAPE减小39.47%,ERMSE减少43.85%。

表4 同一天气类型下预测模型性能评估Tab.4 Forecasting results assessment of models in the same weather

图4 同一天气类型下基于主成分分析的BP预测曲线Fig.4 Short-term PV generation forecasting curve by BP neutral network based on PCA in the same weather

图5为天气类型没有变化时模型2的预测曲线,从图5中可以看出基于主成份分析的GA-BP预测模型的预测曲线与实际发电量曲线拟合度要优于Model2(a)。从图4、图5可以看出Model2(b)的预测精度要高于其他3个模型。由表4可知采用遗传算法优化神经网络虽然预测精度提高,但是遗传算法求取初始权值与阈值的过程需要一定的时间,是以效率换取精度的提高。

图5 同一天气类型下基于主成份分析的GA-BP预测曲线Fig.5 Short-term PV generation forecasting curve by GA-BP neutral network based on PCA in the same weather

图6为突变型天气时4个模型的预测曲线,表5为此时的预测性能评估,由图6与表5可以看出,Model2(b)相对于Model1(a)的EMAPE减小了45.79%,相对于Model1(b)的EMAPE减小了29.78%;4条预测曲线中Model2(b)的预测曲线与实际发电量曲线趋势最为相似,对于配合电力系统调度部门制定发电计划有较高的参考价值。

图6 突变型天气下预测曲线Fig.6 Short-term PV generation forecasting curve in the variability weather

表5 突变型天气下预测模型性能评估Tab.5 Forecasting results assessment of models in the variability weather

4 结语

本文通过相关系数计算得出了各气象因素及其与发电量之间的相关性,辐射量对发电量的影响最大,其次为温度、湿度与发电量成负相关,并通过主成分分析法提取影响光伏系统发电量的主要影响因素;采用遗传算法优化神经网络权值与阈值,将主成分分析法提取的影响光伏系统发电量的主要影响因素作为遗传神经网络的输入量。结果表明,采用主成分分析法提取预测模型的输入量,显著提高了预测精度,尤其是对于单纯的神经网络效果明显;遗传优化神经网络预测模型虽然预测精度较高,但是遗传算法计算神经网络初始权值与阈值需要一定时间,是以运算时间的加长换取精度的提高,对于大型网络,效率将会受到影响;基于主成分分析的遗传神经网络预测模型,在突变型天气时预测精度也有明显提高,对研究突变型天气的发电量预测有较高的参考价值。

[1]曹双华,曹家枞(Cao Shuanghua,Cao Jiazong).太阳逐时总辐射混沌优化神经网络预测模型研究(Study of chaos optimization neural networks for the forecast of hourly total solar irradiation)[J].太阳能学报(Acta Energiae Solaris Sinica),2006,27(2):164-169.

[2]Parishward G V,Bhardwaj R K,Nema V K.Estimation of hourly solar radiation for India[J].Renewable Energy,1997,12(3):303-313.

[3]李光明,廖华,李景天,等(Li Guangming,Liao Hua,Li Jingtian,et al).并网光伏发电系统发电量预测方法的探讨(Discussion on the method of grid-connected PV power system generation forecasting)[J].云南师范大学学报:自然科学版(Journal of Yunnan Normal University:Natural Science Edition),2011,31(2):33-38,64.

[4]张岚,张艳霞,郭嫦敏,等(Zhang Lan,Zhang Yanxia,Guo Changmin,et al).基于神经网络的光伏系统发电功率预测(Photovoltaic system power forecasting based on neutral networks)[J].中国电力 (Electric Power),2010,43(9):75-78.

[5]代倩,段善旭,蔡涛,等(Dai Qian,Duan Shanxu,Cai Tao,et al).基于天气类型聚类识别的光伏系统短期无辐照度发电预测模型研究(Short-term PV generation system forecasting model without irradiation based on weather type clustering)[J].中国电机工程学报(Proceedings of the CSEE),2011,31(34):28-35.

[6]Chakraborty S,Weiss M D,Simoes M G.Distributed intelligent energy management system for a single-phase highfrequency AC microgrid [J].IEEE Trans on Industrial Electronics,2007,54(1):97-109.

[7]Senjyu T,Takara H,Uezato K,et al.One-hour-ahead load forecasting using neural network[J].IEEE Trans on Power Systems,2002,17(1):113-118.

[8]Caputo D,Grimaccia F,Mussetta M,et al.Photovoltaic plants predictive model by means of ANN trained by a hybrid evolutionary algorithm[C]//International Joint Conference on Neural Networks.Barcelona,Spain:2010.

[9]戴浪,黄守道,黄科元,等(Dai Lang,Huang Shoudao,Huang Keyuan,et al).风电场风速的神经网络组合预测模型(Combination forecasting model based on neural networks for wind speed in wind farm)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2011,23(4):27-31.

[10]侯媛彬,杜京义,汪梅.神经网络[M].西安:西安电子科技大学出版社,2007.

PV Generation System Forecasting Model Based on Neutral Network and Principal Components Analysis

JIANG Hao1,HONG Li1,ZHANG Guo-jiang2
(1.School of Electrical Engineering,Southeast University,Nanjing 210096,China;2.Jiangsu Electric Power Company,Nanjing 210024,China)

Most of photovoltaic(PV)generation forecasting models take meteorological factors as the input parameters of back propagation(BP)neural network.However,the input parameters and redundant data cause neural network to converge difficultly.The principal components analysis(PCA)is adopted to analyze individual information of the initial input variables,then the input variables are minimized as extracting the maily comprehensive variables.Thus the problem of the BP neural network can be overcame by the combination of genetic algorithm and BP neural network.The experimental results indicate that principal components analysis can significantly improve the precision of power prediction,and it provide an effective way to forecast generation power of PV system.

photovoltaic generation(PV);short-term photovoltaic generation forecasting;neural network;genetic algorithm;principal components analysis(PCA)

TM615

A

1003-8930(2013)06-0101-05

蒋 浩(1978—),男,博士,副教授,研究方向为可再生能源、电气信息技术。Email:jiangh@seu.edu.cn

2012-10-31;

2013-01-30

国家高技术研究发展计划(863计划)项目(2011AA05A105)

洪 丽(1987—),女,硕士研究生,研究方向为光伏发电与并网。Email:hongliseu@163.com

张国江(1975—),男,博士,高级工程师,研究方向为电力系统运行控制。Email:Zhang_g_j@263.net

猜你喜欢

输入量发电量权值
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
乌东德水电站累计发电量突破500亿千瓦时
电流互感器测量结果不确定度评定
基于集成检定法的重力式自动装料衡器测量结果的不确定度评定
2019年全国发电量同比增长3.5%
输入量与尿量比在深Ⅱ度烧伤患者休克预防性补液中的应用分析
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
中国区域发电量与碳排放的实证检验