基于最优加权组合模型的光伏出力预测

2019-11-06杨红军王胜辉李潇潇

沈阳工程学院学报（自然科学版） 2019年4期

杨红军，王胜辉，李潇潇

（1.沈阳工程学院a.研究生部；b.电力学院，辽宁沈阳 110136；2.辽宁能源投资（集团）有限责任公司，辽宁沈阳 110000）

光伏能源作为可再生能源的一种是新能源发展的趋势，但是光伏发电输出功率受太阳辐照度、温度、相对湿度等气象因素的影响，具有较大的波动性和随机性［1］。大规模的光伏并网会对电网的安全运行和调度部门的协调指挥造成一定影响。因此，对光伏发电功率的精准预测，有助于电网调度调整调度计划，能减少光伏发电的波动性对电网的影响［2］。

光伏发电输出功率预测的方法基本分为直接预测法和间接预测法［3］。直接预测是基于大量历史数据，结合预测算法，对光伏输出功率进行预测。间接预测是首先对太阳辐照强度进行预测，然后通过光伏发电系统模型预测出输出功率［4］。文献［5］利用历史发电数据训练BP神经网络进行光伏功率预测，依赖数据的准确性，且无优化，精度较差。文献［6］提出了一种主成份分析和神经网络预测模型，对初始值和阈值进行优化，但模型建立过程复杂，不实用。文献［7］提出了基于地基云图来对光伏功率进行短期预测，该模型依据地基云图采集设备，通过对云团的运动状况分析太阳辐照度的变化，进而对光伏功率进行预测，但该方法依赖云图采集数据的准确性，且缺乏广泛性，不实用。

本文的研究研究思路如下：首先基于历史发电功率和气象数据，利用模糊聚类方法将历史功率数据分类；其次将预测日所归入类别的历史数据和气象数据作为输入样本分别对建立的BP神经网络模型和支持向量机模型进行预测；最后将BP神经网络模型和支持向量机模型预测出的结果作为原始数据，进行多模型的加权组合，得到适合光伏电站的最优组合预测模型。流程如图1所示。

图1 光伏功率预测流程

1 模糊聚类与历史数据归类识别

1.1 模糊聚类

聚类分析是一种分类的数学模型，根据研究对象之间不同的特征、相似性和其他关系将研究对象进行分类。聚类的目的是把大量的研究对象减少为几类，以方便研究［8］。

将分类域U={x1,x2,…,xn}作为被分类对象，每个样本xi表示光伏发电功率的历史样本，分类对象中每个样本又有m个指标表示其特征，本文的指标以每天气象站实时数据（一般为每15 min）为基础，提取时间为5：00、6：00、7：00、8:00、9:00、10:00、11:00、12:00、13:00、14:00、15:00、16:00、17:00、18：00的太阳辐照度F、环境温度T、相对湿度H的数据，即：

式中，xit表示第i天t时刻的气象数据。

得到原始数据矩阵为

1）每个待聚类样本都有m个指标，每个指标的量纲都不相同，所以需要对各个指标数据进行标准化处理，公式为

2）建立样本模糊相似矩阵，由论域U=[x1,x2,…,xn]和样本中对象指标向量xi=[xi1,xi2,…,xim]依照聚类方法确定相似系数，确定xi与xj的相似程度rij=R(xi,xj)。主要采用相似系数法确定rij=R(xi,xj)，计算公式为

3）采用传递包法将历史功率样本聚类，根据式（2）所得的模糊矩阵R将其改造成模糊等价矩阵R*。用二次方法求R的传递闭包，即t(R)=R*。取适当的阈值λ∈[0 ,1]，对R*进行截割，形成截矩阵t(R)λ=()。再让λ由大变小，得到最佳聚类结果。

1.2 历史数据归类识别

将历史功率样本进行分类之后，有新的功率样本时可以通过归类识别确定新样本的类别。首先依据聚类情况，从待预测日附近和每年同期的光伏发电历史数据开始，利用式（5）计算出和待预测日的关联相似度rij，取关联相似度rij较大的历史日数据作为预测模型的训练样本。

2 单一预测模型

2.1 神经网络模型

BP神经网络是人工神经网络中应用最为广泛的算法模型，具有完整的理论体系和学习机制，已经被广泛应用到电网负荷预测和光伏发电功率预测中。它模拟人脑神经元对外部激发信号的响应过程，建立多层感知器模型，并利用信号前向传播和误差反转调整学习机制。通过多次迭代学习，建立一个处理非线性信息的智能网络模型［9］。本文建立的BP神经网络模型由3层组成，即输入层、隐含层和输出层。选取5:00～18:00各个整点的数据作为预测点，将与预测日的关联度rij较大的太阳辐照度、相对湿度、环境温度和历史光伏发电功率作为模型的输入数据；将5:00～18：00各个整点的光伏发电功率作为输出数据。BP神经网络结构如图2所示。BP神经网络的应用已经较为熟练，此处不再赘述，详见文献［8,10］。

图2 BP神经网络结构

2.2 支持向量机模型

支持向量机（Support Vector Machine，SVM）是Corinna Cortes和Vapnik提出的建立在统计学理论上的一种方法。支持向量机的实质是建立输入量与输出量的映射关系，是一种机器学习方法，具有泛化性强和训练时间短等优点［9］。本文将归类识别后相似度rij较高的历史日数据作为输入量，将实际光伏发电功率作为输出量，用输入量与输出量样本进行训练，如式（6）所示：

其中，x为m维样本数据，即为输入量；y是与之对应的输出量，则训练样本集为

用非线性映射φ(x)将样本映射到m维空间中，构造估计函数，如式（8）所示：

式中，ω是权重向量；b为常数。

为求解最优化问题，导入松弛变量ξ和ξ*，然后依据结构风险最小原则极小化函数，即：

为了使式（9）更容易求解，将约束条件问题转化为拉格朗日对偶问题：

式中，K(xi,xj)为核函数。本文选取高斯函数作为核函数，则已知拉格朗日算子αi、αi*和核函数即可求出f(x)。

3 最优加权组合预测方法

Granger在1969年提出了组合预测方法，其主要思想就是将多个模型组合起来进行预测。组合模型的关键是确定各单一预测模型的权重值，权重值选取的越准确，预测的精度就越高。本文采用最优加权组合的预测方法。

设光伏发电功率预测问题有m个子预测模型，n 个预测时间点，即 yit(i=1,2…；m,t=1,2…,n)，yit表示第i种模型在第t个时间点的实际值，y∧it表示第i种模型在第t个时间点的预测值，向量w=(w1,w1,…wm)T中的元素为组合模型中各个子模型的权重值，则某一时间点的组合预测模型为

设子模型的拟合偏差为

则拟合偏差矩阵为

将求解权重问题转化为最小误差平方和在最小二乘原理上的数学规划问题：

对式（17）用拉格朗日乘子法求得最优权重量：

目标函数最小值为

4 组合预测模型的建立及评价

4.1 最优加权组合模型建立

为避免单一模型的局限性和误差，提出了基于最优加权的光伏功率组合预测模型，利用最优加权将BP神经网络模型和支持向量机模型组合进行预测，即：

建模步骤如下：

1）提取光伏电站历史功率数据及同期气象数据，利用模糊聚类对数据进行预处理。

2）利用待预测日气象数据对待预测日进行归类。

3）确定训练样本及验证样本，并分别对BP神经网络模型和支持向量机模型进行预测。

4）通过最优加权方法的数学机理，确定BP神经网络模型和支持向量机模型的权重值。

5）将上述两个单一模型预测值乘上权重值，得出光伏功率组合预测值。

4.2 模型评价指标

使用下面3个指标作为评价各单一模型及组合模型的精确性。

1）平均绝对误差

2）平均绝对相对误差

3）均方根误差

式中，N为序列长度；yt为实际值；为预测值。

5 算例验证

本文以辽宁某光伏电站作为对象，结合此光伏电站2015年至2018年5月30日发电数据和当地气象站同期数据，拟预测2018年5月31日光伏发电功率。

首先将2018年5月31日的指标向量，即当日5:00～18:00各整点时刻太阳辐照度、环境温度和相对湿度，共42个向量因素进行标准化形成聚类样本，然后将其归类至聚类后的某一类别。找出所属类别中与其相似度较高的8日历史数据和气象数据，其中6日数据即84个数据用于训练，2日数据即28个数据用于验证。按照上述方法，分别建立BP神经网络模型、支持向量机模型，然后利用最优加权组合方法，对这两种方法预测出的结果进行加权组合，得到组合预测结果。

通过聚类分析后，与2018年5月31日相似度较高的日期为2018年5月的26日、28日和30日，2017年5月28日及6月2日，2016年5月30日及6月3日，2015年6月4日，最终选取2018年5月26及2017年6月2日的数据用于验证，剩余数据用于训练。最后将2018年5月31日的指标向量输入训练后的BP神经网络模型和支持向量机模型，得出单一模型预测结果。

设BP神经网络预测模型预测值为y∧1，支持向量机模型为y∧2，将两个模型进行最优加权组合，利用式（15）得到拟合偏差矩阵：

BP神经网络模型的权重值为0.63，支持向量机模型的权重值为0.37，组合模型为再利用式（18）求出权值：

利用MATLAB对5月31日5：00～18：00单个模型及组合模型进行预测，误差分析如表1所示，仿真曲线如图3所示。

表1 各预测方法预测误差分析

由仿真曲线和误差分析表可看出：组合模型预测精度＞BP神经网络模型＞支持向量机模型。

由于天气变化的无规律性，不同天气类型的预测精度可能存在偏差，图4、图5、图6、图7分别为晴转多云、晴天、阴天、雨天模型的预测仿真结果。

图3 预测结果

图4 晴转多云天气预测结果

图5 晴天预测结果

图6 阴天预测结果

图7 雨天预测结果

6 结论

利用最优加权的组合预测方法来预测光伏发电功率，通过模糊聚类分析能够找到与预测日相似度较高的历史相似日，结合相似日数据，能够准确预测出预测日发电功率。运用最优加权的组合方法对BP神经网络和支持向量机模型进行权重组合，避免单一模型的误差，预测的精度大于各单一模型的预测精度。通过实例仿真分析，得出该模型精度较高，具有实用性。