APP下载

基于MRMR的光伏出力匹配方法研究及预测应用

2021-10-28王凯旋

可再生能源 2021年10期
关键词:互信息出力气象

杨 茂,王凯旋

(现代电力系统仿真控制与绿色电能新技术教育部重点实验室 东北电力大学,吉林 吉林 132012)

0 引言

近年来,传统能源急剧消耗,由此带来的环境问题越来越凸显。同时,人们对电力的需求也日益增长。在此背景下,光伏发电逐渐向结构化、规模化发展。然而,大面积光伏场站的接入将影响电力系统的安全稳定运行,因此,准确预测光伏出力变得尤为重要[1],[2]。环境的局地效应和表层大气运动的随机性给光伏出力的预测带来了不可忽视的干扰,同时,光伏出力的周期性和自相关性为光伏出力的预测带来了得天独厚的优势,即相似日/相似片段的选取(光伏出力匹配研究)[3]。

光伏出力的预测方法包括以BP神经网络、支持向量机、相关向量机为代表的静态机器学习算法和以生成式对抗网络、长短期记忆网络(Long Short-term Memory,LSTM)为代表的动态机器学习算法等[4]~[8]。光伏出力匹配研究是提高预测精度的有效手段。目前,光伏出力匹配常用的方法包括K均值聚类、K近邻算法、集对分析以及光伏出力特性建模等[9]~[12]。文献[13]对光伏出力进行不同时间尺度的聚类建模,提取了光伏出力小时级和分钟级波动特征,明确建立了不同天气类型的聚类中心,并通过短期光伏出力预测验证了建模的有效性。文献[14]筛选出与对光伏出力相关性较高的气象因素,然后,通过K临近算法对相似样本进行选取,最后,通过神经网络实现了对光伏出力的概率预测。光伏出力匹配工作主要是从历史实测数据和数值天气预报(Numerical Weather Prediction,NWP)信息中筛选出与光伏出力相关性较强的变量,并通过匹配算法进行匹配。由于不同天气类型、相同天气类型下的气象变量均有可能不同,因此,若采用固有强相关变量进行光伏出力匹配会导致匹配结果不理想。

本文提出一种基于最大相关最小冗余原则(Minimal Redundancy Maximal Relevance,MRMR)的光伏出力匹配研究方法。该方法先采用皮尔逊相 关 系 数(Pearson Correlation Coefficient,PCC)对数据库进行相关性分析,筛选出固有气象变量;再根据互信息理论对初步筛选后的数据样本和预测日NWP信息按短波辐射进行特征抽取,选取当日气象变量,进一步提高匹配效果;然后,将提取出来的待匹配日特征通过马氏距离进行光伏出力匹配;最后,基于MRMR的光伏出力匹配结果,通过长短期记忆网络对新疆某实际光伏场站进行短期预测,预测结果验证了本文方法的有效性。

1 光伏出力特性分析

受多种气象因素和组件状态的影响,光伏出力具有不稳定性,难以控制。因此,在进行光伏出力匹配前,须要对影响光伏出力的气象变量进行分析。光伏场站配备的传感器可以接收多类数据,结合NWP信息,可为数据分析处理提供极大的便利。本文以新疆某实际光伏场站为研究对象,进行相关性分析及特征提取。

本文选取的历史实测数据和NWP信息共计26类数据,数据长度为2017年2月5日-2018年4月30日,采样时间间隔为5 min。其中,历史实测数据通过所属光伏电站数据采集系统获得,历史实测数据的种类包括总辐射(V1)、散射辐射(V2)、直 接 辐 射(V3)、背 板 温 度(V4)、温 度(V5)、湿 度(V6)、风 速(V7)、压 强(V8)、风 向(V9)、光 伏出力(V10);NWP信息来自于当地气象局数值天气预报信息系统,NWP数据种类包括10 m风速(W1)、30 m风 速(W2)、50 m风 速(W3)、70 m风速(W4)、10 m风 向(W5)、30 m风 向(W6)、50 m风 向(W7)、70 m风 向(W8)、温 度(W9)、2 m相 对湿 度(W10)、2 m湿 度(W11)、长 波 辐 射(W12)、短波 辐 射(W13)、云 量(W14)、气 压(W15)、降 水 量(W16)。

根据上述数据库可以看出,26类数据不能全部作为光伏出力匹配的标准,因此,须要对这些数据进行初步相关性分析。本文采用PCC方法对原始数据进行特征抽取,PCC方法的理论公式为

式中:r为相关系数;Y为分析光伏出力与历史实测信息时的光伏出力以及分析NWP信息之间关系时的短波辐射;X为分析光伏出力与历史实测信息时的历史实测气象信息以及分析NWP信息之间关系时的其他气象信息;N为样本数目。

通过PCC方法对数据特征初步抽取的结果如表1,2所示,其中r为相关系数。

表1 基于历史实测信息的抽取结果Table 1 Extraction results based on measured historical information

当相关系数的绝对值小于0.2时,认为NWP信息与光伏出力、短波辐射不相关。依据PCC方法可初步筛选出相关气象信息,包括历史实测信息(V1~V7,V10)8种,NWP信 息(W2,W3,W9~W13)7种,从而将原始气象数据由26维缩至15维。

2 最大相关最小冗余原则

通过上文的初步筛选,实现了对原始数据的缩减,但从预测日光伏出力匹配角度来看,数据样本质量仍须进一步改善。

2.1 互信息理论

在概率论和信息论中,2个随机变量的互信息(Mutual Information,MI)或 转 移 信 息 为 变 量 间相互依赖性的量度[15]。不同于相关系数,互信息能够衡量2个随机变量之间的相关性,即一个随机变量中包含着关于另一个随机变量的信息量。利用互信息有两个目的,一为对PCC方法筛选后的数据通过减少耦合和冗余的数据空间来提高光伏出力匹配的速度和效率;二为利用MRMR原则进一步去除噪声,提高匹配精度。

对于所要筛选的影响变量X和待匹配量Y之 间 的 互 信 息I(X,Y)的 计 算 式 为

式 中:PXY(x,y)为X与Y的 联 合 概 率 分 布 函 数;PX(x)为X的边缘概率分布函数;PY(y)为Y的边缘概率分布函数;a为对数基底,取2。

2.2 最大相关最小冗余原则

能够最大程度反映光伏出力信息的气象特征被称为最大相关,不同气象特征之间的最大耦合为 最 小 冗 余[16],[17]。

通过PCC方法筛选后的数据样本,基于互信息理论和MRMR原则,将数据样本分为3类进行特征抽取。数据样本种类分别为待匹配日NWP数据样本集、历史NWP数据样本集和历史实测数据样本集。其中,待匹配日NWP数据样本集根据待匹配日NWP互信息值的大小选定。历史NWP数据样本集则须要通过MRMR原则进一步筛选。由表1,2可知,经过PCC方法筛选后发现,W2(30 m风 速)和W3(50 m风 速)存 在 耦 合;W10(2 m相对湿度)和W11(2 m湿度)存在耦合。而历史实测数据样本集有两个作用,一为光伏出力的预测应用,可以依据历史实测数据样本集选取输入变量,提高LSTM的训练速度和效率;二为利用该样本集可以进行光伏出力匹配研究。但该样本集中的V3(直接辐射)、V6(背板温度)和V10(光伏出力)不能作为匹配的标准,因为待匹配日仅有NWP信息。

表3为基于不同样本集,对4种不同天气类型的互信息特征抽取结果。

表3 对4种不同天气类型的互信息特征抽取结果Table 3 Mutual information feature extraction results from different sample sets

由表3可知,待匹配日NWP样本集特征与历史实测数据样本集相同,但不同天气类型下的主要气象变量不同。影响光伏出力匹配的气象特征 的 共 性 结 果 为(V1~W13)和(V2~W12),个 性 表现为不同天气类型、相同天气类型下,温度、湿度、风速上的差异。由表3还可以看出,即使在不同天气类型条件下,气象特征的个性结果表现为温度>湿度>风速这一固定排序,此结果与表1,2中基于PCC方法抽取结果相互验证。因此,根据历史实测变量与光伏出力进行相关性分析,选取相关性较高的变量作为光伏出力匹配的标准时,忽略了风速、湿度等变量在光伏出力匹配中的贡献。

3 基于MRMR的光伏出力匹配研究

通过上述分析可知,对于历史NWP数据样本集中的耦合特征,W3(50 m风速)优于W2(30 m风 速),W11(2 m湿 度)优 于W10(2 m相 对 湿度)。本文对新疆某实际光伏场站2018年5月份的4种天气类型(晴天、多云、雨天和晴转多云)进行光伏出力匹配研究。从工程实际角度出发,由于光伏出力待匹配日仅有NWP信息,而NWP信息中的短波辐射的重要程度等同于实测信息中的总辐射,因此,对短波辐射的研究是必要的。通过对新疆1 a的短波辐射通量进行研究可知,年短波辐射通量在时间上的分布为单峰曲线,近似于正态分布,具体如图1所示。

图1 年短波辐射通量分布Fig.1 Distribution of annual shortwave radiation flux

由图1可知,年短波辐射通量最高时节为5-7月。因此,5月的光伏出力匹配到8-12月的概率很小,可以进一步缩小匹配空间。

本文对5月份的2个晴天、2个多云、1个雨天和1个晴转多云天进行光伏出力匹配研究。光伏场站装机容量为30 MW,采样时间间隔为15 min,根据不同天气类型气象变量的互信息值大小,采用马氏距离进行光伏出力匹配,对于n个p维 样 本 集X=(x1,x2,…,xn),xi,xj∈Rp,每2个 样 本之间距离的计算式为

为比较本文方法的优越性,现将MRMR法与PCC方法的计算结果进行对比。不同天气条件下,光伏出力的匹配结果如图2所示。

图2 不同天气类型下,光伏出力的匹配结果Fig.2 Matching results of PV output under different weather types

由图2可知,晴天天气的光伏出力表现为一条光滑的单峰曲线,从匹配结果来看,虽然两种方法均可匹配到晴天日,但本文提出的匹配方法效果更佳。多云天气的光伏出力波动特性与局部区域的云层运动有关,依据历史实测信息筛选出的固有气象变量(对应的NWP信息分别为短波辐射、长波辐射和温度)的光伏出力匹配效果仅能追踪到部分波动区段,结合表3和图2(b)可以看 出,该 天 气 类 型 下 的W3(风 速)、W11(湿 度)的互信息值均大于W9(温度),其中,W3的互信息值最大。图2(c)左侧为雨天的光伏出力匹配结果,该天气条件下的光伏出力值很小,波动情况是由短时的云层运动导致的。另外,根据表2中雨天气象特征的互信息值可以看出,风速互信息值为0.6,与长波辐射相近。但历史实测数据样本集中,该日的风速互信息值仅为0.1,进而容易忽略风速这一变量对光伏出力匹配的贡献,因此,MRMR的匹配效果明显优于历史匹配方法。图2(c)右侧为晴转多云的光伏出力匹配结果,该天气类型的光伏出力的最大值出现在实验前期,同样,因为忽略当日气象变量的影响,造成当日光伏出力的历史匹配结果与晴天一致,而MRMR的光伏出力匹配结果符合该天气类型特征。

表2 基于NWP信息的抽取结果Table 2 Extraction results based on NWP information

4 评价指标

根据国家电网公司2014年5月1日发布的《光伏发电功率预测系统功能规范》中的均方根误差(Root Mean Square Error,RMSE)、平 均 绝 对 误差(Mean Absolute Error,MAE)和 合 格 率(Quality Rate,QR),这些指标同样可以用来量化历史天气匹配结果的准确率,RMSE,MAE,QR的计算式分别为

表4为4种天气类型(共6 d)条件下,不同方法的光伏出力匹配结果。

表4 不同方法的光伏出力匹配结果Table 4 Comparison of matching results of different methods

由表4可知,除了2018年5月7日,晴天条件下,2种方法的光伏出力匹配结果相近外,其余天气类型均为本文提出方法的匹配效果优于历史匹配方法。

5 匹配方法在光伏短期出力预测的应用

光伏出力的准确预测有利于电网可靠性的评估和调度部门备用计划的设定等[18]。然而,由前文可知,对于仅有NWP信息的待预测日,通过PCC方法处理后的可用信息分别为短波辐射、长波辐射、温度、湿度和风速5种,利用这5种信息进行预测很难取得较好的预测结果。但通过光伏出力匹配可以得到待匹配日的实测气象信息,对待匹配日的实测气象信息进行气象变量与光伏出力之间的相关性分析,筛选出输入变量,有利于提升光伏出力的预测精度。本文匹配方法在光伏出力短期预测的应用流程如下。

①通过互信息理论和MRMR原则筛选出待预测日的气象变量,根据筛选出的气象变量的互信息值的大小选取输入变量进行匹配。

②对①得到的待匹配日的实测气象信息,进行气象变量与光伏出力之间的相关性分析,筛选出变量作为LSTM的输入变量。

③设置LSTM模型的参数为7-17-1,激活函数为sigmoid函数,最佳迭代次数为100,通过模拟得到最优预测结果。

基于前文分析,得到4种天气类型的光伏出力预测结果如图3所示。

图3 光伏出力预测结果Fig.3 PV output prediction results

根据评价指标RMSE,MAE和QR,得到光伏出力的预测误差评价结果如表5所示。

表5 光伏出力预测误差评价结果Table 5 PV output prediction error evaluation results

由表可知,4种天气类型的光伏出力预测结果的均方根误差和平均相对误差分别为5.56%和5.81%,合格率为99.65%,满足光伏出力短期预测的指标要求(均方根误差小于20%、合格率大于80%)。

6 结论

本文针对气象变量筛选结果不同导致光伏出力匹配结果不确定的问题,提出了一种基于最大相关最小冗余原则的光伏出力匹配方法,通过算例分析得到以下结论。

①根据待匹配日NWP气象数据的互信息特征,提取与待匹配日实测气象数据的后验知识,可得影响光伏出力匹配的共性结果为短波辐射-总辐射、长波辐射-散射辐射;个性结果表现在温度、湿度、风速上的差异。

②根据历史实测气象数据样本集的互信息计算发现,即使不同天气类型,筛选后的气象特征个性结果一般表现为温度>湿度>风速这一固定排序,其中,风速在光伏出力匹配时的贡献易被忽略。

猜你喜欢

互信息出力气象
气象树
专栏:红色气象 别有洞天
大国气象
基于改进互信息和邻接熵的微博新词发现方法
“出力”就要做为人民“出彩”的事
基于实测数据的风电场出力特性研究
基于互信息的图像分割算法研究与设计
基于互信息的贝叶斯网络结构学习
基于改进SIFT与互信息的异源图像匹配
汽车内饰件用塑料挂钩安装力及脱出力研究