基于聚类分析方法的风电场日前功率预测研究
2018-03-08张旭鹏刘高明
张 介,马 赟,张旭鹏,刘高明
(1.国网浙江省电力有限公司湖州供电公司,浙江 湖州 313000;2.国网河北省电力有限公司保定供电分公司,河北 保定 071000)
0 引言
进入21世纪以来,我国风电装机高速发展,风电在电网中的比重也越来越大。2014年我国累计风电并网装机容量达到9 637万kW,占全部发电装机容量的7%。随着风电装机容量的不断提高,风电出力预测工作也变得更为重要。风电功率预测的准确性直接关系到电力系统的安全稳定运行,其预测精度的提高可以大大减轻风电出力不确定性对电网运行造成的不良影响[1-3]。
现有风电预测方法主要有基于风电功率历史数据的直接法和基于数值天气预报的间接法。直接法主要包括时间序列预测法、指数平滑法等[4]。文献[5]用时间序列法选择神经网络的输入变量,并使用滚动式神经网络权值调整提高了风电功率的预测精度。基于数值天气预报的间接法主要有物理预测方法和统计方法。物理预测方法是基于数值天气预报及风电场周围的地形地貌信息,将数值天气预报数据进行等值,再根据风机出力曲线进行预测的方法[6-7]。文献[7]分析了风电功率预测的物理方法,该方法采用解析原理分析了风电场周围的局地效应并结合风电厂风机尾流影响建立了一套无需历史数据的物理预测方法,可用于新建风电场的功率预测。基于数值天气预报的统计方法主要包括人工神经网络法、支持向量机回归法等[8]。文献[9]对风电功率预测的原理、方法进行研究,建立了基于人工神经网络的风电场功率预测输出系统。文献[10-12]使用人工神经网络法对风电功率进行预测。文献[13]引进分类预测思想,将历史出力分为若干模式,建立历史出力模式库,并利用时间扭曲法将当前出力模式与历史出力模式进行匹配,结合匹配结果做出预测。文献[14]采用统计升尺度方法,将区域内有代表性的风电场出力在空间上升尺度得到区域风电场出力。
风电场中不同特性的气象信息对应的风电功率模式变化很大,但现有的基于数值天气预报的统计预测方法并未将气象信息按不同的特性进行分类,即未考虑不同的气象数据对应的风电出力特性不同这一特点。因此,需要解决:不同特性气象信息对应风电出力差别较大问题;气象数据中的各类因素与风电出力相关性,即哪个或哪几个气象因素对风电出力起到主导作用;如何计及气象信息的预测误差对风电功率预测精度的影响。
以下提出一种基于聚类分析和神经网络相结合的风电功率预测方法。该方法将风电场历史数据进行聚类并分析其对应的风电场出力之间的特性,进而进行风电功率预测。该方法将风电场历史数据中的气象信息数据进行聚类,分析每一类气象数据对应的风电功率输出特性并训练对应的神经网络;再将由数值天气预报提供的待预测日的气象信息聚类,找到与待预测相同类别的历史数据类型,进而使用对应神经网络进行预测工作。
1 风电场运行历史数据特性分析
影响风电功率的因素很多,诸如风速、风向、气压、温度等气象信息,风电场风机尾流影响,风电场地形因素等都会对风电功率造成影响,而且这些因素对风电功率的影响是综合作用的结果。在诸多影响因素中,风电场历史数据中包含了风速、风向、气压、温度、湿度,以下将从这几个方面进行分析。
皮尔森相关系数是用来反映2个变量线性相关程度的统计量。皮尔森相关系数通常用r表示,r的取值范围在[-1,1],若 r>0,则 2个变量正相关;若r<0,则2个变量负相关。r的绝对值越大,表示2个变量的线性相关程度越大。皮尔森相关系数表达式如下:
式中:X,Y为均值;SX,SY为方差。
使用式(1)计算某风电场4月份运行历史数据中风速、风向、气压、湿度、温度与出力及风速之间的相关系数,得到的结果如表1所示。
表1 皮尔森相关系数
从表1中可以看出风速与风电出力的线性相关程度最高,且是正相关。这说明风电场的出力受风速的影响最大,除风速外其他4个因素中风向与风电出力的相关性相对大一些。风向、湿度、温度、气压均与风速呈现一定的相关性,其中风向与风速的相关性最大,说明风向对风速的影响程度较其他3个因素更大。
将风速、风向、湿度、温度、气压和风电场出力按照相关性大小做出数据分布如图1所示,可以看到风速与风电场出力之间数据分布较为紧凑,且呈现出随着风速增大风电场出力也随之增大的趋势,但是数据分布带较宽,这就说明除风速外其他因素同样在一定程度上影响着风电出力,否则数据分布将会很窄;风向与风电场出力的数据分布同样较为集中,但是从图中可以看到,绝大多数的数据风向没有大范围变化,然而风电场出力却分布在零出力到额定出力的整个范围内,这说明除风向外其他因素影响着风电出力;从气压、温度、湿度与风电场出力的关系看出数据点均匀布满整个坐标区域,说明气压、温度、湿度对风电场的出力决定作用很小。
图1 风速、风向、气压、温度、湿度与出力关系
2 神经网络输入数据的选取
以下选用BP神经网络对风电功率进行预测。根据kolmogorov定理,3层BP神经网络可以任意精度逼近任何非线性连续函数,因此文中神经网络采用单隐层结构,即1个输入层、1个隐含层和1个输出层的3层神经网络。
风速、风向、气压、温度、湿度对风电出力都有影响,应作为神经网络的输入,但是一些对风电功率影响很小的因素作为神经网络的输入会使网络更加复杂,训练时间延长,甚至可能使预测精度降低。因此,以下采用排序组合方法选择神经网络的输入。使用某风电场4月10—16日气象信息作为历史数据对4月17日进行预测,首先将风速、风向、气压、温度、湿度分别作为输入进行预测,并将预测误差进行排序,排序结果如表2所示。将排序结果按照误差从小到大进行组合,组合结果作为输入进行预测。误差采用均方根误差,如式(2)所示:
式中:yi为真实值;为预测值。
从表2可以看出,风速、风向组合作为神经网络的输入时误差最小,而风速、风向、湿度、气压、温度作为输入时网络的误差反而很大。造成这种现象的原因是:当输入的参数越多,提供给网络的信息就越多,相应的网络结构就越复杂,导致最后的预测结果精度下降。网络的输入确定为风速、风向,之后便可针对风速、风向对风电功率造成的影响进行分析。
表2 不同输入对应误差
图2、图3分别为风电场4月15—16日的风速及风向分布情况,图中90为正北方向,圆的直径代表风速大小。由图可以看出风速与风向在空间上的分布很不均匀。图2风速分布在0~15 m/s的范围内,而图3中风速都低于10 m/s;图2中风向分布在北方、西北、西方、西南等较大范围内,然而图3中风速基本分布在正北方向。可见2日的风资源分布差异较大。
图2 4月15日风速、风向分布
图3 4月16日风速、风向分布
图4为4月15日风速、风向及出力的三维分布及其投影图。从图4空间中的点及其在风速、风向平面上的投影可以看出,不同的风速、风向对应的出力情况不同。因此,使用风速、风向作为神经网络的输入时应对数据进行聚类。
图4 风速、风向、出力三维分布及投影
3 预测风电功率的思路
预测风电功率的基本思路先对历史数据中风速、风向数据进行聚类,将其分成不同的类别,并训练多个神经网络;将待预测日的风速、风向数据同样进行聚类,按照聚类中心的欧式距离将待预测日风速、风向数据与历史风速、风向数据进行匹配,并将匹配结果输入神经网络进行预测;整合几类预测结果得到待预测日整日预测数据。
具体预测流程如下:
(1)使用模糊C均值聚类算法将风电场运行的历史气象数据中风速、风向数据聚为c类,c类数据对应c个聚类中心。聚类中心表征的是此类数据在空间位置的中心。模糊C均值聚类算法通过优化目标函数J(U,V)来确定每个样本对所有聚类中心的隶属度,从而确定样本的归属:
式中: V 为聚类中心矩阵; U=(uik)c×n为隶属度矩阵,uik为第k个样本属于第i类的隶属度;dik为样本k到聚类中心的欧式距离。目标函数J(U,V)是样本到聚类中心的平方距离在一定权重下的和。权重为第k个样本属于第i类样本的隶属度的m次方。当J(U,V)的值足够小,达到事先给定的某一值时聚类结束。根据隶属度矩阵来确定每个数据的归属类别。当时,可将样本x归为第j类。
(2)从历史数据中找到c类风速、风向数据对应的风电场出力数据。不同类别的风速、风向数据对应的风电场出力特性不同。使用c类风速、风向及其对应的出力数据分别训练c个神经网络。文中使用3层BP神经网络,输入层为风速、风向2个因素;根据使用较为普遍的隐含层神经元数目的(2n+1)原则,隐含层统一使用5个神经元;输出层则有1个神经元。
(3)使用模糊C均值聚类算法将数值天气预报提供的待预测日的风速、风向数据聚为m个类别,得到m个聚类中心。
(4)将待预测日风速、风向的m个类别逐一匹配到历史数据的c个类别中,即在c类历史数据中找到与待预测日m个类相同类别的数据。类别匹配的原则是根据各自数据聚类中心的欧式距离进行匹配。欧式距离计算公式如下:
式中:xi,yi为待预测日聚类中心; xj,yj为历史数据聚类中心。
若待预测日中第i类(1≤i≤m)聚类中心与历史数据中第j类(1≤j≤c)聚类中心的欧式距离最小,则将待预测第i类数据划分到历史数据中第j类。
(5)将匹配完成的待预测日风速、风向数据输入到使用同一类别历史数据训练的神经网络中进行预测,得到预测结果。整合各类预测结果,得到待预测日的风电功率预测曲线。
4 算例分析
算例采用辽宁某风电场4月10—17日运行数据,将4月17日作为待预测数据,其余作为历史数据。风电场装机容量30 MW,每台风机1.5 MW,共20台风机。所有数据15 min为1个采样点。
因为不同数据的特征不同,聚类分析的数据不能唯一确定,因此将数据聚类数目从小逐步增加。对历史数据进行聚类是c值从2开始最终将历史数据聚成7类;对待预测数据分别聚类为1类、2类、3类和4类。将预测误差进行逐一对比,表3是误差对比,采用均方根误差,其中历史数据聚类数目为4时误差最小,待预测日聚类数目为1时均方根误差为3.68。图5为4月17日预测出力曲线与实际出力的对比。
表3 不同分类数目误差对比
5 结论
(1)气象信息中风速、风向、气压、温度、湿度都对风电场出力有一定影响,但是风速与风向对风电功率的影响最为显著,使用风速、风向作为神经网络输入进行预测精度最高。
图5 预测曲线与实际出力对比
(2)风速和风向分布分散,通过文中分析可知,对风电功率进行分类预测,能够提高风电功率预测的精度。
[1]周双喜,鲁宗相.风力发电与电力系统[M].北京:中国电力出版社,2011.
[2]孙涛,王伟胜,戴慧珠,等.风力发电引起的电压波动和闪变[J].电网技术,2003,27(12)∶63-70.
[3]迟永宁,刘燕华,王伟胜,等.风电接入对电力系统的影响[J].电网技术,2007,3(13)∶77-81.
[4]王健,严干贵,宋薇,等.风电功率预测技术综述[J].东北电力大学学报,2011,31(3)∶20-24.
[5]杨秀媛,肖洋,陈树勇.风电场风速和发电功率预测研究[J].中国电机工程学报,2005,25(11)∶1-5.
[6]于大洋,韩学山,梁军,等.基于NASA地球观测数据库的区域风电功率波动特性分析[J].电力系统自动化,2011,35(5)∶77-82.
[7]冯双磊,王伟胜,刘纯.风电场功率预测物理方法研究[J].中国电机工程学报,2010,30(2)∶1-6.
[8]谷兴凯,范高锋,王晓蓉,等.风电功率预测技术综述[J].电网技术,2007,31(2)∶335-338.
[9]范高锋,王伟胜,刘纯.基于人工神经网络的风电功率短期预测系统[J].电网技术,2008,32(22)∶72-76.
[10]ALEXIADIS M,DOKOPOULOS P,SAHSAMANOGLOU H.Short term forecasting of wind speed and related electrical power[J].Solar Energy,1998,63(1)∶61-68.
[11]A SFETSOS.A comparison of various forecasting techniques applied to mean hourly wind speed time series[J].Renewable Energy,2000(21)∶23-35.
[12]MOHAMEDA MOHANDES,SHAFIQUR REHMAN,TALALO HALAWANI.A neural networks approach for wind speed prediction[J].Renewable Energy,1998,13(3)∶345-354.
[13]刘艳华,刘冲,李伟花,等.基于出力模式匹配的风电集群电多时间尺度功率预测[J].中国电机工程学报,2014,34(25)∶4350-4358.
[14]陈颖,孙荣富,吴志坚,等.基于统计升尺度方法的区域风电场群功率预测[J].电力系统自动化,2013,37(7)∶1-5.
[15]钟珞,饶文碧,邹承明.人工神经网络及其融合应用技术[M].北京:科学出版社,2007.
[16]陈祥光,裴旭东.人工神经网络技术及应用[M].北京:中国电力出版社,2003.
[17]GIEBEL G,BADGER J,MARTÍ PEREZ I.Short-term forecasting using advanced physical mod-elingthe results of the anems project results from mesoscale,microscale and CFD modelling[C]//European Wind Energy Conference&Exhibition,Athens,Greece,2006.
[18]FOCKEN U M,LANGE H P W.Previento—a wind power prediction system with an inno-vative upscalingalgorithm[C]//European Wind Energy Conference,2001.
[19]BERNHARDL,KURTR,BERNHARDE,etal.Wind power prediction in Germany—recent adva-nces and future challenges[C]//European Wind Energy Conference,Athens,2006.
[20]LI S.Wind Power Prediction Using Recurrent Multilayer Perceptron Neural Networks[C]//IEEE Power Engineering Society General Meeting,2003.
[21]BERNHARD L,KURT R.Wind power prediction in Germany-recent advances and future c-hallenges[C]//European Wind Energy Conference,Athens,2006.
[22]范高锋,王伟胜,刘纯,等.基于人工神经网络的风电功率预测[J].中国电机工程学报,2008,28(34)∶118-123.
[23]杜颖,卢继平,李青,等.基于最小二乘支持向量机的风电场短期风速预测[J].电网技术,2008,32(15)∶62-66.
[24]潘迪夫,刘辉,李燕飞.基于时间序列分析和卡尔曼滤波算法的风电场风速预测优化模型[J].电网技术,2008,32(7)∶82-86.
[25]董朕,殷豪,孟安波.基于混合算法优化神经网络的风电预测模型[J].广东电力,2017,30(2)∶29-33.
[26]LANDBERG L,GIEBEL G,NIELSEN H AA,et al.Shortterm Prediction-An overview[J].Wind Energy,2003,6(3)∶273-280.