基于模糊聚类和支持向量机的短期光伏功率预测
2016-12-23于秋玲许长清刘晓鸥
于秋玲,许长清,李 珊,刘 洪,宋 毅,刘晓鸥
(1.国家电网河南省电力公司经济技术研究院,郑州 450052;2.天津大学电气与自动化工程学院,天津 300072;3.国家电网北京经济技术研究院,北京 102209)
基于模糊聚类和支持向量机的短期光伏功率预测
于秋玲1,许长清1,李 珊1,刘 洪2,宋 毅3,刘晓鸥2
(1.国家电网河南省电力公司经济技术研究院,郑州 450052;2.天津大学电气与自动化工程学院,天津 300072;3.国家电网北京经济技术研究院,北京 102209)
本文提出了一种基于模糊聚类和支持向量机的光伏短期功率预测方法。通过气象信息建立模糊相似矩阵将光伏发电功率历史样本划分为若干类,然后通过分类识别获得与预测日最相似的一类历史日样本集,将其与预测日的气象因素作为预测模型的输入样本建立支持向量机光伏发电功率预测模型,并利用余一法对构建的支持向量机模型进行核参数和惩罚参数的优化。根据实际数据对所提模型进行验证,计算分析了预测误差,结果表明该方法具有较高的预测精度,对光伏发电预测具有一定的参考价值。
气象信息;模糊聚类;支持向量机;光伏功率;短期预测
光伏发电系统的输出功率受辐射强度、温度、湿度、云量和天气状况等多种因素影响,具有较强的随机性,预测难度非常大,尤其是短期功率预测[1]。目前,光伏发电功率预测总体归纳为两类:间接预测和直接预测[2-3]。间接预测首先需要获得地表的太阳辐照强度,然后根据光伏发电系统的输出功率模型计算光伏发电系统的输出功率[3-4]。相比于间接预测,直接预测则通过光伏发电功率和气象信息的历史数据直接预测其功率输出。
直接预测的方法包括多元线性回归法、神经网络法和支持向量机法SVM(support vector machine)等[5-7],其中基于神经网络的光伏发电预测的研究较为普遍。文献[8-9]首先分析了对光伏发电输出功率有影响的气象因素(太阳辐照强度、温度和云量等),然后利用神经网络构建了光伏发电功率预测模型,实现了未来一天的光伏发电输出功率预测,但神经网络算法容易陷入局部最小,使得光伏发电预测问题得不到最优解,且算法收敛速度较慢[10]。
文献[10]是基于SVM回归的光伏发电功率预测,将天气分为晴、阴和雨3种类型,将1天的9:00~18:00时间段分为10个点进行光伏发电功率预测。但同一天气类型下,太阳辐照强度、温度和湿度差异较大时,导致光伏发电功率数据差异也很大。因此将全部历史数据进行光伏发电功率预测,会使得结果精度不高。
本文为了降低历史数据选取误差和提高光伏发电输出功率预测精度,首先利用模糊聚类算法根据气象信息对光伏发电功率历史数据进行分类;然后采用预测日所属类别的历史数据及气象数据作为样本数据训练光伏发电预测模型,得到改进的SVM光伏发电预测方法;最后,采用实际数据对所提方法进行验证,结果表明与传统SVM的光伏功率预测模型[10]相比,本文模型具有更高的预测精度。
1 模糊聚类与历史数据分类
模糊聚类是根据客观事物间的不同特征、亲疏程度和相似性等关系,通过建立模糊相似关系对客观事物进行分类的数学方法[11-13]。
设集合X为n个待分类样本,即
每个样本均有m个指标描述其特性,即
因此,可得到原始数据矩阵为
根据气象信息,利用模糊聚类方法对光伏发电功率历史数据进行分类的具体步骤如下:
1)历史数据处理
由于描述样本的m个指标,其量纲和数量级各不相同,使用原始数据计算,会影响分类的效果。因此,首先采用均值化的方式对原始数据进行无量纲化处理,处理方法如公式(4)所示:
式中:i=1,2,…,n;j=1,2,…,m。
将所有输入数据无量纲化处理后,则输出数据(光伏发电功率预测值)y*也是无量纲化后的预测结果。因此,输出数据实际值y的计算公式(5)为
2)历史数据分类
根据比较待分类样本对象xi和xj之间关联度大小的方法[14],对光伏发电功率历史数据进行分类。
气象部门提供的天气信息,基本包括天气类型、温度、湿度和风力,太阳辐射强度可从美国国家航空和宇航局 NASA(National Aeronautics and Space Administration)获得。对光伏发电功率影响的气象因素分别是太阳辐射强度、温度、湿度和天气类型。因此,可以先根据天气类型筛选出部分数据。天气类型一般分为晴天、阴天和雨天,先根据这3种类型的天气选取出类型与预测日相似的历史日。用和5个变量分别表示待预测日的光照强度、最高温度、最低温度、平均温度和湿度。历史数据中某天的5个影响因素构成的向量是,则的光照强度因素关联系数如公式(6)所示:
式中:j=1,2,…,n,n是待分类历史数据的个数;ρ是分辨系数,一般取0.5。定义与的关联度为
从临近待预测日的光伏发电历史数据开始,逐一计算并比较与待预测日的关联度,取关联度γj较大的历史日数据作为待预测日的光伏发电功率预测模型的训练样本数据{xi,yi}。
2 光伏发电功率预测模型
2.1 最小二乘支持向量机原理
SVM是一种可训练的机器学习方法,具有较好的泛化功能[14]。根据选定的待预测日样本数据{xi,yi},其中i=1,2,…,n,n是样本总数;xi∈Rd是输入值,d是Rd空间的维数;yi∈R是输出值。用非线性映射φ(x)将样本从原空间映射到高维(k维,k>d)特征空间中,并构造如下估计函数:
式中:w是加权向量,w∈Rk;b是常数,b∈R。
根据结构化风险最小原则,优化目标如公式(9)所示:
其约束条件如公式(10)所示:
式中:c是惩罚系数,控制对超出误差样本的惩罚程度;ξi和是估计误差。
根据Mercer定理:任何半正定的函数都可以作为核函数。因此,定义如下核函数:
引入拉格朗日乘子αi(αi∈R),将不等式约束转化成等式约束,求解卡罗需-库恩-塔克KKT(Karush-Kuhn-Tucker)等式约束条件,如公式(12)所示:
上述线性方程可用最小二乘法求出αi(αi∈Rn)和b,则估计函数如公式(13)所示:
2.2 模型输入和输出数据准备
(1)以30 min为一个预测点,取与预测日关联度γj较大的历史日光伏发电功率、太阳辐射强度、最高温度、最低温度、平均温度和湿度作为模型的输入数据;
(2)待预测日每30 min的光伏发电功率作为模型的输出数据。
2.3 核函数的选取
采用高斯函数作为核函数进行预测,利用余一法进行核参数和惩罚参数的优化。
余一法是将n个样本中的n-1个样本作为训练数据,剩下一个样本作为预测数据。并且循环n次,使得每个样本都作为一次预测数据,计算交叉验证的均方误差。根据n次计算后得到的均方误差平均值估计期望泛化误差,选择一组最优的参数作为核参数和惩罚参数。
2.4 算法步骤
采用基于模糊分类和SVM的光伏发电功率预测的步骤如图1所示。
图1 光伏发电功率预测流程Fig.1 Flow chart of forecasting for PV power
3 算例验证
本节结合河南省某光伏发电系统于2015年10月发电数据和当地气象站同期数据,利用本文所提方法对2015年10月31日的光伏发电输出功率进行预测。
2015年10 月31日的气象信息如表1所示。首先,将待预测日(10月31日)之前的10月份历史日气象信息(辐射强度、最高温度、最低温度、平均温度、湿度和天气类型)进行无量纲化处理后形成聚类样本;然后,根据关联度从10月份历史数据中确定待预测日光伏输出功率预测模型的训练样本(从10月份中选出与10月31日最为相似的有4天,其关联度如表2所示),采用余一法对核函数参数和惩罚参数寻优,利用训练样本对光伏发电功率预测模型进行训练;最后,将样本日数据及预测日的气象数据输入,预测10月31日9:00~18:00间每30 min的光伏发电功率,并与实际值进行比较。
采用相对百分比误差e和平均相对百分比误差e′对预测值进行对比分析,则
式中:Pr是光伏发电输出功率实测值;Pe是光伏发电输出功率预测值;n是预测样本数目。
表3给出了10月31日9:00~18:00间每30 min的预测结果,并且与传统SVM光伏发电功率预测值进行比较。其中,本文改进的SVM进行光伏发电输出功率预测的平均误差为7.36%;传统的SVM[10]进行光伏发电输出功率预测的平均误差为9.78%。
表1 气象信息Tab.1 Meteorological information
通过表3可知,本文所提出的基于模糊聚类和SVM的光伏发电功率预测模型比传统的SVM[10]光伏发电功率预测模型具有更高的预测精度,预测精度能够提高1%~3%。
表2 关联度计算结果Tab.2 Calculation results of correlation degree
表3 预测结果Tab.3 Forecasting results
4 结语
本文采用模糊聚类和SVM进行光伏发电功率短期预测,比传统SVM模型具有更高的预测精度。本文提出的基于关联度的光伏发电预测样本数据的选取方法有助于在大量的历史数据中筛选出特征相似、适于进行预测的数据,对提高光伏发电预测精度具有很大的价值。
应用河南省某地区的光伏发电系统的功率数据进行光伏输出功率预测模型的计算分析,预测结果显示该预测方法能够得到较准确的光伏发电功率预测值。
[1]陈亚博,盛戈皞,黎建,等(Chen Yabo,Sheng Gehao,Li Jian,et al).含光伏和风电的电力系统随机生产模拟(Probabilistic production simulation of power system with photovoltaic power and wind power)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2015,27(5):1-6.
[2]杨晓萍,王宝,兰航,等(Yang Xiaoping,Wang Bao,Lan Hang,et al).风电场短期功率预测(Short-term wind farm power prediction)[J].电力系统及其自动化学报(Proceedings of the CSU-EPSA),2015,27(9):85-90.
[3]杨金焕,于化丛,葛亮.太阳能光伏发电应用技术[M].北京:电子工业出版社,2009.
[4]杨超,榑沼弘贵(Yang Chao,Kurenuma Hiroki).太阳能光伏发电系统发电量的预测方法(Estimation methods of generating electric energy by PV power system)[J].智能建筑电气技术(Electrical Technology of Intelligent Buildings),2011,5(2):29-34.
[5]李光明,廖华,李景天,等(Li Guangming,Liao Hua,Li Jingtian,et al).并网光伏发电系统发电量预测方法的探讨(Discussion on the method of grid-connected PV power system generation forecasting)[J].云南师范大学学报(Journal of Yunnan Normal University),2011,31(2):33-38,64.
[6]丁明,徐宁舟(Ding Ming,Xu Ningzhou).基于马尔可夫链的光伏发电系统输出功率短期预测方法(A method to forecast short-term output power of photovoltaic generation system based on Markov chain)[J].电网技术(Power System Technology),2011,35(1):152-157.
[7]张艳霞,赵杰(Zhang Yanxia,Zhao Jie).基于反馈型神经网络的光伏系统发电功率预测(Application of recurrent neural networks to generated power forecasting for photovoltaic system)[J].电力系统保护与控制(Power System Protection and Control),2011,39(15):96-101,109.
[8]朱永强,田军(Zhu Yongqiang,Tian Jun).最小二乘支持向量机在光伏功率预测中的应用(Application of least square support vector machine in photovoltaic power forecasting)[J].电网技术(Power System Technology),2011,35(7):54-59.
[9]Almonacid F,Rus C,Perez P J,et al.Estimation of the energy of a PV generator using artificial neural network[J].Renewable Energy,2009,34(12):2743-2750.
[10]黎灿兵,李晓辉,赵瑞,等(Li Canbing,Li Xiaohui,Zhao Rui,et al).电力短期负荷预测相似日选取算法(A novel algorithm of selecting similar days for short-term power load forecasting)[J].电力系统自动化(Automation of Electric Power Systems),2008,32(9):69-73.
[11]陈昌松,段善旭,殷进军(Chen Changsong,Duan Shanxu,Yin Jinjun).基于神经网络的光伏阵列发电预测模型的设计(Design of photovoltaic array power forecasting model based on neutral network)[J].电工技术学报(Transactions of China Electrotechnical Society),2009,24(9):153-158.
[12]杨秀媛,董征,唐宝,等(Yang Xiuyuan,Dong Zheng,Tang Bao,et al).基于模糊聚类分析的无功电压控制分区(Power network partitioning based on fuzzy clustering analysis)[J].中国电机工程学报(Proceedings of the CSEE),2006,26(22):6-10.
[13]刘耀年,伏祥运,张文生,等(Liu Yaonian,Fu Xiangyun,Zhang Wensheng,et al).基于模糊识别与模糊聚类理论的短期负荷预测(Short-term load forecasting method based on fuzzy pattern recognition and fuzzy cluster theory)[J].电工技术学报(Transactions of China Electrotechnical Society),2002,17(5):83-86,95.
[14]邓乃扬,田英杰.支持向量机:理论、算法与拓展[M].北京:科学出版社,2009.
Application of Fuzzy Clustering Algorithm and Support Vector Machine to Short-term Forecasting of PV Power
YU Qiuling1,XU Changqing1,LI Shan1,LIU Hong2,SONG Yi3,LIU Xiaoou2
(1.Economic Research Institute,State Grid Henan Power Company,Zhengzhou 450052,China;2.School of Electrical Engineering and Automation,Tianjin University,Tianjin 300072,China;3.State Power Economic Research Institute,Beijing 102209,China)
A short-term forecasting method for photovoltaic(PV)power is proposed based on fuzzy clustering algorithm and support vector machine(SVM).Based on the meteorological information,fuzzy similarity matrix is established to divide the PV power generation history into several classes.The most similar history data to the forecasting day obtained by pattern recognition and the meteorological factors on the forecasting day are used as input to establish an SVM forecasting model of PV power,which uses leave-one-out algorithm to optimize the Kernel parameter and penalty parameter.The model is validated by PV system data from a real project,and the forecasting error is calculated and analyzed.The results show that the proposed method has high accuracy,which can provide reference for the forecasting of PV power.
meteorological information;fuzzy clustering;support vector machine(SVM);photovoltaic(PV)power;short-term forecasting
TM715
A
1003-8930(2016)12-0115-04
10.3969/j.issn.1003-8930.2016.12.019
于秋玲(1979—),女,硕士,高级工程师,研究方向为电网调度控制、配电自动化、大数据分析。Email:79237114@qq.com
许长清(1975—),男,本科,高级工程师,研究方向为电网智能化、能源互联网、大数据分析。Email:zzplus@126.com
李 珊(1984—),女,硕士,高级工程师,研究方向为配电自动化、物联网、全面量测技术。Email:101678110@qq.com
2016-04-18;
2016-06-03