光伏电站功率预测影响因素分析及准确率提升方法研究
2020-06-04胡雪凯胡文平
胡雪凯,时 珉,胡文平,尹 瑞,张 乾,常 杰
(1.国网河北省电力有限公司电力科学研究院,石家庄 050021;2.国网河北省电力有限公司,石家庄 050021;3.国网河北省电力有限公司检修分公司,石家庄 050070)
0 引言
随着光伏发电技术的不断发展,在电力需求中所占比例也越来越大,致使光伏发电对电网的影响越来越明显。光伏发电本身所特有的间歇性和不确定性,增加了电网计划和调度的难度[1-2]。为了解决其发电量不稳定的问题,必须加大系统的旋转备用容量。旋转备用容量的增加间接地增加了光伏发电的运营整体成本,所以有必要对其输出功率进行预测。
通过对光伏电站发电量进行短期和中期的准确预测,将其从未知变为基本已知,调度运行人员可根据预测的波动情况,合理安排应对措施,提高电网的安全性和可靠性;而将功率预测与负荷预测相结合,还有利于调度运行人员调整和优化常规电源的发电计划,改善电网调峰能力,增加光伏的并网容量[3-6];根据预测结果,只需增加对应预测误差的旋转备用容量,可以显著降低额外增加的旋转备用容量,对改善电网运行经济性具有重要意义;光伏功率预测还可以增强风电、光伏在电力市场中的竞争力,提高上网电价。另外,功率预测有助于合理安排检修计划、减少弃风弃光,提高企业的盈利能力[7-9]。
为保障电力系统安全稳定运行,落实国家可再生能源政策,规范光伏发电并网调度运行管理,华北能源监管局制定了《华北区域光伏发电站并网运行管理实施细则》。NB/T 32031-2016《光伏发电功率预测系统功能规范》要求,短期光伏功率预测应能预测次日零时起至未来72 h的输出功率,时间分辨率为15 min;超短期功率预测应能预测未来15 min~4 h的输出功率,时间分辨率不小于15 min。误差评估指标为短期预测月均方根误差应小于0.15,超短期预测第4 h预测值月均方根误差小于0.10。
1 光伏电站功率预测方法分类
光伏发电的主要预测方法如图1所示。
图1 光伏发电功率预测方法
1.1 按照时间尺度分类
根据提前预测时间长短,分为超短期预测、短期预测和中长期预测。
超短期光伏功率预测可采用物理方法和统计预测方法。其中物理方法主要是对云图进行图像处理,结合数值天气预报(N WP)[10-14]或地面观测站数据,进行光伏功率预测;统计预测方法主要采用自回归滑动平均(ARMA)算法、人工智能算法、持续预测法等进行预测。
相比之下,短期功率预测需要气象数据的时空分辨率要求相对较低,可利用精细化的N WP数据进行预测而不必采用云图数据[15]。
中长期光伏功率预测主要是根据地区历史光资源数据等估计未来较长时间段内的光伏功率。
1.2 按照预测模型分类
将预测方法按对于历史数据的需求量划分,可分为物理模型法、统计方法、学习法。
物理模型法不需要大量历史数据,适用于新建的光伏电站,但需要光伏电站详细的地理信息和组件参数等数据,建模过程复杂,且难以模拟一些极端异常天气情况和环境及光伏组件参数随时间发生的缓慢变化,模型抗干扰能力较差,鲁棒性不强。
统计方法基于预测模型输入、输出因素之间的统计规律,通过分析获得预测模型。利用光伏发电的历史数据与相关因素数据进行统计分析。常用的统计预测方法有自回归移动平均算法(ARMA)、自回归积分移动平均算法(ARI MA)、多元线性回归法、指数平滑算法等。
学习方法主要包括模糊推理系统、遗传算法、人工神经网络和支持向量机(SV M)等。其中人工神经网络具有大规模数据处理、自适应学习、容错性强等特点。网络主要包括三层:输入层、隐含层与输出层。ANN适用于解决一些随机非线性的问题,误差较小,且可以随时更换样本数据,不断注入新的测试数据,提高预测精度。但容易陷入局部最小问题,得不到最优解,且泛化能力不强。以上缺点对预测的精度都有一定的影响。
2 光伏功率预测系统的整体框架
光伏功率预测系统是一个集气象站实时气象信息、数值气象预报数据和实时功率数据接入和展示、光伏电站和区域功率预测、数据上报、预测结果动态统计评估为一体的光伏功率预测系统平台。系统须实现自动采集光伏电站运行数据、自动气象站监测数据,对所采集数据信息进行分析与挖掘,准确判定发电效率的影响因子及其变化规律,实现光伏发电站有功功率超短期、短期、长期的高精度预测,实现误差统计、相关性分析等功能,为运行人员提供可靠参考。光伏电站功率预测系统硬件拓扑结构如图2所示[15]。
光伏电站的各运行数据、气象站实测数据、从数值天气预报中心得到气象数据结合通过通信交换机交给含数据处理和预测功能的预测工作站做计算,将预测结果上传至各直属调度数据网和光伏电站监控系统。
图2 光伏电站功率预测系统硬件拓扑结构
光伏预测系统除需在场站区域配置自动气象监测站外,还需要部署专用的应用服务器、数据库服务器、预测工作站和外网工作站,实现光伏电场各光伏组件运行数据、自动气象站实测数据接入、N WP数据解析、光伏出力预测结果计算功能,并将预测结果上传至各直属调度机构。此外为了保障系统和电网安全,还需配置相应的防火墙和硬件隔离设备。
表1描述了光伏电站功率预测系统各部分作用分析。
表1 光伏电站功率预测系统各部分作用
光伏电站功率预测系统设计为模块化设计,可方便按照用户的需求去增减某些功能,系统必须灵活性和可扩展性。系统主要模块包括气象数据采集模块、功率数据采集模块、数值天气预报采集模块、数据通信模块、功率预测模块、统计分析模块、人机交互模块等。
数据采集模块主要包括电站运行数据、气象站数据、数值天气预报数据、发电单元运行数据、数值天气预报校验设置和气象站数据校验设置等。
数据通信模块主要包括数据传递、专网上传、信息流通等功能。
功率预测模块主要包括预测设置、手动预测、日功率曲线图、停机设置、预测结果查看、预测日志查看等。
统计分析模块主要用来统计实际功率与预测功率的误差情况,并计算考核电量,误差统计指标包括均方根误差、平均绝对误差、相关性系数、合格率、考核电量。
人机交互模块主要包括系统的人机界面,系统扩展性和便利性。
3 影响光伏功率预测准确率的因素
光伏功率预测是以数值天气预报数据和实测运行数据为基础,结合光伏电站地理坐标及具体地域特点的参数化方案,建立预测模型及算法,实现对未来一段时间内光伏电站输出功率的预测。光伏功率预测的关键在于确定不同时空尺度下影响光伏功率的主要因素及其作用机理,并选择恰当的算法建立预测模型。
3.1 气象环境影响因素
影响光伏发电功率预测性能的主要环境因素是太阳辐射和环境温度、电池温度。实际上,清洁度指数和日照时间是通过改变达到光伏面板的太阳辐射量来影响光伏系统输出功率。在光伏发电功率预测中,晴空指数和日照时间也常常作为影响因素之一。
灰尘覆盖光伏面板,将减少光伏面板吸收太阳辐射的比例,最终降低光伏面板的输出功率。不同于辐射、云、温度、风速等因素,灰尘对光伏功率输出的影响是一个长期且平稳的过程,因为灰尘的沉降、积累和自然清除是一个持续且稳定的过程。灰尘对光伏面板性能的影响具有缓慢性和渐进性,不能反映在超短期或短期预测当中,但可以根据其影响特性进行补偿。
风速和云也明显地影响光伏系统的功率输出,但是很少被考虑到,因为它们的属性变化很大且很快,在几分钟内甚至几秒钟内使光伏发电输出具有很陡的斜坡,这超出了大多数人工智能方法处理庞大数据量的响应时间。而在数小时、数天或数周时间水平的短期或中期预测中,这种急剧的变化可以被视为异常而忽视。但是在超短期预测中,影响预测精度的最重要因素是云。云只有很小甚至没有惯性,所以云变幻莫测,它的形状、大小、速度和方向都在改变。云的变化会立即改变光伏面板接收到的太阳辐射量,并迅速引起光伏系统输出功率的变化。有研究人员采用天空成像仪和太阳跟踪摄像头探测和跟踪影响光伏发电输出功率的云朵变化,但其算法的时间分辨率还不能达到预期的精度。
3.2 数据影响因素
传统的物理预测方法根据太阳能辐射模型、电站模型、光伏转换模型、电路模型和逆变器模型来预测输出功率。但受辐射的不确定性、云的变化、雨水和环境、电池温度等因素的影响,会导致短期预测不够准确。
基于统计和人工智能技术的输出功率预测方法可以综合考虑并补偿上述各种因素的影响。不过,这些方法需要充分的历史数据支持,以供给统计处理和人工神经网络的训练。通常,至少需要光伏系统输出功率一年连续且完整的数据进行统计回归。神经网络相关的算法不仅需要光伏发电系统输出功率的历史数据,且与气象和数值天气预报的历史数据紧密相关。历史数据的缺少会使相关的统计数据和人工智能预测方法无效。同时,不完整的历史数据可能导致很大的预测误差。
除历史数据外,数值天气预报,如云、风、温度、湿度和降雨等实时数据,也有助于在线训练和调整内部参数以获得更高的预测精度。
除历史数据的完整性,数据本身也值得关注。数据的采样间隔、准确性、收集、预处理、数值天气预报的选择和本地传感器指标特性等都从不同方面决定着数据本身的特性,也将很大程度上影响预测的准确性。有研究表明,更准确的天气预报可以将光伏发电功率预测精度提高10%左右。
3.3 光伏厂区影响因素
3.3.1 厂区逆变器等送电设备
如果逆变器出现频率异常、温度过高等原因使其自动脱网关机,导致部分组件发电不能并网,即电站的投运总容量减少,影响到光功率预测系统的电站开机容量参数与实际不相符,势必影响预测的准确率。
同样,如果有汇流箱、直流配电柜、箱式变压器、开关柜等设备停运,或电缆头爆掉等原因导致一部分组件发电不能并网,最终都会影响预测的准确率。
3.3.2 厂区通信管理机
厂区通信管理机主要负责转换通信网络,如果通信管理机出现损坏、死机、工作不稳定或者收发信息能力较弱,会导致电站综合自动化系统采集逆变器实际出力数据不准确、不及时,影响光功率预测中的出力曲线与实际不相符,预测准确率是依次计算,进而影响准确率这个值的准确性。
3.3.3 厂区通信网络
厂区通信网络分为两部分:一部分是厂区通信管理机之间、厂区通信管理机与中控室通信机之间的通信,通过光纤串联成一个环网;另一部分是厂区通信管理机和需要通信发电设备之间的通信,基于成本考虑大多采用RS485来组成网络。
对于第一部分,只要光电转换设备不掉电、未损坏,光纤通信网络则较稳定;而第二部分RS485通信,虽然采用的是带铠装屏蔽层的线缆,但是由于其技术及协议的局限,其具有通信距离短、通信容易被干扰、通信量小等缺点。
对于RS485通信网络,设计时可能通信线路长度是合格的,但在施工时有可能为了预留电缆头、布线线路调整、线路埋地深度等影响使得通信比设计变长而不合格,或者施工时使得通信线路和电力线路、电力设备之间的距离过小,再或者线缆的屏蔽层没有有效接地,等其他原因造成通信网络被干扰,通信不顺畅,导致逆变器采集出力值不准确,影响准确率。
3.4 中控室内影响因素
3.4.1 硬件设备
光功率预测系统构成见图3,包括的硬件设备有:天气预报数据采集服务器、光功率预测系统服务器、反向隔离装置、硬件防火墙、路由器、交换机等设备。这些设备能否正常运行是关系功率预测系统正常工作的前提。
图3 光功率预测系统构成
比如天气预报数据采集服务器影响天气预报数据的下载、处理并通过反向隔离装置发送到光功率预测系统服务器上,硬件防火墙、路由器、交换机都是光功率预测系统中数据传输的必经设备,影响传输数据的效率及成功率。
3.4.2 软件系统
光功率预测系统中的软件包括:运行在天气预报数据采集服务器和光功率预测系统服务器上的操作系统,固嵌于反向隔离装置、硬件防火墙、路由器、交换机等的嵌入式程序,运行在操作系统上的光功率预测软件、反向隔离装置文件收发软件、预测文件上传调度的传输软件、数据库软件、环境采集仪软件等。
这些软件不能有自动脱网、自动退出程序、自动重新启动等bug,否则都会影响功率预测。
3.4.3 环境采集仪
环境采集仪一般安装在中控室屋顶,主要检测电站当前环境下的关照强度、气温、湿度、风速、风向等数据,用于超短期的光功率预测。采集数据的准确度、分辨率,以及数据及时传输到光功率预测系统服务器上,都直接影响到超短期的光功率预测。
4 光伏功率预测准确率的提升方法
提高预测准确率是光伏功率预测的核心问题,目前研究主要聚焦在通过数据预处理提升输入数据品质以及深度挖掘数据特性提高模型精确性两方面,前者如坏数据剔除、缺失数据重构、数据归一化和去趋势化等;后者如数据样本筛选和输入数据优选。另外,针对光伏发电功率预测的实际需求,以常用的预测目标参数为考察指标,制定综合的评估评价标准体系,也能有效督促光伏电站提高其预测的准确率。
4.1 光伏数据预处理
光伏数据质量参差不齐,通信、测量环节的问题都可能导致坏数据产生及数据缺失;不同类别的数据具有不同的量纲和数值范围,因此,对光伏数据进行预处理操作是高精度预测的必要环节。应加强数据的完整性和有效性设计,注重数据采集、处理和存储积累各环节的设计,从数据来源、数据类型、数据精度、数据密度、时间分布、数据关联性等方面保证数据的完整性和有效性,保证预测的准确性和可重复性。
4.1.1 坏数据剔除
通常依据物理规律或数据采集质量控制要求剔除坏数据。但由于光伏数据本身具有较大的分散性,对坏数据的定义是一个难点,定义不准确会导致误判。
4.1.2 缺失数据处理
当要求数据具有连续性或者数据样本较小时,剔除缺失数据段会给预测精度带来较大影响,因而重构缺失数据很有必要。
插值法是最简单的数据重构方法之一,如采用插值法提高NWP数据的时空分辨率。但由于光伏数据的波动性和随机性显著,插值法可能无法较好地还原数据序列。采用已知数据建立特征空间,利用SVM分类模型实现历史缺失数据的恢复。
辐照度和气象因素都具有较强的空间连续性和相似性,由此产生了基于空间相关性的数据还原技术。采用空间相关性理论,利用目标光伏电站周边光伏电站的数据和主成分分析法,实现对目标光伏电站辐照度或功率缺失数据的重构。这种方法不仅能还原数据序列,而且可用于光伏功率预测。
4.1.3 数据归一化和去趋势化
对光伏数据实行归一化操作是为了避免不同数据的量纲和大小范围导致的预测结果不准确问题。
光伏数据序列具有较明显的季节、时间变化趋势,而统计方法如ARMA等不能适应具有趋势的数据,需要对光伏数据进行去趋势化操作。去趋势化常通过将辐照度数据标准化或转化为晴空指数进行。
4.2 数据样本分类筛选和输入数据选择
光伏数据样本筛选的研究主要包括光伏数据分类/聚类和预测模型输入参数选择。分类/聚类方法研究是当前研究热点,常采用“相似日”的概念。光资源特性和光伏发电特性的研究是实现光伏数据样本筛选的基础,可以用相关性分析和多元回归方法进行特性分析。
4.2.1 样本分类筛选
所谓样本分类筛选,即通过分类或聚类的方法寻找相似样本,用于预测模型的训练,不仅可以防止小容量样本的规律性被遮盖,还可使预测模型对目标样本更有针对性。
分类筛选研究可分为以下两类。
a.将光伏数据按不同的天气类型划分。划分依据通常是季节与天气类型,也可用辐照度和云量作为指标,将光伏样本划分为如晴天、阴天、雨天等。此类划分指标选取简单、实现方便,但划分结果粗糙,不能给出精确的物理、数学解释。
b.选择特征指标构造特征空间,并通过K means聚类、自组织神经网络(SOM),以及SV M和CART等方法实现样本的分类/聚类。选择区分度显著的特征指标和有效的分类/聚类方法是这类研究的重点。特征指标的获取方式有:①直接从N WP中获取,如温度、云量等;②提取直接可得参数序列的某个统计指标作为特征指标,如晴空指数、辐照度三阶导数最大值、辐照度方差、辐照度与理论值偏差值等;③变换直接可得参数,形成特征指标,如采用主成分分析法将现有的相互相关的参数转换成互不相关的主成分。
4.2.2 输入数据选择
输入数据选择是通过物理分析和数学方法,选择目标预测条件下的主导因素。
在不同预测时空尺度、天气模态下,对地面辐照度和光伏功率产生主要影响的因素不同,直接辐照度、总辐照度、散射辐照度的主要影响因素也不同,如在长预测时间尺度上气象要素的重要性比短预测尺度小;对地面直接辐照度影响最明显的因素是云层覆盖率、气溶胶光学厚度、对流层大气成分和平流层大气,而对地面总辐照度影响最明显的因素是降雨量和太阳天顶角。随着气象研究的发展和测量技术的升级,还出现了一些与地面辐照度和光伏功率相关的新参量,如液态水深、空气质量系数、气溶胶光学厚度等。
输入数据选择的方法有多元线性回归法、主成分分析法、相关系数计算法、灵敏度分析法、伽马测试(GT)和遗传算法(GA)等。
4.3 建立评估评价标准
如果没有长时间应用测试数据或在相同条件下对比实验、应用验证,仅通过算法、仿真结果或孤立的实验结果来评价光伏发电功率预测方法是不严谨的。在这个领域至今还没有统一的预测方法评价标准。随着光伏系统的大面积推广,光伏发电系统的部署、设计和应用需要光伏发电功率预测标准。此外,功率预测标准将为电网接纳光伏系统提供决策依据。
综合考虑各方面的因素,应在光伏发电功率预测的评价标准中明确以下信息:
a.光伏电站相关数据,包括:①电站信息:经度、纬度、海拔高度、气候类型等:②电力系统信息和模型:光伏面板、逆变器、存储系统、传感器等。
b.历史数据,包括数据源、数据类型、数据采样间隔、数据精度、数据的完整性及合理性。
c.误差指标,包括几种常用的误差计算方法,如:均方根误差、平均绝对误差百分比、平均相对误差、最大平均误差和相关系数等。
d.时间尺度和时间分辨率,预测时间尺度可以是小时、天、周或月,时间分辨率可以是秒、分钟或小时。
e.算法复杂度,即在预测方法中所使用的计算方法和计算资源的成本。
f.时间复杂度,预测方法的时间成本。
g.经济性,预测方法及其实施的经济性分析。
5 结论及建议
从光伏功率预测方法的分类及其预测系统整体框架出发,分析了影响光伏功率预测准确率的主要因素,包括数据因素、环境因素、光伏厂区、中控室软硬件设备等,并从光伏数据预处理及数据样本分类筛选两个方面介绍了提升准确率的途径。
为进一步提升光伏功率预测的准确率,切实贯彻落实《华北区域光伏发电站并网运行管理实施细则》,对各光伏电站的执行落实情况做好监督,对预测准确率不达标的场站加强考核。技术上,考虑从以下几个方面着手。
a.多种预测方法相结合。组合预测方法分为两类,一种是将几种预测方法所得的结果进行比较,选取误差最小的模型进行预测;另外一种是将几种结果按一定的权重进行加权平均。
b.拓展功率预测评估指标,除均方根误差指标外,引入日极大误差、日峰谷误差等指标,对各光伏电站进行综合评估。
c.在经济成本可以接受的范围内,尽量增加场站的气象测量装置,为预测模型提供更加准确的气象输入信息。
d.通过数据预处理技术,剔除坏数据、还原残缺数据集,增强数据的完整性、有效性。