APP下载

基于深度学习的水电站水流量和发电量预测技术

2020-05-14

电力设备管理 2020年4期
关键词:水流量发电量水电站

引 言

我国水力发电站数量众多,基本上属于无调节能力的径流式水电站,这种水电站具有明显的特殊性[1],而河川径流是由降雨形成,降雨又受到地理、气候等不确定因素的影响,因此对水力发电站的水流量以及发电量进行预测很有必要。水电站的主要运行经济指标是电量,其中水流量的多少将直接影响水电站的蓄水、弃水以及发电量。因此准确预测出发电站的出水量的多少,将会对发电站的经济指标产生很大影响,准确的水位预测是水电站安全运行和增发效益的关键。但受诸多因素的影响,水量预测常与实际情况发生较大偏差,导致发电计划频繁修改,不利于水电站安全、高效、稳定地运行。

大量学者针对水电站的水流量预测和发展预测提出了诸多方法。最早采取的是比较直观也最为简单的回归分析[2],后来随着信息技术的发展,为了追求更精准的预测,有学者相继提出了时间序列法、频谱分析法以及随机微分方程[3]。近年来灰色系统理论、神经网络理论等在水流量预测中都得到了应用[4]。本文对华能旗下三个分别位于上、中、下游的水牛家、自一里、木座发电站收集了相关历史时间序列数据,在对数据进行一定预处理之后,采取了三个预测模型分别对其水流量和发电量进行预测,并对其预测结果进行比较,从而确定最优预测模型。

1 水电站数据预测分析模型

1.1 数据介绍及描述分析

本文选取了水电站数据中的水牛家(装机容量70MW)、自一里(装机容量130MW)、木座(装机容量100MW)三个水电站进行属性分析,通过建立时间序列预测模型,预测这三个水电站的发电量和来水量。通过对水电站的历史数据进行分析之后发现,三个水电站的发电量和水流量数据缺失率低,仅自一里水电站的发电量参数有一个缺失值。其中E_AMOUNT为每天的发电量,W_AMOUNT为每天的水流量,选择完整数据集2008~2018年,并且对2018年进行预测,2008~2017年数据为训练集。对收集到的数据进行描述性统计(表1)。

表1 水电站数据描述性统计

1.2 时间序列处理

时间序列指的是按照时间顺序的一组数列,时间序列分析(Time-Series Analysis)是指将原来的数据分解为四部分来看——趋势、周期、时期和不稳定因素,然后综合这些因素提出预测[5]。对收集到的水电站的时间序列数据进行处理以便后续的模型分析(图1、2)。

图1 E_AMOUNT 原始时间序列图

图2 W_AMOUNT 原始时间序列图

从原始的时间序列来看,三个水电站数据的时间跨度有重合的。通过对数据样本进行统计,发现完整年数据总共10年(2008~2018年),训练数据选择2008~2017年9年的数据,同过机器学习算法进行预测建模,选择最后一年2018年数据进行预测模型测试。另外,从序列图中可以发现W_AMOUNT参数存在较多的异常值。在对数据的时间序列进行分析预测的时候,数据相对越平稳越好,剔除掉异常值就是减少特殊状况对数据的影响,从而使得最终预测结果越准确。异常值采取先删除,后插补的方式进行处理。

2 时间序列数据预测建模

本主要数据预处理和预测建模流程如图3,后续模型的预测选择了三个水电站从2008~2018年的完整数据集,并且取2008~2017年为训练集、2018为预测集进行模型的检验,其中作为训练集的三个水电站各3653条数据,合计共10959条数据。

坚持模型(persistent model)基本思路是把时间序列前一时刻的值作为当前时刻的预测值,坚持型模型作为最简单的预测模型可以作为基准线,与其他预测算法比较准确率,从而证明其他算法存在的必要性。运用坚持模型对水量和发电量的预测如图4、5所示,文中仅以自一里水电站为例。

图3 数据预测流程图

图4 自一里电量持续模型时间序列预测图

图5 自一里水流量持续模型时间序列预测图

长短时记忆网络模型。LSTM(Long Short Term Memory Network)长短期记忆网络是一种特殊的循环神经网络(RNN),解决长时间序列训练过程中的梯度消失和梯度爆炸问题,在时间序列预测问题上面有广泛的应用[6]。所有的RNN 都具有一种重复神经网络模块的链式形式。在标准RNN 中这个重复的结构模块只有一个非常简单的结构,例如一个tanh 层。LSTM 同样是这样的结构,但是重复的模块拥有一个不同的结构。不同于单一神经网络层,LSTM 有四个,以一种非常特殊的方式进行交互。从表2结果来看E_AMOUNT的预测误差较大,W_AMOUNT 预测误差较小。

极限学习机(Extreme Learning Machine,ELM)或超限学习机是一类基于前馈神经网络(Feedforward Neuron Network,FNN)构建的机器学习系统或方法,适用于监督学习和非监督学习问题[7]。极限学习机是一种单隐层前馈神经网络,随机确定输入权重和偏差,然后分析计算输出权重。ELM的关键思想是将难以求解的非线性优化问题,如输入权重、隐层偏差、输出权重的最优化问题转化为求解最优输出权重以简化运算。而这意味着只要权重的

表2 LSTM模型误差统计表

表3 ELM模型误差分析表

图6 X270电量ELM时间序列预测图

图7 X270水量ELM时间序列预测图

标准足够小,用户就不必考虑所有的输入和隐藏层权重,只需要关注输出权重即可。这个想法和传统的迭代学习方法(如梯度下降学习算法)是完全不同的。

3 结语

我国水电站的数量众多,因此对水电站的流水量和发电量进行预测,保证电力系统的稳定运行至关重要。本文通过对水电站收集相关历史时间序列数据,对数据进行一定预处理之后采用三种不同数据分析模型对其发电量和水流量进行预测,三种算法各有其优势所在。运用数据分析模型可以提高对水电站的预测,对水电能源的充分利用和对水电站的经济运行以及设备检修维护具有重要意义,该研究方法还可以用于电力系统短期负荷预报具有广阔的应用前景及实用价值。

猜你喜欢

水流量发电量水电站
枯水期前婆桥村生态沟渠水体的污染指标削减状况研究
4月份全国发电量同比增长11% 火电同比增长12.5%
青海成为中国首个以新能源为主要电源的省份
白鹤滩水电站有多“牛”?
水电站水轮机制造新工艺的探析
EGR冷却器液侧沸腾特性及流量参数优化研究
基于重力方向影响的低压涡轮叶片水流量测量数值计算
磁化水玄武岩纤维钢渣粉混凝土早期强度分析
俄最大水电站发生事故