基于机器学习的葛洲坝水电站日均出力预测

2022-05-22刘亚新徐杨

人民长江 2022年4期

刘亚新徐杨

摘要：考虑三峡水库与葛洲坝水电站的紧密水力联系以及三峡水库出库流量与葛洲坝水电站入库流量的不平衡现象，提出了基于极端梯度提升（eXtreme Gradient Boosting，XGBoost）和自回归差分移动平均模型（Autoregressive Integrated Moving Average model，ARIMA）这两种机器学习的葛洲坝水电站入库流量预测模型，以及基于贝叶斯岭回归的葛洲坝水电站日均出力预测模型，并将两种模型相结合进行葛洲坝水电站入库流量与日均出力预测。通过对2019年非弃水期的实验分析，结果表明：葛洲坝水电站入库流量预测模型优于传统的折算系数三日均值法，可降低流量预报误差;葛洲坝水电站日均出力预测模型具备较高的预测精度和较强的稳健性，可为葛洲坝水电站非弃水期日均出力计划编制提供参考。

关键词：入库流量; 日均出力; 机器学习; 贝叶斯岭回归; 葛洲坝水电站; 三峡水库

中图法分类号： TV737

文献标志码： A

DOI：10.16232/j.cnki.1001-4179.2022.04.032

0 引言

葛洲坝水利枢纽位于三峡水利枢纽下游约38 km处，是三峡水利枢纽的航运反调节枢纽，其主要任务是对三峡水利枢纽日调节下泄的非恒定流[1]过程进行反调节，在保证航运安全和通畅的条件下充分发挥发电效益[2-3]。葛洲坝水电站属于径流式无调节能力电站，调节库容小，调度精度要求高，影响电站运行的因素众多且复杂，一直是梯级枢纽运行调度的难点。

在实际调度中，葛洲坝水电站非弃水期占全年运行期的70%以上，且上游水位控制出现偏差时，弃水期可通过开启泄洪闸弃水来调整水位，非弃水期仅可通过向电网申请修改发电计划来控制水位。因此，非弃水期葛洲坝水电站的精准控制，对保障电站安全稳定运行、提升电站效益具有十分重要的意义。

葛洲坝水电站日发电计划是依照三峡水电站制作的日计划运行后的出库流量过程而制作的。葛洲坝水电站日入库流量预测是出力预测的基础，在不考虑区间入流和降雨的情况下，葛洲坝水电站的入库流量应等于三峡水库的出库流量，但实际上，两者流量并不平衡。葛洲坝水电站入库流量误差经常导致日出力计划与实际调度情况出现较大的偏差，致使发电计划频繁修改，不利于电站安全、高效、稳定地运行。葛洲坝水电站日入库流量通常采用折算系数法计算，折算系数为葛洲坝水电站入库流量与三峡水库出库流量的比值。一般将前3 d折算系数的均值作为当日折算系数的估计值，也有学者采用多元门限回归模型探究此类问题[4]，但是需要将三峡水电站左岸发电流量、右岸发电流量、深孔泄流量、排漂孔泄流量等信息作为模型输入。三峡水库出库流量乘以折算系数求得葛洲坝水电站入库流量，再根据葛洲坝水电站库水位设定情况计算出库流量、尾水位、水头损失、净水头，由机组预想出力线、开机情况、机组过流曲线等求得电站出力。这其中运用到多种静态曲线，经过电站的多年运行，有些曲线与真实数据关系之间存在一定偏差，再加上调峰引起的两坝间及葛洲坝水电站下游水位变化更加复杂[5]，因此在实际计算出力时，通常由人工进行校正。

随着机器学习技术在各行业的推广应用，基于数据驱动的模型由于具有较高的精度以及不受复杂机理认知的影响而在电力行业得到了广泛关注。Shang等[6]首次采用BP神经网络建立葛洲坝水电站下游水位变化过程预测模型，结果较现有计算方法精度有显著提升。Zhang等[7]对比了基于人工神经网络、支持向量机和LSTM的3种水库调度模拟模型，分析表明LSTM模型模拟效果较优。何自立等[8]采用相空间重构小波神经网络预测径流式水电站发电量，为电量预测提供了新思路。李霄等[9]将最小二乘支持向量机用于短期风电负荷预测中，并提出改进最小二乘支持向量机和预测误差校正相结合的方法。雷昌宁[10]提出基于SARIMA和SVR混合模型的径流量预测模型，并应用于黑河的径流量预测中，达到了良好的预测效果。刘亚新等[11]提出基于LSTM的水电站短期水位预测方法，并用于葛洲坝水电站的下游水位预测。良好的数据驱动模型往往建立在对数据进行充分分析与探索的基础上，三峡与葛洲坝水电站经过多年的运行积累了大量的数据，这些数据蕴含着巨大的价值，利用好调度数据，挖掘出反映水库运行的隐含规律，可为葛洲坝水电站精益化运行提供技术支持。

本文采用机器学习方法对非弃水期葛洲坝水电站日均出力预测问题进行研究，从三峡水电站的運行数据出发，考虑三峡水库与葛洲坝水电站的紧密水力联系以及三峡水库-葛洲坝水电站的出入库不平衡影响，建立葛洲坝水电站入库流量预测模型;在此基础上，分析葛洲坝水电站日均出力的相关影响因素，建立葛洲坝水电站日均出力预测模型，从而实现从三峡水电站运行数据到葛洲坝水电站日均出力的全过程预测。

1 葛洲坝水电站日入库流量预测

1.1 影响因素分析

在三峡水电站和葛洲坝水电站的多年运行中，受新机组投产、机组增容改造[12]以及河道下切等多因素的影响，葛洲坝水电站入库流量计算也发生着变化[13]。对2003～2019年的三峡水库日出库流量、葛洲坝水电站日入库流量、三峡水库弃水数据、葛洲坝水电站弃水数据进行分析[14]，图1和图2分别为非弃水及弃水情况下2003～2006，2007～2011，2012～2014，2015～2019年葛洲坝水电站入库流量与三峡水库出库流量的差值和三峡水库出库流量的关系图。

从图1可以看出：非弃水情况下，不同时间阶段葛洲坝水电站入库流量与三峡水库出库流量的差值和三峡水库出库流量存在不同的相关关系。① 2003～2006年，葛洲坝水电站入库流量比三峡水库出库流量小200 m3/s以上，并且差值随着三峡水库出库流量的增加呈现出单调递减的趋势。② 2007～2011年，增容改造陆续进行[15]，葛洲坝水电站发电能力增加，在三峡水库出库流量小于12 000 m3/s时，差值在-200 m3/s左右波动，递减趋势减弱;在三峡水库出库流量大于12 000 m3/s时，差值随三峡水库出库流量呈现出递增的趋势。③ 2012～2014年，地电投产后，三峡水库发电能力增加，相同的三峡水库出库流量下，差值整体有所上升。④ 2015～2019年，差值进一步上升，并且在三峡水库出库流量小于12 000 m3/s时，差值与三峡水库出库流量的关系由之前的递减关系变为递增关系。在预测时，考虑葛洲坝水电站入库流量与三峡水库出库流量的差值和三峡水库出库流量的关系随时间的趋势变化，2015年之前与之后的数据关系表明电站处于不同的运行状态，因此2015年之前的数据对当前葛洲坝水电站入库流量预测将不会产生积极作用，故在建模时只对2015～2019年的数据进行研究。DFF3ED11-A11D-4AB8-85EB-FE194BEF08C0

从图2可以看出：弃水情况下，不同时间阶段葛洲坝水电站入库流量与三峡水库出库流量的差值和三峡水库出库流量也存在不同的相关关系，但与非弃水期并不相同，因此应该分别建立弃水期和非弃水期的葛洲坝水电站入库流量预测模型。

1.2 基于机器学习的葛洲坝水电站入库流量预测模型

本文采用极端梯度提升（eXtreme Gradient Boosting，XGBoost）和自回归差分移动平均模型（Autoregressive Integrated Moving Average model，ARIMA）来研究葛洲坝水电站入库流量的预测问题。

1.2.1 XGBoost原理

XGBoost属于Boosting族算法[16]，在XGBoost中，每轮迭代生成一个新的弱学习器来纠正前面所有弱学习器的残差，最后多个弱学习器进行集成形成一个强学习器，其特点是可以自动运用CPU的多线程进行并行计算，同时在算法精度上也有较大提高，加入正则项以控制模型复杂度[17]。

XGBoost中的弱学习器通常为分类和回归树（CART）[18]，假设XGBoost模型最终有K个树，则对于第i个样本的预测值为

y^i=Kj=1fj（xi），fj∈F（1）

式中：y^i为第i个样本的预测值;fj（xi）为第j棵CART树对第i个样本的预测;F为包含树的函数空间。

为了得到这K个树，需要构建模型训练的目标函数。从保证模型预测的准确性和降低模型复杂度出发，XGBoost的目标函数由训练损失和正则化项两部分组成，设第k次迭代要训练的决策树为fk，则目标函数为

objk=Mi=1L（yi，y^ki）+kj=1Ω（fj）（2）

式中：M表示模型訓练的样本量;yi表示模型输出变量的第i个样本的真实值;y^ki表示第k次迭代后第i个样本的预测值，且y^ki=kj=1fj（xi）;Mi=1L（yi，y^ki）=Mi=1（yi-y^ki）2表示损失函数;kj=1Ω（fj）表示正则化项，表征模型的复杂度，防止模型过拟合。

当训练第k个树时，前面第1到k-1个树是已知的，此时

y^ki=kj=1fj（xi）=k-1j=1fj（xi）+fk（xi）（3）

将式（2）进一步转化为

objk=Mi=1L（yi，y^k-1i+fk（xi））+Ω（fk）+k-1i=1Ω（fi）（4）

上式中y^k-1i和k-1i=1Ω（fi）为已知项，对目标函数进行二阶泰勒展开，并移除常数项，得到目标函数：

objk≈Mi=1gi·fk（xi）+12hi·f2k（xi）+Ω（fk）（5）

式中：gi为样本xi在损失函数上的一阶导;hi为样本xi在损失函数上的二阶导：

gi=y^k-1L（yi，y^k-1i）hi=2y^k-1L（yi，y^k-1i）（6）

决策树的复杂度Ω由叶节点数T和叶节点的权重ω组成，即：

Ω（fk）=γT+12λTt=1ω2t（7）

式中：γ和λ为超参数。将式（7）带入式（5），目标函数转化为

objk≈Mi=1gi·fk（xi）+12hi·f2k（xi）+Ω（fk）=Mi=1gi·ωq（xi）+12hi·ω2q（xi）+γT+12λTt=1ω2t=Tt=1（i∈Itgi）ωt+12（i∈Ithi+λ）ω2t+γT（8）

式中：q（xi）表示样本xi所属的叶节点;It={iq（xi）=t}表示属于叶节点t的所有样本下标的集合。

定义Gt=i∈Itgi，Ht=i∈Ithi，带入式（8），则得到最终的目标函数：

objk≈Tt=1Gtωt+12（Ht+λ）ω2t+γT（9）

上式中Gt和Ht为已知项，若第k个树的结构给定，则对ωt求偏导，可得叶节点t的最优权重：

ωt=-GtHt+λ（10）

此时目标函数进一步简化为

objk=-12Tt=1G2tHt+λ+γT（11）

采用贪心算法找出树的最优切分点，构造决策树fk。如此迭代直至满足终止条件，最终由多个弱学习器之和得到了一个强学习器[19]。

1.2.2 ARIMA原理

ARIMA模型是一种时间序列的预测方法，通常表示为ARIMA（p，d，q）[20]，具体形式为

（1-pi=1αiLi）（1-L）dXt=（1+qi=1θiLi）εt（12）

式中：p表示自回归项数;q表示移动平均项数;d表示将非平稳时间序列转化为平稳时间序列所需要的差分次数;L表示滞后算子，LdXt=Xt-d;αi表示自回归项的参数;θi表示移动平均项的参数;εt表示误差项，是白噪声过程。

ARIMA模型既考虑了时间序列的自相关性，又考虑了随机波动的相关性，是应用广泛且准确度较高的时间序列预测模型之一。为建立ARIMA（p，d，q）模型，首先需要对训练数据的拟合误差序列进行平稳性检验，如果非平稳，可以通过差分转换为平稳时间序列。其次根据差分后的时间序列的自相关图判断移动平均项数q，根据偏自相关图判断自回归项数p[21]。也可以结合Akaike信息准则（AIC）[22]或Bayes信息准则（BIC）[23]来选择合适的p和q值。

将ARIMA模型应用于入库流量预测主要是因为随着时间的推移，以及受一些不可控制、无法预知的其他因素影响，下游电站入库流量会出现一定范围的波动，这些其他因素一般具有时间延续性，可以通过时间序列分析客观反映，进而对入库流量预测进行校正[24]。

1.2.3 模型构建DFF3ED11-A11D-4AB8-85EB-FE194BEF08C0

基于XGBoost和ARIMA的葛洲坝水电站入库流量预测模型具体步骤如下。

（1）选取模型相关数据，包括：三峡水库全厂出力、三峡水库毛水头、三峡水库出库流量、葛洲坝水电站入库流量。

（2）计算三峡水库出库流量与葛洲坝水电站入库流量的折算系数，折算系数为葛洲坝水电站入库流量与三峡水库出库流量的比值。

（3）将数据分为弃水数据集与非弃水数据集。

（4）对弃水数据集和非弃水数据集分别构建XGBoost模型，模型输入为待预测日前3 d的折算系数、三峡水库全厂出力、三峡水库毛水头、三峡水库出库流量，模型输出为待预测日的折算系数。

（5）对弃水数据和非弃水数据的模型训练误差进行组合，构建误差时间序列。

（6）对误差时间序列构建ARIMA模型。

（7） XGBoost模型和ARIMA模型的预测值之和即为折算系数的预测值。

（8）三峡水库出库流量乘以折算系数预测值即为葛洲坝水电站入库流量预测值。

本文采用自动机器学习框架auto_ml实现XGBoost模型的训练和预测，该框架可以实现自动化建模，优化从数据预处理到特征工程到超参数调优的流程，提升建模效率，是常用的AutoML开源框架之一。ARIMA模型的训练和预测采用R软件中的auto.arima（）函数实现[25-26]，根据BIC准则确定模型的最佳参数组合（p，d，q）。

1.3 结果分析

表1～2为模型在2019年测试集上的预测结果，采用一步预测、滚动更新的方法实现，即以2015～2018年的数据作为训练集并预测测试集的第1个步长的数据，然后将来自测试集的真实值添加至训练集中，重新調整模型，预测第2个步长的数据，以此类推。将该方法与传统的折算系数三日均值法进行对比，可以看出，该方法的各项评价指标均优于折算系数三日均值法，误差标准差降低了24.6%，均方根误差RMSE减小了23.123 m3/s。同时该方法有效减少了大流量预报误差，绝对误差大于200 m3/s的天数由13 d降为4 d，减少了3.5%;绝对误差大于100 m3/s的天数由42 d降为26 d，减少了6.2%，说明该方法可以为葛洲坝水电站入库流量预测提供参考依据。

2 葛洲坝水电站日均出力预测

2.1 影响因素分析

对影响葛洲坝水电站出力的相关变量进行分析。图3为葛洲坝水电站发电流量、5号站平均水位、7号站平均水位、毛水头、三峡水库调峰量[27]、葛洲坝水电站调峰量与葛洲坝水电站出力随年份（2015～2019年）变化的关系图。由图3可知各变量与葛洲坝水电站出力均呈现出较强的相关性，尤其是葛洲坝水电站发电流量、水头及上下游水位，且相关关系没有呈现出明显的随年份变化的趋势。

图4为葛洲坝水电站出力的自相关系数与偏自相关系数图。由图4可知：自相关系数存在拖尾现象，偏自相关系数2阶之后减小到很小的数，说明葛洲坝水电站出力受前期出力的影响较大，在模型中应予以考虑。

2.2 基于贝叶斯岭回归的葛洲坝水电站日均出力预测模型

基于上述分析，本文考虑同类型日以及待预测日前期的出力、水位、流量等信息，采用贝叶斯岭回归模型，研究葛洲坝水电站日均出力预测问题。

2.2.1 贝叶斯岭回归模型

贝叶斯岭回归模型采用贝叶斯理论，将回归问题中的参数视为随机变量，通过增加先验分布的形式，来降低模型复杂度，避免过拟合，因此具有较强的鲁棒性。具体过程如下：

对样本集{Xn，yn}Nn=1，Xn表示第n个样本的自变量向量，yn表示第n个样本的因变量值。设X为所有自变量和一列常数1所组成的矩阵，y为因变量向量，β为回归系数向量。设yn服从高斯分布N（Xnβ，α-1），则概率密度函数为

p（yn|Xn，β，α）=12πα1/2exp-α（Xnβ-yn）22（13）

式中：α-1为高斯分布的方差。

β的先验分布为高斯分布N（0，λ-1Im），则概率密度函数为

p（β|λ）=mj=112πλ1/2exp-λ（βj）22（14）

式中：Im表示m阶单位矩阵;λ-1为高斯分布的方差。

参数α和λ的先验分布分别取其共轭分布Gamma分布[28]，即：

p（α|α1，α2）=Γ（α1）-1αα12αα1-1e-α2α（15）

p（λ|λ1，λ2）=Γ（λ1）-1λλ12λλ1-1e-λ2λ（16）

式中：Γ（α1）=∫SymboleB@0tα1-1e-tdt;α1、α2、λ1、λ2为超参数，取默认值α1=α2=λ1=λ2=10-6。

根据贝叶斯定理，参数（β，α，λ）的联合后验分布密度函数为

p（β，α，λ|X，y）∝L（y|X，β，α）·p（β|λ）·p（α）·p（λ）∝Nn=1α1/2exp-α（Xnβ-yn）22×pj=1λ1/2exp-λ（βj）22·αα1-1e-α2α·λλ1-1e-λ2λ（17）

式中：L（y|X，β，α）表示样本集的似然函数;p（β|λ）表示β的先验分布密度函数;p（α）表示α的先验分布密度函数;p（λ）表示λ的先验分布密度函数。

对于给定的新预测点X，对应的因变量y的分布密度函数为

p（y|X，X，y）=∫p（y|X，β，α，λ）p（β，α，λ|X，y）dβdαdλ（18）

通过最大似然估计得到α和λ的估计值αMP和λMP后，公式（18）转化为

p（y|X，X，y，αMP，λMP）=∫p（y|X，β，αMP）p（β|X，y，αMP，λMP）dβ（19）DFF3ED11-A11D-4AB8-85EB-FE194BEF08C0

取分布的均值作为因变量y的预测值[29]。

2.2.2 模型构建

基于贝叶斯岭回归的葛洲坝水电站日均出力预测模型的输出变量为待预测日的葛洲坝水电站总出力，输入变量如表3所列，采用自动机器学习框架auto_ml来实现贝叶斯岭回归模型的训练与预测。

2.3 结果分析

图5和表4为模型在2019年测试集上的预测结果，与1.3节类似，仍然采用一步预测、滚动更新的方法实现。结果表明：模型预测的平均误差为-0.115 万kW，平均绝对误差MAE为0.645 万kW，均方根误差RMSE为0.973 万kW，在2019年非弃水期中有10 d绝对误差大于2 万kW，占总天数的4%，达到了良好的预测效果。

3 葛洲坝水电站入库-日均出力全过程预测

前述中的葛洲坝水电站日均出力预测模型假设葛洲坝水电站发电流量为已知数据，本节考虑葛洲坝水电站发电流量未知的情形。将葛洲坝水电站日入库流量预测模型和日均出力预测模型相结合，通过日入库流量预测模型得到葛洲坝水电站入库流量，再通过葛洲坝水电站的初末水位控制计算葛洲坝水电站出库流量，葛洲坝水电站出库流量减去船闸流量得发电流量，最后由葛洲坝水电站日均出力预测模型得到葛洲坝水电站日均出力，以此来分析从已知三峡水库出库流量预测葛洲坝水电站日均出力的误差情况。

表5为葛洲坝水电站发电流量未知情形下由日入库流量预测模型和日均出力预测模型相结合计算的2019年测试集上的葛洲坝水电站出力预测结果，图6为葛洲坝水电站出库流量预测值和预测误差，图7为葛洲坝水电站出力预测值和预测误差，图8为葛洲坝水电站出库流量误差与出力预测误差关系图。

对比表5和表4可以看出：从三峡水库出库到葛洲坝水电站日均出力整个过程中，模型推算的葛洲坝水电站出库流量误差并未对出力预测产生较大影响。误差均值、标准差、均方根误差RMSE、平均绝对误差MAE值未显著增大，MAE由之前的0.645 万kW变为0.752 万kW，RMSE由之前的0.973 万kW变为1.051 万kW;且葛洲坝水电站出力绝对误差大于2 万kW的天数由10 d增加到了12 d，控制在合理范围内，说明该预测方法较为稳健，可以作为葛洲坝水电站日均出力计划的参考。

由图8可知：葛洲坝水电站出库流量预测误差与葛洲坝水电站出力预测误差基本呈现出线性正相关关系，为减小葛洲坝水电站出力误差，应尽量减小葛洲坝水电站出库流量误差。从拟合关系来看，将葛洲坝水电站出库流量误差控制在200 m3/s内基本可以使出力误差小于2 万kW。

4 结论

本文采用机器学习方法对非弃水期葛洲坝水电站日均出力预测进行了研究，考虑三峡水库与葛洲坝水电站的紧密水力联系，从三峡水电站的运行数据出发，探究了三峡-葛洲坝水电站的出入库折算系数，推求葛洲坝水电站入库流量，进而建立葛洲坝水电站日均出力预测模型。主要研究结论如下。

（1）對2003～2019年的三峡水库出库流量与葛洲坝水电站入库流量进行分析，得出葛洲坝水电站入库流量与三峡水库出库流量的差值和三峡水库出库流量呈现出显著的相关关系，且在不同的时间阶段相关关系有所差异。相同的三峡水库出库流量量级下，差值随着不同的时间阶段呈现出递增的趋势。

（2）用2015年以后的数据进行分析并建立了基于XGBoost和ARIMA的葛洲坝水电站入库流量预测模型，预测三峡水库出库流量与葛洲坝水电站入库流量之间的折算系数，进而预测葛洲坝水电站入库流量。2019年非弃水期的测试结果表明：本文提出的方法优于传统的折算系数三日均值法，可以减少大流量误差的天数，降低平均绝对误差，可作为非弃水期葛洲坝水电站入库流量的参考，为葛洲坝水电站日均出力预测提供输入。

（3）在对非弃水期葛洲坝水电站日均出力影响因素分析的基础上，提出了基于贝叶斯岭回归的葛洲坝水电站日均出力预测模型。在葛洲坝水电站发电流量已知时，该方法在2019年测试集上的预测表现良好，可以准确地预测出葛洲坝水电站出力;在葛洲坝水电站发电流量未知时，将葛洲坝水电站日入库流量预测模型和已知葛洲坝水电站发电流量的葛洲坝水电站日均出力预测模型相结合进行预测，结果表明：从三峡水库的运行情况推求葛洲坝水电站日均出力整个计算过程中，葛洲坝水电站日均出力预测误差无显著增大，且误差控制在合理范围内，可以为葛洲坝水电站日均出力计划制定提供参考。

参考文献：

[1] 牛兰花，张小峰，李云中.三峡电站调峰试验两坝间非恒定流原型观测分析[J].人民长江，2006，37（12）：24-27.

[2] 徐杨，樊启祥，尚毅梓，等.非弃水期葛洲坝水电站下游水位变化过程预测新方法[J].水利水电科技进展，2019，39（3）：50-55.

[3] 浦伟伟.葛洲坝水电站反调节研究[D].武汉：华中科技大学，2010.

[4] 祝俊，罗霄凌，鲍正风.基于多元门限回归模型的葛洲坝入库流量分析[J].水科学与工程技术，2013（5）：1-3.

[5] 刘园，黄钰凯，李天成.调峰过程中葛洲坝下游水位变化分析[J].水电与新能源，2019，33（10）：25-29.

[6] SHANG Y Z，XU Y，SHANG L，et al.A method of direct，real-time forecasting of downstream water levels via hydropower station reregulation：a case study from Gezhouba hydropower plant，China [J].Journal of Hydrology，2019，537：895-907.

[7] ZHANG D，LIN J Q，PENG Q D，et al.Modeling and simulating of reservoir operation using the artificial neural network，support vector regression，deep learning algorithm[J].Journal of Hydrology，2018，565：720-736.DFF3ED11-A11D-4AB8-85EB-FE194BEF08C0

[8] 何自立，陆梦可，王正中，等.基于相空间重构小波神经网络径流式水电站发电量预测[J].中国农村水利水电，2017（9）：178-180，190.

[9] 李霄，王昕，郑益慧，等.基于改进最小二乘支持向量机和预测误差校正的短期风电负荷预测[J].电力系统保护与控制，2015，43（11）：63-69.

[10] 雷昌宁.基于SARIMA和SVR混合模型的黑河径流量预测分析[D].兰州：兰州大学，2018.

[11] 刘亚新，樊启祥，尚毅梓，等.基于LSTM神经网络的水电站短期水位预测方法[J].水利水电科技进展，2019，39（2）：56-60，78.

[12] 艾友忠，卢进玉.葛洲坝电站机组增容改造综述[J].水力发电，2006，32（1）：80-83.

[13] 张益华.浅谈三峡-葛洲坝联合运行对葛洲坝电站的影响[J].华中电力，2011，24（5）：75-78.

[14] 王必新.三峡-葛洲坝梯级水利枢纽调度关键数据分析[J].水利水电技术，2015，46（4）：100-103，113.

[15] 解浩兵，徐华奇.葛洲坝电站增容改造机组运行稳定性介绍[J].大电机技术，2009（6）：39-43，48.

[16] 周志华.机器学习[M].北京：清华大学出版社，2016.

[17] 闫星宇，顾汉明，肖逸飞，等.XGBoost算法在致密砂岩气储层测井解释中的应用[J].石油地球物理勘探，2019，54（2）：447-455.

[18] 李航.统计学习方法[M].北京：清华大学出版社，2012.

[19] 李广野，李伟，田小蕾，等.基于XGBoost算法的短期电力负荷预报[J].智能电网，2017，7（4）：274-285.

[20] HYNDMAN R J，ATHANASOPOULOS G.Forecasting：principles and practice [M].Melbourne：OTexts，2018.

[21] 崔振辉，李林川，赵承利，等.基于ARIMA的电力视频流量分析和预测[J].天津大学学报（自然科学与工程技术版），2015，48（1）：49-55.

[22] AKAIKE H.A new look at the statistical model identification[J].Automatic Control IEEE Transactions on，1974，19（6）：716-723.

[23] SCHWARZ G E.Estimating the dimensions of a model[J].Annals of Statistics，1978，6（2）：461-464.

[24] 张瑞国，李春雨，丁志宏，等.基于时间序列模型的雷达数据随机误差建模与补偿[J].现代雷达，2016，38（11）：49-52.

[25] KABACOFF R I.R in Action：data analysis and graphics with R （Second Edition）[M].New York：Manning Publications，2015.

[26] HYNDMAN R J，KHANDAKAR Y.Automatic time series forecasting：the forecast package for R[J].Journal of Statistical Software，2008，27（1）：1-22.

[27] 李天成，鲍正风，王祥，等.基于弃水边界条件下的葛洲坝电站日发电计划制作策略研究[J].水力发电，2020，46（11）：87-90，100.

[28] 王佐仁，杨琳.贝叶斯统计推断及其主要进展[J].统计与信息论坛，2012，27（12）：3-8.

[29] BISHOP C M.Pattern Recognition and Machine Learning[M].New York：Springer，2006.

（編辑：谢玲娴）

Prediction of daily power output of Gezhouba Hydropower Station during

non-discarded water period based on machine learning

LIU Yaxin1，2，XU Yang1，2

（1.China Yangtze Power Co.，Ltd.，Yichang 443002，China; 2.Hubei Key Laboratory of Intelligent Yangtze and Hydroelectric Science，Yichang 443002，China）

Abstract：

It′s known that the Three Gorges Reservoir and Gezhouba Hydropower Station have close hydraulic connection.However，there is an inconsistency between the Three Gorges Reservoir′s outflow and Gezhouba Hydropower Station′s inflow by operational monitoring，which brings uncertainty to the inflow and power output prediction of Gezhouba Hydropower Station.In order to solve these problems，a prediction model was proposed for Gezhouba Hydropower Station′s inflow based on eXtreme Gradient Boosting （XGBoost） and Autoregressive Integrated Moving Average model （ARIMA） during the non-discarded water period.What′s more，another prediction model was proposed for daily power output of Gezhouba Hydropower Station based on Bayesian Ridge Regression.And then，these two models were combined to predict the daily power output with unknown reservoir inflow.Through the experimental analysis during the non-discarded water period in 2019，the results showed that the proposed inflow prediction model performed better than traditional three-day average conversion coefficient method，greatly reducing the prediction error.Further more，the daily power output prediction model has high precision accuracy and strong noise robusticity，and it can be applied to making power-generation plan of Gezhouba Hydropower Station during non-discarded water period.

Key words：

reservoir inflow;daily power output;machine learning;Bayesian Ridge Regression;Gezhouba Hydropower Station;Three Gorges ReservoirDFF3ED11-A11D-4AB8-85EB-FE194BEF08C0