APP下载

基于机器学习方法的葛洲坝水电站下游水位预测研究

2022-11-23刘晓阳

水利水电快报 2022年10期
关键词:出库水位向量

刘晓阳,郭 乐

(1.三峡水利枢纽梯级调度通信中心,湖北 宜昌 443002; 2.智慧长江与水电科学湖北省重点实验室,湖北 宜昌 443002)

0 引 言

低水头、大流量电站在调度运行中,发电流量与发电水头关系极为敏感,发电水头的变化对出库流量影响较大,在进行后期调度计划安排时,计划负荷曲线的可用性及准确性受到入库预报、厂内运行计算精度的影响。葛洲坝水电站位于长江三峡末端河段,是世界最大的低水头、大流量径流式水电站,主要承担三峡水电站反调节及配合三峡枢纽进行长江河段疏航任务。由于上游三峡水电站运行的计划性较强,葛洲坝水电站预报入库流量精度较高。经校核,葛洲坝上游水位-库容关系曲线、NHQ曲线、水头损失曲线的准确度可满足生产需求,但下游水位变化影响因素较多,变化规律复杂,利用已有的下游水位-流量关系曲线难以精确计算,将直接影响发电水头的计算精度。

近几年兴起的机器学习方法为水位预测提供了新的技术手段,利用机器学习方法可以从大量数据中挖掘变量间存在的复杂映射关系,相比传统的既定关系曲线计算方法具有明显优势,可有效提高计算精度。许多学者尝试将机器学习模型应用于水位预测的研究,并取得了较为丰富的研究成果。孙秋菊等[1]以秦皇岛地区 1992~2002 年地下水平均埋深实测数据作为训练样本建立BP神经网络预测模型,并以2003~2016年地下水位数据作为测试集对模型预测精度进行评估分析,结果显示预测模型在测试集上表现较为良好,误差值均小于0.1 m。刘亚新等[2]分析了葛洲坝上下游水位变化规律的影响因素,以三峡水库上游凤凰山水位、三峡水电站有功出力、葛洲坝电厂有功出力等因素作为输入变量,建立了基于LSTM的水位预测模型,测试结果表明对于葛洲坝水电站连续6 h的下游水位预测以及连续3 h的上游水位预测具有较高精度。翁玲等[3]以多元线性回归、岭回归和套索回归3种机器学习方法为基础,建立了赤水站未来6 h水位预测模型,其中引入72 h滞后量的套索回归表现最优,测试集均方根误差指标为0.192 m;王淑华[4]利用自回归移动平均模型对冯家山水库主汛期水位进行预测研究,测试结果显示,ARIMA(1,2,2)模型预测精度较高,对冯家山水库汛期调度决策具有较大指导意义。刘青松等[5]构建了基于AR-RNN的多变量水位预测模型,以清溪河流域水位测站数据为基础,对比了AR-RNN模型和RNN模型在测试集上的表现,结果表明AR-RNN模型相对于RNN模型在测试集上平均绝对误差MAE提升了10%,RMSE 提升了5%,最大误差及最大相对误差提升了15%。郭燕等[6]基于LSTM和GRU两种神经网络方法分别建立了洞庭湖水位预测模型,对比测试结果表明两种方法均能较好预测洞庭湖水位特征变化,GRU在训练过程中具有更高的收敛速度,在对2012年洞庭湖典型洪水过程的模拟中,LSTM神经网络可准确预测预报期长达3 d的洞庭湖水位。周勇强等[7]通过将SFLA-CNN和LSTM分线性组合的方式构建了太湖区域水位预测模型,测试结果表明该模型具有较高的预测准确度和泛化能力,MAE和RMSE指标分别为0.016,0.018 m。

本文以人工神经网络、支持向量机、随机森林3个代表不同原理的机器学习方法为基础,建立葛洲坝水电站下游水位预测模型,并以2018~2020年历史运行数据为样本数据集展开研究。

1 研究方法

1.1 人工神经网络

1943年,Warren McCulloch和Walter Pitts首次提出人工神经网络技术,他们受到神经细胞的启发,通过数学算法和逻辑表达式,成功模拟了神经元的行为方式。该模型自提出以来一直受到相关领域学者的广泛关注。

一个多层感知网络由节点(神经元)和连接线组成,节点分布在不同层面,包括输入层、隐藏层、输出层、相邻层的节点通过连接线相连。在应用过程中,多数均为全连接神经网络,顾名思义,每一层所有神经元都与前一层的所有神经元相连,由此形成的每个连接都被赋予一个权值,在训练过程中通过不断对链接权值进行修正,最终使该网络单元能够精准描述数据间复杂的函数关系,其具体结构如图1所示。

图1 人工神经网络结构Fig.1 Artificial neural network structure diagram

1.2 支持向量机

支持向量机(Support Vector Machine,SVM)是一种按监督学习方式对数据进行二元分类的广义线性分类器,其决策边界是对学习样本求解的最大边距超平面。SVM使用铰链损失函数计算经验风险并在求解系统中加入了正则化项以优化结构风险,是一个具有稀疏性和稳健性的分类器。SVM可以通过核方法进行非线性分类,是常见的核学习方法之一。1964年提出SVM,20世纪90年代后得到快速发展,并衍生出一系列改进和扩展算法,在人像识别、文本分类等模式识别问题中得到应用,SVM结构见图2。

图2 支持向量机结构Fig.2 Support vector machine structure diagram

1.3 随机森林

随机森林是决策森林的衍生模型。该模型改善了决策森林过拟合、“剪枝”不合理、易于陷入局部最优等缺陷,全面提升了预测性能,构建流程如图3所示。其特点在于结构简单,表达易于理解。相比于传统回归模型,随机森林在回归预测方面具有更优秀的表现,且可有效防止过拟合现象的出现。

2 葛洲坝下游水位预测

2.1 下游水位变化规律分析

葛洲坝水电站下游水位主要受出库流量影响,在进行未来时段调度计划安排时,传统计算模式是利用下游水位-流量关系曲线进行水位计算。该方法主要存在两个弊端:① 曲线是在前期工况下测定,更新成本较高。下游河道形态会随时间发生一系列变化,如曲线更新不及时,则计算过程中会产生客观误差;② 电站出库流量变化受机组出力及闸门开度控制,响应时间较短,但河道水位变化是连续过程,具有一定的滞后性,由图4葛洲坝水电站出库流量与下游水位关系可见,在出库流量发生突变时,下游水位需经历较长过渡时间才能涨落到位。葛洲坝水电站属于低水头、大流量径流式电站,出库流量对水头变化极为敏感,后期调度方案制作精度较大程度取决于水头计算精度。

图4 2018年葛洲坝水电站出库流量与下游水位关系Fig.4 Relationship between Gezhouba Hydropower Station outflow and downstream water level in 2018

2.2 机器学习方法超参数设置

人工神经网络、支持向量机、随机森林3种机器学习方法参数设置如下。

(1) 人工神经网络隐藏层层数为15;隐藏层神经元个数为50;激活函数为修正非线性(relu);学习率为0.001;梯度下降方法为Adam。

(2) 支持向量机核函数kernel为rbf;惩罚系数C为1.0;核函数参数degree为3;核函数参数gamma为scale。

(3) 随机森林基评估器(树)的数量为100;树生成模式random_state为None。

2.3 预测因子选取

根据前文葛洲坝水电站下游水位变化规律分析可知,下游水位变化并不会及时响应出库流量变化,而且受惯性影响,前期水位变化趋势对后续水位变化同样存在一定影响。因此将这一规律加入到机器学习模型的建立过程,加入以前两个时段水位值作为描述前期水位变化趋势的变量,以降低映射复杂度,加快机器学习方法学习效率。为便于后期调度计算模型调用,本文采用单点预测方式。设置输入变量为葛洲坝出库流量、1 h前下游水位、2 h前下游水位;输出变量为预测时刻下游水位。

2.4 预测精度评价

评价指标选取均方误差MSE和决定系数R2两个回归任务评价指标。

(1)

(2)

为更好体现预测模型对训练数据集泛化能力,评价时使用k折交叉验证(k取10)。即将数据集等比例划分成k份,以其中的一份作为测试数据,其他的k-1份数据作为训练数据,进行k次测试后得到综合评价结果。本文所用数据集为2018~2020年历史运行数据,共17 470条样本数据,采用10折交叉验证,即每次验证以15 723个样本作为训练集,1 747个样本作为测试集,3种机器学习方法的训练及测试评价结果见表1。

表1中所示3种方法在测试集上均有较好表现,其中支持向量机表现最优,MSE为0.0071,R2平均值为0.98,预测精度较高,可见基于机器学习方法的预测模型可在复杂因素影响下的水位预测中表现良好。

表1 3种预测模型预测精度评估Tab.1 Prediction accuracy evaluation of three types of prediction model

2.5 案例分析

为更加直观地展示预测结果,本文选取训练集以外的葛洲坝水电站典型日内水位过程为独立测试对象,进行模型预测结果的定量分析。研究选取了2021年葛洲坝水电站出库流量10 000 m3/s 以上和以下两个不同出库流量的的典型过程作为测试对象。支持向量机模型在3个模型中表现最好,因此利用支持向量机预测模型对典型日内水位过程进行模拟预测,预测效果如图5~6所示。图5~6中预测水位与实际水位较为接近,尤其在水位变化段能够较好模拟实际水位趋势,可见在不同工况下基于机器学习方法的水位预测模型均表现良好,预测精度较高,满足生产实际需求,可在后续调度计划制作应用种进一步验证其预测效果。

图5 2021年葛洲坝水电站典型过程预测水位结果对比 (出库流量小于10 000 m3/s)Fig.5 Comparison of water level prediction results in typical processes(outflow below 10 000 m3/s)in 2021

图6 2021年葛洲坝水电站典型过程预测水位结果对比 (出库流量大于10 000 m3/s)Fig.6 Comparison of water level prediction results in typical processes(outflow above 10 000 m3/s)in 2021

3 结 语

本文针对葛洲坝水电站实际调度中下游水位-流量关系曲线难以准确模拟下游水位变化这一问题,引入人工神经网络、随机森林和支持向量机3种机器学习方法作为技术手段,以2018~2020年历史出库流量、下游水位等小时尺度运行数据为样本数据集,分别建立水位预测模型,并在预测因子选择时加入下游水位变化规律,以降低映射复杂度,加快模型学习效率。k折交叉验证结果表明,基于支持向量机的预测模型表现最优,预测精度较高,可满足生产实际需求,且对后期葛洲坝水电站调度计划制作具有重要指导意义。

猜你喜欢

出库水位向量
向量的分解
聚焦“向量与三角”创新题
汽车配件的出库、盘点与库存控制
优化拍卖出库流程控制防范拍卖出库环节财务风险
报文数据分析法在立体库故障分析中的应用
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
七年级数学期中测试题(B)