APP下载

关键水文信息对三峡水库调度决策的重要性分析

2023-01-03陈柯兵李圣伟何奇锴孙思瑞

水电与新能源 2022年11期
关键词:三峡水库出库水位

陈柯兵,李圣伟,何奇锴,孙思瑞

(1.长江水利委员会水文局,湖北 武汉 430010;2.油气地球化学与环境湖北省重点实验室(长江大学资源与环境学院),湖北 武汉 430100;3.长江水利委员会水文局长江中游水文水资源勘测局,湖北 武汉 430010)

三峡水利枢纽工程以防洪任务为首,兼具有发电、航运等多项综合效益,其地理位置特殊、防洪库容巨大,可直接控制下游荆江、城陵矶等处洪水,在目前长江流域的防洪调度体系中,处于最重要的核心地位。

城陵矶(莲花塘)水位为三峡水库调度决策的重要指标,三峡(正常运行期)-葛洲坝水利枢纽梯级调度规程中明确指出,三峡水利枢纽汛期运行水位、蓄水方式、防洪调度等均与其数值直接相关。

国内学者已开展了众多三峡水库对城陵矶水位影响的研究,如黄群等[1]利用BP神经网络对洞庭湖出口城陵矶站的水位过程进行模拟,量化了三峡水库蓄水对水位的影响。王蒙蒙等[2]建立了基于支持向量机的回归模型,定量描述了三峡逐日出库流量与洞庭湖代表水文站之间的关系。桂梓玲等[3]利用简化运行策略分析了长江上游已建21座水库群蓄水对鹿角水位和城陵矶流量的影响。但如何分析城陵矶水位对三峡水库的调度决策产生的影响,尚待进一步探讨。

水库调度决策者通常将各种水文信息,如水库当前水位、预报入库流量等,与水库调度规则、发电需求等结合起来,以确定水库的出库。近年来,通过数据挖掘方式,获取调度决策者的知识与智慧,并应用于水库调度,以提高水库运行效益,逐渐流行。尹正杰等[4]考虑入库流量、水库库容与时段信息,采用人工神经网络中径向基函数制定了水库供水调度规则。Hejazi等[5]把水库运行中的水文信息分为三种,即过去、当前和未来信息,采用信息理论方法对美国数十个水库的历史运行数据进行挖掘,从入库、水库库容等信息中,找出影响出库流量的重要信息。Yang等[6]使用CART树算法和随机森林算法来模拟美国加利福尼亚州水库的出库流量,并得出水库库容、季节和下游水位是水库运营中最为重要的信息。

以上研究针对水库调度决策中主要的水文信息而展开,揭示了相关水文信息和出库决策之间的关系,本文将此思想应用于三峡水库逐日运行数据。研究拟通过出库决策模拟模型分析水库历史运行数据,区分汛期与非汛期,从多角度对三峡水库调度所采用的水文信息进行排名并判断其价值,重点分析下游防洪控制点城陵矶水位对三峡水库调度决策的影响。

1 三峡水库出库决策模拟模型

1.1 研究使用数据

为了建立三峡水库出库决策模拟模型,将三峡水库的历史运行数据划分为模型输入(决策变量)和输出(目标变量),考虑的模型输入和输出信息(变量)具体情况如下:

1)当前的信息。当前信息包含三个水文变量,即目前的月份(M),体现不同的时段对水库运行的影响;水库当前的水位(RWL)和下游防洪控制点城陵矶水位(DWL),是被广泛应用于三峡水库出库决策制定的指标。

2)未来的信息。未来信息包含三峡水库运行中真实记录的,预报1、2 d和3 d的入库流量,即It+1、It+2、It+3。这些数据在调度实践中每天都会更新,由长江电力的数据库提取得到。

3)模型的输出为下个时段的日平均出库流量。表1列出了模型输入和输出变量的介绍。

由于三峡水库在汛期与非汛期有不同的运用目的,因此将历史运行数据分为两个部分,以进一步分析汛期(6月1日至9月30日)和非汛期之间水库运行的变化,使用全年数据的情况也保留作为比较基准。

故共有三种方案,使用全年、汛期、非汛期数据分别分析和构建出库决策模拟模型。三峡水库2008年开始启动175 m试验性蓄水,收集的三峡历史运行数据涵盖了2008-06-01日到2017-05-31日共9年的资料。使用2008-06-01日到2015-05-31日的数据进行决策模拟模型的训练和交叉验证,其余数据用于模型检验。

1.2 随机森林算法

研究利用随机森林(Random Forest,RF)算法在输入和输出变量之间建立回归模型。作为非黑箱和非参数的数据挖掘技术,RF由多个决策树的集合组成。决策树的树状结构包括决策节点、枝、叶,最终形成一系列的决策规则,用于数据挖掘中的分类或回归问题。回归随机森林中的决策树获取每个类别(叶)中目标变量的平均值,并储存相应的规则。为了进行回归,常用的决策节点选取标准为下式中的最小化相对误差之和[7]。

(1)

式中:yl和yr是决策节点的左右分支,两分支拥有的变量数量分别为L和R;yL和yR是左右分支输出变量的平均值;d为决策节点的划分规则。

使用随机森林算法进行回归时,要调整的主要超参数为森林中决策树的数量(N)和决策树的最大深度(depth)。构建随机森林的过程,如图1所示,训练数据使用上文提及的2008-06-01日到2015-05-31日6个输入变量与输出变量(未来1 d出库)。为了评估随机森林的回归效果,以确定超参数,采用解释回归模型的方差得分,如下式,最终建立得到输入、输出变量间超参数最优的随机森林回归模型。

图1 随机森林算法示意图

(2)

式中:ytar是真实的目标值;yout是随机森林的输出值;Var表示方差的计算。该指标的取值范围为0至1,越接近于1说明模型的效果越好。

随机森林算法在构建模型的过程中,能提供量化的输入变量间相对重要性,将帮助建模者对输入变量进行评估。

1.3 模型验证指标

为了比较出库决策模拟模型的性能,选择纳什效率系数(NSE)、水量相对误差(RE)作为统计指标[6],NSE计算公式如下所示:

(3)

水量相对误差表示某时段出库总水量的模拟误差占实际出库总水量的百分比,其值越接近0表明模型模拟效果越好。

2 研究结果分析和讨论

2.1 随机森林参数选择及输入变量重要性

经试算分别从3至10中选择森林中决策树的数量(N),3至6中选择决策树的最大深度(depth)这两个参数。采用机器学习中常用的网格搜索方法进行调试、优选,该方法考虑了所有候选的32种参数组合。

将2008年至2015年的训练数据集,逐日地随机打乱,利用打乱的数据以及提及的三种输入方案,计算每种参数组合下的解释回归模型的方差得分。即每种输入方案都需要计算32次,在计算过程中,记录随机森林算法中的变量重要性得分。图2绘制了三种输入方案各自经过32次计算后,得到变量重要性得分的平均值。比较这三种情景,无论是全年、汛期还是非汛期,信息的重要性排名均为未来预报、下游水位、水库水位、月份。

图2 随机森林模型输出的变量重要性得分

此外,在图2中可明显看出,汛期未来预报流量重要性较高,尤其是预报未来一天入库。非汛期预报流量的重要性相对降低,而下游水位重要性进一步提升,说明了预报流量在汛期的重要性更强,城陵矶水位在非汛期也是对于调度决策的重要指标。

虽然直觉上城陵矶水位在汛期应该发挥更大的作用,可能原因为:①汛期预报流量的重要性更强,从而相对降低了城陵矶水位的重要性。②非汛期城陵矶水位也是水资源、水生态调度的重要目标,目前的调度规程中明确规定了枯水期的最小下泄流量,从而间接同城陵矶水位相关。

2.2 决策模拟模型参数及模拟效果

将32种候选参数组合进行对比分析后,利用最大深度、决策树的数量参数为4和7的随机森林模型作为三峡水库出库决策模拟模型。并在检验期的数据集(2015~2017年)上测试了模型性能。由于检验期数据从未在模型的训练和交叉验证中使用过,因此可将其视为独立的测试时期,以评估三种输入方案下模型的性能。对于全年模型,测试期为2015-06-01日至2017-05-31日的全时段。对于其他两模型,仅使用相应的汛期或非汛期的数据。模型在检验期性能的统计汇总在表2中,全年模型的模拟效果与观测值对比,见图3所示。

表2 决策模拟模型在检验期的性能

图3 观测和全年模型模拟出库流量的对比情况

根据文献[8],如果NSE大于0.50,则可以将模型性能判断为满意。由于表2中的NSE值在0.572到0.832之间,因此模型的统计性能对于所有三种情况都是令人满意的。比较这三种情况后,有两个发现:

1)将数据人为地划分成汛期、非汛期两部分不会明显改善模型的性能。与全年模型相比,汛期和非汛期模型在三个不同的待比较时段内均未明显改善NSE、RE指标。

2)模型在汛期的效果要好于非汛期,全年模型的NSE、RE指标,在汛期的值为0.696、0.89%均好于其在非汛期的0.587、-11.01%。可能的原因是三峡水库汛期以防洪调度为主,调度决策受到预报入库流量、城陵矶水位的影响更加直接。而非汛期,三峡水库的作用以兴利为主,其出库决策受到电网需求等影响,更加复杂,模拟的准确性将会下降。

2.3 模型的应用价值

本研究可从多角度探索其应用。从水库下游用水者的角度来看,上游水库的出库流量高度依赖于水库调度者的决策,与自然条件下的流量过程差异明显。为了建立适当的水资源管理计划,下游用水者需要了解上游水库的运行模式,可以建立模型来估算上游水库可能的出库流量。

从水库决策者的角度来看,建立的出库决策模拟模型已经包含了历史上的专家经验,在应用中可以依据模型计算出可供参考的出库流量,经过决策者人工校正后实际使用。除模型之外,评估出的水文信息重要性也有一定实用价值。对于三峡水库的调度管理而言,无论在汛期还是非汛期,城陵矶水位均为调度决策的重要指标,需加以考虑。

从研究人员的角度来看,许多针对三峡水库的优化调度研究是基于调度规则开展的,这些调度规则会包含不同的水文信息作为规则中的变量。哪些变量应该优先选择,论文研究成果可提供一定的参考。第一,三峡水库在汛期和非汛期的运行方式是不同的,调度规则应有差异。第二,汛期与非汛期的调度规则中都应包含预报入库流量、城陵矶水位,尤其在汛期,预报流量对于水库调度规则的制订至关重要。

3 结 语

本文基于随机森林算法,利用月份、水库水位、城陵矶水位、预报入库流量等信息,模拟了三峡水库的出库决策,构建了全年、汛期、非汛期三种时段下的模拟模型。

从三种模型的模拟结果,与随机森林算法中得到的输入变量的重要性排名两个角度,评估了水文信息对水库出库决策的影响,主要结论如下:

1)对模拟的三峡出库流量与实际出库流量间的统计指标分析表明,随机森林算法可以合理地模拟出三峡水库的出库决策。

2)无论是全年、汛期还是非汛期,三峡水库调度决策中,重要信息依次为未来预报流量、城陵矶水位、水库水位、月份。在汛期的出库决策制定中,未来预报流量尤为重要。

3)无论在汛期还是非汛期,城陵矶水位均为三峡水库调度决策的重要指标,需在三峡水库的调度管理和优化研究中重点考虑。

猜你喜欢

三峡水库出库水位
配方高架库空箱出库程序的优化设计与应用
优化拍卖出库流程控制防范拍卖出库环节财务风险
基于NGA算法的舰载机机库出库调度优化*
七年级数学期中测试题(B)