基于灰狼优化算法的灌区流量预测模型研究
2023-03-14单无牵宁芊周新志张人元罗强
单无牵,宁芊,2*,周新志,张人元,罗强
(1.四川大学电子信息学院,成都610065;2.新疆师范大学计算机科学技术学院,乌鲁木齐830054;3.成都万江港利科技股份有限公司,成都 610064)
0 引言
虽然我国土地辽阔,淡水资源总量为28000亿立方米,占全球水资源的6%,名列世界第四,但是我国人口众多,人均水资源量只有2300立方米,仅为世界平均水平的25%,所以我国是一个严重缺水的国家[1]。同时,不同地域不同时期水资源的分布不均匀,更加加剧了问题的严重性。在这样的一个背景下,很多地区都希望能够准确地测量出灌区的流量值,以此为依据,为计划用水以及水资源调配等工作进行量化参考,能够对水资源进行更合理的管理与分配[2]。
针对灌区流量测算的研究大致分为两种:第一种是在传统的流量测算方法的基础上,对测量设备进行改进,例如改进流速仪、水位测量装置等;第二种方法是研究与流量有关的中间变量,例如水位、流速、几何形状等,研究中间变量与流量之间的内在联系,通过相应的算法来实现。例如曹登峰等[3]、周冬生等[4]改进了水位计、流速仪等测量设备或使用雷达等新型测量工具提高流量计算的精度。Lin等[5]使用软测量技术,以闸门开度、水位等条件为输入进行模糊边界流场计算。Aggarwal等[6]以实测河流数据为基础,通过三种时序模型来进行流量评估。张振等[7]使用图像算法替代了流速测量工具,建立了RBFNN软测量模型。文献[8-10]采用自适应神经模糊推理系统(ANFIS)研究了90°急弯的流量,对其进行数值模拟以及水文信息预测。
为了提高灌区流量预测精度,本文提出使用灰狼优化算法(WGO)优化BP神经网络模型的权值和阈值。首先使用经验公式法和BP神经网络创建相应的预测模型,并指出相应缺陷;其次在花海灌区的实测数据的支撑下对三种模型进行比较。
1 研究区域概况
1.1 基本情况
花海灌区属于石油河下游的花海盆地,具体位置位于玉门市老市区以北76公里左右,灌区中心位于东经97°44′,北纬41°18′,南靠宽滩山北麓戈壁,北靠马鬃山前戈壁,西接昌马灌区青山农场,东与金塔县接壤,面积3878平方公里。灌区深居亚欧大陆腹地,为典型的大陆荒漠气候,终年干旱少雨或雪,风沙大,光照强,昼夜温差大,年降水量70.1毫米,年蒸发量2982.5毫米,区内海拔介于1215~1325米之间,南北自然坡度1/500,东西自然坡度1/1000。
1.2 数据来源
花海灌区内包含各种干渠以及众多支渠,无论干渠或是支渠,流量测算时均采用流速-面积法。测量时根据渠道的物理参数以及水位信息等合理布置流速-面积法所需要的测线数目、测点个数及位置。在对花海灌区的数据资料进行筛选后,选择了北直四农、北直七农、东二支三斗马家峪、北直十二农水桥、东干渠、西干渠等22条渠道、共计147条流量数据。
2 研究方法
2.1 经验公式法
法国工程师谢才在1769年提出了一种计算明渠和管道均匀流平均流速、流量沿程水头损失的经验公式[11]:
该公式的求解核心是求解谢才系数C,针对这一情况,不同学者提出了不同的经验公式,然而在实际运用工程中最为简便而运用广泛的是曼宁公式:
利用谢才公式可以算出明渠断面的平均速度,曼宁公式则用来确定谢才公式中的谢才系数C。引入流量Q,谢才-曼宁公式[11]又可以写成:
式中:n为糙率;C为谢才系数;R为水力半径;A为过水断面面积;J为坡度。
2.2 BP神经网络
神经网络是由多个神经元以及层级相互连接组成的拓扑结构,BP神经网络[10]由于结构简单、使用方便常常用于解决各种工程问题。BP神经网络包括向前传播和误差反向传播两部分。向前传播时,网络中各神经元接受前一级的输入,并输出到下一级。误差反向传播部分是根据真实输出与期望输出之间的误差来不断修正神经网络的权值和阈值,从而使得神经网络的预测误差越来越小。训练的流程图如图1所示。
图1 神经网络训练流程图
由文献[12]可知,影响灌区流量测量的主要因素为测点参数以及渠道参数,故本文以渠道糙率n、渠底宽b、水深h、测点流速u、测点位置(x,y)为BP的六个输入因子,以流量Q为输出因子,建立的神经网络模型如图2所示。
图2 BP神经网络结构
2.3 GWO-BP模型
GWO算法是Mirjalil等[13]于2014年提出的一种智能优化算法,该算法模仿灰狼的领导层级和狩猎机制进行数学建模,从而完成优化工作。整个狼群按照自适应度由高到低,分为α、β、δ、ω四个等级。捕食过程中α、β、δ负责追捕猎物,ω跟随其他三者搜索。
灰狼与猎物之间的距离为
式中:t表示迭代次数、Xp()t表示猎物的位置、C为[0,2]的随机数。灰狼位置更新为
式中:α是收敛因子,r1是[0,1]的随机数。
α、β、δ三头狼与猎物之间的数学描述如下:
ω朝向α、β、δ的位置为
ω的最终位置为
由于BP神经网络通过误差反向传播,在训练过程中朝着误差梯度下降的方向收敛,因此在实际训练过程中存在收敛速度慢、陷入局部最优解、过拟合、参数选取敏感等问题。为了改善BP神经网络的缺陷,本文使用GWO方法对BP神经网络中较为敏感的权值和阈值进行优化。整个过程中将灰狼的位置作为BP的权重和阈值,通过不断更新灰狼的位置来找到最优的权值和阈值。训练的流程图如图3所示。
图3 GWO优化BP神经网络流程
3 结果和讨论
3.1 评价指标
本文对三种流量预测模型进行研究,并得到了测流结果。单一的结果无法说明模型的好坏,故本文采用了决定系数R2、均方根误差RMSE、平均绝对误差MAE、平均绝对百分比误差MAPE四种评价指标进行判断。R2越接近1模型性能越好,RMSE、MAE、MAPE越接近于0,模型性能越好。这些指标的计算方式如下:
式中:QPi是预测的流量;QMi是实际测量的流量;n为参与计算的流量个数。
3.2 灌区流量预测结果
本文共收集到147条花海灌区流量实测数据,并将数据集划分为两部分,训练集97条(70%)测试集50条(30%),并对数据进行归一化处理,消除奇异样本导致的不良影响。相应模型完成训练后,采用三种模型对测试集的50条数据进行预测。
模型一:选取灌区的糙率n、断面面积A、坡度J、水力半径R为输入,利用经验公式模型对花海灌区流量进行预测,预测结果如图4所示。
图4 经验公式预测流量结果
模型二:选取灌区的糙率n、渠底宽b、水深h、测点流速v、测点位置(x,y)为输入,利用BP神经网络模型对花海灌区流量进行预测,预测结果如图5所示。
图5 BP神经网络模型预测流量结果
模型三:选取灌区的糙率n、渠底宽b、水深h、测点流速v、测点位置(x,y)为输入,利用GWO-BP神经网络模型对花海灌区流量进行预测,预测结果如图6所示。
图6 GWO-BP模型预测流量结果
从三种模型的流量预测结果可以看到,经验公式模型的预测效果最差,尤其体现在峰值上,这是因为渠道的糙率以及坡度是影响预测结果的重要参数,然而工程实际中这两个参数往往不容易精确测量,故导致通过该方法得到的测流结果不够理想。BP神经网络模型和GWO-BP模型均能对灌区流量进行有效预测。而GWO-BP模型对峰值的预测效果更加接近真实值,误差分布也更加均匀,详细的评价指标汇总见表1。
表1 评价指标
灌区流量是水资源合理分配的重要依据,因此快速准确地流量预测具有重要意义。从表1可以看出,GWO-BP模型的精度是最高的,使用GWO优 化BP后R2提 高0.054,RMSE减 少0.044,MAE减少0.029,MAPE减少0.003。最终可以得出结论,使用灰狼优化算法能够有效提高BP神经网络模型的准确性。
4 结语
本文采用灰狼优化算法与单一的BP神经网络模型相结合,构建了GWO-BP模型。将该模型应用在花海灌区流量预测中,并与传统的经验公式模型以及BP神经网络模型进行了比较。就结果而言,在进行灌区流量预测时,本文实验充分证明了使用GWO优化BP模型是有效的,其决定系数R2高至0.972,均方根误差RMSE低至0.059。综上,GWO-BP模型是对灌区流量预测问题研究体系的强力补充,在一定程度上补足了现有研究的不足,同时也能为花海灌区流量预测精度提升提供必要的参考依据。