半分布式耦合BP神经网络洪水预报模型研究
2017-03-22王竹
王 竹
(辽宁江河水利水电新技术设计研究院,沈阳 110000)
1 研究区域概况
大伙房水库位于抚顺市东郊浑河中游,水库坝址以上控制流域面积5 437 km2,坝址以上流域降水均值为79.24 mm,年均降水最大值为1 201.5 mm;坝址以上断面平均径流量14.7 亿m3;坝址处多年平均径流量15.6 亿m3;水库设计洪峰流量15 000 m3/s,设计洪水总量20.2 亿m3。
目前大伙房水库现有洪水预报模型为大伙房模型(DHF),该模型是集总式模型。在实际预报中由于其集总式的特性而不能考虑水文过程,对各支流的流量及水位等不能有效描述[1-3],而且参数的选择上一直通过优选法选定或人工试错法确定,并需要实时校正,而参数率定的准确性对预报精度有着较大影响,因此对率定工作的经验性要求较高,且工作也较为繁琐,率定效率较低。因此针对大伙房流域现状和原有大伙房模型其集总式模型的不足,并以提高预报精度为目标,本文建立了一种耦合式BP神经网络的子流域单元型半分布式水文模型,该模型一方面不仅可以优化参数率定过程,且由于耦合了大伙房模型,使模型不因应用智能算法变成简单的黑箱模型,因此在理论层面上使模型更为完善;另一方面由于该模型的半分布式特点,使得其对各子流域的防洪、洪水预报以及水资源配置调度方面都产生了积极影响。
2 耦合式半分布BP神经网络洪水预报模型的构建
所建模型是一种融合大伙房模型、BP神经网络以及遗传算法的半分布式耦合BP神经网络洪水预报模型,研究表明一个3层的BP神经网络足以实现任何复杂的映射问题[4],因此该模型选用3层网络。为便于后文叙述这里将该模型命名为DHF-GA-BP神经网络模型,基本结构如图1所示。模型整体上可以分为两个部分,第一部分是大伙房模型计算各个子流域的出口流量,第二部分采用BP神经网络模型将各个子流域的出口流量演算到输出层,即计算出流域总出口流量。
图1 BP神经网络与大伙房模型的耦合模型结构Fig.1 Coupling model structure of BP neural network and the DHF model
图中xn表示流域平均降雨量;Qn表示各个子流域的大伙房模型预报流量值;Q为流域总出口即入库的流量值。
首先子流域内的流量预报时应用大伙房模型,此时要对大伙房模型进行参数率定,确保其可以应用于各个子流域,方法上采用遗传算法,以此提高参数率定效率;其次,在入库流量预报中应用BP神经网络时,利用遗传算法对其初始权重进行优化,使网络加速收敛,并提高精度保证运行效率。
2.1 流域区域划分
本文选用子流域单元型半分布式水文模型为依据建立洪水预报模型,因此需要对研究流域进行单元划分。分区时以距离各个水文站最近的自然流域分水线为界,本文应用ArcGIS,采用DEM数据进行流域单元划分。对大伙房坝址以上流域划分划分结果如图2所示。
2.2 遗传算法率定大伙房模型参数
传统上,大伙房洪水预报模型的模型参数是通过优选法选定或人工试错法确定的,且需要实时校正,这对率定工作者的经验性要求较高。遗传算法借鉴了自然选择和遗传机制的理论[5],以一个种群的所有个体为对象,将生物进化过程中适者生存规则与染色体交换机制有效地结合起来,利用随机化技术对一个编码参数空间进行高效搜索,在搜索过程中能自动获取和积累在此期间产生的空间知识,被认为是一种高效的全局寻
图2 大伙房坝址以上流域分区图Fig.2 The watershed partition map of above dam of Dahuofang reservoir
优方法。为避免人工率定带来的主观因素的干扰,提高工作效率,本文应用遗传算法实现对模型参数的智能率定。
遗传算法目标函数选用预测值与实际值的绝对误差,具体形式为:
F=∑ni=1|QC-Q0|
(1)
确定模型中各项参数为:进化代数为40;种群规模设定为30;交叉概率pc选为0.7;变异概率pm选取为0.01。
本文中需要率定的参数为g、B0、K0、KW、N、AA、DD、CC,共8个,其中g为不透水面积占全流域面积之比值;B0为特征河长比例系数;K0为汇流曲线底宽指数;KW为衰减系数;N为底宽比例系数;AA、DD、CC为壤中流汇流曲线参数。此处选择1985年的2场连续的场次洪水分别对三个子流域应用的大伙房模型参数应用Matlab中的遗传算工具箱法进行率定,两场洪水的洪水编号分别为19850802和19850804,三个子流域的模型参数率定结果如表1所示,两场洪水各子流域的预报结果如表2所示,预报洪水过程线与实测洪水过程线的对比如图3至图5所示。
结合图表可以看出,3个子流域的模型参数率定效果较好,各子流域的两场洪水确定性系数均在0.8以上,洪峰流量相对误差绝对值控制在10%以内,洪水总量相对误差绝对值控制在15%以内,均能够满足预报需求。
3 子流域内流量预报
子流域内流量预报不仅是入库流量预报的基础,也是对各子流域大伙房模型参数率定结果的检验。根据所率定好的参数,分别对三个子流域应用大伙房模型进行洪水预报,选1975年至2010年间的12场洪水,分别在各个子流域应用大伙房模型进行洪水预报,各子流域的预报成果如表3所示,并且选用洪水编号为20100819与20100826的两场洪水观察其预报值洪水过程线,如图6至图8所示。
表1 各子流域参数率定结果Tab.1 The results of the parameters of the sub Basin
表2 各子流域大伙房模型预报结果(率定期)Tab.2 Forecast results of DHF model for each sub basin (Calibration stage)
图3 Ⅰ区率定期洪水过程Fig.3 Calibration stage flood process inⅠArea
图4 Ⅱ区率定期洪水过程Fig.4 Calibration stage flood process inⅡArea
图5 Ⅲ区率定期洪水过程Fig.5 Calibration stage flood process inⅢArea
序号洪水编号降雨历时(时段数)区域单位时段内流域平均降雨量/mm实测洪峰流量/(m3·s-1)实测洪量/万m3预报洪峰流量相对误差/%预报洪量相对误差/%峰现时间误差(时段数)确定性系数11975072924Ⅰ区9.18141016731.04-0.81-3.1010.70Ⅱ区9.56161019070.1324.1030.4500.43Ⅲ区9.73496.55151.27-3.52-17.7100.6421985073014Ⅰ区1.421191307.63101.0500.63Ⅱ区2.381511455.864.64-2.1910.89Ⅲ区1.0915.8182.743.803.9300.5331985081312Ⅰ区8.506113284.9671.96-6.3400.92Ⅱ区8.56871.6673546.490.151000.95Ⅲ区8.44221923.78010.1500.9041985081810Ⅰ区6.16519.672965.610.612.3710.96Ⅱ区8.3410304262.2203.13-10.98Ⅲ区8.36273.81522.51-0.668.68-10.9152008073116Ⅰ区3.7490.8688.560.44-2.8710.97Ⅱ区3.15150844.342.00-2.6410.93Ⅲ区3.92.6690.951.30-2.9010.9762009071931Ⅰ区3.261161726.83-4.74-6.98-10.96Ⅱ区3.521953013.501.503.5010.97Ⅲ区2.5716283.45-18.12-7.3000.9572010071927Ⅰ区3.382221514.810.906.4000.97Ⅱ区4.332252806.2115.207.6600.96Ⅲ区4.021401534.055.20-1.7010.958201007268Ⅰ区3.23154.16542.643.793.6000.70Ⅱ区8.485971124.71-7.90-13.6000.93Ⅲ区6.77126518.023.34.8000.929201007319Ⅰ区9.7615505942.496.711.5010.20Ⅱ区16.113172.41318417.6023.600.26Ⅲ区12.365531489.86-3.60-9.7000.95102010080815Ⅰ区2.593073047.411.275.7410.85Ⅱ区3.65574806-5.210.6800.85Ⅲ区2.4170.8467.05-1.13-0.0700.85112010081929Ⅰ区4.918538653.9219.118.1410.68Ⅱ区5.2277011783.9141.567.6720.57Ⅲ区4.792662281.8430.8317.8200.68122010082627Ⅰ区3.1553610125.5410.823.2810.88Ⅱ区3.55908127118.815.4410.90Ⅲ区3.132022325.508.9118.3800.84
观察表3中数据结果可以看出,经过参数率定的大伙房模型应用在各个子流域中时,虽有明显的峰现时间提前或错后现象,但仍能满足预报需求;对于合格场次的洪水,其洪峰流量以及洪水总量的相对误差大多能保证在10%以内。根据水文情报预报规范(SL250-2000)[6],Ⅰ区甲级预报为5场、乙级预报为2场、丙级预报4、不合格预报均为1场,合格率为91.7%,模型整体预报水平属于甲级预报;Ⅱ区甲级预报为6场、乙级预报为2场、丙级预报1、不合格预报均为3场,合格率为75%,模型整体预报水平属于乙级预报;Ⅲ区甲级预报为6场、乙级预报为3场、丙级预报3场、不合格预报0场,合格率为100%,模型整体预报水平属于甲级预报。
观察图6至图8可知,经过参数率定的大伙房模型对各个子流域预报时,在降雨起始的几个时段内,流量较低值预报效果较好,洪峰流量与之后的退水预报情况不佳。
对于以上情况,分析表3中乙级预报与不合格预报的水文资料,发现不合格场次洪水有两个特征:①降雨历时短,且单位时段内流域平均降雨量小,这会导致实测流量变化不大,且截取的流量范围小,数据不够分散,以至于关于实测流量值的总离差平方和较小,因而即使预报较准确的洪水(每个时段的预报值的相对误差均控制在5%以内)时,确定性系数却仍较小,Ⅰ区和Ⅲ区洪水编号19850730的场次洪水就属于这个范畴;②降雨历时较长,且单位时段内流域平均降雨量较大,有骤然降雨,流量走势徒增的现象发生,这时模型预报不准确,三个子流域的洪水编号20100819的场次洪水就属于这个范畴。总结上述两点得出,流域总平均降雨量的大小是影响模型预报精度的主要原因:当总流域平均降雨量大致在[26,138]这个区间内时,预报结果为甲级或者乙级,预报较为准确;当其小于26或大于138时,预报误差将会增大。
图6 Ⅰ区检验期洪水过程Fig.6 Inspection stage flood process in ⅠArea
图7 Ⅱ区检验期洪水过程Fig.7 Inspection stage flood process in Ⅱ Area
图8 Ⅲ区检验期洪水过程Fig.8 Inspection stage flood process in Ⅲ Area
再结合上述检验期图表,进一步研究发现,预报流量的大小也会影响模型的预报精度,即预报的洪峰流量超过1 000 m3/s时,预报精度下降,而且可能导致预报不合格的现象发生,最为典型的就是Ⅰ区和Ⅱ区的20100731号洪水。
4 入库流量预报
4.1 数据筛选
对于构建神经网络,在选择输入数据时应尽量做到其是对输出有显著影响的因子[7],因此本文采用逐步回归分析法将初选出的输入数据进行再次筛选,将其中对目标输出影响显著的数据筛选出来,从而提高模型精度,避免因输入过多而产生的过度拟合,即过适应现象[8]。
经分析初步选择全流域平均降雨量、Ⅰ至Ⅲ区出口断面实测流量以及入库断面实测流量,它们中除全流域平均降雨量不包含当前时刻之后3 h时刻数据外,均包含当前时刻数据、当前时刻之前3 h时刻、6 h时刻、9 h时刻的数据以及当前时刻之后3 h时刻数据,以上五组共24个因子。对于这24个因子除入库断面当前时刻之后3 h时刻流量值作为因变量外,其余的23个因子均作为自变量。入库断面最终筛选出的数据如表4所示。
4.2 建立并训练DHF-GA-BP网络
建立DHF-GA-BP网络,确定网络中的参数,建立一个输入层节点数为10,输出层节点数为1的三层BP神经网络模型,隐层学习函数为tansig函数,输入层学习函数为purelin函数,训练函数选用神经网络的默认算法,即Levenberg-Marquardt算法,样本数据及其他各参数值见表5所示。
应用遗传算法优化DHF-GA-BP神经网络的初始权重和阈值结果如下:
表4 入库断面模型数据筛选结果Tab.4 Screening results of model data for the reservoir section
表5 入库断面建立的DHF-GA-BP网络情况Tab.5 The DHF-GA-BP neural network in the reservoir section
b2=[-2.061]
式中:iw为输入层到隐含层的权重;b1为输入层到隐含层阈值;lw为隐含层到输出层权重;b2为隐含层到输出层阈值。
将上述4个初始值输入到网络中,并对DHF-GA-BP神经网络进行训练。将DHF-GA-BP神经网络模型的检验结果与大伙房模型进行对比,对比结果如表6所示。由于篇幅限制,仅将入库断面检验期洪水过程线与大伙房模型以及实际值进行对照,对照结果如图9所示。
表6 入库断面模型检验结果Tab.6 The results of the reservoir section model
图9 入库断面检验期洪水过程Fig.9 Inspection stage flood process of the reservoir section
通过表6可以看出DHF-GA-BP模型对入库洪水的洪峰流量和洪量预报精度较高,洪峰流量预报值的相对误差绝对值控制在4%以内,洪量预报值的相对误差绝对值控制在6%以内,峰现时间误差均为0,确定性系数能够达到90%以上,各场次洪水预报均达到甲级预报水平,14场洪水的预报合格率为100%,整体上该模型为甲级预报模型,可以用于正式的洪水预报。通过图9可以看出,DHF-GA-BP模型对洪水过程线的拟合效果更佳。
5 结 论
半分布式耦合BP神经网络洪水预报模型即DHF-GA-BP模型,耦合了大伙房模型与遗传算法优化后的BP神经网络模型,将网络从单一的映射关系,转变成了包含降雨径流影响的耦合模型。通过优化后的结果显示,优化效果较好,提高了网络精度且提高了运行效率,最终的入库断面预报结果显示,DHF-GA-BP神经网络模型较原大伙房模型的预报效果有所提高,提高预报效率的同时预报效果更佳。该模型弥补大伙房模型的不足之处,且其结合了大伙房模型、BP神经网络以及遗传算法的优势,并考虑了降雨的空间变异性、流域特征的不均匀性等因素对径流过程的影响。将该模型应用于大伙房水库进行洪水预报,取得了较好的成果。
□
[1] 刘金清,王光生,周 砺.分布式流域水文模型刍议[J].水文, 2007,27(5):21-24.
[2] 刘青娥,雷晓辉,王 浩,等.面向分布式水文模型的汉江流域空间离散化方法.南水北调与水利科技[J], 2009,(2):24-28.
[3] 石教智,陈晓宏.流域水文模型研究进展[J].水文, 200,(1):18-23.
[4] 朱东海,张土乔,任爱珠,等. BP神经网络用于给水管网模拟试验时的构造参数设计[J]. 给水排水, 2001,(2):10-13,1.
[5] 宋茂斌,冯宝平,张展羽.基于遗传算法的皮尔逊Ⅲ型曲线参数估计[J].中国农村水利水电, 2008,(6):52-54.
[6] SL250-2000,水文情报预报规范[S].
[7] 魏守忠,常绪正,马 健,等.影响三工河干沟春季融雪洪水发生的气象因素[J].干旱区研究, 2005,22(4):60-64.
[8] 翁明华,邓 鹏,李致家.人工神经网络模型与新安江模型的应用比较[J].水文, 2008,(6):33-35.