联合EEMD 与BP 神经网络的灌区水源情势预测研究
2020-10-28李雯晴王丽霞吴小宏
李雯晴 ,刘 招, ,王丽霞,李 强,吴小宏
(1.长安大学 水利与环境学院,西安 710054;2.长安大学 旱区地下水文与生态效应 教育部重点实验室,西安 710054;3.长安大学 水与发展研究院,西安 710054; 4.长安大学 地质工程与测绘学院,西安 710054;5.泾惠渠灌溉管理局,陕西 三原 713800)
0 引 言
水是农业的命脉。水源情势对依赖引水灌溉的大型灌区而言,是直接关系到农业生产和粮食安全的重大问题,历来受到地区和国家的高度重视。人类社会进入21 世纪以来,气候条件变化和人类活动加剧,对原有的水文规律带来了巨大冲击,河川径流锐减、洪水频发、区域地下水大面积疏干[1]。【研究意义】水资源规律的改变给工农业用水及区域水资源管理带来了诸多问题,尤其对干旱半干旱地区的广大灌区而言,深入探讨水源情势与灌溉需水规律,确保粮食生产安全是一项紧迫而重要工作。
水源形势的改变对区域水资源利用带来新的问题和挑战。【研究进展】近年来,许多专家学者对区域水源形势与水资源可利用量进行了大量研究[2-5],包括对水沙变化规律[6]、流量与水沙过程响应关系[7]、水沙规律预测[8]、地表水资源可利用量潜力[9]等问题的研究。采用了滑动平均[10]、Mann-Kendall 秩次相关检验法[11]、BP 神经网络[12]、Copula 函数[13]等方法。【切入点】在前人对水源情势的研究中,多集中于水沙演变规律这类浅层意义上的研究;对水源情势的预测多采用BP 神经网络这种单一的方法,与其他方法如EEMD、小波分析等结合研究较少;在预测未来水源情势并同时分析水资源可利用量方面研究较少。【拟解决的关键问题】本研究尝试联合总体经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)与BP(Back Propagation)神经网络对灌区地表水源及灌溉需水进行预测,分析未来情景下渠首引水和灌溉需水量间的可能关系,为缓解目前灌区水资源矛盾、高效利用和管理水资源、保障农业生产安全提供技术支撑及参考。
1 材料与方法
1.1 研究区概况
1.1.1 灌区概况
泾惠渠灌区位于陕西省关中平原中部,其前身即为我国古代三大水利工程之一的郑国渠。泾惠渠灌区灌溉面积9.69 万hm2,辖西安、咸阳及渭南地区的6 县48 个乡镇,总人口118 万人。粮食作物以小麦、玉米为主,经济作物以蔬菜、果树为主,是陕西省重要的农产品生产区[14]。据泾惠渠渠首——泾河张家山站实测年径流量数据显示,灌区地表水源的泾河径流泥沙呈现出明显的递减趋势[15],多年平均实测径流量从20 世纪60 年代的17.15 亿m3下降到20 世纪70、80 年代的13 亿m3左右,直至2000 年来的10 亿m3左右,径流衰减迅速。与此同时,由于地下水的过量开采,地下水位埋深也由1982 年的4.74 m 下降为2016 年的20 m,局部地下水埋深甚至降至 50 m 以下[16]。
1.1.2 灌区渠首泾河张家山站水文情势
张家山站历史径流数据序列如图1 所示。据泾河张家山站1970—2017 年年径流量序列分析表明,灌区渠首年径流量波动性较大,多年变化幅度为3.22 亿~20.87 亿m3,多年均值为11.85 亿m3。年径流量在20 世纪90 年代前相对平稳,但从20 世纪90 年代中期起出现明显下降趋势。进行MK 趋势检验得其Z 值为-1.52,表明年径流量为下降趋势。
图1 灌区渠首泾河张家山站历史径流泥沙数据序列 Fig.1 Historical runoff and sediment data sequence of Zhangjiashan station, canal head, irrigation area
1.1.3 灌区取用水现状
灌区渠首引水主要用于灌溉、发电和补充西郊水库。统计泾惠渠渠首多年实际引水及主要用水构成如图2 所示。由图2 可见,20 世纪70 年代,渠首总引水量约为4.60 亿m3,20 世纪80 年代后开始出现下降趋势,2005 年后维持在3.6 亿m3左右。地表水有效灌溉量均值亦呈下降趋势,从20 世纪80 年代的2.50 亿m3下降到2010 年的1.44 亿m3,约占总引水量的40%,多年平均值为1.80 亿m3,约占据总引水量49.18%。以1985 和2015 年为例,统计不同时期泾惠渠灌区地表水资源利用情况如表1 所示。
发电用水量多年平均为1.29 亿m3,占总引水量的35.24%,其余水量充蓄西郊水库,若仍有盈余时将退泄水量排至石川河。西郊水库为典型的灌区内水库,其除调蓄灌溉水资源外还供给三原县等地的工业、生活用水,有效库容0.20 亿m3。
因来水与作物需水规律不尽一致,加之水价及农民主管等因素,致使当前灌区地表水有效灌溉水量占总引水量的份额较低,引取的相当部分水量并非直接用于灌溉。一般年份,灌区灌溉总需水量均在3 亿m3以上,这就意味着灌区消耗较多地下水的同时地表水未能得以充分利用,这种情形十分不利于灌区水资源利用。同时,若泾河来水和地表水可引水量进一步降低,必然对维持良性的灌区水文生态带来较大冲击。
图2 泾惠渠渠首多年实际引水及主要用水构成 Fig.2 Actual water diversion and main water use composition of Jinghui canal head for many years
表1 不同时期泾惠渠灌区地表水资源利用情况 Table 1 Utilization of surface water resources in Jinghui Irrigation Area in different periods
1.2 基于EEMD-BP 的预测方法
为了给灌区未来水资源管理提供支撑,研究联合经验模态分解及神经网络来预测泾河未来10 a 来水。河川径流受气象、水文、水力等多方面因素影响,具有明显的随机性和复杂性。径流序列是一个典型的非线性过程,预测难度较大[17]。EEMD 是一种自适应的数据处理或挖掘方法,非常适合非线性、非平稳时间序列,可有效地提取序列中变化特征、趋势等隐含信息;BP 神经网络是基于人工神经网络所提出的误差反向传播算法,其对因果关系复杂、变化规律模糊的问题有出色的分析及递推能力[18]。将二者结合可有效发挥各自优势,大大增强对非平稳时间序列的预测能力[19]。EEMD 为解决模态混淆问题而提出,通过加入白噪音再进行分解,利用白噪音均值为0 的特性进行筛选,即可消除采用EMD方法时IMF(Intrinsic Mode Function)里夹杂2 个不同时间范围讯号的现象。EEMD 分解出的IMF 减少模态混合现象,使不同时间尺度的讯号正确分布在对应的IMF 中[20-21]。
EEMD-BP 时间序列预测模型建立思路如下:
1)利用EEMD 方法对水文时间序列进行分解,得到不同频率的IMF,并将其进行归一化处理。
2)对BP 神经网络的隐含层个数、训练速率、训练次数、控制误差等参数进行初始化设置,1973—2012 年为训练期,2013—2017 年实测数据为验证数据。将经EEMD 分解处理后的输入层与输出层数据导入并进行训练。
3)训练完成后,用训练好的神经网络对灌区渠首2018—2027 年径流泥沙量进行预测,得到不同频率预测值。
4)将不同频率的预测值进行叠加重构,最终得到预测结果。
泾河作为知名的多泥沙河流,其高含沙水流及汛期洪水无法直接利用,在对灌区渠首水源形势进行预测和分析时,这部分不能作为可用水资源来对待。因此,考虑到含沙率影响,本研究中,不仅要预测径流量,同时还应同步预测河道逐年输沙量。
1.3 模型的训练及验证
一般而言,同条河流同一站点的径流及泥沙序列自相关性较强,除此之外,含沙量同时与径流量也有较强的相依关系,即所谓“水大沙大”。研究基于上述EEMD-BP时间序列预测模型,对历史数据系列进行EEMD分解,再输入BP神经网络对分解序列进行预测,然后重构,对模型反复训练,最终将EEMD-BP神经网络与BP神经网络预测值进行对比,结果见图3。EEMD-BP神经网络模型结构和主要参数见表2。由图3可以直观看出,联合EEMD的BP神经网络与实测值拟合效果比BP神经网络拟合效果好,能够较为准确地反映真实值。
表2 EEMD-BP神经网络模型结构与参数 Table 2 EEMD-BP neural network model structure and parameters
图3 径流泥沙预测结果 Fig.3 Prediction results of runoff and sediment
EEMD-BP 模型验证期年径流及泥沙的标准均方差NMSE 分别为0.265 3 和0.307 8;平均绝对误差MAE 分别为0.9 亿m3和0.13 亿t,相较多年平均值,误差在可接受范围内;预测结果的方向变差对称值DVS 均为100%,表明预测系列的变化趋势与实测系列完全一致;决定系数R2分别为0.980 1 和0.986 2。故模型预测效果良好。
2 结果与分析
2.1 渠首径流及输沙量预测
基于1970—2017 年径流泥沙数据,利用建立好的EEMD-BP 预测模型,对2018—2027 年的灌区渠首张家山站径流泥沙进行预测,结果见图4。由图4可知,2018—2027 年的模拟期内,水沙变化较为同步,趋势均为短暂的上升后再下降。年均径流量约为11.86 亿m3,最大为16.25 亿m3,最小为8.14 亿m3;输沙量多年均值为1.00 亿t,最大2.58 亿t,最小0.29 亿t。与1996—2017 年相比,平均径流量略有上升,回升值为1.65 亿m3;平均输沙量略有下降,年均下降了0.17 亿t。
对2008—2017 年实测数据和此次预测的2018—2027 年数据的特征参数进行比对,若特征参数较为吻合,则说明预测结果基本可信。检验结果见表3。
图4 泾河张家山站未来10 年径流量输沙量序列预测 Fig.4 Prediction of runoff and sediment transport series of Zhangjiashan station in the next 10 years
表3 预测径流及泥沙系列与实测系列特征对比 Table 3 Characteristics comparison between predicted runoff and sediment series and measured series
由表3 可知,径流及输沙量预测结果与历史数据系列的特征值总体上并无明显差异。且由于径流泥沙受气候变化和人类活动影响,水文时间序列特征本身也会有一定波动。同时考虑到泾河中上游流域内水土保持和退耕还林还草工作将持续展开,流域水保及人类活动程度基本稳定,所以总体认为预测结果基本合理可信。
2.2 渠首地表水资源可利用量分析
泾河流经黄土高原,泥沙量很高。对灌区而言,这些高泥沙水流及汛期洪水一般无法取用,故其均为不可利用水量,在水资源分析时应予以剔除。在灌区实际生产中,考虑到渠道冲淤等限制,实际灌溉引水控制含沙量不应超7%,在持续干旱等特殊情况下可有所放宽,但含沙量仍不可超过10%。此外,在非汛期需要优先保证河道生态基流,在计算灌区可利用水资源量时,这部分亦应予以扣除。采用式(1)来估算渠首水资源可利用量[9]。计算式为:
式中:Wa为水资源可利用量;Wt为年径流量;We为非汛期河道最小生态需水量;Wu为汛期不可利用水量。单位均为108m3。
计算非汛期河道最小生态需水量采用常用的基于水文学的Tenant 方法,在枯水季,即10 月—次年5 月,最小生态流量按多年平均流量的15%来计算[9],求得We为0.734 亿m3;汛期不可利用水量包括2 部分,即汛期洪水和高泥沙径流。而由于水文不确定性,这2 部分在各年份情况差异较大,较难进行准确计算。事实上,如前述分析,泾河河道洪水与泥沙含量相关关系较为密切,高泥沙水流多由上游暴雨洪水所致,因此这二者可以合一考虑[22]。本文统一采用汛期水流含沙量这一指标来推算汛期不可利用水量。为此,需先求得各年份汛期径流量,基于年径流及汛期径流历史数据,进行回归分析,最终求得相关关系较好的二次多项式回归方程,其相关系数r 为0.89:
式中:Wf为汛期(每年6—9 月)径流量。
因泾河汛期来沙占据全年来沙量的97%以上,故本文不考虑非汛期输沙。根据汛期径流量及预测的沙量即可求得汛期水流平均含沙量Cs,如表4 所示。再依据历史数据,统计汛期弃水与平均含沙量关系,通过回归分析求得二者相关关系较好的关系式,相关系数r 为0.86:
求得We和Wu后,即可利用式(1)计算得到渠首逐年水资源可利用量,结果如表4 所示。
表4 基于预测的泾惠渠灌区渠首地表水资源可利用量分析 Table 4 Analysis of available quantity of surface water resources at the head of canal in Jinghui irrigation area based on prediction
3 讨 论
EEMD 非常适合非线性、非平稳时间序列,可有效地提取序列中变化特征、趋势等隐含信息,BP神经网络对因果关系复杂、变化规律模糊的问题有出色的分析及递推能力,将二者结合可有效发挥各自优势,大大增强对非平稳时间序列的预测能力。未来泾惠渠灌区渠首可利用水资源量相对比较平稳,平均值约为7.79 亿m3,这较目前略有上升。主要是由于泾河泥沙呈下降趋势,来水变清,在一定程度上提高了水资源可利用率。事实上,近年来泾惠渠灌区渠首年均引水量约为3.6 亿m³,从预测结果看来,若灌区引水需求无大的变化,基本可以满足未来几年的地表水资源需求。2019—2027 年最大可利用量为2021 年的11.25 亿m3,最小为2023 年的4亿m3左右,在2023 年应当注意灌区水资源的调蓄和有效利用,谨防发生缺水减产问题。此外输沙量的预测值对水资源可利用量影响较为显著。尽管年预测值最大的2019 年径流总量达16.26 亿m3,但其泥沙预测值也较高,致使不可利用水量达7.3 亿m3,而可利用水资源量为8.22 亿m3,尚不及径流量相对较小的2020、2021 和2025 年。
由于渠首及引水工程有确定的设计标准,上述计算的可利用水资源量并非完全可为工程所用。泾惠渠灌区渠首的设计引水能力为50 m3/s[14],若不考虑水库调蓄,当河道流量超出这一值时无法被工程利用。因此实际工程可利用量并非河道水资源可利用量,只有不超出引水能力的河道水量才是渠首工程的可引水量。
4 结 论
1)建立的EEMD-BP 模型预测年径流及泥沙效果良好。二者标准均方差NMSE 分别为0.265 3 和0.307 8,平均绝对误差MAE 分别为0.9 亿m3和0.13 亿t,误差在可接受范围内,预测系列的变化趋势与实测系列完全一致,决定系数R2分别为0.980 1 和0.986 2;
2)灌区渠首未来2019—2027 年均径流量约为11.87 亿m3,较1996—2017 年略有上升,年均输沙量约为1.00 亿t,较1996—2017 年略有下降,预测结果延续了泾河水沙多年变化的大致趋势;
3)灌区渠首2019—2027 年可利用水资源量相对比较平稳,平均水资源可利用量约为7.79 亿m3,这较1996—2017 年可利用量略有上升但相差不大,在灌区引水需求无大的变化条件下,基本可满足未来引水灌溉需求,但应注意一些干旱年份水资源的调蓄和有效利用,谨防发生缺水减产问题。