APP下载

基于人工神经网络模型的丽江黑龙潭泉群断流预测

2020-11-06李恒丽李保珠

中国水运 2020年7期
关键词:人工神经网络

李恒丽 李保珠

摘 要:位于云南省丽江市古城区的黑龙潭泉群,在降雨偏少时会发生季节性断流,特别是近年来由于降雨减少,人为活动增多,泉群断流情况越来越严重,断流次数逐渐增多、时长也增长,以致丽江市从“高原姑苏”变成严重缺水的城市,直接影响了丽江市的形象,制约其社会经济的发展。因此对黑龙潭泉群进行动态研究与断流分析预测,对于丽江市的发展、地下水资源的利用具有重要意义。本文采用人工神经网络方法分析黑龙潭泉群降雨量与流量的变化,应用python语言及相关库分析,计算黑龙潭降雨量与流量的相关性系数,利用matlab人工神经网络方法预测黑龙潭泉群的出水量及判断是否断流。模型模拟及预测结果较好,与实际值相差无几,能较好地预测流量的变化趋势及断流结果。

关键词:人工神经网络;流量预测;断流预测

中图分类号:TP183                  文献标识码:A            文章编号:1006—7973(2020)07-0149-04

1 引言

黑龙潭泉群位于丽江盆地东北部的象山山麓,九子海复向斜南部翘起端,泉群出露于三叠系北衙组中上段裂隙发育的灰岩、白云质灰岩中。泉群地下水类型为炭酸盐岩裂隙水,补给来源主要是大气降水,其次还有冰雪融水、基岩地下水、河流渠道水等,地下水补给来源十分丰富,使黑龙潭泉群拥有较大的出水量[1~4]。黑龙潭泉群为丽江古城提供生活、景观及服务业用水,其流量的变化直接关系到丽江市民的生活状况。但上世纪八十年代以来,其发生过多次断流,给丽江的生产、生活各方面造成了巨大的影响,所以其流量的稳定性及提前预测具有重要意义[5,6]。

目前研究发现,对黑龙潭泉群流量的主要影响因素为:水源补给区域的降雨量、城市用水量、植被退化与地下水开采。其中降雨量为最主要因素,降雨量减少导致渗入地下的水流减少,最终造成黑龙潭断流[7]。目前对黑龙潭流量的研究论文也有很多,但主要仍停留在定性分析上,只是研究了大体的影响因素及如何作用还有一些统计学数据;对流量的定量研究仍处于初步阶段,很多模型都没有尝试过,当然,对其进行定量研究时,整个系统的周期性可能不是按整月的,而数据统计时都按整月统计,造成了变化不一致等;还有整个系统的响应并不是线性的,自变量较多及存在很多潜在因素的影响等造成系统建模难度增大。而利用传统的GMS进行建模分析时,需要钻孔钻探试验确认地下含水层的厚度、顶底板,各处的渗透系数等,而这些数据因为各方面的原因都没进行实验采集,所以该方法也很难进行。

在这种模糊条件过多,响应为非线性,各因素的影响系数未知的系统中,最合适的研究方法为人工神经网络。该方法在确定主要影响因素的情况下,可以将所有影响因素作为自变量导入,将要研究的对象作为因变量,让计算机自动寻找规律,而且如果对结果不满意可以多次训练模型或者调整参数、自变量等,使结果最终符合预期目标,达到良好的预测效果。利用python先分析出各月降雨量、井水位与流量的相关性,确定主要影响因素,然后用matlab的神经网络工具箱,代入所有影响因素跟是否断流后,训练模型,再用新数据检验模型,不断调整参数,当效果达到预期后最终导出模型。

2 主要影响因素的确定

当前能为建模提供建模基础的数据主要参考为丽江站1988~2018年每月降雨量,九子海2000~2017年每月降雨量,丽江站1992~2018年每月井水位,黑龙潭1990~2012年每月流量。由于九子海降雨量太小,为间接影响黑龙潭流量因素且与黑龙潭流量数据的时间重合度太低,暂时不作为因素考虑。为了宏观地观察丽江站降雨量、丽江井水位与黑龙潭流量的关系,先绘制出重合时间内三者的趋势图。由于井水位的数据级别太小,为方便观察,将其扩大400倍与降雨量跟流量比较。

图1明显表明:流量与井水位保持同步变化,当井水位上升时流量随之上升,且时间刻度上保持一致,未见滞后性。而降雨量与流量整体趋势也相同,但图上也很明显有时间差,当降雨量到达最大值时,往往过二至三个月,流量才达到最大值,由此猜测本月丽江降雨量并不会对本月流量产生影响,而是影响两到三月后黑龙潭的流量。

为了验证以上猜想,需要计算降雨量与流量的相关性系数。

经计算,本月流量与本月降雨量相关性系数为-0.166067,与往前一个月为0.110125,与往前两个月为0.333704,与往前三个月为0.449788,与往前四个月为0.456936,本月流量与本月井水位的相关性系数为0.938674。很明显,相关性系数的计算结果与假设相符。

由于表中所有数据都是基于时间序列的离散型数据,且流量与本月降雨,前月降雨相关性系数太低,由此利用传统的分析方法,假设流量的变化量与前2、3、4月降雨量存在相关性。将本月流量与前月流量作差,得到流量的变化量。由于多元自变量不方便分析,同时为了均衡多个月份降雨量对流量的影响,现计算多个月流量的平均值与流量的相关性,然后选取相关性最大的作为单一自变量。

经计算,本月流量与前2、3月降雨量平均值的相關性系数为0.435440,与前3、4月份为0.503288,与前2、3、4月为0.503063。因此此处选择相关性系数最大值作为自变量,即前3、4月份的平均降水量。由此,将前3、4月份的平均降雨量作为自变量,将流量的变化量作为因变量进行线性分析并绘制出分布散点图。

图2中纵坐标为本月相对于上月的流量变化量,横坐标为本月前3、4月的平均降雨量,图中直线为基于最小二乘法的线性回归线。很明显,分布呈现很大的离散性,即表明相同或相近的降雨量所导致的流量变化差异很大,如前3、4月平均降雨量在1500mm左右时,本月流量的变化可能几乎不变,也可能上升800mm。另外,点的分布也并未与任何规律曲线(二次或三次曲线)相符,由此,并不能基于此建模。

由以上推论,降雨量不能作为影响流量的单一变量,而井水位与流量的相关性系数比较大,所以可以将上个月的井水位作为一个影响因素。另外,从原理上分析,也是在降雨后,雨水渗入地下,三个月以后才影响黑龙潭泉群流量,而雨水降落后渗入地下,优先会作用表现在井水位上,然后井水位上升后,再体现在流量的变化上。且井水位可以看成是降雨量与流量双重作用下长期累积的结果,其承担着降雨量转化为黑龙潭流量的枢纽关系,所以应将其看成是影响流量的重要因素。另外,前一个月流量也必然影响着本月的流量,因为流量都是基于前一个月的流量在变化着的,例如,上月流量很大,但前几个月降雨量都很小,流量必然会降低,这种降低是基于前个月的流量下的,却不会因为降雨量减少而突然断流。上个月流量较大时,即使降雨量很小,断流的几率也几乎为零。最后,由于每年降雨量,蒸发量,农业灌溉等也是周期性的,所以将月份纳入到影响因素也很有必要。由此,初步确认了所有的自变量即影响流量的所有因素:前月流量,前月井水位,月份,往前三个月,往前四个月与往前五个月的降雨量。

3  MATLAB神经网络分析

人工神经网络是模仿人脑工作原理设计的计算模型,它由多个节点互相连接组成,能对数据的复杂关系进行建模。节点间的连接都被赋予不同的权重,权重的含义是一个节点对另一个节点的影响大小。每个节点表示一个特定的函数,其他节点传来的数据到达该节点后会进行相应的权重计算,输入到一个激活函数中并计算新的值。从系统的角度上看,人工神经网络是由大量的神经元经过复杂的连接构成的自适应非线性动态系统。一个两层的神经网络就可以逼近任意函数,所以,只要有足够的神经元和训练数据,人工神经网络可以学到很多复杂的函数。

流量的预测是一个复杂的非线性系统,这个系统的真正状态方程必然是由很多微分方程组成,同时系统又包含了很多的未知情况,有很多隐藏的因素作用在系统上,而且支持整个系统的理论也有很多需要深究之处。综上,要想用数学方法准确建模是十分困难的,因此,可以尝试用神经网络来表达这个复杂的非线性系统。

将整个系统看成是一个黑箱,所有影响因素作为系统输入,把是否断流作为输出,最终整个系统也就是成为了一个二分类问题。通过所有的统计数据神经网络,不断地调整优化后,使得该网络有了能表达该未知系统的能力,这个神经网络也就能预测系统输出了。

此处使用MATLAB的神经网络工具箱对其进行分析,该神经网络是一种多层前馈神经网络,该网络最大的特点就是信号前向传播,误差反向传播,每层的神经元状态只会影响下一层的,如果输出层达不到期望的输出,就会把误差进行反向传播,调整神经网络的权值与阈值,最终使神经网络的输出不断逼近预期值。神经网络的训练过程包含以下几个步骤:

(1)初始化神经网络:根据系统的输入输出值(X,Y)大致推出网络输入层节点数n、隐含层节点数   ,输出层节点数m,初始化输入层、隐含层和输出层神经元之间的连接权值ωij,ωjk,初始化隐含层阈值α,输出层阈值b,给定学习速率和神经元激励函数。

对于预测断流,将是否断流看成是一个二分类问题,将断流定义为0,未断流定义为1,而神经网络所有的预测并不会完全确定各月是否断流,而是计算出一个概率,该概率值介于0与1之间,预测结果的数据越接近1就表示越不会断流,越接近0,即表示断流的概率越大。

将丽江站降雨量,月份,黑龙潭上月流量,上月井水位作为自变量,设置神经网络的隐藏层深度为8层,设置训练集为90%的总体样本数,验证集为5%的总体样本数,测试集为5%的总体样本数,对本月是否断流进行分析。在对神经网络进行多次调整并重新学习后,训练出了预测准确率较高的模型。用该模型重新预测全部月份的断流情况,总数据量为237个,預测断流的准确次数为227次,准确率达到了95.78%,而且在预测会断流而实际未发生断流时,该月实际流量也已经很低了,接近于断流状态。实际发生了断流却未预测成功的只有一次。截取所有数据中1995年的情况,表1中列出了该年每月的实际流量,实际是否断流,预测的断流情况。

表1对1995年6、7两月的断流已经准确地预测出来了,但对5月的预测有误差,预测该月断流的概率较大,但实际还有流量。从实际情况来看,却也不能认为预测错误,因为从流量来说,该月的流量已经很低了,可能该月月底也已经断流了,实际也需要采取补水措施。综上,该模型已经能对断流提供良好的预测能力,能够指导进行提前预防控制了。

4 结论

(1)经计算得出,黑龙潭泉群流量与降雨量的相关性系数最大的月份为本月往前三、四月:与往前三个月降雨量为0.449788,与往前四个月为0.456936,另外本月流量与本月井水位的相关性系数为0.938674。由此得出:①流量与井水位基本保持同步变化,当井水位上升时流量随之上升,未见滞后性;②本月丽江降雨量并不会对本月流量产生影响,而是影响三到四月后黑龙潭的流量。

(2)前几月平均降雨量与本月流量相关性系数计算中,得出前3、4月份平均降雨量相关性最大,为0.503288。而将前3、4月份的平均降雨量与流量的变化量进行线性分析,发现准确性太差,从而得出降雨量不能作为影响流量的单一影响因素,并且综合分析初步确认了所有的影响流量的所有因素:前月流量,前月井水位,月份,往前三个月,往前四个月与往前五个月的降雨量。

(3)通过人工神经网络建立的模型已经能较准确地预测是否断流,能使用MATLAB中建好的模型对是否断流进行指导性的预测;本文通过选取黑龙潭泉群1992年到2011年降雨量与出水量数据的90%搭建人工神经网络,用该模型预测剩余10%的情况,结果与预期目标相符。

(4)通过人工神经网络模型如果有更多的数据进行训练,预测的准确性和通用性将会大大提高,所以可以将以后统计的实际数据纳入到训练样本中,从而提高生产力。对于预测到断流,该给黑龙潭补多少水的问题,由于没有补水对流量影响的试验数据,所以很难给出参考,需要进行相关实验及相关的地质考察后,才有条件模拟出。

参考文献:

[1] 康晓波,张华,王波. 丽江黑龙潭泉群水文地质特征及断流的影响因素分析(云南省地质环境监测院)[C].岩溶水文地质研讨会暨第十八届全国洞穴学术会议,2012.

[2] 周友妹.丽江古城黑龙潭泉水断流原因分析[J].人民珠江.2015(01):54-58.

[3] 和菊芳,方金鑫.丽江黑龙潭泉水动态变化与降水关系初探[J].中国农村水利水电. 2019(08): 26-27.

[4] 谭乃元,张丽芳.丽江黑龙潭泉水断流初探[J].城市建设, 2012(17).

[5] 李豫馨,许模,高伟,漆继红. 基于时间序列方法预测丽江黑龙潭泉域流量[J].人民珠江, 2016(3):6-9.

[6] 李豫馨.基于时间序列分析的丽江黑龙潭泉域动态研究[J].成都理工大学,2016.

[7] 曾成,杨睿,杨明明,胡君春,武贵华,樊宇红 .丽江市黑龙潭泉群断流的人工神经网络模拟[J].中国岩溶, 2013(04) P391-397.

[8]王小川,史峰,郁磊,李洋编著. MATLAP神经网络43个案例分析[Z]. MATLAP 技术论坛.

[9] 陈明编著.MATLAP神经网络原理与实例精讲[Z].

猜你喜欢

人工神经网络
基于人工神经网络的故障诊断专利浅析
人工神经网络发展历史与训练算法概述
基于人工神经网络的优化配置研究
基于人工神经网络的地震电场卫星数据异常识别
ANN、ANFIS和AR模型在日径流时间序列预测中的应用比较
人工神经网络在旅游人数预测中的应用研究
中国房地产上市公司治理状况预测
浅析人工神经网络在汽车轮轴松旷间隙检测中的应用
基于改进隐马尔科夫模型的畜禽全基因组关联分析中的多重检验方法
基于人工神经网络的经济预测模型