APP下载

基于BP神经网络的桃林口水库水质预测

2019-12-30赵林戴天骄陈亮冯琛雅刘琦赵明杰

安徽农业科学 2019年24期
关键词:BP神经网络水质预测

赵林 戴天骄 陈亮 冯琛雅 刘琦 赵明杰

摘要  为掌握秦皇岛桃林口水库未来水质变化的状况,选取总磷(TP)、硝酸盐氮(NO3-N)、亚硝酸盐氮(NO2-N)、氨氮(NH3-N)、高锰酸盐指数(CODMn)、溶解氧(DO)和五日生化需氧量(BOD5)7项指标2008—2015年8年的实测数据作为训练样本,建立BP神经网络模型对桃林口水库出库站2016、2017年7项水质指标进行预测,结果表明,该BP神经网络模型预测模拟训练后的模型预测效果良好,可以运用到桃林口水库水质指标的预测预警系统中。

关键词  水质;预测;BP神经网络;桃林口水库

中图分类号  X824    文献标识码  A

文章编号  0517-6611(2019)24-0073-05

doi:10.3969/j.issn.0517-6611.2019.24.024

Prediction of Water Quality in Taolinkou Reservoir Based on BP Neural Network Model

ZHAO Lin, DAI Tian-jiao, CHEN Liang et al

(School of Environmental Science and Engineering, Tianjin University, Tianjin 300072)

Abstract  In order to grasp the future water quality changes of Taolinkou Reservoir in Qinhuangdao, the measured parameters in 2008-2015 such as total phosphorus (TP), nitrate nitrogen (NO3-N), nitrite nitrogen (NO2-N), ammonia nitrogen (NH3-N) and permanganate index (CODMn), dissolved oxygen (DO) and five-day biochemical oxygen demand (BOD5) were selected as training samples, by establishing the BP neural network model for the Taolinkou Reservoir to predict 7 indicators of outbound station from 2016 to 2017. The results showed that the BP neural network model predicted the model after simulation training effectively and can be applied to the early-warning system of water quality index for Taolinkou reservoir.

Key words  Water quality;Prediction;BP neural network;Taolinkou Reservoir

基金項目  河北省科技项目“水质自动监测系统在地表水水库生态安全预警中的应用研究”(17273905D)。

作者简介  赵林(1961—),男,黑龙江绥化人,教授,博士,从事环境科学研究。

收稿日期  2019-05-15

水质预测是对供试水体质量作出预测,是水污染综合防治的基础工作。自20世纪中期开始,随着经济的快速发展、城市化进程的加快,水体污染问题受到广泛的关注,对水环境质量变化趋势进行预测分析工作愈加受到重视。常用的水质预测方法主要有水质模型、灰色系统理论、神经网络等[1-6]。

在人工智能算法的迅猛发展过程中,19世纪 40 年代,人工神经网络ANN(artificial neural networks)在水环境水质预测方面的应用进展迅速。采用人工神经网络方法对非线性的数据进行预测时,需要较长系列的实测水质数据,其预测结果具有很高的精确度,并具有收敛速度快、预测精度较高等优点,受到国内外专家学者们的喜爱,成为水质预测的研究重点,满足于水质预测并被广泛使用。

在我国,BP神经网络在水质模拟预测方面的应用已发展得较为成熟。袁宏林等[7]基于BP神经网络模型通过皂河上游断面水质监测数据来预测下游的水质变化,模型中各项水质指标的预测平均误差均小于6%,预测结果满足水质预测精度的要求。马正华等[8]在太湖出入湖河流水质预测研究中建立BP神经网络模型,将1996—2004年太湖的监测数据作为训练模型来预测2005年太湖的水质状况,并对2005年太湖的水质进行评价,研究结果表明太湖水质污染状况已经有所改善。郭庆春等[9]用MATLAB实现改进BP神经网络模型,建立了长江水质COD的预测模型,模拟结果表明COD的预测值与实测值的线性相关系数高达0.991,取得了良好的预测结果。高峰等[10]利用PSO(粒子群算法)优化BP神经网络模型对汾河进行水质预测,预测结果表明优化后的模型与传统的BP神经网络相比相对误差可以减小到1.46%,预测结果更加精确。张青等[11]选取pH、溶解氧、铵态氮、硝态氮、总磷和总氮作为预测参数建立BP神经网络模型对洪湖水质进行预测,并引入传统的一元线性回归模型和GM(1,1)灰色预测模型进行对比,最终研究表明BP神经网络模型预测结果明显优于它们。琚振闯等[12]利用BP神经网络模拟黄河内蒙古河段水质,利用上游监测断面COD值预测下游监测断面COD值,预测精度较高,平均相对误差为5.66%。费丹[13]选取溶解氧、高锰酸盐、生化需氧量、氨氮、总氮和总磷作为水质指标,在大伙房水库水质预测中建立BP神经网络模型,各项水质指标的相对误差小于9%,获得较好的预测效果。

该研究将秦皇岛市桃林口水库作为研究区域,建立神经网络,以桃林口水库2008—2015年监测的7个水质指标(总磷、硝酸盐氮、亚硝酸盐氮、氨氮、高锰酸盐指数、溶解氧和五日生化需氧量)数据作为训练样本,预测2016、2017年的水质情况,以此验证建立的BP神经网络是否可行,以期为秦皇岛市桃林口水库水质预测预警研究及工作提供新思路。

1  研究区

1.1  桃林口水库概况

桃林口水库位于秦皇岛市西北部,滦河支流青龙河上,于1998年建成,控制流域面积5 060 km2,总库容8.59亿m3,每年可为秦皇岛市提供1.82亿m3生活用水,为唐山、秦皇岛地区补充农业水源5.2亿m3。桃林口水库是一座具有城市供水、农业灌溉、防洪以及发电等综合效益的大型水利枢纽工程[14],其水质对青龙县乃至秦皇岛市的社会稳定和经济发展起着举足轻重的作用。

研究选取桃林口水库水源站和出库站2个监测断面水质指标数据建立BP神经网络模型,利用水源站的水质指标监测值预测出库站水质指标值。水源站和出库站的地理位置如图1所示。

1.2  研究数据

样本集数据来源于2008—2017年10年对桃林口水库水质监测的资料,对总磷(TP)、硝酸盐氮(NO3-N)、亚硝酸盐氮(NO2-N)、氨氮(NH3-N)、高锰酸盐指数(CODMn)、溶解氧(DO)和五日生化需氧量(BOD5)7项水质

指标进行预测研究。

2  神经网络原理和模型的建立

2.1  数据归一化处理

在BP神经网络数据分析之前,通常需要将数据归一化,利用归一化后的数据进行数据分析。不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据归一化处理,以解决数据指标之间的可比性,各指标处于同一数量级,以防某些数值低的特征被淹没,一般要求输入数据的值最好在0~1。原始数据经过数据归一化处理后,各指标处于同一数量级,适合进行综合对比评价,处理方法如下。

训练数据的输入数据的归一化:

[iputn,inputps]=mapminmax(input_train);

训练数据的输出数据的归一化:

[outputn,outputps]=mapminmax(output_train)。

2.2  输入变量与输出变量的选择确定

秦皇岛桃林口水库水源站和出库站2个监测断面2008年1月—2015年12月总磷、硝酸盐氮、亚硝酸盐氮、氨氮、高锰酸盐指数、溶解氧和五日生化需氧量的监测数据变化趋势分别见图2。

由圖2水源站和出库站总磷、硝酸盐氮、亚硝酸盐氮、氨氮、高锰酸盐指数、溶解氧和五日生化需氧量的监测数据变化趋势可知,水源站和出库站的水质指标监测数据变化趋势均为非线性函数,难以用数学方法建模来逼近只有一个时间变量的非线性函数,可以利用BP神经网络来表达这些非线性系统。

该研究样本数据集选取2008—2015年桃林口水库水质监测项目中的7项指标(总磷、硝酸盐氮、亚硝酸盐氮、氨氮、高锰酸盐指数、溶解氧和五日生化需氧量的监测数据)作为训练集,2016年和2017年的7项水质指标数据作为验证集。将水源站监测断面的总磷、硝酸盐氮、亚硝酸盐氮、氨氮、高锰酸盐指数、溶解氧和五日生化需氧量的监测数据作为输入变量,出库站监测断面的总磷、硝酸盐氮、亚硝酸盐氮、氨氮、高锰酸盐指数、溶解氧和五日生化需氧量的监测数据作为输出变量,对7项指标进行预测。

2.3  网络层数和隐含层的确定

根据Kolmogorov定理“对于具有一个隐层的3层BP神经网络,有足够多的隐节点数,就可以实现对任意非线性函数的逼近”[15],并且三层BP神经网络结构可以提高网络学习速度,而过于复杂的网络结构意味着过多的参数和模型精度的降低,所以该研究选择隐含层数为1的3层BP神经网络。

该研究中输入层和输出层分别为水源站和出库站7项指标值(总磷、硝酸盐氮、亚硝酸盐氮、氨氮、高锰酸盐指数、溶解氧和五日生化需氧量值),输入层和输出层神经元数都为7。

根据Komogorov定理和Hecht-Nielsen理论确定隐含层节点数为3~12,通过试错法,选择训练次数最少并且误差最小对应的神经元数,最终确定的隐含层节点数为10。故该研究的BP神经网络的拓扑结构最终确定为7∶10∶7,结构如图3所示。

2.4  选择算法

程序的实现基于MATLAB环境,对选定的样本进行学习训练。建立的BP神经网络模型的参数设定如下,训练函数采用的是自适应学习率动量因子梯度训练法,输入层与隐含层之间的传递函数为对数S型函数logsig,隐含层与输出层之间的传递函数是正切S型函数tansig。BP神经网络模型程序的表达式为:

最大迭代次数:net.trainParam.epochs=5 000;

期待误差:net.trainParam.goal=0.000 1;

学习速率:net.trainParam.lr=0.000 1;

学习目标:net.trainParam.goal=0.000 04。

3  模型预测及分析

采用已经训练好的BP神经网络模型对桃林口水库出库站2016年和2017年的7项指标(总磷、硝酸盐氮、亚硝酸盐氮、氨氮、高锰酸盐指数、溶解氧和五日生化需氧量的监测数据)进行预测,水质模型计算结果实测值和BP神经网络预测值的对比如图4所示,7项指标(总磷、硝酸盐氮、亚硝酸盐氮、氨氮、高锰酸盐指数、溶解氧和五日生化需氧量的监测数据)的线性回归方程如图5~11所示,训练及预测检验结果如表1所示。

由图4可知,BP神经网络模型对于各项水质指标预测值和实测值的重合度是较高的,趋势一致,偶有偏差,但是从整体上的趋势可以看到重合度很高,BP神经网络模型对各项水质指标的拟合结果较为理想。

该研究以5个评价参数来分别评估该BP神经网络模型的效能:R2、r、RMSE、NSE和Pearson相关系数。

RMSE:均方根误差,是预测值与实测值偏差的平方和与监测次数n比值的平方根,是用来衡量预测值和实测值之间的偏差。

RMSE=(Xi-i)2n(1)

式中,Xi为实测值(mg/L);i为BP神经网络模型预测得到的预测值(mg/L)。

NSE:納什效率系数,一个用于评价模型质量的评价参数,常用于水文领域模型的效能评价。NSE取值为负无穷至1,NSE接近1,表示模型质量好,模型可信度高;NSE接近0,表示模拟结果接近实测值的平均值水平,即总体结果可信,但过程模拟误差大;NSE远远小于0,则模型是不可信的。

NSE=1-Tt=1(Qt0-Qtm)2Tt=1(Qt0-0)2(2)

式中,Q0为实测值;Qm为BP神经网络模型预测得到的预测值;Qt为第t时刻的实测值;0为实测值的总平均。

由图5~11可知,判断系数R2均在0.70之上,总磷、硝酸盐、亚硝酸盐、氨氮和溶解氧的判断系数R2均在0.90以上;相关系数r均在0.84以上,总磷、硝酸盐、亚硝酸盐、氨氮和溶解氧的相关系数r均在0.98以上,说明模拟值和实测值具有较好的相关性,氨氮和五日生化需氧量的实测值和预测值相关性略低。由表1可知,总磷、亚硝酸盐、氨氮、溶解氧和五日生化需氧量预测值的RMSE值都小于0.1,硝酸盐和高锰酸盐预测值的RMSE值都小于0.2;总磷、硝酸盐、亚硝酸盐、高锰酸盐、溶解氧和五日生化需氧量预测值的NSE值都大于0.99,氨氮预测值的NSE大于0.90,表示模型质量好,模型可信度高;利用SPSS求得各项水质指标实测值和预测值的Pearson相关系数,结果表明各项指标的实测值和预测值在置信度为0.01时相关性皆是显著的。

5项评价参数R2、r、RMSE、NSE和Pearson相关系数的计算结果都表明该BP神经网络模型的各项指标的预测结果完全符合水质预测的要求。这说明该文建立的BP神经网络水质预测模型可以对桃林口水库水质进行有效预测。

4  结论

该文选取秦皇岛市桃林口水库2008—2017年水源站7项水质指标数据作为输入变量,出库站7项水质指标作为输出变量。利用2008—2015年8年的水质数据作为训练样本,建立BP神经网络模型,预测模拟2016、2017年出库站水质情况。

将2016年和2017年出库站水质指标的预测值和实测值对比,判断系数R2均在0.70以上,相关系数r均在0.84以上,RMSE值都小于0.2,NSE均大于0.9,Pearson相关系

数均大于0.84。结果表示,经BP神经网络模型预测模拟训练后的模型预测效果良好。由此可知该文建立的基于BP神经网络的桃林口水库水质预测模型可以用于对桃林口水库水源站水质7项指标进行预测,在实际应用的过程中,可以用于桃林口水库水质指标变化的预警系统中,但BP神经网络模型模拟预测仍有不足之处,由于模型受到本身复杂程度等方面的限制,无法对水质变化的原因进行有效分析,有待日后对其和水质指标变化的因素等进行进一步的研究。

参考文献

[1]MA X X,SHANG X,WANG L C,et al.Innovative approach for the development of a water quality identification index—a case study from the Wen-Rui Tang River watershed,China[J].Desalination and water treatment,2015,555(5):1400-1410.

[2]孙兆兵,王保良,冀海峰,等.基于概率组合的水质预测方法[J].中国环境科学,2011,31(10):1657-1662.

[3]袁从贵.最小二乘支持向量回归及其在水质预测中的应用研究[D].广州:广东工业大学,2012.

[4]刘双印.基于计算智能的水产养殖水质预测预警方法研究[D].北京:中国农业大学,2014.

[5]李如忠.水质预测理论模式研究进展与趋势分析[J].合肥工业大学学报(自然科学版),2006,29(1):26-30.

[6]梁楠.基于人工神经网络的水质预测及 MATLAB 实现[D].西安:长安大学,2007.

[7]袁宏林,龚令,张琼华,等.基于BP神经网络的皂河水质预测方法[J].安全与环境学报,2013,13(2):106-110.

[8]马正华,王腾,杨彦,等.BP神经网络模型在太湖出入湖河流水质预测中的应用[J].计算机应用与软件,2013,30(11):172-175.

[9]郭庆春,郝源,李雪,等.BP神经网络在长江水质COD预测中的应用[J].计算机技术与发展,2014,24(4):235-238,242.

[10]高峰,冯民权,滕素芬.基于PSO优化BP神经网络的水质预测研究[J].安全与环境学报,2015,15(4):338-341.

[11]张青,王学雷,张婷,等.基于BP神经网络的洪湖水质指标预测研究[J].湿地科学,2016,14(2):212-218.

[12]琚振闯,王晓,弓艳霞.基于BP神经网络的黄河水质预测研究[J].青海大学学报,2017,35(3):88-92,102.

[13]费丹.大伙房水库水质的BP神经网络模拟预测[J].水资源开发与管理,2018(2):30-33.

[14]何长宽,宋宝生.桃林口水库一期工程对秦皇岛市城市用水的作用[J].河北水利水电技术,1999(1):24-25.

[15]HECHT-NIELSEN R.Kolmogrovs mapping neural network existence theorem[C]//Proceedings of the international conference on Neural Networks.New York:IEEE Press,1987.

猜你喜欢

BP神经网络水质预测
水质抽检岂容造假
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
一月冬棚养虾常见水质浑浊,要如何解决?这9大原因及处理方法你要知晓
水质总磷测定存在的问题初探
水质总氮测定方法改进探究