APP下载

基于改进的BP神经网络水源地水质安全预测

2018-01-19赵志怀司宏宇

水力发电 2017年10期
关键词:水源地水质神经网络

张 萌,赵志怀,司宏宇

(1.太原理工大学水利科学与工程学院,山西太原030024;2.中国冶金地质总局第三地质勘查院,山西太原030002)

0 引 言

随着人口的增长和社会经济的发展,水源地的污染愈加严重[1]。为加强水源地的环境管理和污染的治理,提高居民饮用水质量,保障公共用水安全[2-3],政府管理人员应清楚地了解水源地现状,准确掌握水质安全状况。现行的水质评价模型有单因子评价法、模糊评价法、神经网络法等。单因子评价法[4]过分夸大了个别较差指标对整体水域的污染,并不能真实地反映实际水质状况;模糊评价法[5]是通过经验赋予因子权值,结果存在很大的主观性;BP神经网络[6]通过得到的样本特性,预测时权值不断修正,是一种更为客观的模型。但传统的BP神经网络未对水质影响因子进行筛选,造成预测过程没必要扩展。本文使用Pearson相关系数法[7]对水质影响因子进行初步筛选。然而,Pearson相关系数法筛选因子时只是主观确定一个范围,并未对筛选的因子合理性进行评价,因此利用方差来代表指标的信息,即信息指标评价法[8]对需要筛选的因子进行信息持有度分析,从而得出最佳影响因子,提高了工作效率。本文将Pearson相关系数法、信息指标评价法和BP神经网络法称为改进的BP神经网络。

以阳泉市33个水源地水质安全预测为例。采用Pearson相关系数法计算出各个模拟因子与被模拟因子的关联度;将关联度从大到大进行排列,应用信息指标评价法对模拟因子进行筛选确定出最优模拟因子;确定BP神经网络结构,以28个水源地的最优模拟因子作为训练样本,5个水源地的被模拟因子作为测试样本进行模拟预测。同时,将传统的以及改进的BP神经网络模型预测的水质状况综合指数[9]与实际值进行比较,分析改进的BP神经网络模型的预测精度,验证本文预测模型的合理性。

1 基本原理

1.1 Pearson相关系数法

Pearson相关系数法用于描述2个指标之间的相似性,通过计算各个模拟因子与被模拟因子之间的相关系数,从而得出各个模拟因子与被模拟因子的相似程度。如需得模拟因子(x1,x2,…,xn)T,被模拟因子(y1,y2,…,yn)T相关性大小,为消除模拟因子量纲,首先采用下式进行无量纲化处理

(1)

式中,xi为各个原始模拟因子;zi为标准化后模拟因子。则模拟因子与被模拟因子之间的相关系数γ(z,y)为

(2)

式中,γ(z,y)∈[-1,1],若γ(z,y)>0表示x、y是正相关;若γ(z,y)<0表示x、y是负相关;γ(z,y)的绝对值越接近1,表现出x、y相关性的越大。

1.2 信息指标评价法

变异系数法使用方差大小来代表模拟因子携带信息的多少,从而对模拟因子进行赋权[10]。因此,在评价筛选的因子是否合理时,也可用方差的大小来评判。具体做法如下:

将m个模拟因子与被模拟因子y的γ(z,y)求出,按照其相关系数从大到小进行排列,从而得出下面的模拟因子与被模拟因子的集合矩阵ω

(3)

式中,zij表示第i个模拟因子的第j个样本值;yj表示第j个样本的被模拟因子。定义信息持有度R为前i个模拟因子含有的信息量Si占m个总模拟因子含有的信息量Sm的比例,即

(4)

式中,zi为第i个模拟因子值;zm为第m个模拟因子值;E(zi)为前n个模拟因子的算术平均值;E(zm)为m个总模拟因子的算术平均值。

对i值进行试算。当R>N时(N为参考值),对应最小的i值即是最优模拟因子个数,前i个模拟因子为最优预测因子。在主成分分析理论中,保留累计方差贡献率达到80% 以上,即信息含量较大的主成分,表示全部原始指标信息的绝大多数得到了反映[11]。借助此思想,N取80%。

1.3 BP神经网络

BP神经网络是1个至少为3层的导师学习式的神经网络,其训练是通过信号正传播和误差逆传播进行的[12]。同时,能反映模拟因子和被模拟因子的非线性关系,适合用于水质预测。BP神经网络的工作原理见图1。

图1 BP神经网络工作原理

输入层:输入层通常为模拟因子,本文中输入层的因子个数为最优模拟因子数。

隐含层:对隐含层的节点数目前没有统一的确定方法,一般取为输入层节点数的75%[13]。按照这个比例,选取几个可能的节点数试验,最终确定最优隐含层的节点数。

表1 示例数据

输出层:输出层节点的个数和被模拟因子个数相等,本文等于1。

2 改进的BP模型示例

本文采用山西省阳泉市水务局2015年阳泉市地下水调查的33个地下水水源地水质资料为基础数据,并以28个水源地的总硬度、硫酸盐、氯化物、氨氮、锰、溶解性总固体、镉、汞、挥发酚、氟化物等10个监测值为模拟因子,5个水源地对应的水质状况综合指数WQI为被模拟因子。由于篇幅有限,本文只列出部分数据,示例数据见表1。

根据式(1)对监测值进行均值标准化,采用式(2)计算各个模拟因子的相关性,得出的结果从大到小排列,见表2。选取不同的模拟因子的个数,即i值,代入式(4)进行计算,得到不同模拟因子个数下的信息持有度R。模拟因子数i与信息持有度R关系见表3。由表3得出,当R大于80%时,模拟因子数i的最小取值为8,模拟因子确定为挥发酚、汞、锰、镉、溶解性总固体、硫酸盐、总硬度、氟化物。

本次建模采用的网络结构输入层数为8,按照输入节点的75%比例,选取几个可能的节点试验,确定隐含层节点数为6,输出层为1。因此,改进的BP模型的最终结构为8- 6-1。

本文以28个水源地的数据作为训练数据,5个水源地的数据作为测试数据。应用改进的以及传统的BP神经网络模型预测得到水质状况综合指数进而得到的水质指数,与水源地实际的水质状况综合指数和水质指数相比较。水质状况综合指数、水质指数对比结果分别见表4、5。

表2 模拟因子相关性

表3 模拟因子数i与信息持有度R关系

表4 水质状况综合指数对比

表5 水质指数对比

从表4可知,传统的BP神经网络模型预测值与实际值的平均相对误差为5.44%,改进的BP神经网络模型的平均相对误差为3.80%,传统模型预测精度低于改进模型。从表5可知,传统的BP神经网络模型得出的水质指数与实际值偏差率为40%,而改进模型偏差率为0。这是由于传统模型将一些对水质安全影响较低的因子也加入预测,扩展了模型结构,训练效率降低,容错性下降,而改进模型合理地克服了这个缺点。因此,改进模型进行地下水水质安全预测时更加符合实际。

改进的BP神经网络模型对水质安全评价是以Ⅲ类水质标准为评价依据。水源地水质安全见图2。从图2可知,对柏井、白羊墅和龙庄水源地,传统模型和本文模型都可得出正确水质指数,水质指数点完全重合;对乱流和程家水源地,本文模型预测值与实际水质完全一致,传统模型预测值比实际水质差一个级别,成为Ⅲ类水。水源地水质全部在安全标准线之下,即阳泉市水源地水质状况较好,水源地为安全级别[14]。

图2 水源地水质安全

3 结 语

本文以阳泉市地下水水源地水质为例,利用Pearson相关系数、信息指标评价法和BP神经网络建立改进的BP神经网络模型对水质进行预测,得出以下结论:

(1)采用Pearson相关系数理论获得阳泉市地下水饮用水水源地的水质信息特征,利用信息指标评价法可以避免人为主观确定范围选定最优模拟因子的特点。通过Pearson相关系数和信息指标评价法筛选指标,简化了BP神经网络结构,提高了预测效率。

(2)改进的BP神经网络模型预测的水质状况综合指数平均相对误差为3.80%,水质指数平均相对误差为0%,精度高于传统的BP神经网络模型。

(3)阳泉市水源地水质为安全级别。改进的BP神经网络模型可以在一定精度上对地下水饮用水水源地水质状况进行定量化的预测,可更加快速客观地得出的水质指数,对含有多个评价指标的多个地下水饮用水水源地水质安全预测具有实用性。

[1] 郦建强, 王建生, 颜勇. 我国水资源安全现状与主要存在问题分析[J]. 中国水利, 2011(23): 42- 51.

[2] 侯俊, 王超, 兰林, 等. 我国饮用水水源地保护法规体系现状及建议[J]. 水资源保护, 2009, 25(1): 79- 82, 85.

[3] 李扬. 山西省农村饮水安全现状及对策措施[J]. 山西水利, 2016, 32(8): 21- 22.

[4] 罗孝芹, 张强, 陈丽影, 等. 基于单因子指数法的贵阳市南明河上游区综合水质评价[J]. 地下水, 2016, 38(1): 80- 82.

[5] 孙旺旺, 任传胜, 朱春伟. 基于模糊RBF神经网络的地表水环境质量评价[J]. 水力发电, 2013, 39(11): 1- 3.

[6] 穆征, 王方勇, 李静, 等. 基于模糊综合评价模型的河流水质综合评价[J]. 水力发电, 2009, 35(4): 11- 13.

[7] 葛芳君, 赵磊, 刘俊, 等. 基于Pearson相关系数的老年人社会支持与心理健康相关性研究的Meta分析[J]. 中国循证医学杂志, 2012, 12(11): 1320- 1329.

[8] 顾在浜, 石宝峰, 迟国泰. 基于聚类-灰色关联分析的绿色产业评价指标体系构建[J]. 资源开发与市场, 2013, 29(4): 350- 354.

[9] 水利部水利水电规划设计总院. 全国城市饮用水水源地安全状况评价技术细则[R]. 北京: 水利部水利水电规划设计总院, 2005.

[10] 张小泓. 基于变异系数法的灰色关联模型在节水灌溉工程投标方案优选中的应用[J]. 节水灌溉, 2009(8): 54- 56.

[11] 赵梦杰, 蒋晓辉, 姚文艺, 等. 影响黑河正义峡断面下泄水量的主导因子分析[J]. 人民黄河, 2016, 38(1): 56- 59.

[12] 郭琦, 何湘君. 基于BP神经网络的水电工程定额编制模型研究[J]. 人民长江, 2016, 47(5): 69- 72.

[13] 唐启义, 冯明光. DPS数据处理系统[M]. 北京: 科学出版社, 2006.

[14] 朱党生, 张建永, 程红光, 等. 城市饮用水水源地安全评价(Ⅰ): 评价指标和方法[J]. 水利学报, 2010, 41(7): 778- 785.

猜你喜欢

水源地水质神经网络
浅议农村饮用水源地保护区划分
神经网络抑制无线通信干扰探究
一月冬棚养虾常见水质浑浊,要如何解决?这9大原因及处理方法你要知晓
图像识别在水质检测中的应用
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
河南省集中供水水源地水质状况调查评价
基于支持向量机回归和RBF神经网络的PID整定
南水北调中线水源地土壤侵蚀经济损失估算
水质总磷测定存在的问题初探