基于BP神经网络在白洋淀水质综合评价中的应用
2014-02-28张彦
张彦
(保定水文水资源勘测局,河北保定 071003)
基于BP神经网络在白洋淀水质综合评价中的应用
张彦
(保定水文水资源勘测局,河北保定 071003)
选用2012年为现状年,应用BP神经网络建立白洋淀水质综合评价模型,用训练好的BP神经网络模型对白洋淀各监测断面的水质现状进行类别评价。结果显示,与单因素评价法相比,BP神经网络法是一种更加客观、有效和实用的环境质量评价方法。
BP神经网络;水质综合评价;白洋淀
白洋淀位于河北省中部、保定市以东的安新县附近,地处北京、天津和石家庄3市的三角形中心位置[1],是在太行山前的永定河和滹沱河冲积扇交汇处的扇缘洼地上汇水形成,汇集了唐河、府河、潴龙河等9条径流[1],是华北地区最大的淡水湿地,也是我国东部地区典型的浅水型湖泊,总面积366km2,由143个淀泊、3700多条沟壑组成,水域面积约占50%,被誉为“华北之肾”。同时,白洋淀对缓滞洪水、蓄水灌溉、调节气候、补充地下水、维持生物多样性和生态平衡等起到了极其重要的作用。
目前,由于白洋淀上游及周边工矿企业的增加,保定市城市污水的汇入,淀区内网箱养鱼规模的增加,以及受天然入淀水量的限制,白洋淀水质逐年恶化,已成为影响淀区周边地区人民生活以及经济持续发展的重大隐患。
河湖水质受外界影响因素众多,各影响因子之间关系又比较复杂并且呈现非线性,因此至今尚无统一的水质综合评价模型。近10年来,人工神经网络得到迅速发展[2-3],其应用己经深入到各个领域。而其中的BP神经网络具有建立任意输入与输出的非线性映射功能以及能模仿人脑进行自识别、自组织、实时学习等特点,已经在湖库的水质综合评价和预测中得到广泛应用。基于目前尚无针对保定市白洋淀水质的BP神经网络综合评价模型,笔者采用Matlab人工神经网络工具箱,建立一个能对湖泊水质作出正确评价的BP神经网络模型,并对白洋淀水质现状作出客观的评价,以期为有效保护和治理白洋淀污染提供决策依据。
1 BP人工神经网络概述
1.1 人工神经网络简介
人工神经网络,是对生物或自然的神经网络的抽象和模拟,是一种非线性动力学系统[4]。人工神经网络模型具有非线性、非局限性、非常定性、非凸性等四大基本特征,可以对信息进行分布存储及并行处理,具有自组织、自适应、实时学习的能力。目前,人工神经网络已经得到广泛应用,在机器人控制、模式识别、图像处理、自动控制、优化组合、生物医学工程等许多领域取得了令人鼓舞的进展,并已日趋成熟,具有极重要的理论和应用价值[5]。
1.2 BP神经网络简介
BP神经网络是以D.E.Rumelhart和J.L.McCelland为首的科学家小组在1986年提出的,按照误差逆向传播算法训练的一种多层前馈型网络,是目前在人工神经网络中应用最广泛的神经网络模型之一。由于BP网络的神经元通常采用sigmoid型可微函数作为传递函数,因此就能实现输入层和输出层之间的任意非线性映射,这使其在非线性预测、模式识别、特征提取等许多领域有着更为广泛的应用[6]。
1.3 BP网络模型结构
BP网络模型结构比较简单,一般分为3层,第1层为输入层、中间层为1个或多个隐含层,第3层为输出层。神经网络的每层都包含若干个神经元,前、后层之间各神经元完全连接,而每层的各个神经元之间没有连接。3层前向网络,即隐层只有1个的BP神经网络,被认为是对模拟输入、输出的相似关系最为适用,是在人工神经网络中算法最为成熟,应用最为广泛的一种[7]。图1是常见的3层BP网络的结构。
图1 BP神经网
1.4 BP网络的工作原理简述
BP网络算法的自学习过程是由信息正向传播和误差反向传播两部分组成。首先网络通过正向传播,将样本数据由输入层经各隐含层神经元逐层处理,传到输出层,如果实际输出误差达不到期望误差,网络就将输出误差反向传播,网络就是这样通过不断将训练输出与实际输出相对比,按照误差梯度下降的方式对各层神经元的权值或域值进行调整,从而使训练输出与实际值之间的误差不断减小,直至到达所需误差。
2 BP神经网络模型应用于白洋淀水质的综合评价
2.1 BP神经网络的建立
2.1.1 网络层数的确定
BP神经网络结构一般由输入层、隐含层和输出层3个部分组成。BP网络被证明具有很强的映射功能,BP定理[8]在理论上证明了:任一连续函数或映射均可用BP三层网络加以实现。Kolmogorov定理[9]及Cybenko定理[10]都证明了对于具有足够多的隐含层神经元数的三层前馈型网络可以在任意的精度下逼近1个实数值的连续函数。因此,在考虑满足精度要求和减少学习时间的情况下,本文的神经网络模型选择1个隐含层的三层神经网络模型。
2.1.2 输入层神经元数的确定
神经网络的输入层神经元为水质评价指标,输入层神经元的个数则等于所选取的评价指标数目。本文通过白洋淀实际水质监测结果,最终确定了化学需氧量(COD)、五日生化需氧量(BOD5)、氨氮(NH3-N)、总磷(TP)、总氮(TN)等影响水质分级的主要因子作为建立评价模型的主要参数指标。
本文建立的水质评价模型的输入层设有5个神经元。
2.1.3 隐含层节点数的确定
目前BP神经网络的隐含层节点数的选取还没有理论上的指导,需根据实际情况进行对比选取。常用的经验公式主要有以下两种:
式中ny为隐含层节点数;n为输入层节点数。
式中ny为隐含层节点数;n为输入层节点数;m为输出层节点数;常数a=1~10。
本文对隐含层节点数的选取方法是根据以上经验公式进行推算,考虑到由经验公式确定的隐含层节点数过于保守,因此,在以经验公式推算值作为初始值的基础上,在设定的范围内对隐层节点数进行循环递增运算,以模型的误差为目标函数,经试算,最终确定本文的网络模型隐层结点数为20。
2.1.4 网络输出与输出层神经元数的确定
GB3838—2002《地表水环境质量标准》[11]中规定的地表水环境质量类别共分为5级,另外鉴于白洋淀部分水域水质现状较差,增加劣V类水质标准,所以水质类别共分为6级,分别用0.1~0.6的间隔为0.1的6个小数代替,作为网络输出。由于每类水质标准对应相应的水质类别,所以输出层神经元数应为1。
2.1.5 训练样本的选择和预处理
本研究选用2012年为现状年,对白洋淀13个水质采样点(监控断面分布见图2)水质指标的年平均数据进行分析。各采样点样品的采集和测试按照《水环境监测规范》[12]由保定水环境监测中心完成。数据处理软件及其版本为Matlab R2010a。
图2 白洋淀水质监测断面分布简图
根据GB3838—2002《地表水环境质量标准》中规定的分类等级,各类水质的环境指标浓度均有限值,只要所要评价的指标处于各类水质的浓度限值范围内,该水质就是其相应的类别。由于用标准作为训练样本数量较小,为保证本模型的正确性和可靠度,本文用unifrnd函数在水质相应类别限值范围内进行随机插值,生成足够多属于各类水质类别的训练样本,然后打乱生成的数据顺序再重新进行输入,这样数据就更加具有典型性和更优良的泛化能力。
本文对6个水质类别的指标分级区间内随机插值生成200个样本,共获得1200个样本。
为了加快网络的收敛速度,根据输入样本的数量级范围的差异程度,有必要对这些数据进行变换处理,用Matlab自带的mapminmax归一化函数对输入样本进行规范化处理,归一化的范围为[0,1]。
2.2 网络的学习训练及结果验证
网络结构、训练样本及输出值确定后,接下来开始建立BP网络。采用newff函数来生成BP网络,在生成网络的同时,该函数自动对网络各层的初始值和阀值进行了初始化。选用tansig函数建立输入层和隐层函数间的对应关系,选用purelin函数建立隐层和输出层之间的对应关系,选用trainlm函数作为训练函数。接着对网络的训练参数进行设置。设定最大训练次数为1000次,学习速率为0.01,期望误差为1e-5,最大失败步数设为100。在设置完训练参数之后,调用train函数对BP网络进行训练。图3为BP神经网络模型分别在训练样本、检验样本和测试样本上的均方误差变化曲线。
图3 BP神经网络均方误差
从图3中可以看出,算法经过370步训练达到了期望误差,证明了其收敛速度很迅速。另外,检验样本和测试样本两者的均方误差曲线的变化趋势是一致的,说明网络具有很强的泛化能力,完全可以用来作评价。
Matlab神经网络工具箱训练结果还给出了3组样本的实际输出与期望输出线性回归分析,结果如图4所示。
图4 BP神经网络实际输出与期望输出的回归分析
从图4中可以看出,训练样本和检验样本的实际输出y与期望输出t的相关系数均达到了0.9998,而测试样本的实际输出y与期望输出t的相关系数更是达到了0.9999。同样可以表明,经上述样本训练后得到的神经网络模型对训练样本、检验样本和测试样本具有很高的拟合能力,即该神经网络的泛化能力很强。至此,基于BP神经网络的白洋淀水质综合评价模型建立完成,可以很好地用于评价未知样本。
2.3 白洋淀水质综合评价结果
将白洋淀13个监测站点的水质监测数据作为系统输入,由已训练好BP网络模型对它们进行评价,按照其输出值与期望值的接近程度,决定其归属哪一级,评价结果见表1。作为对比,在表1最后一列还列出了用GB3838—2002《地表水环境质量标准》进行的单因素法评价。
表1 白洋淀监测站点水质综合评价结果
由表1的评价结果得知,BP网络评价结果为S1、S3、S4水质最差,为劣Ⅴ类标准,S2、S6、S7、S8为Ⅴ类标准,其余均为Ⅳ类标准;通过比较可以得出:绝大部分单因素法评价的水质类别都比相应的BP网络评价的类别要高,这是因为单因素评价法只是根据污染程度最严重因子来判断水质类别,而BP神经网络法则是通过对所有参评因子进行学习训练而得出的一种综合评价结果,显然比单因素评价法评价的结果更为客观。
另外,从地理位置上看,S1为保定市区排污入淀控制断面,由于城市污水处理力度不够,导致大量的污染物流入白洋淀,以致该断面附近水体污染程度非常严重;S4断面距离S1断面最近,受S1水质的影响,其水体污染程度也非常严重;S3断面污染程度严重的主要原因是由该水域水产养殖所致;由整体趋势看,白洋淀水质污染程度自白洋淀入口向淀区方向呈现辐射状减小趋势,由此说明,白洋淀主要为点源污染,污染源为保定市城市生产生活的污废水。
综合BP网络评价的结果不难看出白洋淀的水质状况已经很严重了,亟待有关部门采取相应的治理措施。
3 结语
(1)BP神经网络具有自组织、自学习、自适应能力,能够学习和存储大量的输入和输出模式映射关系,因而能客观地反映系统内部的本质特征,避免了主观随意性。与单因素法相比,弥补了单因素法只根据污染程度最重的因子来确定水质类别的不足,因此,用基于BP神经网络的水质综合评价模型对白洋淀进行水质评价,结果更客观、更合理。
(2)成功建立白洋淀BP神经网络水质综合评价模型,利用该模型对白洋淀水质进行综合评价,由结果可知,白洋淀淀区水质都在Ⅳ类水及以上,入淀控制断面及其周边甚至达到了劣于Ⅴ类水标准,再加上受自然入淀水量不足影响,白洋淀水质的污染程度将日益加剧。因此,建议加大保定市城市污水处理和再利用程度,加大水资源利用程度,合理调度水资源,进一步改善白洋淀水生态环境。
[1]朱宣清,弓冉,穆仲义,等.白洋淀环境演变及预测[M].西安:西安地图出版社,1994.
[2]胡守仁,余少波,戴葵.神经网络导论[M].长沙:国防科学技术大学出版社,1993.
[3]张立明.人工神经网络的模型及其应用[M].上海:复旦大学出版社,1993.
[4]阎平凡,张长水.人工神经网络与模拟进化计算[M].北京:清华大学出版社,2005.
[5]杨建刚.人工神经网络实用教程[M].杭州:浙江大学出版社,2001.
[6]许东,吴铮.基于MATLAB 6.x的系统分析与设计[M].西安:西安电子科技大学出版社,2002.
[7]王旭.人工神经元网络原理与应用[M].沈阳:东北大学出版社,2000.
[8]Hecht-Nielsen R.Theory of the Back Propagation Neural Network[J].Proc of IJCNN,1989(1):593-603.
[9]Kolmogorov A.V On the representation of continuous functions of several variables by superposition of continuous functions of one variable and addition[J].Doklady Akademii. NaukUSSR,1957(114):303-314.
[10]Cybenko G.Approximation by superposition of a sigmoidal function[J].Math control signals systems,1989(2):303-314.
[11]GB3838—2002,地表水环境质量标准[S].
[12]SL 219—98,水环境监测规范[S].
Comprehensive Assessment of Water Quality Based on BP Neural Network in Baiyangdian Lake
ZHANG Yan
(The Hydrology Water Resource Surveys Bureau of Baoding,Baoding 071003,China)
Selected 2012 as the present year,the paper establishes a comprehensive assessment of water quality model in Baiyangdian lake by BP neural network,and then makes a assessment of water quality classification for each water monitoring sites of Baiyangdian lake by the trained BP neural network model.The results show that:compared with single factor evaluation,BP neural network method is an objective,effective and practical environmental quality evaluation method.
BP neural network;comprehensive assessment of water quality;Baiyang lake
X824
B
1672-9900(2014)03-0063-04
2014-01-26
张彦(1979-),男(汉族),河北迁安人,工程师,主要从事水质化验工作,(Tel)18932653658。