APP下载

广义回归神经网络在昆山水质评价中的应用

2018-09-17陈广银蔡灏兢

资源环境与工程 2018年3期
关键词:水质评价广义水体

陈广银, 蔡灏兢, 朱 奕, 夏 飞

(昆山市环境监测站,江苏 昆山 215300)

科学评价水质状况是环境管理的基础。一些学者尝试运用新的方法评价水体,如灰色评价法、模糊数学法、主成分分析法、多元统计法、色聚类法等[1-8],但这些方法多数需要设计各评价指标对各级标准的隶属函数及各指标的权重,评价结果受主观因素影响较大,限制了评价方法的通用性,也影响了结果的可靠性[9]。神经网络是20世纪 40年代产生、80年代发展起来的模拟人脑生物过程的人工智能技术,特别适用于对因果关系复杂的非确定性推理、判断、识别和分类等问题的处理,并被应用在水质评价中,如BP网络模型、模糊神经网络模型,但这些模型学习速度慢,受初始值、权值等多种因素影响,易陷入局部最优、重复性较差[10-13]。本文尝试用广义回归神经网络评价水体水质,并和其它评价方法对比说明其可行性。

1 评价原理

1.1 广义回归网络原理

广义回归神经网络(GRNN)是美国学者DonaldF·Specht在1991年提出的,是径向基函数神经网络的一种特殊形式,用密度函数来预测输出[14]。GRNN建立在非参数核回归基础上,样本数据作为后验概率验证条件执行Parzen非参数估计,从样本中计算自变量和因变量之间的联合概率密度函数,算出因变量对自变量的回归值[15]。

假设x,y是两个随机变量,其联合概率密度为f(x,y)。若已知x0,y相对于x的回归为

(1)

对于未知的概率密度函数f(x,y),则可根据x和y的观测样本通过Parzen非参数估计得:

(2)

d(x0,xi)=(x0-xi)T(x0-xi)/2σ2

(3)

d(y0,yi)=(y0-yi)2/2σ2

(4)

将公式(2)、(3)、(4)代入式(1),交换积分与求和的顺序得到式(5):

(5)

由于

(6)

化简上式可得:

(7)

式中:n为样本容量;m为随机变量x的维数;σ为光滑因子,其为高斯函数的标准差。GRNN 神经网络的输出数据和训练样本的误差主要由平滑因子决定的,只需调整平滑因子就可以获得较好的全局性收敛模型[16]。

1.2 BP网络评价原理

BP网络分为输入层、隐藏层和输出层。输入信号通过权值链接作用于隐藏层,隐藏层通过激活函数的非线性变换后计算得到输出层,产生输出信号。如果没有得到期望输出,则根据实际输出与期望输出的误差偏差调整输入层节点与隐藏层节点、隐藏层节点与输出层节点之间的联接权值及阈值,使误差沿梯度下降方向,经过反复迭代,当实际输出和期望输出达到设定误差时训练即告完成[12]。

2 数据预处理及模型建立

训练数据来源于《地表水环境质量标准》(GB 3838—2002),见表1,并用matlab R2013a中的linspace线性内插法生成500组数据。待评价数据来源于Ⅲ类功能水体的某湖泊采样点,采样时间为2016年每月4日,连续12个月,监测项目见表2。为了消除因变量及自变量量纲及浓度不同所带来的影响,将原始数据进行归一化处理后作为网络输入和输出,并将网络评价结果进行反归一化得到实际评价结果。

表1 地表水环境质量标准值Table 1 Surface water environment quality standard

表2 待评价水体水质参数Table 2 Waterquality parameters for evaluation

通过MATLAB R2013a中的广义回归神经网络命令net=newgrnn(P,T,SPREAD)建立模型,其中SPREAD为光滑因子,训练时将光滑因子分别取值为0.4、0.6、0.8,并将Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ类水体标准值代入训练好的网络模型进行评价,评价误差如图1。从图中可以看出,当光滑因子为0.8时,模型评价误差为2.1%~36%;当光滑因子为0.4时,5种水体的评价误差在0.5%~4.7%,因此本文采用光滑因子为0.4时的模型。

图1 光滑因子对评价结果的影响Fig.1 Smooth factor’s influence on the evaluation results

3 结果与讨论

为了说明本文所提出的广义回归神经网络的可行性,将其评价结果与比较成熟的BP神经网络的评价结果进行比较,结果如图2。

图2 水质评价结果Fig.2 The results of water quality evaluation

从图2中发现GRNN与BP神经网络的水质评价结果基本一致,GRNN和BP评价结果误差为-0.4%~18.6%。两种评价方法都表明一年中2、3月份的水质最差,夏季的水质评价较好,其中8月份最好。通过分析原始数据发现影响水质的主要因素是TN,分析夏季水质较好的原因可能为:8月份雨水较充沛,在一定程度上稀释了水体;高温天气,企业停产停工较多,也在客观上减少了水体TN的排入;水体温度高,硝化、厌氧硝化较为活跃,加速水体中TN的去除。2、3月份水质最差的原因一方面2、3月份温度低,硝化、反硝化弱,导致水质自净能力差;另一方面,春节期间可能违法行为较多,污染物偷排量大。

单因子评价法是选取评价时段内水质最差的类别为评价结果,是水质评价使用最多的方法,能够确定影响水质类别的关键因素[17]。本例中主要污染因子是TN,从而有利于提出针对性的水环境治理措施,但其评价结果过于悲观。尽管其它污染指标浓度很低,基本处于Ⅱ类水标准,但由于TN较高,导致所评价水体全部是Ⅴ类或劣Ⅴ类,无法评价水质的综合状况。

GRNN和BP通过对环境标准的学习,自动计算因子间的权重系数,消除主观误差,两者评价结果平均相对误差为8.8%,说明将广义回归神经网络用于水质评价是可行的。GRNN及BP评价结果显示,2、3月份水质污染最严重,均超过水体功能区Ⅲ类水的标准,其余月份都符合Ⅲ类功能。BP网络训练时需要大量的数据,模型参数多,易陷入局部最优,而GRNN只需调整模型平滑因子,为全局收敛。

4 结论

GRNN与BP神经网络的水质评价结果基本一致,其评价结果相对误差-0.4%~18.6%,说明了GRNN评价水质的可行性。水质评价结果表明,待评价水体水质不容乐观,刚好达到或者已经超过功能区标准。一年中污染最重的是2、3月份,污染最轻的是8月份。应该加大水体治理力度,特别是春节期间的 2、3月份,严查企业偷排行为,减少水体污染物的输入。GRNN用于水质评价时模型参数少、操作简单,通过对标准方法的学习,自动计算因子间的权重系数,评价结果能够综合反映水质状况,有助于管理人员通过大量的监测数据快速掌握不同水体的污染程度,为水资源管理提供重要的技术支持。

猜你喜欢

水质评价广义水体
Rn中的广义逆Bonnesen型不等式
农村黑臭水体治理和污水处理浅探
生态修复理念在河道水体治理中的应用
从广义心肾不交论治慢性心力衰竭
滻灞河水质评价方法研究
广元:治理黑臭水体 再还水清岸美
基于概率统计和模糊综合评价法的水质评价模型及其应用——以拉萨河水质评价为例
有限群的广义交换度
基于SPAM的河流水质评价模型
模糊数学评价法在水质评价中的应用