变权欧式距离模型在水质综合评价中的应用*
2010-06-05张庆庆许月萍牛少凤楼章华
张庆庆,许月萍,牛少凤,楼章华
(浙江大学水文与水资源研究所,浙江 杭州 310058)
水质综合评价是以定性的方式对水环境的总体状况做出评价,为水资源污染的控制和管理提供科学依据。由于水质指标的多样性,选择一个合理的综合评价方法成为首要的问题。随着新的数学方法在分类学中的广泛应用,新的水质综合评价方法层出不穷,如模糊数学法[1-3]、灰色系统理论法[4-5]、物元理论与可拓集合法等[6-7]。较常用的有灰色聚类法以及模糊综合指数法等。然而,灰色聚类法和模糊综合指数法的计算过程都相当复杂, 虽然编写程序可使运算速度加快, 但由于白化函数和隶属度函数的计算均要求水质的污染程度与污染物浓度成正比,而对于像DO这样浓度越高水质越好的因子,则需要调整白化函数和隶属度函数的计算公式。若每次水质评价时选取的指标不完全一样, 则编写的程序需作相应调整后方可使用, 增加了评价工作的难度。
欧式距离是聚类分析中经常使用的概念。Kodaz等[8]所提出的基于信息增益的人工免疫识别系统(IG-AIRS)正是利用基于信息的欧式距离从众多疾病数据中识别出动脉硬化;Mohamed等[9]通过计算输入的英文字母与指定的相关参数之间的欧式距离建立了识别手写字的分割算法;Ruzanski 等[10]在研究人类语音所反映的压力水平时,在包含频率特征和Teager能量算子特征的多属性空间中应用欧式距离实现了对压力水平的分类。同样,水质综合评价,作为一个多属性分类问题,也可以借助欧式距离来完成。如果对欧氏距离赋予权重,则变成加权欧式距离。如果权重是变化的,则变成变权欧式距离。本文将利用变权欧式距离模型对水质进行评价,并将变权欧式距离模型、灰色聚类法和模糊综合指数法应用于钱塘江支流东阳江水质评价,最后对三个评价结果进行比较和理论分析。
1 评价方法简介
1.1 变权欧式距离模型
为了将欧式距离应用于水质综合评价,必须考虑不同污染因子对于水质影响程度的不同,即污染因子的权重。利用变权欧式距离模型对水质进行综合评价的原理为:对于某一个待评价单元(即某个监测断面在某个监测时间的各污染因子的监测值),根据污染因子的污染贡献率计算其权重,该权重对于每个监测值都有所不同,所以称为变权。另外,在根据污染贡献率计算权重时,应将DO这种浓度越高污染越小的污染因子与其他浓度越高污染越重的污染因子区分开来。建立以各个污染因子为坐标轴的n维空间,以水质标准中的I级浓度限制为“原点”,然后结合污染因子的权重系数计算每个待评价单元以及水质评价标准中其他各级别水质与“原点”间的变权欧式距离,并将后者作为划分每个待评价单元水质级别的标准。其计算步骤如下:
1.1.1 建立欧式空间。记i=1,2,…,m为待评价单元;j=1,2,…n为参与评价的污染因子;k=1,2,…5为根据地表水质量标准划分的水质等级;设实测样本矩阵为C,cij(i=1,2,…m;j=1,2,…n)为第i个待评价单元第j个污染因子的实测浓度值。根据国家规定的水质分级标准,设含有n个污染因子的5级水质标准矩阵为B,其中bjk(j=1,2,…n;k=1,2,…5)为第j个污染因子的第k级标准浓度限值。将C中的每一行和B中的每一列均看作以n个污染因子为坐标轴的欧式空间中的点。
1.1.2 欧式空间坐标转换。将水质标准矩阵B的Ⅰ级浓度限值作为欧式空间的原点,则C和B的坐标变为:
(1)
(2)
1.1.3 权重的确定。根据污染贡献率计算各个监测值的权重,即某监测值超标倍数越多,其权重越大[2]:
(3)
式中,ωij,cij分别为第i个待评单元中第j个污染因子的权重和实测浓度;cij/bj1反映了污染因子的超标量。
对于像DO这样浓度越高,水质越好的因子,上述权重系数的公式应当作出调整。因此,假设第λ(1≤λ≤n)个因子浓度越高,水质越好,则第i个待评价单元中DO实测值的权重为:
(4)
1.1.4 变权欧式距离的确定。利用前述得出的ωij分别计算第i个待评价单元转换后的坐标和第k级水质标准转换后的坐标到原点的变权欧式距离[11]:
(5)
(6)
可见0≤Δik≤1。 将δi与Δik比较即可判断第i个待评价单元的水质级别。
1.1.5 水质综合评价等级。当δi≤1时,若Δik≤δi≤Δi,k+1(k=1,2,…,p-1),对水质进行综合评价的等级定义如下:
(7)
式中,k为待评价单元所属水质级别。当δi>1时,第i个待评价单元的水质级别为Ⅴ类,即H=5。
1.2 其他方法
1.2.1 灰色聚类法。灰色聚类分析的提出是为了解决分类学中的灰色性问题。该方法建立在灰数的白化函数生成的基础上,通过对聚类对象进行非等权白化来进行分类,既考虑了水环境质量系统的灰色性,也考虑了系统的白化程度。记i= 1, 2, …,m,i为聚类对象(即各待测评价单元);j= 1, 2, …,n,j为聚类指标(即各污染因子);k= 1, 2, …,k为灰类(即各水质级别)。灰色聚类法评价水质的步骤如下[4]:
①对数据进行无量纲化处理。
④根据聚类结果确定最终污染级别。
1.2.2 模糊综合指数法。模糊数学在水质评价中的应用时为了解决水质分类存在的模糊性问题。不同水质级别之间无法制定一个明确的边界,因为它们是一个连续的过程。为了解决这个问题,在水质综合评价中引入模糊数学的概念即得到模糊综合评价法。代表性方法有模糊综合评判法、模糊概率法和模糊综合指数法等。模糊综合指数法的步骤如下[2]:①确定水质标准S;②建立模糊关系矩阵R;③计算权重矩阵A,计算公式同式(3)和式(4);④多指标模糊综合评价矩阵:B=A·R;⑤计算模糊综合指数:FCI=Y·S。
2 评价实例
2.1 评价过程
本文选取钱塘江支流东阳江许村断面1996-2006年7个污染因子的部分监测数据为评价对象,监测数据见表1。7个污染因子的等级根据《地表水环境质量标准》(GB 3838-2002)进行划分。
表1 东阳江许村断面水质监测数据
首先利用式(2)对7个污染因子的水质标准进行坐标转换,结果见表2。
表2 坐标转换后的评价标准值
根据评价因子的污染贡献率,由式(3)和式(4)计算所得的权重系数见表3。
根据表2和3,公式(6)计算出各个待测单元的各级水质标准与I级水质标准的变权欧式距离Δ,见表4。
表3 各待评价单元中各污染因子的权重系数
表4 变权欧式距离Δ
Table 4 Euclidean distance with varying weights Δ
表5给出了利用式(1)对实测样本表1进行坐标转换后后由式(5)计算出的每个待测单元与I级水质标准的变权欧式距离δ然后利用式(7)对每个待测单元的水质进行评价得到的水质评价结果。表5同时也给出了灰色聚类法和模糊综合指数法的水质评价结果。
2.2 评价结果
通过比较可以看出,变权欧式距离模型的评价结果与灰色聚类法、模糊综合指数法的评价结果基本一致,这说明了变权欧式距离模型应用于水质综合评价的合理性。根据3种评价方法的评价过程以及评价结果可得到以下结论:
1)模糊综合指数方法以及变权欧式距离模型都是变权的评价方法,其权重的计算方法充分体现了超标污染物对水质的影响。灰色聚类法则认为某个污染因子在水质标准中的标准值越小,则水质对其越敏感,该因子所占权重也就越大,并根据不同的水质类别确定相应级别的各污染指标的权重。这种权重计算方法显然没有考虑超标污染物对水质的损害,所以,灰色聚类法评价水质容易偏轻。
表5 1996-2006年东阳江许村断面水质评价结果
2) 变权欧式距离模型按照污染贡献率计算污染因子的权重有助于对水质进行单因子分析,确定主要致污因子。比较表3的数据,TN和NH3-N的污染贡献率要明显高于其他5项污染因子,是东阳江许村断面在1996-2006年期间的主要致污因子。
3)从表5来看,虽然用3种方法得到2004年7月和2005年7月的水质评价结果均为Ⅴ类,但变权欧式距离模型能得到更进一步的结论:前者的H值大于后者的H值,故前者的水质要劣于后者;二者的H值都远远超过了5,所以二者均属于劣Ⅴ类水质。但是,对于2004年3月、2006年7月和11月这种δi>1的情况,只能判断均为Ⅴ类水质却不能判断污染程度孰重孰轻,但一般情况下,δi越大则污染程度越重的可能性比较大。
3 结 论
通过变权欧式距离模型的应用,以及将其评价结果与灰色聚类法、模糊综合指数法的评价结果进行比较,验证了变权欧式距离模型应用于水质综合评价的科学性和合理性。综上分析,变权欧式距离模型具有如下优点:
1) 变权欧式距离模型不仅全面考虑了各污染因子,而且强调了超标污染物对水质的影响,便于对水质进行因子分析。
2) 当δi>1时,变权欧式距离模型评价结果中的H,不仅给出水质级别,而且能够给出待评价单元对于某级别水质的贴近度,详细地体现了水质的变化趋势。
3) 变权欧氏距离模型形象、直观、方便、准确率较高,能够较完整地反映水环境污染程度,适用于水质综合评价。
参考文献:
[1] ADEBOWALE K O, AGUNBIADE F O, OLU-OWOLABI B I. Fuzzy comprehensive assessment of metal contamination of water and sediments in Ondo Estuary, Nigeria[J]. Chemistry and Ecology, 2008, 24(4):269-283.
[2] 朱雷, 陈威. 模糊综合指数法在水质评价中的应用[J]. 武汉理工大学学报, 2001, 23(8): 61-65.
[3] SASIKUMAR K, MUJUMDAR P P. Application of fuzzy probability in water quality management of a river system [J]. Systems Science, 2000, 31(5): 575-597.
[4] 许文杰, 陈文国. 应用灰色聚类法评价湖泊水体富营养化[J]. 山东建筑大学学报, 2007, 22(1): 49-51.
[5] 刘金英, 杨天行, 李明, 等. 一种加权绝对灰色关联度及其在密云水库水质评价中的应用[J]. 吉林大学学报:地球科学版, 2005, 35(7): 54-58.
[6] SUN Xiuling, TAN Yongming, XU Xiaochi. Matter Element Extension Evaluating Model Based on Synthesis Weights and Approach Degree and its Application [C]. The 2nd International Conference on Bioinformatics and Biomedical Engineering. Shanghai,China:Inst of Elec and Elec Eng Computer Society, 2008:3661-3665.
[7] 张龙云, 曹升乐. 物元可拓法在黄河水质评价中的改进及其应用[J]. 山东大学学报:工学版, 2007,37(6): 91-96.
[8] KODAZ H, KARA S, LATIOGLU F, et al. A new hybrid classifier system: Information gain-based artificial immune recognition system [J]. Experimental Techniques, 2007, 31(6): 36-43.
[9] MOHAMED S, ABDELKRIM L, ALI B H, e al. A segmentation method to handwritten word recognition [J]. Neural Network World, 2007, 17(3): 225-236.
[10] RUZANSKI E, HANSEN J H L, MEYERHOFF J, et al. Stress level classification of speech using Euclidean distance metrics in a novel hybrid multi-dimensional feature space [C]//2006 IEEE International Conference on Acoustics, Speech, and Signal Processing. Toulouse:Institute of Electrical and Electronics Engineers Inc, 2006: 1425-1428.
[11] KURNIAWATI R, JIN J S, SHEPHERD J A. An efficient nearest-neighbour search while varying Euclidean metrics [C]//Proceedings of the sixth ACM international conference on Multimedia. New York: Association for Computing Machinery, 1998: 411-418.