APP下载

基于改进萤火虫算法的投影寻踪太湖水质综合评价

2017-03-21白雁翎崔晨风童山琳

节水灌溉 2017年5期
关键词:水质评价萤火虫投影

白雁翎,崔晨风,童山琳

(西北农林科技大学水利与建筑工程学院,陕西 杨凌 712100)

随着工业的不断发展和人类活动的多样化,我国各类水体受到了不同程度的破坏。鉴于此,对水环境的质量进行检测与评价,并进行相应的预防和治理非常必要。水质评价大致可分为确定性和不确定性2类,确定性方法有Jacobs和Horton等于20世纪60年代提出的水质指数概念和公式[1]、美国Nemerow教授提出的内梅罗水污染指数法[2]、前东欧和苏联学者提出的化学指标和生物指标[3]等,这些确定性方法使水质评价趋于全面和科学。我国学者在此基础上又提出了多种水质综合指数计算模式[4-6]。而不确定性理论是近年来不断发展起来的,其理论和方法也被引入到水质评价中,比如数理统计理论、人工神经网络法、模糊集理论、灰色系统理论方法等[7,8]。2类方法各有利弊:确定性方法相对简单,但评价结果片面不客观。不确定性方法目前应用较多,但也存在不少问题,比如存在对信息丢失严重的问题,评价结果易趋于均化,不易分辨,如数理统计理论要求大量的实测数据,若水质样本容量较小则不适用;再如人工神经网络法在模型表现中有收敛速度慢、稳定性差等问题[9]。

由于水质评价指标的多样性及相互之间的不相容性,合理的综合评价被要求能够给出一个综合反映水质状况的指标,也即将一个多指标的评价问题转化成一个用单指数进行评价的问题。投影寻踪方法就是这样一种方法[10],它被用于处理和分析高维数据,用来解决一定程度上的非线性、非正态等问题。它是将高维数据投影到低维空间上并保持原数据的特征结构不变,进而将高维数据用最合理的一维指标表示。基于此,本文提出了改进的萤火虫算法的投影寻踪模型,在传统萤火虫算法的基础上使寻优后期步长逐步减小,更易于找到最优解[11],得到最佳投影方向使得水质评价更为客观准确,并将其应用到太湖不同时间尺度下的水质数据上,评价结果符合当地实际状况。

1 研究区概况

太湖是长江流域南段(以江浙为主)自然形成的一个淡水湖,水面面积超过0.2 万km2,是我国第3大淡水湖。太湖流域是我国经济最为发达的地区之一,区域内工业密集,人口积聚,由于土地、水资源等开发利用强度持续加大,流域水环境压力重,尤其是太湖西北部大面积污染。这是因为太湖流域沿线城镇特别是工业发达地区的生活用水和工业用水用水量巨大,而污水没有得到很好的净化处理,导致超标的污水流入太湖后造成严重污染。因此,太湖水质准确客观的综合评价对当地水资源与水环境管理工作具有十分重要的意义。

2 数据来源

论文中所使用的溶解氧(DO)、化学需氧量(COD)和氨氮(NH3-N)浓度数据来自于国控监测站点全国主要流域重点断面水质自动监测周报的监测资料。与常规水质监测相比较,水质自动监测的监测频次高、监测结果传输及时,除便于环境管理系统及时掌握水环境质量外,还可根据需要形成日报、周报等各种形式的报告,必要时还可进一步降低监测的时间尺度,对于准确分析水质的变化情况具有重要意义。年数据选取2004-2013年10 a间太湖区6个代表性站点(无锡沙渚、宜兴兰山嘴、苏州西山、湖州新塘港、青浦急水港、嘉兴王江泾)的监测数据,周数据选取2011年上海青浦急水港站的监测数据。各站点后文分别用1~6站点代替。评价标准依据地表水水质评价标准(GB3838-2002),各个评价指标的等级标准见表1,10 a间水质单项指标的的年均浓度见表2,上海青浦急水港2011年周数据用以分析,此处不列出。

表1 地表水水质评价指标标准 mg/L

表2 太湖水质2004-2013年监测数据 mg/L

3 研究方法

3.1 基于萤火虫算法的投影寻踪模型

投影寻踪(PP)方法是一种探索性数据分析方法[13-15],它是把多维数据通过坐标组合投影到单维空间上,每一个投影都能表现出特定的数据特征,而最能反映多维数据的投影表征即为最佳投影方向。最佳投影方向可采用构建投影指标函数并求取最优解来获得。优化投影指标函数是一个十分复杂的优化问题,目前常采用的有遗传算法(GA)、蚁群算法(ACA)和粒子群算法(PSO)。这些算法普遍存在“早熟收敛”的缺陷,不利于获取最优解[10]。为此本研究引入一种新的优化算法:萤火虫算法(FA),是通过模拟萤火虫的随机集散行为而仿造出的一种随机优化算法。经验证明,萤火虫算法在寻找全局最优解上比其他算法更为有效。本文将利用萤火虫算法优化投影指标函数模型,求得最佳投影方向。

萤火虫算法的运算过程大致可描述为:搜索研究空间中的所有可行解,将搜索和优化过程模拟成夜空中萤火虫个体的聚集和飞行过程,依据目标函数适应度(聚集度)值确定搜索和优化过程中好的可行解[9]。

模型建立步骤如下。

(1)样本评价指标集的归一化处理。设样本集为{x*(i,j)|i=1,2,…,n;j=1,2,…,p},x*(i,j)为第i个样本的第j个指标值,n,p分别为样本和指标的个数。为使各样本评价指标值消除量纲便于计算,并使其变化范围统一,对各评价指标值进行归一化处理[16]。

越大越优的归一化公式:

(1)

越小越优的归一化公式:

(2)

式中:xmin(j)、xmax(j)分别为第j个指标的最小值和最大值;x(i,j)为指标特征值归一化后的序列。

Q(a)=SzDz

(3)

(4)

r(i,j)=|z(i)-z(j)|

(5)

式中:Sz为投影值z(i)的标准差;Dz为投影值z(i)的局部密度;R为局部密度的窗口半径,其取值与样本特性有关;r(i,j)为样本之间的距离;u为一单位阶跃函数;u[R-r(i,j)]为随着r(i,j)增加而下降的单调密度函数。

(3)优化投影指标函数。各样本指标值一定时,投影指标函数Q(a)仅与投影方向a有关。通过优化目标函数可求得最佳投影方向,即能最大程度暴露高维数据某类特征结构的投影方向:

Q(a)=SzDz

(7)

这是一个非线性的函数,并以{a(i,j)|j=1,2,…,p}为优化变量,用常规优化方法难以处理。本研究拟采用萤火虫算法(FA)解决该优化问题。

(4)等级评价。用步骤(3)求得的最佳投影方向将标准等级中的样本指标集降维,得到水质综合评价的分级标准。

3.2 改进的萤火虫算法

萤火虫寻优算法是通过表述萤火虫最大的聚集度来实现,与萤火虫群会在亮度最大处聚集一样,搜索值主要集中于最优值附近,在个解向最优值趋近的过程中,指标值在最优值附近跳跃会造成最优值震荡,进而导致最优值发现率降低,影响模型测算精度。为此,本研究改进标准萤火虫算法,使后期集聚现象集中时步长变大,这样萤火虫算法将在开始时就有很好的全局寻优能力,能够最快定位最优值,而在搜索后期受干扰较少。初始步长alpha设定为 0.25,当笛卡尔距离>0.25时,经过改进的萤火虫优化算法如下:

xi(t+1)=xi(t)+β[xj(t)-xi(t)]+krij(rand-1/2)

(8)

式中:k为根据实际情况可调整的正相关系数。

萤火虫优化算法步骤如下。

(1)初始化算法基本参数。设置萤火虫数目m,光强吸收系数γ,最大吸引度β,步长因子α,搜索精度或最大迭代次数maxN。

(2)随机初始化萤火虫的位置,计算萤火虫的目标函数值作为各自最大荧光亮度I0。

(3)计算群体中萤火虫的相对亮度I和吸引度β:

I(t)=I0e-γ r

(9)

β(r)=β0e-γ rm

(10)

式中:γ为光强吸收系数,荧光会随着距离的增加或传播媒介的吸收逐渐减弱,设置一系数来反映此特性,多数问题中γ∈[0.01,100];r为萤火虫i与j之间的欧氏距离,在解决离散问题或其他特殊问题时,距离可根据实际情况定义:

(11)

式中:d为空间维数;xi,k为萤火虫i在d维空间中第k个分量。

根据相对亮度决定萤火虫的移动方向,更新萤火虫的空间位置,更新公式如改进后的式(8),xi(t+1)为萤火虫xi在t+1次移动后的位置,初始步长取较大值,后期按照改进方法使随机步长随rij的变化而变化。更新萤火虫的位置可先随机扰动处在最优位置的萤火虫,根据变动情况重新计算萤火虫的亮度。

(4)当搜索精度满足要求转下一步;不符合要求增加搜索次数进行下一次搜索。

(5)输出全局极值点和最优个体值。

根据上述算法描述,改进后的萤火虫优化算法简图见图1。

图1 改进后的萤火虫优化算法简图Fig.1 Improved firefly algorithm

4 结果与讨论

4.1 水质评价结果

根据经验,随机样本太少将导致数学模型不精确。本研究为使算法更具说服力,使投影曲线更为稠密,在各水质等级范围内均匀随机产生各100 个样本点。随机产生的样本值与对应水质等级Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ的边界浓度共构成505个样本点。种群规模设置为200,初始迭代步长α=0.25,迭代次数s=200,最大吸引度β=1,光强吸收系数 。利用模型优化目标函数,得到最佳投影方向:(0.314 2,0.800 2,0.510 8)。各指标投影方向值的大小可表明该指标对水质评价的影响程度,影响程度从大到小顺序依次为:化学需氧量,氨氮,溶解氧;同时,得到相应的水质等级综合评价的分级标准,见表3。将太湖2004-2013年各站点数据及2011年上海青浦急水港站点的数据进行投影计算,得到各水质样本基于最佳投影方向的投影值,见表4。

表3 水质等级的计算值Tab.3 Computation values of water quality grades

表4 水质评价结果Tab.4 Evaluation results of water samples

4.2 评价结果分析

从表4及图2可以看出,前4个站点的水质较好,10 a间均属于Ⅰ类水质,在Ⅰ类水质中略有波动。从评价表中可以发现在2012-2013年,1~4站点均出现了水质变差的现象,而在站点5、6中没有发现类似情况,结合4个站点的单项指标数据,发现是CODMn的含量升高而导致的。站点2在4个站点中水质相对较差,且在2008年达到10 a中水质最差。站点3在2004-2009年一直保持着综合水质最好的地位,但从2007年开始,水质连年下降,虽然仍然处于Ⅰ类水质,但是水质下降的趋势却值得关注。站点6由Ⅲ类水质逐渐变为在Ⅱ、Ⅲ类水质边界处徘徊,说明治理效果不是十分显著。站点5则呈现出明显的水质好转趋势,由最初的水质最差(达Ⅳ类)逐渐转标为Ⅱ、Ⅲ类水质,2013年达到Ⅰ类水质的标准。

图2 太湖各站点2004-2013水质综合评价Fig.2 Water quality evaluation result s of the sections in Taihu Lake in 2004-2013

水质的综合评价能够提供一种客观准确的方式对综合水质状况进行相对比较。如对于站点1、3,从单项评价指标来看,DO和CODMn均满足Ⅰ类水质,1站点的DO呈现出先下降后又上升的趋势,3站点的DO呈现出连年下降的趋势;1站点的CODMn呈现出整体下降的趋势,3站点的CODMn含量反复波动曲折。单项指标变化之复杂使水质综合评价难以实现。通过投影分析,在最佳方向上将多维污染物指标一维化,生成的综合评价系数能够客观准确地反映水质变化情况,能够满足水质评价和治理的需求。

对某一流域而言,降雨和径流对污染物的扩散能力变化很大,且多为季节性变化,因此,研究区域内小时间尺度下水质指标的变化,对充分利用气象条件来指导规划和生产力布局,对改善流域水环境质量条件有非常重要的意义。

上文分析,站点5的水质在10 a内得到了明显的改善,因此我们选择上海青浦急水港2011年全年的周数据,对小时间尺度内的水质状况进行综合评价。评价结果见图3。

图3 上海青浦急水港2011年水质综合评价Fig.3 Water quality evaluation of Shanghai Qingpu Jishuigang in 2011

可以看出全年大部分时间处于Ⅱ类水质,这与之前的结果相同;3、4、6~8、18~20周达到Ⅰ类水质标准,26~30周处于Ⅲ类水质,1~34周中波动起伏较大,35~52周波动幅度变小,全年水质变化呈现出季节性变化的规律。太湖流域处于亚热带季风气候,夏季高温多雨,冬季低温干燥。可以看出综合评价在Ⅲ类的水质主要出现在夏季,冬季个别几周可达Ⅰ类水质,其余大部分时间处于Ⅱ类水质。

4.3 水样评价结果对比

本文采用中华人民共和国地下水质量标准(GB/T14848-93)中推荐的综合评分法(F值法)进行对比分析,对所选站点2011年的水质进行评价,单项及综合评价结果见表5。

从表5中可看出,本文采用的模型对水质的评价结果普遍好于综合评分法,结合原理可看出是因为投影寻踪算法在多种污染物中寻求最佳投影方向,改进的萤火虫算法进一步确保了得到的评价值客观准确;而综合评分法对各指标按照国家标准评分,取其平均值作为综合评分值,可能放大其中的某些污染物的影响,得到的评价结果在水环境治理中的指导意义存在一定程度的差异。

5 结 语

投影寻踪模型可有效排除人为主观因素的干扰,较好解决了水质评价中的各类指标的不相容性和模糊性问题。本文提出用改进的萤火虫算法优化投影寻踪模型,针对寻优后期步长过长会导致寻优效率变低,用根据实际情况调整的正相关系数代替固定步长,使得迭代前期的收敛速度加快提高效率,迭代后期使步长变小精确寻优,进而求解出最佳投影方向。利用上述模型对太湖水质进行综合评价,得到了太湖水质在不同时间尺度下的变化情况,有助于当地污染的预防和治理。

表5 站点水质评价结果及对比Tab.5 Evaluation and comparison results of each sites

在综合水质评价中,单项水质监测指标作为数据基础,对评价结果产生影响。尽管投影寻踪模型能够消除差异性,水质指标的个数及时间尺度均会对结果产生影响。水质指标越多,综合评价越真实准确;时间尺度越小,水质变化评价越准确。因此在以后对太湖的水质评价或者其他水域的水质评价研究中,合理选择实测数据、样本个数和时间跨度特别重要,这也为以后更好地指导水污染治理提供了更切实可行的理论依据。

[1] Jacobs H L. Water quality criteria[J]. Journal of Water Pollution Control Federation, 1965,37(5):292-300.

[2] Wang L Z, Lyons J, Kanehl P. Impacts of Urbanization on Stream Habitat and Fish Across Multiple Spatial Scales[J]. Environmental Management, 2001,28(2):255-266.

[3] Jin Kang-Ren, James R Thomas, Lung Wu Seng. Assessing Lake Okeechobee eutrophication with water-quality models[J]. Journal of Water, 1998,124(1):22-30.

[4] 彭 静,廖文根. 对水环境研究的认识及展望[J]. 中国水利水电科学研究院学报, 2004,2(4):271-275.

[5] 郭劲松,龙腾锐,霍国友,等. 四种水质综合评价方法的比较[J]. 重庆建筑大学学报, 2000,22(4):6-12.

[6] 徐祖信. 我国河流综合水质标识指数评价方法研究[J]. 同济大学学报(自然科学版), 2005,32(4):482-488.

[7] Tiryaki Fatma, Ahlatcioglu Beyza. Fuzzy portfolio selection using fuzzy analytic hierarchy process[J] . Information Sciences, 2008,179(2):53-69.

[8] 巩奕成,张永祥,丁 飞,等. 地下水水质评价的FA优化灰色关联投影寻踪模型[J]. 应用基础与工程科学学报, 2015,23(3):512-521.

[9] 巩奕成,张永祥,丁 飞,等. 基于萤火虫算法的投影寻踪地下水水质评价方法[J]. 中国矿业大学学报, 2015,44(3):566-573.

[10] 邵 磊,周孝德,杨方廷,等. 基于自由搜索的投影寻踪水质综合评价方法[J]. 中国环境科学, 2010,30(12):1 708-1 714.

[11] 付 强,蒋睿奇,王子龙,等. 基于改进萤火虫算法的土壤水分特征曲线参数优化[J]. 农业工程学报, 2015,31(11):117-122.

[12] 胡雅杰,马 静,黄国情. 基于多种方法的太湖综合水质评价比较[J]. 水利水运工程学报, 2015,(5):67-74.

[13] Xin-She Yang. Firefly algorithm, stochastic test functions and design optimization[J]. International Journal of Bio-inspired Computation, 2010,2(2):78-84.

[14] Xiao Ma, Ye Li, Meng Zhang. Assessment and analysis of non-point source nitrogen and phosphorus loads in the Three Gorges Reservoir Area of Hubei Province, China[J]. Science of the Total Environment, 2011,412:154-161.

[15] 曾 冰,李明富,张 翼,等. 基于萤火虫算法的装配序列规划研究[J]. 机械工程学报, 2013,49(11):177-184.

[16] 巩奕成,张永祥,任仲宇,等. 基于投影寻踪和模糊物元组合模型的地下水水质评价[J]. 北京工业大学学报, 2014,40(9):1 402-1 407.

猜你喜欢

水质评价萤火虫投影
阿什河哈尔滨段水质评价
解变分不等式的一种二次投影算法
秦皇岛北部地表水和地下水水化学特征及水质评价
浞河浮游藻类的调查研究与水质评价
基于最大相关熵的簇稀疏仿射投影算法
找投影
找投影
萤火虫
萤火虫
抱抱就不哭了