环巢湖河流水环境质量的时空变化分析
2021-09-03刘阳王欢唐萍余晓美
刘阳 王欢 唐萍 余晓美
摘要 以环巢湖主要河流2015年1月—2019年6月逐月的水质指数(WQI)为研究对象,运用函数型数据分析方法构建各河流WQI变化曲线以及WQI变化速度曲线,通过K-means函数型聚类算法对WQI变化曲线及WQI变化速度进行动态特征分析。结果表明:环巢湖河流水质呈现“两阶段”周期性,受气象条件影响显著;水质区域差异显著,易受人为因素影响;环巢湖河流水质有所改善,各河流治理工作和实时效果不同,部分河流水质治理效果显著。
关键词 水环境质量;时空变化;水质指数(WQI);函数型数据分析;K-means函数型聚类;环巢湖河流
中图分类号 X 824 文献标识码 A
文章编号 0517-6611(2021)14-0072-04
Abstract Taking the monthly water quality index (WQI) of the main rivers around Chaohu Lake from January 2015 to June 2019 as the research object,the functional data analysis methods were used to construct the WQI change curve and WQI change speed curve of each river, Kmeans functional clustering algorithm was used to analyze the dynamic characteristics of WQI change curve and WQI change speed.The results showed that the water quality of river around the Chaohu Lake had the cycle of two stages,which was significantly affected by meteorological conditions.The water quality had distinct regional difference, which was easily affected by human factors.The water quality of the rivers around Chaohu Lake had been improved,the river governance work and realtime effects were different for the rivers, which was remarkable only in some rivers.
Key words Water environmental quality;Temporal and spatial changes;Water quality index (WQI);Functional data analysis;Kmeans functional clustering;Rivers around Chaohu Lake
基金項目
安徽高校自然科学研究项目(KJ2018A0424);第二次全国污染源普查工业源普查报表制度及普查数据质量控制实施技术支持项目(22110399005)。
作者简介 刘阳(1988—),男,安徽亳州人,助理工程师,硕士,从事水环境质量综合分析。
收稿日期 2020-11-24;修回日期 2020-12-08
巢湖是我国的五大淡水湖之一,是我国水污染防治的重点湖体,在供水、水量控制、生态平衡和经济发展等方面发挥着重要作用。巢湖主要有9条环湖河流,其中西半湖有5条入湖河流(南淝河、十五里河、派河、杭埠河和白石天河),东半湖有3条入湖河流(兆河、双桥河和柘皋河)和1条出湖河流(裕溪河)。近几十年来,随着周边城镇经济的快速发展,工业和家庭废水经河流流入巢湖,引入大量有机物,巢湖现已成为我国污染最严重的湖泊之一。为了缓解巢湖的富营养化,在2012年合肥市政府启动了“引江济巢工程”,长江水经赵河引入巢湖,缩短湖泊水循环,缓解水体富营养化。为更好地了解巢湖水环境质量状况,学者们从不同角度运用各种传统的统计方法对巢湖水质的影响因素和时空变化特征进行了研究[1-2]。环巢湖河流水环境质量对巢湖水污染防治也有着重要影响[3-4]。
随着信息技术和监测手段的迅速发展,实际问题中搜集的数据越来越具有函数特点,因此函数型数据分析方法与应用日益受到学者们的广泛关注,在环境科学、气候学、计量经济学和医学等领域应用广泛[5-6],使其成为统计学领域研究的热点之一。笔者以环巢湖主要河流2015年1月—2019年6月逐月的水质指数(WQI)为研究对象,运用函数型数据分析方法构建各河流WQI变化曲线以及WQI变化速度曲线,通过K-means函数型聚类算法对WQI变化曲线及WQI变化速度进行动态特征分析,以期为政府部门进行水环境质量管理和水污染防治政策的出台以及绿色经济发展评价提供重要的技术支撑。
1 资料与方法
1.1 数据来源 该研究选取2015年1月—2019年6月环巢湖9条主要河流水质监测断面月度数据,根据环湖河流的水质特点选取5项主要水质参数(氨氮NH4+-N、总磷TP、化学需氧量COD、生化需氧量BOD5和高锰酸盐指数CODMn),按照文献[7]的方法可计算出每条河流月度WQI数据。
1.2 研究方法
1.2.1 WQI计算。WQI计算步骤如下:
(1)选择水质指标。根据管理目标和研究区环境特征,选择一组水质指标来描述研究区域水质状况。
(2)分别计算所选指标的指标指数。不同单位和维度的变量被转换成具有共同尺度的指标,通常在0~100范围内。对于值越小越好的指标(如CODMn),
其中xi和yi分别为监测数据和第i个指标的指标指数;ci0为Ⅰ类的下限,cij是第j类的上 限,参照地表水环境质量标准(GB 3838—2002)[8]。
(3)分配水质评价指标权重。在大多数文献中,评价指标的权重是根据它们对整体水质的相对重要性来分配的[9],加权方法如下:
ωi=qiLi=1 qi (i=1,2,…,L),其中ωi和qi分别表示第i指标的权重和重要性参数,L为指标总个数。qi为取值于[1,5]的整数,qi值越大表示第i指标的重要程度越高。 该研究考虑每个评价参数对水质影响不同,根据各参数超标情况,超标越多权重越大原則,水质参数NH4+-N、TP、COD、BOD5和CODMn的重要性分别取值为5、4、4、3、2。
(4)计算WQI。计算公式为 z=Li=1ωiyi,其中z 为该监测断面的WQI。该研究9条河流2015年1月—2019年6月逐月WQI数据见表1,其中S1~S9分别表示南淝河、十五里河、派河、兆河、杭埠河、白石天河、双桥河、柘皋河和裕溪河水质监测断面。
1.2.2 基于函数型数据WQI的动态分析。
将环巢湖各个河流的WQI数据均看作是随时间变化的函数曲线,则表1中的数据矩阵可看作为区间上的随机过程 X(t):Xij=Xi(tj),i=1,2,…,n;j=1,2,…,Mi。在实际问题中利用采集或观测到的有限离散数据,通过数据函数化拟合转化为无穷维的函数曲线X(t)。在实际问题中由于误差存在,数据模型记为Yj=X(tj)+εj,误差项εj 满足零均值同方差独立同分布。
该研究采取的数据是样本个数 n=9 ,每个样本都在相同的时间点取值的均衡数据。根据水质变化的周期性特征,采用傅立叶基函数法将WQI离散数据转换为函数曲线,具体步骤参照Ramsay等[10]的研究,记 (t)=ki=1ii(t),其中1(t),2(t),…,k(t)是k个正交傅立叶基函数,i表示基函数i(t) 所占的权重。针对该研究9条环巢湖河流2015年1月—2019年6月WQI数据矩阵,依据上述函数曲线的拟合方法,把表1中的数据矩阵转化为9条连续函数曲线 X(t) ,其中每条函数曲线代表某一条河流的时间序列WQI函数曲线。由于 X(t)为连续光滑曲线,易得曲线的各阶导函数DmX(t),因此,可以估计X(t)和DmX(t)在任意时间t上的函数值(t)和mX(t), 从而获得各个环湖河流WQI动态变化特征。根据WQI函数曲线 X(t) ,定义均值函数 (t) 和方差函数Var X(t) 如下: (t)=n-1ni=1Xi(t), Var X(t)=(n-1)-1ni=1[Xi(t)-i(t)]2 。
通过对9条环巢湖河流的WQI函数曲线 X(t) 、均值函数曲线 (t) 、标准差函数曲线Var X(t)以及导数曲线DmX(t)的动 态变化过程分析,可以得出近5年环巢湖河流水质治理的阶段性成果;揭示各个河流水质现状、变化趋势和规律,挖掘影响各个河流水质的因素以及水质区域性差异的原因。
1.2.3 对环巢湖河流进行函数型聚类分析。
对水质进行时空特征分析和水质评价中,传统多元统计方法如聚类分析(CA)、主成分分析(PCA)和判别分析(DA)已被广泛应用[11],为识别影响特定流域内水质的主要参数提供了可靠的方法。然而,在聚类分析中距离的概念很容易推广到连续函数数据的情况。与传统聚类方法对静态数据的分析相比,函数型数据聚类方法[12]能够从动态的角度对环巢湖河流WQI曲线进行分类。为进一步研究环巢湖河流WQI动态变化和各个河流水质之间的关联性,该研究采用类似多元统计分析聚类思想的K-means函数型聚类算法,从形状和数值2个维度对WQI这一综合性数量指标进行聚类分析。
2 结果与分析
2.1 环巢湖河流WQI动态变化规律 该研究采用傅立叶基函数法拟合9条环巢湖河流2015年1月—2019年6月的WQI曲线如图1所示,从图1可以看出,①各河流WQI指数曲线呈现明显的“两阶段”周期特征。按周期来看,各河流WQI指数曲线表现出两阶段特征,即水质指数下降期和上升期。下降期阶段在当年10月—次年2月,上升期阶段在2—9月。可见水质变化的周期特征与气候因素关系显著。各河流WQI极小值大多出现在1—3月,显然冬季降雨量减少,河水流量较小,使得污染物浓度升高。②环湖河流WQI曲线呈现区域化差异。从河流WQI曲线的数值来看,各河流水质差异显著。虽然WQI曲线均呈现周期性变化,但各个河流WQI曲线拐点的发生时间有一定的差异。从图1可以看出,水质越差的河流其WQI曲线变化幅度越大,反之变化平缓。因此可以认为水质与河流所处的地理位置有关。南淝河、十五里河和派河受区域社会因素影响较大,水质差。
因此,在对各行政区域环境治理绩效评价时,需要充分考虑区域因素、自然因素和社会因素等差异造成的影响,建立起公正科学的评价体系。③各环湖河流水质总体而言有所改善。从9条环巢湖河流的WQI曲线可以看出,2015年1月—2019年6月总体上河流WQI有增加趋势,各函数曲线的相对位置层次分明,但部分曲线也出现交叉。也就是说水质好的河流保持着较好的水质,但与此同时部分河流水质改善显著。2017年6月以来,双桥河、十五里河和派河水质明显好转。
因此,这种水质变化现象应归结为政府部门环境治理导致的结果,这种有效的环境管制方式值得总结推广。
利用9条环巢湖河流WQI曲线,获得均值函数 (t) 和方差函数Var X(t) ,如图2所示。从均值曲线可以看到,2015—2019年环巢湖河流平均 WQI 在55~85,水质评估分级对应为轻度污染至良。2018年以来环巢湖河流平均水质的良好程度明显提高,反映我国环境政策效果在逐渐显现,环境监管取得了很好的成效。但是污染严重河流治理难度依然较大,并且还出现了反弹,例如南淝河。从标准差曲线来看,河流WQI标准差波动范围在18~29,2015—2017年的波动程度呈周期性缓慢下降,2018年以来各河流的WQI差异在逐渐缩小,即各河流水质受区域性影响变小。
環湖河流WQI函数曲线一阶导数 D′(X(t)) ,即各河流WQI的变化速度曲线,如图3所示。从WQI的变化速度曲线来看,各河流WQI变化速度曲线受降雨等整体外部环境影响形状相似,但是各河流变化速度大小不同,差异性仍然显著。另外,WQI变化速度曲线整体变化平稳,正向值占大多数时间,说明水质向好的方向变化;负向值主要出现秋冬季阶段,水污染形势严峻。因此,要探究如何分阶段治理水污染问题。
2.2 环巢湖河流WQI曲线的K-means函数型聚类分析 通过K-means函数型聚类算法对9条环巢湖河流WQI曲线进行聚类,将具有相似变化的WQI曲线聚成一类。从聚类的中心值曲线分析,分为两大类是比较合适的,南淝河、十五里河、派河为第一类,双桥河、兆河、杭埠河、白石天河、柘皋河、裕溪河第二类。从聚类结果来看,受合肥市人为环境影响,巢湖西半湖西北部入湖河流南淝河、十五里河、派河水质较差,西半湖西北部入湖河流水质明显劣于西半湖南部和东半湖河流,呈现一定的区域差异性和集聚性。进一步对9条环巢湖河流WQI变化速度曲线进行聚类,从聚类的中心值曲线分析,分为两大类是比较合适的,十五里河、派河、双桥河的WQI变化速度曲线聚成第一类,其他6条河流的变化速度曲线聚成第二类。第一类的3条河流近5年的WQI指数变化幅度波动较大,在2015年1月—2017年6月水质总体较差,部分时间段也在改善,2017年7月以来改善程度最大;第二类中有5条河流WQI指数变化幅度平稳和对称,水质改善具有持续性和连贯性。通过对比分析WQI曲线聚类结果和WQI变化速度曲线聚类结果,可以看到区域不是唯一因素,在同一区域,WQI变化速度曲线并不在同一类。因此,环巢湖河流水质的改善需要因地制宜,找出科学治理方法。十五里河、派河、双桥河3条河流水质改善的效果相对较好,兆河、杭埠河、白石天河、柘皋河、裕溪河5条河流水质保持和控制效果相对较好。因此,在环巢湖河流水质治理上需要重点关注南淝河的治理和防止十五里河、派河水质出现反弹。
3 结论与讨论
该研究以环巢湖主要河流2015年1月—2019年6月水质监测数据为研究对象,运用函数型数据分析方法构建各河流WQI变化曲线、均值函数曲线、标准差函数曲线以及变化速度曲线,通过K-means函数型聚类算法对WQI曲线及变化速度曲线进行动态特征分析,具体结论如下:
(1)环巢湖河流的水质呈现明显的“两阶段”周期性,受气象条件影响显著,秋冬季水质相对较差。另外,水质与区域的地理位置和社会因素有关,例如南淝河、十五里河和派河受合肥市人为因素影响,水质较差。
(2)环巢湖河流水质总体而言有所改善,各河流治理工作和实时效果不同,双桥河、十五里河和派河水质治理效果显著,但重污染河流南淝河水质改善缓慢,治理难度较大。
(3)环巢湖河流的WQI曲线和WQI变化速度曲线的聚类结果能够更准确地得到水环境状况动态发展评价。从评价结果来看河流呈现一定的区域差异性和集聚性,但是也可以看到区域不是唯一因素,在同一区域,WQI变化速度曲线并不在同一类。
信息技术的发展使得数据收集的手段和技术越来越丰富,在环境的监测中可获取高频、多维和实时数据,充分发挥函数型数据分析动态灵活和高维数据无可比拟的优势,基于高频或多维水环境指标数据探索不同河流水质动态变化的精准因素。
参考文献
[1] 陶涛,孙世群,姜栋栋,等.模糊综合评价在巢湖水质评价中的应用[J].环境科学与管理,2010,35(12):177-180.
[2] 金菊良,吴开亚,郦建强. 巢湖水质安全评价的对应分析和投影寻踪熵耦合方法[J].四川大学学报(工程科学版),2007,39(6):7-13.
[3] 储茵,朱江,夏守先,等.巢湖典型支流柘皋河水质污染时空变化特征[J].水土保持学报,2011,25(4):243-248.
[4] 沈文静,孙世群. 巢湖西半湖主要入湖河流水质的模糊评价及结果分析[J].环境科学与管理,2011,36(11):187-190.
[5] LUN Z H,ZHOU Y C.Ranking of functional data in application to worldwide PM10 data analysis[J].Environ Ecol Stat,2017,24(4):469-484.
[6] 余晓美,沈永昌.中国环境保护重点城市空气质量的动态特征分析[J].统计与决策,2019,35(11):91-94.
[7] YAN F,LIU L,LI Y F,et al. A dynamic water quality index model based on functional data analysis[J].Ecol Indic,2015,57:249-258.
[8] 国家环境保护总局,国家质量监督检验检疫总局.地表水环境质量标准:GB 3838—2002[S].北京:中国环境科学出版社,2002.
[9] SEMIROMI F B,HASSANI A H,TORABIAN A,et al.Evolution of a new surface water quality index for Karoon catchment in Iran[J]. Water Sci Technol,2011,64(12):2483-2491.
[10] RAMSAY J O,SILVERMAN B W.Functional data analysis[M].2nd ed.New York:SpringVerlag,2005.
[11] ZHONG M F,ZHANG H Y,SUN X W,et al.Analyzing the significant environmental factors on the spatial and temporal distribution of water quality utilizing multivariate statistical techniques:A case study in the Balihe Lake,China[J].Environ Sci Pollut Res,2018,25(29):29418-29432.
[12] HENDERSON B.Exploring between site differences in water quality trends:A functional data analysis approach[J].Environmetrics,2006,17(1):65-80.