基于多元统计分析的黄河山东段水质评价研究
2020-10-12时文博曹春燕宋颖李永军董方慧
时文博 曹春燕 宋颖 李永军 董方慧
摘 要:以黄河山东段为例,在利用方差分析(ANOVA)对高村、孙口、艾山、泺口和利津5个断面2015—2017年各水质监测指标月度监测值进行时空尺度显著差异性分析的基础上,采用层次聚类分析法将180个水质样本分成12组,并以各组样本均值为基础,运用综合水质标识指数法对河流综合水质进行评价。结果表明:黄河山东段综合水质状况良好,综合水质类别为Ⅰ类或Ⅱ类;时间上,2015—2017年综合水质状况逐渐好转;空间上,利津断面综合水质状况最差,其余断面从上游到下游综合水质状况呈好转趋势。
关键词:水质评价;方差分析;聚类分析;综合水质标识指数;黄河山东段
中图分类号:TV882.1;X824 文献标志码:A
doi:10.3969/j.issn.1000-1379.2020.02.010
Abstract:The Shandong reach of the Yellow River was measured as the research area in this study. Based on the results of analyzing the temporal and spatial differences of monthly surveillance data of five monitoring sites from 2015 to 2017 according to the analysis of variance (ANOVA), 180 samples were divided into 12 groups by hierarchical cluster analysis. Using the sample mean of each group as the input, the comprehensive water quality identification index of each group was calculated. The results show that the comprehensive water quality of the Shandong reach of the Yellow River is in good condition and the comprehensive water quality of the sampling sections is at class I to class Ⅱ levels. The comprehensive water quality condition has an upwarding trend from 2015 to 2017. The comprehensive water quality of Lijin section is the worst among five monitoring sites and from upstream to downstream, the comprehensive water quality has an upwarding trend except Lijin section.
Key words: water quality assessment; analysis of variance; cluster analysis; comprehensive water quality identification index; Shandong reach of the Yellow River
河流綜合水质评价是合理开发利用水资源及水环境管理的重要基础工作,对水质监测数据进行合理评价能够了解和掌握水体的污染程度,从而为水资源保护和水环境管理提供科学依据。由于水体环境的复杂性,因此评价方法的选择是河流综合水质评价的核心。水质评价方法大致可分为水质指数法和不确定性评价方法两大类,目前应用较多的评价方法有水质指数法[1-5]、模糊综合评价法[6-7]、灰色系统理论评价法[8-9]和人工神经网络法[10-11]等不确定性评价方法。此外,近年来,物元分析[12-13]、可拓评价[14-15]、投影寻踪技术(PP)[16-17]、集对分析[18-19]、TOPSIS法(即逼近理想解的排序方法)[20-21]、多目标决策-理想区间法(MODMIIM)[22]等新型不确定性研究方法和技术开始应用于河流水质综合评价中。水质指数法具有计算方法简单、物理概念清晰等优点,但是水质指数法通过有目的地选择一些重要的水质指标,将复杂的水质监测数据转换成可以理解和使用的信息,具有主观性。不确定性评价方法充分考虑了水环境系统的随机性、模糊性和灰色性[23],能够客观反映水环境质量,但这些方法均需构造相应函数,存在计算过程复杂的缺点,且有的方法在使用过程中需要依靠经验,有的方法存在分辨率低及计算时缺失信息多的缺点,有的方法不能准确判断水质类别[24],有的方法受人为因素干扰数据波动较大且没有典型的分布规律[25],这些不足限制了这些方法在实际应用中的推广。上述水质评价方法为水环境管理和水资源规划提供了决策支持,但在评价过程中通常将各时期、各断面进行独立评价,未考虑各种水体污染物在时间和空间上的差异性和相关性,导致了大量重复计算及评价过程的繁杂性。
当前水质评价方法应解决的主要问题是,充分利用大量水质监测数据的相似性与差异性,从而达到降维、简化计算过程和提高分析结果可靠性的目的。为克服传统评价方法在应对大量复杂样本时难以解释数据之间关联性及差异性的缺点,在以往多元统计分析方法(如因子分析[26-27]、主成分分析[28]、方差分析[29]、聚类分析[30])及综合水质标识指数法[3]的基础上,提出了基于多元统计分析和综合水质标识指数的水质评价方法,并将其应用于黄河山东段水质评价中。该方法有以下显著特点:简化了计算过程,减少了水质评价的工作量;充分挖掘了水质监测数据的时空特征,特别适用于多断面、长时间的水质评价;不仅可以定性评价,而且可以定量评价。
1 水质评价方法
1.1 基于多元统计分析和综合水质标识指数的水质评价方法
该方法以多元统计分析和综合水质标识指数法为理论基础,其基本步骤如下。
(1)通过方差分析(ANOVA)对各断面多年水质监测数据进行空间和时间尺度上的显著性差异分析,识别出具有显著差异的样本。
(2)通过层次聚类分析(HCA)对样本进行聚类分组。
(3)以各组水质数据为基础,采用综合水质标识指数法对水质状况进行评价。
(4)将评价结果分解到各组对应的样本点,从而实现多断面、长时间大量样本的水质评价。
1.2 方差分析
方差分析(ANOVA)是用于推断两个及两个以上样本的总体均值是否存在差异的显著性检验,其基本思想是,通过分析不同来源的变异对总变异的贡献程度,确定可控因素对研究结果影响的大小。数据的变异量可分解为组间变异和组内变异,组间变异即由可控因素引起的变异,组内变异即由随机误差引起的变异。根据控制变量个数不同,ANOVA可分为单因素方差分析和多因素方差分析。在本研究中,可控因素为时间或断面,属于单因素方差分析,计算公式为
1.3 层次聚类分析
聚类分析(CA)是一种统计分析技术,它是研究“物以类聚”的一种方法,其中使用最多的是层次聚类法。层次聚类分析法(HCA)的基本思想是,通过研究观察对象之间的亲疏程度,逐步将相似的对象聚合在一起,直至聚为一类。亲疏程度的计算包括2类:样本间距离和小类间距离,样本间距离的测量方法有欧氏距离、欧氏距离平方、Cityblock距离(布洛克距离)和Mahal距离(马氏距离)等,小类间距离的测量方法有最短距离法、最长距离法、中间距离法、重心法和离差平方和法(Ward法)等。本研究采用SPSS 19.0软件实现聚类分析,样本间距离和小类间距离分别采用欧式距离平方和Ward法测量。
1.4 水质标识指数评价法
(1)单因子水质标识指数。单因子水质标识指数可以完整地表示水质类别及与水功能区目标的比较情况,既可以对水质类别进行定性评价,又可以在同一类别中定量比较水质优劣。单因子水质标識指数pi由一位整数和小数点后两位有效数字组成,其结构为pi=X1.X2X3,其中X1、X2、X3代表的含义及其数值确定见文献[1]。
(2)综合水质标识指数。综合水质标识指数是在单因子水质标识指数的基础上建立起来的,是一种河流综合水质评价方法,该方法克服了单因子评价法以偏概全的缺点,能够对河流综合水质做出合理评价。其结构为Iwq=X1.X2X3X4,其中X1、X2、X3、X4代表的含义、X1.X2的计算公式及X3和X4的数值确定见文献[3]。
根据综合水质标识指数Iwq中的X1.X2可判定河流综合水质级别,当1.0≤X1.X2≤2.0时,综合水质类别为Ⅰ类;当2.0
2 实例研究
2.1 研究区域概况及采样点布设
黄河自菏泽市东明县进入山东省,自西南向东北横跨山东省西北部,黄河下游山东段干流河道全长628 km,流域面积1.83万km2。山东沿黄城市主要有菏泽、济宁、泰安、聊城、济南、德州、滨州、淄博和东营。黄河作为山东省最主要的客水资源,其水资源质量优劣和多少对沿黄各市社会经济的可持续发展具有举足轻重的地位,因此水质状况受到广泛关注。在黄河山东段干流设置高村(S1)、孙口(S2)、艾山(S3)、泺口(S4)和利津(S5)5个断面进行水质评价。
2.2 数据采集
研究基础数据来源于黄河水利委员会山东水文水资源局2015—2017年的水质监测数据,根据黄河山东段的实际水质状况,排除一年中多数月份小于检出限的项目,选取化学需氧量(CODCr)、氨氮(NH3-N)、砷(As)、铜(Cu)、总磷(TP)和五日生化需氧量(BOD5)作为评价指标,根据《地表水环境质量标准》(GB 3838—2002)进行水质评价。每个断面每月进行一次水质监测,水质样本共180个,各断面各水质指标监测数据见表1。
2.3 数据时空尺度方差分析
考虑到水体污染物的时空差异性与相关性,对各水质评价指标进行同一断面不同年度间和同一年度不同断面间月度监测值的单因素方差分析,结果见表2和表3。其中:Sig值是差异性显著的检验值,Sig值小于等于0.05,表明控制变量下不同水平总体平均值存在显著性差异;Sig值大于0.05,不存在显著性差异。结果表明,在时间上,TP存在显著性差异,As和BOD5均不存在显著性差异,部分断面CODCr、NH3-N和Cu在不同年度间存在显著性差异;在空间上,6个水质评价指标在同一年度不同断面间均不存在显著性差异。由此可见,各水质评价指标在时空尺度上存在差异性与相关性,根据各指标存在的相似性,将样本进行分组评价,从而简化评价过程,减少数据的重复计算。
2.4 样品点分组
通过SPSS 19.0软件用Ward法对180个水质样本进行层次聚类分析,得到重新调整距离聚类合并的树状图和聚类表,根据树状图和聚类表对样本点进行分组。根据SPSS 19.0软件生成的聚类表,以类数为横坐标,以离差平方和系数为纵坐标,绘制曲线(图略),从曲线可以看出,从12类变化到11类时,曲线斜率明显增大,因此把样本分成12组。12组样本对应的水质样本点见表4。
[6] 李莲芳,曾希柏,李国学,等.利用模糊综合评判法评价潮白河流域水质[J].农业环境科学学报,2006,25(2):471-476.
[7] CHANG N B, CHEN H W, NING S K. Identification of River Water Quality Using the Fuzzy Synthetic Evaluation Approach[J]. Journal of Environmental Management, 2001, 63(3): 293-305.
[8] 赖坤容,周维博.灰色关联分析在延安市宝塔区延河段水质评价中的应用[J].成都理工大学学报(自然科学版),2010,37(5):570-573.
[9] CHENG Y Q, MA H M, SONG Q W, et al. Assessment of Water Quality Using Grey Relational Analysis and Principal Component Analysis[J]. Advanced Materials Research, 2011, 255-260: 2829-2835.
[10] 李晶.基于人工神经网络的黄河宁夏段水质评价研究[D].银川:宁夏大学,2013:17-28.
[11] PALANI S, LIONG S Y, TKALICH P. An ANN Application for Water Quality Forecasting[J]. Marine Pollution Bulletin, 2008, 56(9): 1586-1597.
[12] LI P Y, HE S, HE X D, et al. Seasonal Hydrochemical Characterization and Groundwater Quality Delineation Based on Matter Element Extension Analysis in a Paper Wastewater Irrigation Area, Northwest China [J]. Exposure and Health, 2018, 10(4): 241-258.
[13] 邹叶锋,陈锁忠.基于物元分析的地下水质量综合评判[J].水文,2006,26(6):20-22.
[14] 汪明武,周天龙,叶晖,等.基于联系云的地下水水质可拓评价模型[J].中国环境科学,2018,38(8):3035-3041.
[15] WONG H, HU B Q. Application of Improved Extension Evaluation Method to Water Quality Evaluation[J]. Journal of Hydrology, 2014, 509: 539-548.
[16] 付强,付红,王立坤.基于加速遗传算法的投影寻踪模型在水质评价中的应用研究[J].地理科学,2003,23(2):236-239.
[17] ZHANG C, DONG S H. A New Water Quality Assessment Model Based on Projection Pursuit Technique [J]. Journal of Environmental Sciences, 2009, 21(增刊1): 154-157.
[18] 冯莉莉,吕小凡,高军省.水质评价的集对分析方法研究[J].人民黄河,2010,32(10):76-79.
[19] SI Q, LI M C, ZHANG G Y, et al. Set Pair Analysis Method for Water Quality Evaluation Based on Nonlinear Power Function[J]. Environment Science and Materials Engineering, 2012, 573-574: 497-500.
[20] 陈强,杨晓华.基于熵权的TOPSIS法及其在水环境质量综合评价中的应用[J].环境工程,2007,25(4):75-77.
[21] LI P Y, WU J H, QIAN H. Groundwater Quality Assessment Based on Rough Sets Attribute Reduction and Topsis Method in a Semi-Arid Area, China[J]. Environmental Monitoring and Assessment, 2012, 184(8): 4841-4854.
[22] 楊晓华,杨志峰,郦建强,等.水环境质量综合评价的多目标决策-理想区间法[J].水科学进展,2014,15(2):202-205.
[23] 刘国东,丁晶.水环境中不确定性方法的研究现状与展望[J].环境科学进展,1996,4(4):46-53.
[24] 李绍飞.区域水资源水环境综合评价方法研究[D].天津:天津大学,2006:10.
[25] KUO Y Y, YANG T H, HUANG C W. The Use of Grey Relational Analysis in Solving Multiple Attribute Decision Making Problems[J]. Computers & Industrial Engineering, 2008, 55(1): 80-93.
[26] 杨苏才,南忠仁,牛亚萍,等.因子分析在水质评价与成因分析中的应用[J].人民黄河,2006,28(5):37-39.
[27] LIU C W, LIN K H, KUO Y M. Application of Factor Analysis in the Assessment of Groundwater Quality in a Blackfoot Disease Area in Taiwan [J]. The Science of the Total Environment, 2003, 313: 77-89.
[28] SHRESTHA S, KAZAMA F. Assessment of Surface Water Quality Using Multivariate Statistical Techniques: a Case Study of the Fuji River Basin, Japan[J]. Environmental Modelling & Software, 2007, 22(4): 464-475.
[29] ZHENG L Y, YU H B, WANG Q S. Assessment of Temporal and Spatial Variations in Surface Water Quality Using Multivariate Statistical Techniques: a Case Study of Nenjiang River Basin, China[J]. Journal of Central South University, 2015, 22(10): 3770-3780.
[30] 周丰,郭怀成,刘永,等.基于多元统计分析和RBFNNs的水质评价方法[J].环境科学学报,2007,27(5):846-853.
【责任编辑 吕艳梅】