湘江流域水环境评价模型及驱动因子识别
2023-10-17曹艳敏安宏雷
曹艳敏,安宏雷,韩 帅
(1.湖南城市学院 土木工程学院,湖南 益阳 413000; 2.国防科技大学 智能科学学院,长沙 410073;3.湖南省水利水电勘测设计规划研究总院有限公司,长沙 410035)
0 引 言
流域水环境是自然因素与人类活动综合作用的结果[1]。由于涉及范围广、人类活动复杂,流域水环境评价工作及驱动力分析是研究中的难点。湘江作为长江的主要支流,汇集了湖南省60%以上的人口及70%以上经济生产总值[1],随着社会经济的快速发展,城市、工业、农业污染等诸多因素,包括历史遗留污染等问题,使得湘江流域环境问题趋于复杂化[3]。众多学者从各个角度开展湘江流域水环境的研究,所应用的水环境评价方法,包括均值指数法[4]、内梅罗综合污染指数法[5]、水质指数(Water Quality Index,WQI)模型[6]等,对主要污染物的识别和驱动因子分析方法包括主成分分析[7]、聚类分析[8]、因子分析[9]、多元回归分析[10]等。因湘江流域涉及范围广、水环境问题复杂,传统的评价方法计算量大,往往局限于干流或局部区域[8-10]。
2005年徐祖信[11]提出综合水质标识指数评价方法(WQI),该方法可考虑各类指标对水质进行整体评价,解决了已有方法存在的指标单一,或评价过程主观的因素及由于运算量大导致的信息丢失等缺点[12]。近年来,WQI评价方法应用于水环境评价中[13]逐步形成了改进模型,如最小水质指数WQImin(The minimum WQI)模型[14]和加拿大环境部长理事会水质指数(Canadian Council of Ministers of the Environment Water Qaulity Index,CCME WQI)模型[15]。其中,WQImin模型既继承了传统的WQI模型的优点,又剔除冗余水质指标,成本小、效率高,被广泛应用[16-19]。主成分分析法(Principal Components Analysis,PCA)可将众多水质指标简化为少数指标,简化后的少数指标可以反映原始数据的大部分信息,有效简化水环境评价过程[20]。杨列等[20]结合PCA法与WQImin模型有效评价了武汉市金银湖水质演变情况。
本研究以湘江流域77个水质监测站的实测水质监测指标为基础,采用改进的WQI模型结合聚类分析法和PCA法,建立了湘江全流域WQImin水环境评价模型。利用Pearson线性相关法建立湘江流域水环境评价模型得到的WQImin值与对应地区社会经济因子之间的相关性,以此识别影响流域环境的主要驱动因子。
1 研究区域与方法
1.1 区域概况
湘江是长江重要支流之一,是湖南省最大的河流,水量充沛而少沙。湘江起源于蓝山县紫艮瑶族乡,在湖南省境内自南向北流经永州、衡阳、湘潭、株洲、长沙,后于岳阳市湘阴县流入长江水系的洞庭湖。流域支流涉及到郴州、娄底,同时涉及广西省桂林市全州县、兴安县及灌阳县,江西省萍乡市上栗县、莲花县、芦溪县、安源区、湘东区及开发区和宜春市袁州区[21]。
流域水系发达,支流众多,其中有3条支流流域面积>10 000 km2,即潇水、耒水和洣水;3 000~10 000 km2的一级支流有舂陵水、蒸水、渌水、涟水、浏阳河共5条;1 000~3 000 km2的一级支流有灌江、紫溪河、芦洪江、白水、宜水、祁水、涓水、捞刀河、沩水共9条[21],见图1。
图1 湘江全流域及湘江主要支流示意图Fig.1 Map of Xiangjiang River basin and its major tributaries
1.2 数据来源
拟分析数据采用2020年湘江流域77个监测点的1—12月份地表水质月监测数据,监测站点信息见图2。监测指标包含水温(T)、pH值、溶解氧(DO)、五日生化需氧量(BOD5)、高锰酸盐指数(CODMn)、总磷(TP)、氨氮(NH3-N)、镉(Cd)、砷(As)、六价铬(Cr6+)、电导率、总硬度、总碱度石油类、粪大肠菌群、氟化物、氯化物等共计21项指标,水质监测数据由湖南省水利厅提供。流域社会经济发展数据摘自《湖南统计年鉴2021》《江西统计年鉴2021》《广西统计年鉴2021》《中国城市统计年鉴2021》。
图2 湘江水质监测站位置Fig.2 Location of water quality monitoring stations
1.3 研究方法
1.3.1 聚类分析
聚类分析是一种被广泛应用的多元统计分析方法,其过程是将多个数据的变量特征也可以是个案按照其相关性的远近程度进行分类[11]。本文分析方法采用系统聚类法,选择组间联接的聚类方法,亲疏程度的计算选用平方 Euclidean 距离作为度量标准。
1.3.2 主成分分析
PCA是一种降维处理技术,将原来众多的具有一定相关性的变量重新组合成新的少数几个相互独立的综合变量,并要求这些综合变量能够反映原变量提供的大部分信息,以保证分析的准确性[22]。本次研究水质监测指标达21项,运用SPSS 24.0对各水质指标进行主成分分析,以寻求可以反映原水质特征大部分信息的水质因子。
1.3.3 WQImin模型分析
研究采用包含指标权重的WQImin模型[16]见式(1)及式(2)。水质指标由主成分分析筛选的关键指标进行综合水质评价。
(1)
式中:n为水质指标总数;Ci为第i个指标的归一化值,计算方法如式(2)所示;pi为第i个指标的权重,pi值通过收集已有研究成果[23]列于表1。
表1 基于GB 3838—2002标准计算WQImin所有水质指标的归一化值和权重Table 1 Normalized values and weights of water quality indicators for calculating WQImin based on the Environmental Quality Standards for Surface Water of China (GB 3838—2002)
式中:Ti为第i个指标的实测值;Si,k和Si,k+n分别为第i个指标的k级和k+n级标准浓度,其取值参考《地表水环境质量标准》(GB 3838—2002);N为标准值相同的个数(当无相同时,N=1);Ii,k为第i个指标的k级指标值。本文WQImin模型采用MatLab R2014a编程处理数据。
1.3.4 极差标准化法
极差标准化法可以有效处理存在量纲及数量级大小差异巨大的数据,正向指标标准化公式见式(3),负向指标公式见式(4)。
(3)
(4)
式中:xij、Xij′分别为原始数据、标准化后数据;xmax、xmin分别为相应指标数据的最大值和最小值。
1.3.5 Pearson线性相关法
Pearson线性相关法又称简单相关法,是用来定量描述2个变量间线性关系密切程度和相关方向的统计指标。Pearson相关系数是量纲为一的量,其值为正表示正相关,为负表示负相关。相关系数的绝对值越接近1,表示两变量间的相关关系密切程度越高。本文用Pearson线性相关法对计算得出的WQImin值与对应的社会经济指标进行相关分析,可以得出与WQImin值相关密切的社会经济指标。
2 结果与分析
2.1 聚类分析及污染因子主成分分析
2.1.1 基于水质指标的流域监测站点聚类分析
利用SPSS24.0软件对湘江流域77个监测站点进行聚类分析,使水质特征相似的监测站点聚成一类。分析结果如图3所示。可将湘江流域水质监测站点聚类为3类。
图3 基于水质数据的湘江流域各监测站聚类分析结果Fig.3 Cluster analysis of measurement results at monitoring stations based on water quality data
Ⅰ类监测点共29个,以衡阳市境内站点为主,同时包含湘江干流衡阳市至株洲市范围的监测站——如归阳、衡阳、三樟、松柏、株洲、霞湾,以及支流部分监测点如耒水、渌水赣湘缓冲区、涟水、洣水、浏阳河。
Ⅱ类站点共16个以湘江支流监测点为主,包括舂陵水、蒸水、涟水、涓水株洲市境内犁头口;栗水、捞刀河。湘江干流监测站有3个,如永州境内老埠头站、湘潭境内马家河站、长沙市境内暮云站。
Ⅲ类监测点共32个,以永州市境内站点为主,同时包含一部分郴州市内站点如东江等,及少量长沙市范围站点。湘江干流站点有桂湘缓冲区内绿埠头。上东江边、石门坎与以上三类监测点平方 Euclidean 距离较远,但两监测站与Ⅲ类监测点地理范围重合,因此归为第Ⅲ类监测点。
2.1.2 污染因子主成分分析
利用SPSS24的PCA模块对Ⅰ—Ⅲ聚类水质监测站点的21项水质指标进行降维处理,成果见表2。通过主成分分析计算,Ⅰ聚类站点1—点3特征根均>1,且解释了该区域总污染物特征99.28%,可以确定主要污染物为DO、BOD5、CODMn、Cr6+及NH3-N。Ⅱ聚类站点主要污染物确定为DO、Hg、BOD5、TP、NH3-N、CODMn,Ⅲ聚类站点主要污染物确定为DO、BOD5、TP、Cr6+、CODMn。
表2 Ⅰ—Ⅲ聚类水质监测站点主成分分析贡献率Table 2 Contribution rates obtained from principal component analysis of monitoring sites with class Ⅰ—Ⅲ water quality
由主成分分析法得出湘江全流域共有的污染因子为DO、BOD5、CODMn,见表2。DO主要受水温、空气中氧分压、水文条件等自然因素影响,是研究水自净能力的重要依据。BOD5和CODMn都反映水体有机物污染情况,但污染来源各地区有所不同。
聚类分析得出Ⅰ类水质监测站以衡阳市境内站点为主,湘江干流衡阳市至株洲市范围的监测站点,同时包含株洲、湘潭、长沙部分站点。主成分分析得出主要污染因子为DO、BOD5、CODMn、Cr6+及NH3-N。湘江流域聚集了全省70%以上的大中型企业。
而长株潭地区及衡阳地区产业则更为集中、多样,如电子信息、汽车制造、化学制品制造业、电气机械及器材制造业、有色金属冶炼及压延加工业等组成[23]。
这些产业均有依靠水资源、需水量大、易形成污染源的特点。另外,湘潭市的湘潭县,衡阳市的衡阳县、衡南县都是受畜禽排泄污染严重地区[24]。畜禽排泄污染会导致水体中BOD5、NH3-N及部分重金属超标[24]。基于上述分析可认为聚类Ⅰ确定的污染因子合理。
聚类分析得出Ⅱ类水质监测站以支流为主,同时包含3个湘江干流监测站。主成分分析得出主要污染因子为DO、Hg、BOD5、TP、NH3-N、CODMn。流域支流人类干扰强度均>20%[25]。BOD5、TP、NH3-N、CODMn可考虑由城镇污水、生活污染以及农业源污染构成[8]。重金属Hg考虑自然因素及工业污染[8]。
聚类分析得出Ⅲ类水质监测站以永州市境内站点为主,同时包含部分郴州市及少量长沙市境内站点。主要污染物确定为DO、CODMn、BOD5、Hg、TP、Cr6+。王敦球等[8]认为永州市主要污染因子为NH3-N、CODMn、BOD5、TP以及部分重金属,且认为CODMn、TP首要污染源为农业源,NH3-N污染主要来自生活源。本文在NH3-N上与上述研究有出入,其他结果一致,且考虑是郴州市及少量长沙市境内站点的加入导致Ⅲ类监测点其他污染因子比重加大导致。
2.2 基于WQImin模型的湘江流域水环境评价
以2.1.1节和2.1.2节研究内容为基础,不同区域WQImin模型计算指标Ⅰ聚类站点主要污染物为DO、BOD5、CODMn、Cr6+及NH3-N;Ⅱ聚类站点主要污染物为DO、Hg、BOD5、TP、NH3-N、CODMn;Ⅲ聚类主要污染物为DO、BOD5、TP、Cr6+、CODMn。
WQImin评分范围为0~100,分值越高表明水质越好,结合Jonnalagadda等[26]和唐琦等[13]研究成果及湘江流域水环境特征,本研究分值标准设置为优([100,90)、[90,80))、好([80,70)、[70,60))、中([60,50])。
2.2.1 汛期及非汛期WQImin值空间分析
湘江流域汛期为4—9月份,非汛期为10月份—次年3月。为减少自然因素流量Q的影响,本文分汛期及非汛期分析WQImin,见图4。
图4 湘江流域汛期和非汛期WQImin空间分布Fig.4 Spatial distribution of WQIminduring flood seasonand non-flood season in Xiangjiang River Basin
湘江流域各监测站WQImin范围为95.2~70.0,符合湘江流域实际情况。湘江全流域非汛期水质整体优于汛期,非汛期WQImin处于优([100,90))站点占全流域站点的23%,多于汛期的13%;非汛期WQImin处于优([90,80))的站点占全流域站点60%,多于汛期的56%,考虑汛期径流携带地表面源污染源进入湘江流域水体形成该特征。这与刘叶叶等[7]研究得出湘江流域面源污染逐渐增加一致。
从地区来看,湘江流域永州地区及潇水水环境优于其他地区。桂湘缓冲区、 湘江永州开发利用区至湘江祁阳开发利用区及潇水WQImin全年优于90。支流紫溪河、芦洪江、白水、舂陵水、涟水非汛期水质优于汛期,WQImin达到优([100,90))。
衡阳、株洲、湘潭、长沙区域的湘江干流以及耒水、蒸水、攸水、涓水、捞刀河、沩水等各支流汛期WQImin普遍介于70~80之间,级别为好但WQImin低于流域其他地区,表明该区域的汛期水环境问题较为突出。同时,该区域的水功能区涉及大量开发利用区、保留区及缓冲区。该区域与聚类分析中聚类Ⅰ区域相对重合,可认为该区域是湘江流域污染源较为复杂且水环境脆弱地区。
2.2.2 干支流WQImin沿程分析
湘江干流从永州至长沙,相同市域监测点取WQImin年平均值分别为91.13、82.72、80.86、78.65、81.6(见图5),永州至湘潭逐步降低,湘潭市WQImin年平均值最低,长沙市WQImin均值有所提高。
图5 湘江干流及支流的WQImin沿程分布Fig.5 WQImin of mainstream and tributaries along Xiangjiang River
舂陵水由永州流经郴州在衡阳入湘江干流,WQImin均值逐渐降低,由88.95降至83.95。耒水由郴州至衡阳汇入干流,WQImin均值逐渐降低分别为88.16、81.17。涟水由娄底至湘潭汇入干流,WQImin均值逐渐降低,分别为86.42、79.98。洣水由株洲至衡阳汇入干流,WQImin由83.75降到80.58。潇水位于永州境内,WQImin由92.18降至87,WQImin均值为90.73。渌水由江西省萍乡至株洲汇入干流,WQImin由79.6降至75.5。祁水由衡阳至永州汇入干流,WQImin在衡阳地区为80.45,在永州地区升到85.4,水质好转。湘桂缓冲区WQImin为93.1,水质为优。渌水赣湘缓冲区WQImin为79.6。
2.3 湘江流域水环境驱动因子识别
以长沙、湘潭、株洲、衡阳、永州、娄底、郴州以及广西桂林市和江西萍乡市2020年社会经济发展数据为基础,参考已有研究成果[10],确定社会经济因子指标确定为常住人口、地区生产总值、工业废水排放量、城镇污水排放量、化肥用量及大牲畜年末存栏数。
由于流域社会经济数据在量纲及数量级上差异巨大,因此采用极差标准化法对数据进行标准化处理,结果见图6。利用Pearson相关性建立水环境评价WQImin与湘江流域社会经济驱动因子相关性分析。支流除舂陵水,其他跨市支流所涉及地区为2个市,通过Pearson相关性可识别主要驱动因子,但因参数较少无法具体其相关系数,因此本文不在此列出。
图6 各市社会经济指标极差标准化值Fig.6 Standardized range values of socioeconomicindicators of different cities
2.3.1 流域各市域水环境驱动因子分析
结合2.1节的聚类分析结果,同市域监测点WQImin值以监测点所在市域社会经济发展各指标为自变量对湘江流域进行分区追踪驱动因子,见表3。长株潭及衡阳地区的主要水环境驱动因子是工业废水排放量、化肥用量及常住人口。永州主要水环境驱动因子为化肥用量;娄底及郴州主要环境驱动因子为工业废水排放量。
表3 主要地区WQImin与社会经济发展指标Pearson相关性分析Table 3 Pearson correlation between WQImin and socio-economic indicators in major regions
2.3.2 跨市河流水环境驱动因子分析
跨市河流考虑上游市及本市社会经济指标为作为自变量;对于省界监控断面以流域涉及到的外省地区社会经济发展指标为自变量,其分析结果见表4。
表4 跨市河流WQImin与社会经济发展指标Pearson相关性分析Table 4 Pearson correlation between WQImin of cross-city river and socio-economic indicators
湘江干流桂林—永州是流域较优的地区,工业废水、城镇污水、农业污染及上游市洲的城镇污水都影响该区域水质。湘江干流衡阳—长沙是流域水环境WQImin值较低区域,本市的工业废水排放量、农业污染及上游市洲城镇污水排放量对水环境都有较大的影响。针对上游市洲的城镇污水排放量对下游市洲的影响,需加强治理及监管。
支流以舂陵水为例,由于受人类干扰强度突出,本市的工业废水排放量、城镇污水排放量、大大牲畜年末存栏数以及上游市洲的工业废水排放量、化肥用量、城镇污水排放量都是水环境的主要驱动因子。
3 结 论
本文对湘江流域77个水质监测点进行聚类分析,利用PCA法对聚类分析的监测点水质指标进行分析。建立湘江流域水环境WQImin评价模型,时间尺度上分汛期与非汛期,利用Pearson线性相关法对WQImin值与对应区域的社会经济发展指标相关性进行分析。研究结论如下:
(1)湘江流域主要污染因子为DO、BOD5、CODMn。DO主要受自然因素影响,是水自净能力的重要依据。BOD5和CODMn反映水体富营养化污染情况,在永州市主要受市政污水、生活污水和工业废水排放的影响;衡阳、株洲、湘潭地区都受到农业因素的影响;长沙地区主要由生活污水排放和工业生产驱动。娄底和郴州地区BOD5和CODMn污染成因需要进一步开展研究得出。
(2)湘江流域WQImin模型评价得到湘江流域整体水环境为优—好等级,WQImin值介于95.2~70.0之间;湘江流域水环境非汛期优于汛期,考虑由于汛期雨水径流携带地表面源污染进入湘江水体形成;水环境最优地区为永州及潇水;最差为长株潭地区及衡阳市,衡阳至长沙范围内湘江干流及支流监测站汛期WQImin值普遍介于70~80之间,低于流域其他区域,该区域主要污染因子为DO、BOD5、CODMn、Cr6+及NH3-N。湘江流域治理应加强对长株潭地区及衡阳市汛期水环境的监管,加大湘江流域面源污染的防控;湘江干流自上游至下游WQImin值逐渐降低,湘潭区域WQImin最低,为78.65,长沙WQImin有所提升,为81.60。其他支流自上游至下游WQImin逐渐降低。
(3)水环境驱动因子长株潭及衡阳地区为工业污染、农业污染及人口因素;永州为农业污染;娄底及郴州为工业污染。湘江干流水环境主要驱动因子为工业污染、农业污染及上游市的城市污染。
湘江流域涉及区域广、行政市洲多,其水环境因素复杂,建议在数据量允许的条件下,形成长时间序列数据可利用多元统计回归方法识别更多驱动因子,并且量化其贡献率,为后期水生态补偿研究提供基础。