基于距离矩阵计算的上海市水质监测断面优化方法研究
2021-04-17卢士强邵一平杨漪帆
陈 昊,卢士强,邵一平,杨漪帆,刘 扬
(1.同济大学 环境科学与工程学院,上海 200092;2.上海市环境科学研究院,上海 200135)
1 引言
在人民群众对水环境质量的需求尚未满足的背景下,对水环境质量的精细化管理提出了更高的要求,而水质监测的能力提升是水环境质量高效管理的基础。长期以来,国家及各地市级的水利系统与环保系统分别构建了针对管理目标的区域河湖水环境质量监测体系并开展了长时间序列的水环境质量监测[1]。在2018年3月第十三届全国人民代表大会第一次会议批准的国务院机构改革方案实施后,水功能区管理职责由水利部转隶至生态环境部,与地表水环境质量结合管理[2]。上海市的水务系统水功能区等河湖水环境质量监测网络、生态环境保护系统的地表水环境监测站网,在近年来都得到了快速建设和发展,在2018年水功能区管理整合至生态环境部后,两套水质监测体系在逐步合并同步监测的过程中,发现了点位重叠、点位临近等问题。
为了兼顾现有水功能区划职责由水利部门转隶至生态环境部门,结合目前河长制管理需求不断强化的趋势,同时由于上海市的中小河道水质监管治理也是后续上海市重点关注的方向[3],因此,在原有两套水环境质量监测体系的基础上,有必要结合前述需求,研究探索现有水质监测站网的优化方法,提出监测站网建设完善的思路。
2 材料与方法
2.1 河流概况
上海市位于长江入海口处,处于太湖流域下游,域内江湖河网密布,港汊纵横交错,主要包括有黄浦江、苏州河、吴淞江等水系[4]。根据2019年上海市河道(湖泊)报告统计,上海市共有河道(湖泊)47332条(个),河道湖泊面积632.79 km2,河湖水面率达到9.98%,河网密度4.71 km/km2。其中市管河道31条,长853.88 km,市管湖泊2个,面积48.27 km2;区管河道515条,长2931.78 km,区管湖泊19个,面积21.43 km2;镇管河道2655条,长6524.13 km,镇管湖泊20个,面积3.04 km2;村级河道39045条,长达18452.95 km。除此以外,上海市有小微水体共计51898个,面积达到68.69 km2(表1)。
表1 上海市各等级河道(湖泊)情况统计表
2.2 监测站网概况
上海市河湖水质监测站网经过多年发展,逐步形成了分别以水务系统和环保系统为主线的对重要江河湖泊水功能区管理、全市主要河流水质状况评价、中小河道综合治理、城市黑臭水体的消黑除劣攻坚战、全市水污染防治行动计划推进、饮用水水源地监管、出入境河流水质监测等多套上海市水环境质量监测站网体系。
上海市全国重要江河湖泊水功能区共计117个,设置监测断面217个,上海市与江浙省界河流93条,设置监测断面26个,上海市中小河道综合治理河流共计1864条段,设置断面1918个,水污染防治行动计划实施方案中明确全市国市考水质监测断面259个,另外区界断面生态环境部门设置51个,水务部门设置7个。通过初步合并规整,将水务系统及生态环境系统的所有镇级以上河流监测断面进行合并,最终形成全市4016个镇级以上河流水质监测断面。
不同监测断面的设置和监测体系的构建满足了各方面行政管理和污染治理等需求,然而,不同的监测体系间存在较多差异,包括行政管理部门的不同,监测因子、监测频次、分析方法等监测需求的不同,管理目标和要求的不同等。这些不同监测体系间的差异,带来了同一点位的监测断面重复监测、同一河流上下游监测断面水质趋同、相交河流点位距离较近等问题,监测站网的优化完善存在较大空间。
2.3 优化思路
2.3.1 相邻断面合理性分析
利用QGIS中distance matrix矢量分析工具,计算各点间直线距离的距离矩阵,保留相邻断面中等级较高河道的监测断面,同等级监测断面保留监测数据更全面的断面[5],以此进行相邻断面的合理性分析和断面优化。
2.3.2 断面水质相关性分析
利用斯皮尔曼Spearman相关系数,计算相邻断面间的水质相关系数,同时判断溶解氧、高锰酸盐指数、氨氮和总磷4项指标的相关性,并进行相关系数累加比较[6],以此筛选水质存在较大相关性的相邻断面,作为断面优化的筛选条件。
2.4 统计方法
斯皮尔曼Spearman相关系数被定义成等级变量之间的皮尔逊相关系数。Spearman秩相关可用等级相关系数rs来说明变量间的直线相关关系的密切程度与相关方向[7]。其基本思想是将n对观察值Xi、Yi(i=1,2,…,n)分别由小到大编秩,Pi表示Xi的秩,Qi表示Yi的秩,di=Pi-Qi表示X、Y两变量秩排列的一致性情况,对于样本容量为n的样本,n个原始数据被转换成等级数据,相关系数ρ为:
(1)
3 结果与分析
3.1 距离计算
将全市镇级以上河道4016断面根据经纬度信息导入QGIS地理信息系统,利用矢量分析工具distance matrix对各断面间相互距离一一进行计算,设置计算每个断面最近距离的3个断面,共获得20238组距离数据。进一步对其中重复值进行筛选,获得12266组断面间距数据(图1)。
图1 QGIS距离矩阵distance matrix 设置及输出结果
3.2 距离筛选
根据12266组断面间距离进行统计,整体呈正态分布,如下图2。其中,间距范围在1000~2000 m有6591组,占总体组数的53.7%,其次为500~1000 m间距范围的断面有3206组,占整体26.1%,2000~3000 m间距范围的断面有1205组,占9.8%,100~500 m间距范围的断面有921组,占整体的7.5%。上述4个范围段即100~3000 m间距范围的断面占整体的97%。
除此以外,完全重合的断面有19组,即19个断面为重复设置断面,间距在0~10 m的断面有45组,10~100 m范围的断面有92组(表2、图2)。
表2 断面间距计算结果分布范围
图2 断面间距分布情况
3.3 断面间相关性分析
利用RStudio软件中相关系数计算函数cor(),逐一计算前述12266组断面间月度水质监测数据(溶解氧DO、高锰酸盐指数CODMn、氨氮NH3-N、总磷TP)相关性,形成每组断面间水质监测因子相关系数矩阵。将四项因子相关系数进行加和,得到每组断面组的相关系数加和数(表3、图3)。
表3 相邻断面的相关系数计算(部分)
图3 Rstudio处理语句示意
统计12266组相邻断面组,有效组数11884组,另有382组因两个断面有1个以上断面月度监测数少于7个月,主要原因包括施工停测、断面调整等,不纳入本次断面优化调整考虑范围。在11884组相邻断面组中,参考各项因子相关系数为0、0~0.5、0.5~0.6、0.6~0.7、0.7~0.8、0.8~0.9、0.9~1、1以及<0共计9个梯度,将各因子相关系数总和范围划分为0、0~2、2~2.4、2.4~2.8、2.8~3.2、3.2~3.6、3.6~4、4以及<0同样9个组别进行统计。统计结果可以看出,相关系数总和在3.6以上的断面组数达到51组,相关系数总和在3.2~3.6的断面组数为453组,为同组两个断面存在强相关性组别,建议进行优化调整。
同时,从断面间距离范围的角度分析,有18组断面位置完全重复、45组断面间距在10 m以内,多数为同一断面不同监测部门进行监测,尽管部分断面相关系数不高,同样进行优化调整(表4、图4)。
表4 各因子相关系数综合范围组数情况
图4 各相邻断面组间距范围内相关系数总和比例
3.4 断面优化过程
基于上述相关性分析及断面间距统计,确定断面优化范围的选取原则,断面优化范围主要考虑各断面间相邻距离和水质指标相关系数,具体如下。
(1)间距为0的两个断面,即为同一位置的两个断面,多为不同监测部门对同一点位的重复监测,建议进行优化。
(2)间距为0~10 m的两个断面,若为同一河流,多为不同监测部门对同一河流点位的重复监测,建议进行优化。
(3)相关系数总和大于3.2的两个相邻断面组。
在此基础上,筛选出需优化的断面组别,进一步按照河道管理等级、监测频次、水质状况为原则进行优化[8]。具体判断逻辑如下。
(1)判断河道管理等级,河道管理等级基于河道长度、宽度、所涉及行政区域等确定,因此,在河道管理等级不同的断面组别中,保留河道管理等级较高的断面。
(2)若相邻断面组中河道管理等级一致,则进一步判断河道监测频次,监测频次较高的断面可认为具有更多历史数据,并往往具有更好的采样监测条件,因此,若河道管理等级相同则保留年度监测频次更高的断面。
(3)当两个相邻断面的河道管理等级相同且监测频次一致的情况下,保留年均值水质较差的断面,以上海市主要水质超标因子氨氮、总磷为参考因子,分别比较两个断面氨氮年均值之差与所有断面氨氮年均值的比值,以及两个断面总磷年均值之差与所有断面总磷年均值的比值,以两个比值的绝对值相对大值来判断两个断面的相对水质优劣[9]。
3.5 断面优化结果
根据断面优化的选定范围及筛选原则,共选定符合优化范围的相邻断面组共570组,按照筛选原则进行优化后,共选定439个断面予以优化,其中,依据河道等级予以取舍的断面72个,依据监测频次予以取舍的断面34个,依据水质优劣程度进行取舍的断面333个(表5)。
表5 建议优化断面调整依据统计
将相邻断面按照水体(是否同一水体)、管理部门(是否同一管理部门,生态环境、水务)、行政区(是否数据同一行政区)进行归类,作为相邻断面优化的判别依据之一,并对优化结果按此分类进行统计,439个断面中,水体、部门、行政区完全相同的相邻断面24组,其间距多集中于100~4000 m范围内,以1000~2000 m范围居多;同水体、同行政区但不同管理的断面36组,其间距多集中于0~1000 m范围内,以0~10 m范围居多,说明该类型断面组多为不同部门设置的重复断面;同水体、同部门但不同行政区的相邻断面2组,间距在500~2000 m范围内;同水体、不同部门、不同行政区的相邻断面5组,其间距均小于10 m,说明该类型断面组可理解为不同行政区设置的跨区重复断面;另有不同水体的相邻断面372组,多集中于100~2000 m范围内,是本次优化的主要区间范围(表6)。
表6 建议优化断面相邻间距统计
4 结论与讨论
上海市的水环境质量监测站网需考虑各方面需求,包括对水功能区管理和评估考核的需求、全市河长制管理考核的需求、水污染防治行动计划管理考核的需求,以及中小河道的水质评估和治理需求。不同的管理需求在现阶段存在较大差异[10],目前阶段尚不具备将各方面考核评估体系作合并和优化的条件,应在现有体系的基础上继续按照各自体系需求进行完善优化。从长远来看,水功能区、河长制等不同体系对于河道的水质要求、管理要求将逐步协调,随着监测能力的持续提升,应在满足现有管理需求的前提下,以全市镇级以上河道监测网络为基础,进一步兼顾村沟宅河等中小水体的水质状况评价。
水质监测的站网优化方式各式各样,常用的理论方法包括模糊聚类分析法、主成分分析法、BP神经网络优化法[11,12]等,核心理论都是基于水质历史状况进行相似断面的优化合并。本研究针对全市镇级以上河道,提出了利用空间地理信息进行的相邻断面合理性分析和spearman相关特征分析相结合的优化方法,形成了439个断面的优化方案。总体而言,水质监测站网应加快水务系统、生态环境系统等不同管理部门之间数据共享共建,提升水质监测效率和效益。