APP下载

近10年漓江干流水量水质分析及污染物通量估算

2022-07-09施文飞陈俊鸿赵振鑫

科技和产业 2022年6期
关键词:阳朔水文站回归方程

施文飞, 陈俊鸿, 赵振鑫, 翟 婷

(桂林理工大学 环境科学与工程学院, 广西环境污染控制理论与技术重点实验室, 岩溶地区水污染控制与用水安全保障协同创新中心, 广西 桂林 541004)

水污染是中国面临的主要环境问题。人口持续增加和经济快速发展带来的水资源短缺,生活污水、工业废水的大量排放以及农业面源污染等问题,导致地表水和地下水污染严重、生态环境恶化,已成为制约中国经济社会持续发展的重要因素。因此,探究河流污染负荷对于流域水环境承载力精准解析具有重要意义[1-3]。漓江是中国著名的风景名胜区,漓江风景名胜区的主体部分,其独特秀丽的山水享誉海内外,有“世界十大水上奇迹”的美誉,同时肩负着流域内工农业用水、居民生活生产用水、生态用水等重任。漓江整体水质状况良好,其干流水质常年达到国家地表水Ⅱ类水质标准,但依然存在区间入河污染,其中以生活污水的排放为主,主要污染物为磷和氨氮。且由于枯水期水量减少,水体的自净能力下降,漓江流域水环境污染事件时有发生。近年来不少学者针对漓江流域点面源污染及重金属污染展开了一系列研究[4-5],但漓江流域主要污染物通量估算及水质分析等鲜有研究。

污染物通量估算是掌握研究断面河流污染负荷总量,表征流域污染物产输特征的方法,但通常需要高频率的水量水质监测数据支撑。目前,国内河流流量监测系统比较完善,但常规水质监测受环境变化、监测成本等限制,通常仅能获得每月1次的离散数据,难以反映出河流水质的连续变化[6-7],且无法反映出河流污染物通量逐日变化情况。LOADEST模型是由美国地质勘测局(United States Geological Survey,USGS)研发的一款用于估算河流污染物通量的模型。在实际应用中,利用离散、有限的水质数据及河流连续日径流量数据,建立对应污染物通量与流量相关的回归方程,从而估算河流在不同时空尺度下的污染通量。目前该模型已应用于美国北卡罗来纳州纽斯河[8]、美国印第安纳州小巴克溪[9]、美国印第安纳州、威斯康星州和密歇根州流域[10]、宝象河[11]、淮河[12]、深圳河[13]等国内外多个流域,是估算低频率水质监测河流污染物通量的有效途径之一[14]。然而,受数据观测误差的影响,模型拟合效果不好,其估算结果与实测值之间存在一定误差。

因此,本文在已有模型研究的基础上,提出基于“预处理-回归”过程链的河流污染物通量估算方法。首先采用箱线图法对水质数据进行预处理;随后根据桂林及阳朔断面逐日流量数据与逐月水质数据,基于LOADEST模型建立两水文站污染物通量回归方程,在验证方程有效性的基础上估算NH3-N(氨氮)、CODMn(高锰酸盐指数)及TP(总磷)通量,为漓江流域污染物治理提供科学依据。

1 材料与方法

1.1 研究区概况

漓江位于广西东北部(109°45′~110°40′ E,24°18′~25°41′ N)[15],是珠江水系支流桂江上游河段的通称,起点为桂江源头越城岭猫儿山,终点为平乐三江口,从北向南依次流经兴安县、灵川县、桂林市区、阳朔县及平乐县,全长214 km,流域总面积5 857.11 km2。受季风气候影响,年内降水分配极不均匀,具有典型的雨季和旱季交替特征,雨季降水占全年降水的72.26%,而1月月平均流量不足20 m3/s,由此导致丰水期与枯水期水量差异明显。漓江干流水环境总体状况良好,全年期满足Ⅰ~Ⅲ类水质河长超过总长的99%,但支流水质仍有待改善。城区生活污水及城郊工业废水、农业灌溉用水等排入漓江及其支流,以及城区汽车、游轮等排放的含氮尾气溶于水中,导致氮磷污染时有发生。桂林至阳朔段是漓江通航主干道,也是漓江风景最优美的河段,保证漓江“黄金河道”的水质达标显得格外重要。因此,本文以漓江桂林-阳朔河段为研究区域(图1),收集了2010—2019年漓江流域桂林及阳朔水文站逐月的水质资料以及逐日的流量资料,数据由桂林市水文中心提供。

图1 研究区域示意图

1.2 箱线图法异常检测机制

箱线图[16]是一种用作显示一组数据分散情况资料的统计图,其常用于数据异常值处理。图2展示了箱线图位置点与标准正态分布之间的对应关系,Q1为1/4分位数点,Q3为3/4分位数点,Median为中位数,IQR为Q3与Q1值之差,可以看出,服从正态分布的样本数据位于箱形范围以外的概率仅为0.7%,因此可认为将处于Q1-1.5IQR及Q3+1.5IQR范围外的点视为异常值[17]。在进行分析数据时,利用箱线图可以判断数据集的偏向及离散程度(观察盒子的长度及上下隔间的形状);同时能直观地识别数据集中的异常值(查看离群点)。

图2 箱线图异常值判定

1.3 LOADEST模型原理

污染物通量一般指在一定时段内污染物通过研究断面的总量,可表示为

(1)

式中:Lτ为τ时段内断面污染物通量,kg/d;Q为流量,m3/s;C为污染物浓度随时间变化的函数,mg/L。但在实际研究中,由于水质数据监测频率远低于流量数据,无法直接使用式(1)计算河流断面污染物通量,所以考虑时段平均流量与瞬时污染物浓度之积作为估算河流污染物通量的方法。在此基础上,LOADEST模型利用多元线性回归的方法对河流断面污染物通量进行估算[18]。其通量估算公式通常表达为

(2)

(3)

表1 LOADEST模型提供的河流污染物通量回归方程

LOADEST模型提供了3种方程参数的拟合估算方法,分别是最大似然估计法(MLE)[21]、渐进极大似然估计法(AMLE)[22]、最小绝对偏差法(LAD)[23]。通量估算中使用的主要估算方法是AMLE法,当数据(流量、水质)包含删失数据时,则选用ALME法,当数据为非删失型数据时,则采用MLE法。AMLE法和MLE法应用取决于模型残差服从正态分布的假设,如果残差不符合正态分布假设,则使用AMLE和MLE法估算结果可能不是最优的,应考虑用LAD估算法来代替AMLE法。LAD通量估算法不依赖正态性假设。

优选出的回归方程利用残差序列相关系数(SCR)检验残差是否存在序列相关性,SCR值越小,表明残差之间相互独立。并通过相关系数R2来判定方程总体的拟合效果,R2越接近于1,表明拟合效果越好。对于非删失型数据,适用概率曲线相关系数(PPCC)检验其残差正态分布,相关系数越接近1,残差越接近正态分布。

2 结果与分析

2.1 河流水文水质特征

由图3(a)、(b)可知,2010—2019年,桂林及阳朔水文站断面年平均流量分别为236.22、139.82 m3/s,河流年平均流量整体呈现阶段性高低交错的状态,年内月平均流量变化均呈现“峰状”。阳朔水文站月平均流量高于桂林水文站,且流量峰值相差大,每年丰水期流量峰值近于桂林站的2倍。由于桂林雨季长,降水充足,地下水资源丰富,河流自上游到下游,河流支流补给,导致阳朔站平均流量高于桂林水文站。

图3 桂林及阳朔水文站断面年平均流量、多年月平均流量、NH3-N浓度、CODMn浓度、TP浓度

图3(c)、(d)、(e)表征研究期间桂林及阳朔水文站断面NH3-N、CODMn、TP月平均浓度变化情况。两水文站NH3-N、CODMn、TP年平均浓度分别为0.26(桂林)、0.12(阳朔)、1.63(桂林)、1.56(阳朔)、0.056(桂林)、0.056(阳朔) mg/L。总体水质情况较好,均能达到Ⅲ类水以上标准。桂林水文站NH3-N含量普遍高于阳朔站,漓江流经城区时,城市生活污水排放城郊农业面源污染、汽车及游船含氮尾气排放溶于水形成氨氮,均导致桂林水文站NH3-N含量的升高[3]。由图3(d)、(e)可以看出,两水文站TP、CODMn含量在枯水期高于丰水期,说明雨季径流对河流的稀释作用强于对土壤的冲刷及养分的淋溶作用,这与中国其他南方地区的研究结果一致[4]。

河流中的污染物通量主要取决于流量及污染物浓度两个因素。以阳朔水文站为例进行相关分析,分析结果表明:河流中污染物通量与污染物浓度相关性弱,而与河流流量呈极显著相关(P<0.01)。由图4可知,河流NH3-N、CODMn、TP通量与河流流量的相关系数R2分别为0.648 9、0.763 1、0.820 5;与NH3-N、CODMn、TP浓度的相关系数R2分别为0.316 7、0.360 8、0.296 7。可以看出,污染物通量主要取决于流量的变化,与污染物浓度变化的影响弱,这与其他学者的研究结果一致[7,11]。

图4 阳朔水文站断面实测通量与河流流量及污染物浓度的相关分析

2.2 水质数据预处理

由于人工水质监测过程中的人为误差,导致水质数据存在异常值,对河流污染物通量估算精度产生了重要影响[24]。因此,本文在进行污染物通量估算之前,首先利用箱线图法对水质数据进行异常值预处理,结果如图5所示。将桂林及阳朔水文站2010—2019年CODMn、TP、NH3-N污染物浓度按月份进行归类,两水文站3种污染物分别有120个浓度数据,利用箱线图法对水质异常数据进行有效范围判断,得到桂林水文站CODMn、TP、NH3-N污染物浓度分别有异常值7、0、4个,阳朔水文站分别有6、4、9个,其中数据偏大的异常值占70%。常用的异常值处理方法有:①用平均值修正;②将异常值直接删除;③将异常值视为删失值处理。分别用这3种方法对异常值进行修正,以减小异常值对污染物通量估算的影响,比较预处理与未处理拟合效果,取最优修正方法用LOADEST模型进行污染物通量估算。

1~12为桂林站逐月水质数据;13~24为阳朔站逐月水质数据。图5 水质数据箱线图

利用箱线图法对水质数据进行预处理,将异常值分别用①平均值修正;②将异常值直接删除;③将异常值视为删失值处理进行修正,然后进行LOADEST模型模拟。未处理和3种预处理结果对比见表2,最优预处理方法为①平均值修正。将未处理水质数据进行LOADEST模型模拟,得出桂林站的NH3-N、CODMn、TP相关系数R2依次为0.696 6、0.925 5、0.875 6;阳朔站的NH3-N、CODMn、TP相关系数R2依次为0.733 1、0.916 4、0.871 1。将模拟结果与未处理计算结果相比较,桂林水文站NH3-N、CODMn、TP拟合效果分别提高了2.37%、2.82%、0%;阳朔水文站NH3-N、CODMn、TP拟合效果分别提高了2.89%、1.72%、3.75%。结果表明,在已有模型研究的基础上,提出基于“预处理-回归”过程链的河流污染物通量估算方法是行之有效的。

2.3 漓江流域污染物通量估算

利用离散、有限的水质数据及河流连续日径流量数据,通过LOADEST模型,建立污染物通量与日均流量的回归方程,根据河流流量数据估算出污染物逐日通量。首先,将2010—2019年的水文水质监测数据分成两组,2010—2017年作为标定数据,2018—2019年作为验证数据。基于2010—2017年逐日流量数据与逐月水质数据,通过LOADEST模型来建立桂林及阳朔水文站断面NH3-N、TP及CODMn污染通量与河流流量的回归方程。基于LOADEST模型的桂林及阳朔水文站污染物通量回归方程参数率定结果见表3、表4。然后,利用2018—2019年桂林及阳朔水文站的实测逐月水质及流量数据,将实测通量值与估测值进行对比,检验回归方程的可靠性和准确性(图6)。验证结果表明,在标定期,桂林及阳朔水文站CODMn(0.92,0.91)及TP(0.88,0.86)拟合方程的相关系数R2与验证期模拟验证结果(0.86,0.70;0.86,0.83)的相关系数R2均大于0.70,表明回归方程拟合程度非常好。相较于CODMn与TP,NH3-N的拟合效果稍差,但也达到了较好水平(R2>0.60),桂林及阳朔水文站标定期拟合方程相关系数R2分别为0.64,0.75;验证期相关系数R2分别为0.67,0.60。参数估计与验证结果表明,利用LOADEST模型优选出的污染物通量回归方程可以用于估算两水文站NH3-N、CODMn及TP通量,其结果合理、可信。利用2010—2019年桂林及阳朔水文站实测预处理(用平均值修正异常值)水质及流量数据,基于LOADEST模型优选出断面NH3-N、CODMn及TP通量回归方程见表5。

表2 桂林及阳朔水文站未处理与预处理结果对比

表3 桂林水文站污染物通量回归方程参数率定结果

表4 阳朔水文站污染物通量回归方程参数率定结果

图6 基于LOADEST模型的桂林及阳朔水文站污染物通量拟合效果及验证结果

表5 桂林及阳朔站污染物通量回归方程

桂林及阳朔水文站的参数检验结果见表6,结果表明:两水文站断面CODMn及TP通量拟合效果非常好(R2>0.90),NH3-N拟合效果良好(R2>0.70),且残差不存在序列相关性、服从正态分布(SCR值接近于0,PPCC值接近于1)。

表6 桂林及阳朔水文站参数检验结果

用LOADEST模型基于上述回归方程估算出两水文站的污染物通量,结果如图7所示。由图7可知:桂林及阳朔水文站断面NH3-N、CODMn、TP年平均通量分别为987.302、1 254.781 t,6 784.407、14 964.549 t,265.945、756.055 t。从年际变化来看,两水文站污染物通量变化趋势大体一致,阳朔站断面CODMn及TP通量均高于桂林站断面,且总量是桂林站断面的2.21和2.84倍。NH3-N总通量两水文站差距较小,在枯水年2011及2018年,桂林站断面NH3-N总通量高于阳朔站断面。相较于阳朔站,桂林站断面污染物通量波动幅度较小。从年内变化来看,污染物通量逐月变化趋势呈现单峰状,两水文站NH3-N通量“峰型”一致,丰水期降雨量大,约占全年降雨量的72.5%,污染物通过降雨-径流冲刷形式进入河流。由图7(d)、图7(f)可知,阳朔站断面CODMn及TP通量单峰远高于桂林站断面,各污染物通量最大值出现在5、6月份,最小值一般出现在12—2月份,这与河流丰水、枯水期变化一致。

3 结论

1)2010—2019年漓江流域桂林站断面水质分析表明,桂林站断面NH3-N浓度大于阳朔站断面,而阳朔站断面CODMn及TP浓度更高。两水文站NH3-N、CODMn、TP年平均浓度分别为0.26、0.12 mg/L,1.63、1.56 mg/L,0.056、0.056 mg/L。总体水质情况较好,均能达到Ⅲ类水以上水平。且污染物通量与河流流量的相关系数大于污染物浓度,说明污染物通量主要取决于流量的变化。

2)根据箱线图法异常值判定原理,对水质数据进行预处理,将异常值分别用平均值修正、直接删除、视为删失值处理进行修正,然后进行LOADEST模型模拟,取最优拟合结果。得到用平均值修正处理效果最佳,与未处理结果相比较,桂林水文站NH3-N、CODMn、TP拟合效果分别提高了2.37%、2.82%、0%;阳朔水文站NH3-N、CODMn、TP拟合效果分别提高了2.89%、1.72%、3.75%,表明基于“预处理-回归”过程的河流污染物通量估算方法提高了拟合精度。

3)利用2010—2019年漓江流域桂林及阳朔水文站的逐日流量数据及逐月水质数据,基于LOADEST模型分别建立了桂林及阳朔断面的污染物通量回归方程,以2010—2018年作为标定期,2018—2019年为验证期,对回归方程参数进行率定。结果表明,标定期和验证期各污染物回归方程相关系数R2均大于0.60,方程拟合效果较好。

图7 桂林及阳朔水文站污染物逐年及多年月平均总通量

4)桂林及阳朔水文站断面NH3-N、CODMn、TP年平均通量分别为987.302、1 254.781 t,6 784.407、14 964.549 t,265.945、756.055 t。河流污染物通量估算是科学保护漓江、维持优良生态环境的前提,估算通量结果可为漓江流域污染物治理提供科学依据。

猜你喜欢

阳朔水文站回归方程
阳朔山间,田园如歌
快乐阳朔游
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
金沙江坝下水文站中泓浮标系数稳定性分析
SL流量计在特殊河段的应用——以河源水文站为例
西双版纳州水文站网合理布设及测验方法探析
长江干流沙市水文站汛期流量变化趋势分析
走进回归分析,让回归方程不再是你高考的绊脚石