APP下载

融入变异系数的空气和地表水质量评价方法

2021-07-20冯然翟德超袁永生

环境工程技术学报 2021年4期
关键词:空气质量北京市权重

冯然,翟德超,袁永生∗

1.河海大学理学院

2.资源与环境信息系统国家重点实验室,中国科学院地理科学与资源研究所

3.中国科学院大学

大气污染和水污染作为生态环境领域的核心问题已经引起了国际社会的高度关注[1-3]。环境评价是人们认识、保护和改善环境的基础,是环境管理和决策工作的重要组成部分[4]。因此采用更科学、准确的方法来评价环境(空气和地表水)的污染程度对于反映环境质量和预测其发展趋势具有重要意义[5-6]。

目前,我国环境质量评价方法多采用多指标数学综合评价模型,主要有综合污染指数法、模糊综合评价法、灰色聚类法和物元分析法等[7-17],国外对此也有较多的研究[18-22]。这些方法虽然应用广泛,但仍有很多不足之处。如不同的空气污染物之间具有一定的相关性,使用综合污染指数法时容易造成信息冗余,降低所求污染物权重的准确性以及算法的效率[23]。而模糊综合评价法和灰色聚类法采用隶属度函数来描述大气污染状况,计算较为复杂,且在空气污染物浓度较低或过于分散时,计算过程中遗失的信息较多,难以准确反映环境质量状况。

目前,我国在空气和地表水的评价中采用的是空气质量指数(AQI)[24]和综合污染指数[25],但这2种方法同样存在不足之处。有学者指出AQI指数只取空气质量分指数的最高值会忽略次要污染物[26],而综合污染指数取各污染物指数的算数平均值,这种等权的设置并不合理。针对AQI指数评价的不足,不同的学者提出了不同的解决方案,如灰色聚类法和模糊-灰色聚类法[27-28]。针对地表水评价方法的不足,同样提出了一定程度的解决方案,如有学者引进了层次分析法和主成分分析法评价水环境质量[29-30]。虽然上述对空气和地表水质量评价方法的改进起到了一定效果,但都较为复杂,实用性有限。

变异系数(coefficient of variation)用于测量一组数据的变动情况,通过标准偏差除以这些数据的算数均值,消除了这组数据的度量单位差异[31],与这些数据所使用的量纲无关。在多维及高维数据中,变异系数较大的属性列更能表征这一对象(或事件)的特征,对该对象的解释力更高。因此,笔者将变异系数融入空气和地表水的质量评价中,优化监测指标间的权重配置,既解决了AQI计算中忽略次要污染物问题,也完善了综合污染指数计算中的等权缺陷,而且变异系数的计算量较小,可操作性强,为环境质量的评价方法提供了一个很好的改进策略;该方法不仅可以检测出传统方法中的首要污染物,还可以得到污染浓度波动较大的某一(几)项污染物。希望融入变异系数的空气∕地表水质量评价方法可以对环境质量评价相关政策的制定有所帮助,并且在对空气∕地表水质量进行改善时能够起到一定的借鉴意义。

1 材料与方法

1.1 研究区概况及数据获取

北京市位于华北平原西北边缘,西面和北面以及东北面被群山环绕,东南是北京平原,向渤海倾斜,地势呈西北高、东南低[32]。北京平原的海拔高度为20~60 m,最高峰是与河北省交界的东灵山,海拔为2 309 m[33]。境内的几条主要河流分别是潮白河、北运河、永定河和拒马河[34]。北京市夏季高温多雨,冬季寒冷干燥,春秋季短促,是华北地区降水量最多的地区之一,且降水量季节分布不均匀,全年降水量的80%集中在6—8月[35]。

选取2015—2019年北京市所有35个空气质量监测站点数据(部分天数有缺失)以及3个地表水监测断面(西帽山、谷家营和辛庄桥)数据。根据HJ 633—2012《环境空气质量指数(AQI)技术规定(试行)》,空气质量监测指标包括PM2.5、PM10、二氧化硫(SO2)、二氧化氮(NO2)、臭氧(O3)和一氧化碳(CO)浓度。根据GB 3838—2002《地表水环境质量标准》,结合北京市地表水监测数据的实际情况,选取溶解氧(DO)、总氮、氨氮、总磷、氟化物浓度以及化学需氧量(COD)、高锰酸盐指数、五日生化需氧量(BOD5)8项监测指标。数据来自中国环境监测总站。北京市空气监测站点以及地表水监测断面分布如图1所示。

图1 空气监测站点和地表水监测断面的位置分布Fig.1 Location of air monitoring stations and surface water monitoring sections

1.2 研究方法

1.2.1 变异系数法权重的确定

变异系数(CV)计算公式如下:

式中:σ为标准偏差;μ为平均值。

变异系数有2个特征:1)没有量纲,不同变量之间相互比较时不用考虑量纲的差异;2)只在平均值不为0时有定义,且一般适用于平均值大于0的情况,而空气指标、水体污染物的浓度等不存在小于0的情况。

对于多维数据来说,某一维度的变异系数越大,表示该维度数据离散程度越大,更能反映样本之间的差异,所以在使用多维数据反映总体情况时,各维度所占的权重不应该是相同的。假设该多维数据有n维,维度i的权重(Wi)计算公式如下:

1.2.2 改进的环境空气质量指数法

改进的环境空气质量指数法是以HJ 633—2012为基础的。首先,计算空气质量分指数。污染物p的空气质量分指数计算公式如式(3),具体数值见HJ 633—2012中各污染物浓度限值。

式中:IAQIp为污染物p的空气质量分指数;Cp为污染物p的实际浓度;BPHi为与Cp相近的污染物浓度限值的高位值;BPLo为与Cp相近的污染物浓度限值的低位值;IAQIHi为与BPHi对应的空气质量分指数;IAQILo为与BPLo对应的空气质量分指数。

计算AQI原始的方法是取IAQI中的最大值。这样将某一分指数直接作为空气质量指数的方法所利用的分指数的信息较少。改进的方法将考虑所有的分指数,按照式(1)和式(2)计算各分指数的权重,然后进行加权求和,计算公式如下:

1.2.3 改进的综合污染指数法

改进的综合污染指数法是以GB 3838—2002为基础,对水质断面监测数据进行评价。单因子污染指数计算公式如下:

式中:Pm为单因子污染指数;Cm为第m项污染物的实际观测浓度;Sm为第m项污染物的标准限值,参见GB 3838—2002,如根据实际情况选择Ⅱ类水为标准,其高锰酸盐指数的标准限值为4 mg∕L。当Pm>1.0时,说明已超标;当Pm=1.0时,为临界值;当Pm<1.0时,说明未超标,水体清洁。

计算P原始的方法是取多个单因子污染指数的算数平均值,相当于每个单因子污染指数的权重都是相同的1∕n。但是由于每个因子的变异系数不同,对于总体的解释程度也不同,所以每个因子的权重不应该是相同的,故改进的综合污染指数计算公式如下:

1.3 数据分析

采用SPSS 25.0软件对试验数据进行预处理和变异系数的计算;用Python程序语言进行改进的AQI和综合污染指数的计算;最后用ArcGIS10.6软件中的普通克里格插值对北京市空气质量进行时空分析。

2 结果与讨论

在计算空气和地表水的各项监测指标权重时,取该日(或该月,地表水监测数据为月尺度)的前N天∕月的监测结果作为计算变异系数的数据集。N越大表明该污染物存在的时间越长,这样更有利于检测出长期存在的污染物;但是N的扩大不利于检测短期存在的污染物,如在传统节日燃放烟花爆竹,使SO2浓度短时间内激增,这种情况更适合下调N,从而快速准确地捕捉到其浓度变化,进而增加该项指标的变异系数。N的大小可以根据当地实际情况进行调节,当N确定后滑动计算各监测指标每天∕月的权重。最近的前N天∕月在时间上更能反映这段时间每个监测指标的变化情况:如果某污染物(如SO2或DO等)浓度在前N天∕月的波动较大,其变异系数也会较大,那么该污染物则被认为是一个重要指标,其权重自然会变大;当其处于平静期时,变异系数下降,相应的权重也会降低,说明在这段时间内该污染物并不是主要污染物。通过将变异系数融入空气和地表水质量评价中,根据实际情况设定N的大小可以动态调整每个监测指标的权重。

改进的方法不仅适用于监测数据连续的情况,对于质量较差的监测数据也同样适用。在实际计算改进的空气质量指数∕综合污染指数时,会遇到2个问题:1)当某天∕月的监测指标出现异常值或是漏测,这时计算改进的污染指数时,该指标对应的权重乘以其浓度则为0,这样得到的污染指数一定程度上会被低估。为了解决上述问题,将缺失数据的指标权重按照其他指标(该天∕月数据未缺失)权重的比例分配到这些指标上。如某地的水质监测断面数据有8个监测指标,但是某月缺失了COD数据,这样就将COD权重按照其他7项指标权重的比例分配其中,使得该7项指标的权重之和仍为1。不过当该天∕月的监测指标缺失大于3个时,便认为无法计算改进的污染指数。2)由于部分数据的缺失会导致数据不连续,这样用于计算空气和地表水各监测指标权重的数据会出现不足N天的情况,这时所采取的策略是跳过缺失的该项监测数据,直到获取足够天数的数据。

2.1 改进的空气质量评价方法与原始方法的对比

以密云空气监测站点为例,数据来自北京市生态环境监测中心,时间跨度为2015—2019年。根据多次试验,选取该天的前30 d的监测结果作为计算变异系数的数据集,然后滑动计算各监测指标每天的权重,最终得到AQI与adjAQI的关系,如图2所示(由于部分天数的所有监测指标数据均缺失,有些年份的波动曲线是断开的)。从图2可以看出,adjAQI与AQI的波动趋势相同,但振幅较小,这是因为adjAQI采用的是加权平均的计算结果;而AQI取的是各空气质量分指数的最大值。adjAQI计算结果的波动趋势和AQI相同,反映了本方法的准确性和可用性。

图2 2015—2019年北京市密云空气监测站点AQI与adjAQI的对比Fig.2 Comparison of AQI and adjAQI at Miyun Air Monitoring Station in Beijing from 2015 to 2019

表1是用改进的方法计算得到的2015—2019年密云监测站点的6项空气污染指标的季度平均权重,其均值为0.167,高于该值则被认为变异系数较大,污染物浓度波动较大。从表1可以看出,PM2.5和PM10的权重在这5年间普遍较高,可见细颗粒物浓度波动最为剧烈,是北京市空气质量监测需要重点关注的指标;此外O3浓度在夏季的权重较高,这与实际情况相符;SO2浓度的季节性差异比较明显,春夏季波动明显高于秋冬季,则SO2浓度在春夏季获得较大的权重。

图3为采用改进的空气质量评价方法计算得到的主要污染物在各季节中存在的天数占比。从图3可以看出,2015—2019年细颗粒物(PM2.5和PM10)浓度是影响空气质量的主要指标;在年际尺度上,春夏季O3浓度对空气质量的影响较大,尤其是夏季O3成为首要污染物,而秋冬季的首要污染物是细颗粒物,NO2浓度对空气质量的影响随着四季的更替逐渐变大,该结果与文献[36]的研究结果一致。对比表1和图3可以看出,改进的方法所检测到的首要污染物和传统方法相比差别不大,但是由于监测指标的权重差异,使得季度的首要污染物存在天数占比会向波动较大的监测指标偏移。

图3 2015—2019年密云空气监测站点各季度首要污染物存在天数的比例(基于改进的空气质量评价法)Fig.3 Proportion of days with primary pollutant in each season in Miyun station from 2015 to 2019(based on the adjusted method)

表1 改进的空气质量评价方法计算得到的2015—2019年北京市密云空气监测站点空气质量监测指标的季度平均权重Table 1 Quarterly average weights of air quality monitoring items at Miyun station in Beijing from 2015 to 2019 with the adjusted method

对比上述2种方法,传统的AQI计算简单,一定程度上可以反映空气的质量状况,但是该方法过于强调首要污染物,忽略了次要污染物。与原始的AQI方法相比,改进的AQI有如下优势:不仅考虑到传统方法中的首要污染物,还兼顾了在一定时间段内波动较大的污染物,较为全面地利用了所有监测信息,而且根据变异系数调整了权重分配,使得到的结果更加合理;可以根据当地的实际情况设定特定的N,这样便可以调整用于检测长期∕短期存在的污染物;很好地控制了数据结果的突变,如图2所示圆圈部分,原始AQI方法计算得到很多极端值,这些值可能是正常值的几十倍,而改进的方法有效地避免了这一问题。

2.2 改进的地表水评价方法与原始方法的对比

以北京市西帽山(滴水湖)监测断面月尺度数据为例,时间跨度为2015—2019年,滑动选取前12个月作为样本计算变异系数并转化为权重,最终得到2016—2019年西帽山监测断面的adjP,结果如图4所示(由于数据选取的起始年份是2015年,所以该年份没有计算变异系数的数据基础)。从图4可以看出,改进的计算结果和原始的污染指数变化幅度基本相同,证明了该方法的有效性(根据实际情况选择Ⅲ类水为标准)。

图4 2016—2019年北京市西帽山监测断面的P与adj P的对比Fig.4 Comparison of P and adj P of Ximaoshan monitoring section in Beijing from 2016 to 2019

2016—2019年北京市西帽山断面地表水监测指标的年度平均权重如表2所示。地表水的8项监测指标的年度平均权重的均值为0.125,高于该值表示该污染物的变异系数较大。从表2可以看出,溶解氧、总磷和总氮浓度在2016—2019年的权重均高于平均值,表明这3项指标变化较大,而且前2项指标在2019年变化更加剧烈,总氮浓度的权重在这几年中变化不大,处于平稳状态。2016—2019年,最高的年度平均权重分别为溶解氧浓度(0.248)、总氮浓度(0.231)、溶解氧浓度(0.264)和总磷浓度(0.282),表明最近几年溶解氧浓度是该研究区地表水监测指标中波动最大的。剩余5项指标,除了2017年的COD和氨氮浓度超过平均值之外,其余均处于均值以下,这可能是因为在2017年部分时段内该断面附近有特定污染物的排放。高锰酸盐指数和氟化物浓度在这4年中一直处于较低状态,但是高锰酸盐指数在最近2年有上升趋势。

表2 2016—2019年北京市西帽山断面地表水监测指标的年度平均权重Table 2 Annually average weights of surface water monitoring items in Ximaoshan section in Beijing from 2016 to 2019

传统的综合污染指数法是取所有污染项指数的平均值,没有考虑到各污染项存在重要性的差异,相比而言,改进的综合污染指数法有以下优点:1)融入了变异系数,重新调整了权重的分配,使得到的结果更加合理。2)可以根据当地的实际情况设定特定的时间,自行调整用于检测长期∕短期存在的污染物。3)可以有效解决监测数据异常或者缺失等问题,这在水质监测中是很常见。该方法可以自动重新分配权重,使得缺失数据的指标权重为0,其他指标的权重之和为1,有效避免了计算结果被低估的问题。

上述改进的方法同样存在一定的问题,如滑动平均所设置的N需要根据实际情况来决定,这样就会造成一定的不确定性。这需要判断当地的空气或者地表水是否长期处于稳定状态,如果是的话,可以相应地增大N,反之则降低N。

2.3 北京市空气质量的时空分布

为了得到北京市空气质量的时空分布,基于2015—2019年的北京市所有监测站点的空气监测数据,利用空间插值的方法,对adjAQI进行插值。考虑到空气质量数据较为平稳,采用普通克里格进行插值,结果如图5所示。

从图5可以看出,2015—2018年北京市的空气质量已经有了变好的趋势,2019年的空气质量有了较大的转变,四季的adjAQI都比前3年低很多。在季节上,夏秋季的空气质量普遍要优于春冬季,其中夏季的空气质量普遍最优;冬季的空气质量普遍最差。结合2.1节北京市的空气质量受PM2.5和PM10的影响最大,得出以下原因:1)冬季尤其是冬季的夜晚,天气寒冷,近地面的大气要比上层大气温度低,造成大气层结构稳定,空气无法上下对流,污染物积聚很难扩散;夏季则相反,地面相对于大气是热源,大气垂直运动活跃,污染物容易扩散[37];2)北京市采用燃煤供暖,而燃煤排放的煤烟尘会导致细颗粒物浓度升高[38]。

图5 2015—2019年北京市adjAQI的时空分布Fig.5 Spatiotemporal distribution of adjAQI in Beijing from 2015 to 2019

从空间尺度上看,北京市整体上的空气质量呈从北到南逐渐变好的趋势。空气质量较好的区域集中在密云区和怀柔区,然后扩展到延庆区和平谷区。空气质量较差的区域主要集中在主城区以及丰台区。这是因为北京市的主城区是人口主要聚集的地区,是车辆运转以及各种污染排放的集中地。但是随着季节的变化,空气质量的空间分布又会呈不同的态势,虽然整体上还是梯度分布,但是夏秋季空气质量的局部积聚效应较为明显,空气质量较差的区域主要集中在主城区;到了春冬季,尤其是冬季,局部积聚分布几乎完全转变为梯度分布。

3 结论

(1)改进的空气质量指数法通过动态调整各污染指标之间的权重配置,有效地解决了传统方法忽略次要污染物,监测信息利用不全面的问题。改进的评价方法不仅考虑了首要污染物还兼顾了波动较大的污染物,使评价结果更加合理。

(2)在计算空气或地表水的各项监测指标权重时,滑动选择天∕月数的长度,能够调节评价指数对长期∕短期污染物的敏感度,滑动选择的时间越长更容易检测长期存在的污染物,反之亦然。以北京市密云监测站空气数据和西帽山断面的水质数据为例,验证了改进方法的有效性。结果表明,2015—2019年北京市空气质量监测指标中的细颗粒物(包括PM2.5和PM10)浓度以及2016—2019年地表水监测指标中的溶解氧、总磷和总氮浓度的变异系数较大,重要性更高。

(3)应用改进的空气质量指数法分析了2015—2019年北京市空气质量的时空分布。从时间尺度上看,该5年北京市的空气质量持续向好,夏秋季比春冬季要好,这主要是由于春冬季的燃煤供暖导致细颗粒物排放造成的;空间尺度上看,北京市的空气质量呈从北到南逐渐变好的梯度现象。

猜你喜欢

空气质量北京市权重
北京市:发布《北京市2022年能源工作要点》
北京市丰台区少年宫
北京市勘察设计研究院
北京市营养源研究所
权重常思“浮名轻”
为党督政勤履职 代民行权重担当
基于公约式权重的截短线性分组码盲识别方法
“空气质量发布”APP上线
车内空气质量标准进展
重视车内空气质量工作 制造更环保、更清洁、更健康的汽车