基于灰色定权聚类的河南省辖市污染情况评估
2021-07-12张炎亮
张炎亮, 张 森
(郑州大学管理工程学院, 郑州 450001)
随着中国快速发展和城镇化进程的加快,环境质量呈现出显著的区域性。受产业转移的影响,环境质量整体上呈现从东到西明显上升的地域趋势[1]。位于中原地区的河南省虽然近年内经济发展日新月异,但随着工业化程度的增加,生态环境的压力随之加大。环境污染治理已经被政府作为提高人民生活质量和人民生活的重点工作,改善生态环境是十分必要的。
生态环境的评估是控制环境污染、制定环境政策等活动的基础,能够为改善生态环境提供理论支持,是保护和改善环境的第一步。废水、废气和固体废弃物这“三废”是导致城市环境质量变差的罪魁祸首,如果不加治理,就会严重污染城市生态环境,因此对城市环境污染情况进行研究具有重要意义。
目前,针对城市环境污染情况评估的问题学者们开展了大量研究。向用彬等[2]运用改进的灰色聚类方法,以拉萨市中干渠为对象,对其水环境质量进行了聚类评估;丁卉等[3]以广州市为例,应用模糊-灰色聚类方法,对广州市的空气环境质量进行了定量评估。上述研究虽然都对环境的污染情况进行了评估聚类,但不管是对空气质量还是水环境质量进行评估,选取的指标都是单一类型,没有综合考虑废水、废气和固体废弃物这“三废”的影响,对环境的污染情况的评估都不够全民。针对上述问题,屈葵葵选取了废水、二氧化硫、烟粉尘和固体废物4个指标,利用偏离份额分析和K-means聚类方法对中国30个省的环境污染情况进行了分析[4]。虽然考虑到了废水、废气和固体废弃物三类因素,但对每种因素都是单独分开进行分析,并没有将多种因素之间的交互嵌套关系综合纳入评估体系。
灰色聚类方法作为一种考虑多指标聚类的定量分析方法,在各个行业和领域都有重要应用[5-12]。基于上述不足之处,采用灰色定权聚类的方法,对河南省18个省辖市2013—2017这5年的7个污染指标数据进行综合分析评估,将河南省各市按照污染情况分为4类,并根据聚类结果得出结论并提出对应建议。
1 评估指标的确定
1.1 确定评估指标
污染情况评估体系指标的构建,需要在一定的构建原则下,以恰当的概念模式为分析框架,选取一系列单个污染指标。因此,构建时应遵守以下准则。
(1)科学性。主要目的在于研究河南省省辖市的污染情况,以对整个河南省的污染情况进行分类,提出相关治理建议,减少河南省在经济高速发展当口下的环境污染。因此构建的评估指标必须以能体现污染情况为导向,有明确可靠的数据来源,且要对评估体系的构建具有重要参考意义。
(2)全面性。由于主要研究河南省省辖市的污染情况,而污染情况评估是一个系统的,总体的评估目标,包括空气质量,水流污染情况等。因此需要建立含多个方面,多个维度的评估指标,保证最终的评估结果具有可对比性和科学性。
(3)全面与重点相统一。评估指标越全面越能反映总体问题,但是过于庞杂的评估指标体系会带来很多信息收集和数据处理上的困难,需要投入大量的人力物力,导致实际操作中的低效率。而且评价指标的多样性容易导致关键指标的模糊性和不突出性。因此,构建污染情况的评估指标时既要能全面评估出各市的污染情况,又要能抓住反映主要特征的指标。总之,要尽可能地做到全面和重点的统一[13]。
1.2 确定指标权重
灰色定权聚类评估方法需要对各聚类评估指标赋权,指标的权重确定是重要环节之一。当指标数量较少时,权重可以根据经验或指标间的对比主观确定。当指标较多时,常会使用层次分析法(analytic hierarchy process, AHP)来确定权重。
层次分析法确定定性指标权重简单有效[14]。对于单一层级的指标,层次分析法的流程图如图1所示。
图1 单层级层次分析法流程Fig.1 Single-level AHP process
根据两两指标相对重要程度打分,得到判断矩阵A为
(1)
计算得7个指标对应的权重向量W=(0.30,0.04,0.07,0.12,0.07,0.13,0.27)T,且满足一致性需求,最终确定废水排放总量、废水化学需氧量(COD)排放量、废水中氨氮排放量、二氧化硫排放量、氮氧化物排放量、(粉)尘排放量这7个指标的权重。最后确定评估指标及其权重(表1)。
表1 污染情况评估指标及权重Table 1 Pollution evaluation indicators and weights
2 河南省省辖市的污染情况评估分析
2.1 数据来源及处理
原数据均来源于《河南省统计年鉴》,以2017年为例。通过对以上7个指标每组数据的统计汇总,以废水排放总量为例,对各数据进行初步的判断和处理。各市废水排放总量直方图如图2所示。
通过原始数据(表2)和直方图(图2)可以初步看出,郑州市的多项指标的值都很高,且与另外17个市差距较大,说明郑州市污染情况最为严重。考虑到郑州市是河南省重点扶持发展的城市,污染最为严重这一现象可以理解。
表2 2017年各市污染物排放量Table 2 Pollutant emissions by cities in 2017
图2 各市废水排放总量Fig.2 Total wastewater discharge by cities
除郑州市废水排放总量明显较多之外,该组数据体现出明显的左偏特点,即废水排放总量较少的城市数量较多,且数据的正态性不强,其他指标的数据也有类似的特点,这可能导致聚类的结果也大幅左偏。因此需要对这些数据进行Box-Cox变换,减少数据左偏幅度和增强数据正态性,进而进行之后的数据分析和处理。
对原始数据Y进行Box-Cox变换得[15]
(2)
式(2)中:Y为原始数据,Y>0;λ为待定参数,由最大似然法确定的各指标的λ依次为0、0.5、0.5、0,0、0,0。即对废水中COD排放量和废水中氨氮排放量这两组指标数据进行平方根变换,对其余5个指标数据进行对数变换,变换后的数据如表3所示。
表3 Box-Cox变换后各指标值Table 3 Each index value after Box-Cox transformation
2.2 白化权函数的建立
图3 4种形式的白化权函数Fig.3 Four forms of whitening weight function
常用灰色聚类方法中,确定各变量的白化权函数方法如下[16]。
(1)累积频率法。由各指标原始数据绘制累积频率曲线,将曲线上各指标不同累积频率对应的值作为白化权函数的参数,确定白化权函数。
(2)三角白化权函数法。将各个指标的原始数据的极值看作一个区间,根据想要划分的灰类数量,将指标也划分为与灰类数量相同的区间,区间端点由行业标准或者实际情况确定。
(3)参考行业规范或者国家标准直接得到。有的行业直接规定了某个指标数据在各个区间内时,其代表的水平好坏程度。
拟将河南省省辖市的污染程度由轻到重分为4个灰类,由于各个指标的年排放量均没有国家标准评定其水平,因此决定选用三角白化权函数法确定各个指标的白化权函数。现有的三角白化权函数法有基于端点和基于中心点两种,根据相关数学推导分析可知,基于中心点的三角白化权函数相比较之下更优,因为其没有两个以上灰类交叉的现象,且拥有更好的规范性[17]。因此决定在进行污染情况聚类分析时选用该方法。中心点三角白化权函数的计算分为如下两个步骤。
步骤1 对各指标原始数据的取值范围进行划分,分割区间的个数由拟聚类的灰类个数决定。找出最可能属于某个灰类k的点λk(k=1,2,…,s)作为该灰类的中心点。确定中心点后可将该灰类的取值范围确定为[λk-1,λk+1]。对于两个端点λ0和λs+1可由相邻点延拓得到。
图4 中心点三角白化权函数示意图Fig.4 Schematic diagram of the center point triangle whitening weight function
对于指标j的值x,其白化权函数为
(3)
根据上述方法和步骤,由于原始数据已事先经过Box-Cox变换,减小了数据的左偏幅度,因此可以先找出每个指标数据的最小值xmin和最大值xmax,并根据最值求出中间3个四分位数,划分出各单一指标的四个灰类区间,并求出区间的中心点λ1、λ2、λ3、λ4,把中心点向左、右各延拓一次得到λ0、λ5。之后,对每个指标数据进行相同的处理,每个指标的白化权函数如表4所示。
表4 各指标的白化权函数Table 4 Whitening weight function of each indicator
2.3 聚类结果
表5 污染情况聚类结果Table 5 Pollution clustering results
对2013—2017年河南省省辖市污染情况的原始数据进行上述相同的灰色定权聚类处理,将最终聚类结果整合在一张图上,如图5所示。
从图5可以清晰地看出,同一年内河南省辖市的环境污染情况和全省污染情况随时间变化的情况。通过该图可以较为全面地判断河南省整体环境情况,为相关部门制订政策提供参考。
图5 河南省2013—2017年城市污染情况聚类结果Fig.5 Clustering results of urban pollution in Henan Province from 2013 to 2017
3 结论
(1)从河南省整体来看,河南省东部污染程度轻,中西部污染程度较为严重。这与中国环境质量东部好西部较差的分布相吻合。特别是郑州市和平顶山市,2013—2017这5年的污染程度一直居高不下,需要重点关注和监控,制定合理的环境政策,控制这两市的环境质量。
(2)从时间维度来看,由于国民环境意识的提高和政策管控的原因,河南省环境质量整体呈现逐渐变好的趋势,污染程度重的城市数量逐渐减少,污染程度中的城市所占比例较大,今后应在完善现有政策管控的基础下,探索更符合实际、更高效的污染控制政策和技术。
(3)灰色定权聚类评估方法在使用中有一定的局限性。各个指标的权重分配和白化权函数的建立具有一定的主观性,且对于各种指标的原始数据过于离散的情形,容易丢失部分有用的信息。 但它的确是一种能解决多对象多指标的聚类评估问题的有效方法。