主成分分析和模糊综合评价法在大连市地下水水质评价中的应用研究
2020-09-01薛伟锋褚莹倩曹文军侯辰侠沈葆真
薛伟锋,褚莹倩,刘 强,吕 莹,曹文军,侯辰侠,沈葆真
(1.大连海关技术中心,辽宁 大连116600;2.辽宁大学 环境学院,辽宁 沈阳110036;3.中检(大连)测试技术有限公司,辽宁 大连116600)
0 引言
地下水是水资源中重要组成部分.近年来,随着地下水开采量的增加以及恶劣气候变化,导致地下水环境质量急剧恶化,由其引发的环境问题也日益突出,已引起国内外广泛关注[1-8].地下水一旦遭受污染,由于其自净能力较弱,会对生态环境造成严重影响,直接或间接危害人类[9-14].
大连市作为一个滨海城市,淡水资源却异常匮乏,地下水环境质量的优劣直接关系到城市的环境保护、经济建设和居民生活等一系列问题.随着大连市经济快速发展,地下水环境质量问题日益突出[15,16].为了及时采取有效措施,保护和改善地下水水质,有必要对大连市地下水环境质量进行评价.
目前,国内外围绕水质评价方法开展了一系列重要的研究,常见的有单因子评价法[17]、综合指数评价法[18]、模糊综合评价法[19]、神经网络法[20]、灰色评价法[21]和主成分分析法[22]等.每种方法都有其侧重点,但每种方法都无法全面地反映复杂的水质状况.因此,在实际研究工作中将各种方法结合使用是全面可靠了解水质的良好选择.地下水环境是一个复杂系统,存在许多不确定性因素,具有明显的模糊性,从而难以定量.模糊数学法能有效地解决评价边界模糊和监测误差对评价结果的影响.模糊综合评判法以模糊数学理论为基础,通过隶属函数表示模糊状态,利用隶属度对样本进行分类,根据最大隶属度原则,确定水质类别.主成分分析法充分考虑不同指标之间的信息重叠,对多维数据进行标准化,在尽可能地保留原有信息的基础上,对多维数据进行降维处理,更加客观地筛选出独立的综合因子,避免了主观随意性,已被广泛应用于水质评价[23-26].基于此,本研究采用模糊综合评价法和主成分分析相结合对2015年大连市地下水水质进行评价,并与文献报道结果[27]进行比较,分析不同水质评价模型差异原因,为大连市地下水改善和可持续发展提供更加全面可靠的科学依据,为大连市居民用水安全提供基本保障.
1 实验方法
1.1 主成分分析
采用SPSS 17.0软件进行分析,步骤如下所示.
1.1.1 水质指标选取
根据文献[27]报道结果,选取总硬度、溶解性总固体、氯化物、铁、硝酸盐氮等5项水质因子作为评价指标.
1.1.2 数据标准化
对原始数据进行标准化处理,消除不同指标间的量纲和数量级影响.
1.1.3 相关性检验
采用Kaiser-Meyer-Olkin(KMO)检验统计量和Bartlett球形度检验判断指标间的相关性,以确定原始变量是否适合进行因子分析.当KMO值大于0.5时,可进行因子分析.Bartlett球形度检验对应的显著性小于0.05时,原始变量间存在相关性,可进行主成分分析.
1.1.4 确定主成分个数
一般选取累计方差贡献率不小于70%,特征值大于1的主成分.
1.1.5 确定主成分表达式
根据计算结果,确定主成分Fi的表达式.
1.1.6 水质评价
计算主成分分值,综合得分越高,表明水质污染越严重.
1.2 模糊综合评价法
1.2.1 水质指标选取
同样根据文献[27]报道结果,选取总硬度、溶解性总固体、氯化物、铁、硝酸盐氮和氨氮等6项水质因子作为评价指标.
1.2.2 确定水质指标评判标准
根据GB/T 14848-2017《地下水质量标准》[28]确定上述水质指标评判标准,如表1所示.
表1 地下水水质指标评价标准
1.2.3 建立隶属度函数及模糊矩阵
当j=1时,隶属度公式为(其中,X:水质因子实际测定值;S:水质因子标准限定值,见表1):
当j=2、3、…、n-1时,隶属度公式为:
当j=n时,隶属度公式为:
1.2.4 建立权重矩阵
通过超标倍数赋权法实现权重赋值.由于权重的不同定义,导致最终评价结果有较大差别,因此应将权重归一化.权重计算方法如下:
其中,ai-污染物i的权重值;Xi-污染物i的实测值;Si-污染物i的评价标准算数平均值.
1.2.5 确定模糊综合评价结果矩阵
建立权重矩阵A和模糊矩阵R之后,两个矩阵相乘后可以得到各水质因子的最终矩阵B,计算方法如下:
B=A×B=(b1,b2,b3,…,bn)
1.2.6 确定水质类别
根据评价结果,获得水质隶属度,最终确定水质类别.
2 结果与讨论
2.1 主成分分析结果
2.1.1 原始数据标准化及相关矩阵计算
为消除原始数据不同量纲和数量级的影响,对数据进行标准化处理,处理结果如表2所示.相关系数的大小表征不同指标之间的相关程度,对监测结果进行处理,结果如表3所示.
2.1.2 变量相关性检验
主成分分析以变量相关性检验为前提,地下水KMO和Bartlett检验结果如表4所示.由表4分析可知,地下水KMO检验度量值大于0.5,Bartlett球形检验显著性小于0.05,表明原始变量之间存在相关性,适合做主成分分析.
表2 标准化后数据
表3 相关系数矩阵
表4 KMO和Bartlett检验结果
2.1.3 主成分确定
主成分的方差及方差贡献如表5所示.由表5分析可知,特征值大于1的只有1个成分,累积的方差占比为69.478%(近似70%,基本满足1.1.4部分主成分个数确定要求),即可用1个主成分替代5个水质指标,其包含的信息量可以解释监测指标表征的绝大部分信息,可利用其进行地下水水质的评价研究.
表5 解释的总方差
2.1.4 初始因子载荷矩阵
初始因子载荷矩阵系数表征监测水质指标与主成分的相关程度,用于解释各个主成分变量的变异情况.其中,正值表示水质指标与主成分之间呈正相关,负值表示水质指标与主成分之间呈负相关;其绝对值越接近1,表明相关程度越高,则该指标可以作为评价地下水水质的主要控制指标.地下水主成分初始因子载荷矩阵如表6所示.主成分1在总硬度和溶解性总固体等变量上具有较高载荷,表明主成分1主要反映这两个指标的信息.
表6 主成分初始因子载荷矩阵
2.1.5 主成分表达式建立及水质评价
用主成分初始因子载荷矩阵中数据除以主成分对应特征值平方根,得到主成分相对应的特征向量,即每个指标相应的系数,与标准化的后的数据ZXi相乘,即可得出主成分F相应的表达式.主成分得分的计算公式如下式所示:
F=0.515ZX总硬度+0.524ZX溶解性总固体
由上述公式,获得地下水水质主成分F值,结果见表7.根据F值越大,水质污染越严重进行不同采样点水质排名,由优至劣依次为黄旗-二十里-尹家-兴民-付家-南鸭路咀-小黑石-苏家.
表7 F值综合得分
2.2 模糊综合评价法结果
2.2.1 建立模糊矩阵
根据隶属度公式,计算获得大连市地下水水质模糊矩阵,结果见表8.
表8 地下水水质模糊矩阵结果
2.2.2 建立权重矩阵
根据权重计算公式,获得大连市地下水水质权重矩阵,结果见表9.
表9 权重矩阵结果
2.2.3 综合评价结果及水质类别
将上述计算获得的权重矩阵和模糊矩阵相乘后得到最终矩阵,进而获得综合评价结果,根据最大隶属度原则,确定水质所属类别,如表10所示.由该表可知,模糊综合评价法获得大连市地下水水质由优至劣顺序为黄旗-尹家-小黑石-南鸭路咀-兴民-二十里-付家-苏家.
表10 地下水水质模糊综合评价结果
2.3 主成分分析与模糊综合评价法预测结果比较
主成分分析法获得大连市地表水水质由优至劣依次为黄旗-二十里-尹家-兴民-付家-南鸭路咀-小黑石-苏家;模糊综合评价法预测地表水水质由优至劣依次为黄旗-尹家-小黑石-南鸭路咀-兴民-二十里-付家-苏家.根据模糊综合评价法结果,黄旗水质最好(I类水),苏家水质最差(V类水),尹家为II类水,其余5个采样点均为III类水.其中,模糊综合评价法给出的黄旗和苏家水质排名与其在主成分分析中排名一致.尹家水质在模糊综合评价法和主成分分析中均具有较高排名,分别为第2和第3位.尽管兴民、付家、二十里、南鸭路咀和小黑石在两个预测模型中排名顺序不很一致,可能原因是这5个采样点水质均为III类水,本身污染程度差别不明显,还有两种模型算法也不完全相同,导致两种预测模型在预测同一类水水质排名时出现较大差异.通过与文献[27]报道的内梅罗指数法预测水质结果比较,发现本研究使用的模糊综合评价法预测的水质类别要比内梅罗指数法预测的水质类别更好一些,水质排名总体趋势基本一致.综上,尽管本研究使用的两种预测模型预测水质排名时存在差异,但总体趋势基本一致,说明两种模型结合使用后预测结果更加全面可靠.
3 结论
本研究以大连市地下水为研究对象,运用主成分分析和模糊综合评价法对水质主要影响指标进行分析,并对综合水质进行了评价,结论如下:
1)针对大连市8个不同区域的地下水,主成分分析指出,可将5个水质指标综合为1个主成分进行解释,解释率为69.478%,水质综合控制指标为总硬度和溶解性总固体.模糊综合评价法预测8个地下水中1个I类水、1个II类水、5个III类水和1个V类水.
2)主成分分析和模糊综合评价法对8个地点的地下水水质排名预测存在差异,但总体趋势基本一致,说明两种模型结合使用后预测结果要比单一预测模型更加全面可靠.
4 建议
根据大连市地下水水质评价结果,提出以下3点建议:
1)展开更详细调查,查明风险源周边地下水环境状况,提高风险评价精度;
2)加强地区各部门配合,建立信息共享机制,及时通报情况和处理各类污染隐患问题;
3)建立基于空间地理信息的地下水资源与环境管理、评价与信息发布系统,及时预测和分析地下水水质状况,为政府和有关部门提供一种有效手段.