APP下载

基于主成分聚类分析的地下水化学分类方法

2016-06-15周金龙贾瑞亮曾妍妍

地下水 2016年1期
关键词:分类法水化学组分

孟 奇,周金龙,贾瑞亮,曾妍妍

(新疆农业大学水利与土木工程学院,新疆 乌鲁木齐 830052)



基于主成分聚类分析的地下水化学分类方法

孟奇,周金龙,贾瑞亮,曾妍妍

(新疆农业大学水利与土木工程学院,新疆 乌鲁木齐 830052)

[摘要]根据新疆巴里坤县汉水泉地区20组承压水水样的K+、Na+、Ca2+、Mg2+、SO42-、Cl-和HCO3-等7个化学指标检测数据,采用舒卡列夫分类法进行地下水水化学类型分类。结果显示,部分同类型之间组分含量差异较大而不同类之间组分含量差异较小,分析认为是舒卡列夫分类法划分界限人为性太强导致的。因此,我们采用主成分聚类分析法代替舒卡列夫分类法,对水化学类型进行分类。本文借助SPSS软件进行主成分分析,提取2个主成分,将主成分得分作为指标进行聚类分析,最终将20组水样划分为6类。主成分聚类法通过消除变量之间的相关性使结果更加客观合理。

[关键词]主成分分析;聚类分析;地下水化学分类

正确合理地划分地下水化学类型有助于分析地下水化学特征及其成因。目前地下水水化学分类方法有多种,其中舒卡列夫分类法是应用较为广泛的方法之一,但是此方法存在一些不足。

汉水泉地区位于新疆维吾尔自治区巴里坤哈萨克自治县北部,北部为大哈甫提克山、呼洪得雷山,南部为白依山。研究区内海拔460~1 700 m,地形较平坦开阔,地形坡降约为40‰~90‰,面积为1 482 km2[1]。该地区基本无人类工程活动,人类对地下水的扰动很少。

本文采用主成分聚类分析,将汉水泉地区20组承压水水样划分为6类,通过与舒卡列夫分类法比对,发现该方法分类结果更加客观准确,对于其他研究区的地下水水化学分类也有一定参考价值。

1研究区水文地质条件概况

汉水泉地区内无常年性地表水流,研究区内及附近分布零星的泉点,以及在融雪季节和夏季暴雨过后在沟谷中可形成暂时性的地表水流。研究区第四系、新近系形成了许多层面裂隙、构造断裂和孔隙等空隙,为地下水的储存、循环和运移提供了良好的场所,赋存基岩裂隙水、第四系松散岩类孔隙潜水和新近系碎屑岩类孔隙裂隙承压水。研究区内地下水类型为多层结构,即上覆第四系松散岩类孔隙潜水,下伏碎屑岩类孔隙裂隙承压水及基岩裂隙水。

研究区地下水补给来源为:山区为基岩裂隙水补给,平原区主要为大气降水入渗、侧向径流补给。山区地下水主要以基岩裂隙泉水和侧向径流为主要排泄方式。平原区以蒸发、植被蒸腾、自流井溢出为主要排泄方式。

2 地下水化学分类方法对比

2.1舒卡列夫分类法

舒卡列夫分类方法是常用的地下水化学分类方法[2]。赵丽等(2015)通过对研究区部分表层土壤和地下水取样进行测试分析,结合舒卡列夫分类法对研究区地下水水化学类型进行分类,对地下水进行了质量综合评价并分析了污染原因,结果表明,研究区地下水质量不容乐观[3]。尹恒等(2012)对德阳市城市规划区地下水水样水化学分析结果,在采用舒卡列夫分类法水化学分类的基础上,对研究区地下水水化学特征以及空间分布进行了探究[4]。陆海燕等(2014)在已有资料的基础上运用舒卡列夫分类法对通州-龙旺庄地区地下水水化学类型进行划分,对水质演化规律进行了探究并分析了水质恶化的原因[5]。郭春艳等(2014)运用舒卡列夫法在对唐山市平原区地下水进行了基本分类的基础上,通过对研究区化学组分的浓度和分布规律的研究,更进一步探究了研究区地下水环境的影响因素,并为该研究区地下水资源保护及开发利用提供了依据[6]。

舒卡列夫分类法采用地下水6种主要离子Na+(K+合并于Na+中)、Ca2+、Mg2+、SO42-、Cl-和HCO3-(CO32-合并于HCO3-中),以及TDS划分地下水化学类型。规定含量大于25%毫克当量的阴离子与阳离子进行组合,将地下水化学类型划分为49类。周金龙等(2003)认为:该方法依据25%毫克当量的划分带有一定人为性,会对分类结果造成很大影响,导致分类不尽合理[7]。表1是采用舒卡列夫分类法对汉水泉地区20组承压水地下水水样的分类结果。

表1  汉水泉地区地下水舒卡列夫法分类结果

2~5类地下水化学组分均值和变异系数见表2。由表2可以看出:变异系数≤0.25占28.57%,变异系数0.25~0.50占60.71%,变异系数0.50~0.75占7.15%,变异系数0.75~1.00占3.57%;平均变异系数为0.33。除4类外,同一类型的地下水化学组分含量变异系数较大(一般>0.25)。由表2还可以看出:2类和3类、4类和5类地下水化学组分差异较小。由此说明,舒卡列夫法分类结果在很大程度上达不到同类组分含量差异较小、不同类组分含量差异较大的分类目的[7]。

表2  舒卡列夫分类法不同类型各组分平均值和变异系数一览表

注:由于HK24-2与HK14-1单独分为一类(1类和6类),故未列入本表;斜线左侧为组分的平均含量(毫克当量/升),斜线右侧为组分含量的变异系数。

2.2主成分聚类分类法

2.2.1主成分分析

主成分分析是将原来众多具有相关性指标,重新组合成新的无相关的综合指标从而替代原来的指标。选取汉水泉地区20组承压水7个化学指标(K+、Na+、Ca2+、Mg2+、SO42-、Cl-和HCO3-)进行分析,选用数据单位为毫克当量/升。通过运用SPSS软件因子分析模块对数据进行主成分分析,为聚类分析做准备。

主成分分析过程如下:

1)数据相关性

根据数据生成的相关矩阵进行检验,一般认为相关系数多数大于0.3,则认为适合做主成分分析[8]。由表3知大多相关系数大于0.3,相关性较强,则可以做主成分分析。KMO(Kaiser-Meyer-Olkin)检验统计量是用于比较变量间简单相关系数和偏相关系数的指标,一般认为低于0.5是不适合做主成分分析[8]。本文计算KMO值为0.514,说明原始指标中存在共线性,选用的数据适合做主成分分析。以上两种检验都判断该组数据可以做主成分分析。

表3 相关系数矩阵

2)主成分的选取

主成分选取采用累积贡献率法,大多以累计方差贡献率超过85%为标准,但是在本文中,通过生成结果(表4)发现第三主成分与原始因子相关性不强,故提取前两个主成分,累积贡献率为80.37%(表5),即前两个主成分代表了原始成分的80.37%的信息量,其中第一主成分累积贡献率为62.13%。

表4  因子荷载矩阵

表5  主成分特征值及方差贡献率

通过本文数据分析,得出因子荷载矩阵(表4)。根据数据知,主成分1代替了原始数据中的K+、Na+、Ca2+、Cl-和SO42-,其中Mg2+和HCO3-载荷相对较低,即主成分1对其解释度较低。主成分2代替了Mg2+和HCO3-。

3)主成分得分

主成分得分的计算方法:将表4中第i列的每个元素分别除以第i个特征根的平方根,得到第i个主成分系数(表6)。

表6  主成分系数

根据表6得出前两个主成分y1和y2线性组合为:

y1=0.36x1+0.45x2+0.45x3+0.10x4+0.44x5+0.43x6-0.28x7;

y2=-0.07x1+0.13x2+0.06x3+0.75x4+0.24x5-0.18x6+0.57x7

其中:x1,x2,x3,x4,x5,x6, x7为对原始变量标准化后的变量。

原始变量标准化采用Z-Score标准化,然后通过上式计算出主成分得分(表7)[9,10]。

表7  主成分得分

图1 主成分聚类分析树状图

2.2.2 聚类分析

用主成分得分替代原始数据进行样品聚类。通过SPSS聚类模块,对20组数据的进行系统聚类分析。

聚类方法选用Ward法(离差平方和法)[11-13],必须选用欧式距离[14],将主成分分析中提取的两个主成分得分作为聚类的新指标。根据聚类分析的结果(图1),将20个水样点划分为6类(表8)。(其中样点HK14-1与HK22-1各自聚为一类,这两个样点的TDS分别为6139.8 mg/L与6414.3 mg/L,为其余样点TDS的1.4~6.5倍)。

根据上述分类计算各类离子含量平均值及变异系数(表9)。1、2、3和6类地下水化学组分均值和变异系数见表9。由表8可以看出:变异系数≤0.25占71.43%,变异系数0.25~0.50占28.57%,变异系数0.50~0.75占0.00%,变异系数0.75~1.00占0.00%;平均变异系数为0.21。同一类型的地下水化学组分含量变异系数明显小于舒卡列夫分类法划分的同一类型的地下水化学组分含量变异系数。由表9还可以看出:各类地下水化学组分含量的差异明显大于舒卡列夫分类法划分的同一类型的地下水化学组分含量差异。

对比表9和表2的不同类型各组分平均值和变异系数发现,主成分聚类分析法对地下水化学类型的划分比较客观合理。

表8  主成分聚类分析结果

表9 主成分聚类分析法不同类型各组分平均值和变异系数一览表

注:同表2。

3 结语

比较主成分聚类分析法和舒卡列夫分类法对汉水泉地区承压水水化学的分类结果,得出以下结论:

(1)舒卡列夫法分类法划分地下水化学类型的界限人为性强,在很大程度上达不到同类组分含量差异较小、不同类组分含量差异较大的分类目的。

(2)主成分聚类法通过消除了变量之间的相关性使结果更加客观合理,同一类型的地下水化学组分含量变异系数明显小于舒卡列夫分类法划分的同一类型的地下水化学组分含量变异系数,不同类型地下水化学组分含量的差异明显大于舒卡列夫分类法划分的不同类型的地下水化学组分含量差异。

参考文献

[1] 吴霞,吴津蓉,李巧,等.新疆汉水泉地区地下水环境背景值计算[J].人民黄河.2015,(1):83-86,90.

[2] 张人权,梁杏,靳孟贵,等.水文地质学基础(第六版)[M].北京:地质出版社.2011:67.

[3] 赵丽,王同桂,邓春光,等.重庆市西部地区浅层地下水化学特征及污染现状分析[J].地下水.2015,(1):70-72.

[4] 尹恒,吴勇,高东东,等.德阳市城市规划区地下水化学特征分析[J].地下水.2012,(1):30-35.

[5] 陆海燕,杨帆,辛宝东,等.北京大兴迭隆起隐伏岩溶水化学特征及水质变化原因[J].南水北调与水利科技.2014, (5):155-159.

[6] 郭春艳,马震,张兆吉,等.唐山市平原区浅层地下水环境特征研究[J].南水北调与水利科技.2014,12(4).

[7]周金龙,董新光,兰卫松.分步聚类分析方法划分地下水水化学类型[J].新疆农业大学学报.2003,26(2):72-75.

[8] 管于.实用多元统计分析[M].杭州:浙江大学出版社.2011:188-213.

[9] 何晓群.多元统计分析(第三版)[M].北京:中国人民大学出版社.2012:129-135.

[10] 王晓鹏,曹广超.基于多元统计和GIS的环境质量评价研究[M].北京:科学出版社.2013:19.

[11] 吕晋,邬红娟,林济东,等.主成分及聚类分析在水生态系统区划中的应用[J].武汉大学学报:理学版.2005,51(4): 461-466.

[12] 蒋群,许光泉,梁修雨.主成分和聚类分析应用于淮南矿区地下水水质评价[J].能源环境保护.2007,21(2):51-53.

[13] 鲁守刚,邓娅敏,张美雁,等. 基于多元统计分析的高砷地下水水化学特征研究——以内蒙古杭锦后旗为例[J].中国农村水利水电.2014,(12):179-182.

[14] 胡雷芳.五种常用系统聚类分析方法及其比较[J].浙江统计.2007,(4):11-13.

Groundwater Chemical Classification Method Based on Principal Component Cluster Analysis

MENGQi,ZHOU Jin-long,JIA Rui-liang,ZENG Yan-yan

(College of Water Conservancy and Civil Engineering, Xinjiang Agricultural University, Urumqi 830052, Xinjiang)

Abstract:According to the determination result of seven chemical indexes including K+, Na+, Ca2+, Mg2+, SO42-, Cl- and HCO3- of 20 groups of confined groundwater samples in Hanshuiquan region of Balikun County in Xinjiang , Shkalev classification is applied to classification of hydrochemical types. Results show that the difference among the same type of samples is relative greater and the difference among different type of samples is relative smaller which is probably due to certain artificial factors of Shkalev classification which can lead to the inaccuracy of classification results. Therefore, principal component cluster analysis is applied to classification of hydrochemical types instead of Shkalev classification. Using principal component analysis with SPSS software,two principal components were extracted in our study. The 20 groups of samples were divided into six categories according to the principal components scores which are regarded as the metric of cluster analysis. The principal component cluster analysis eliminates the correlation between variables and makes the results more objective and reasonable.

Key words:Principal component analysis;cluster analysis and groundwater chemical classification

[收稿日期]2015-07-31

[基金项目]中国地质调查局“西北地区主要城市地下水污染调查评价”(1212011220982)和新疆自治区水文学及水资源重点学科基金(xjswszyzdxk20101202)

[作者简介]孟奇(1989-),男,江苏徐州人,在读硕士研究生,主攻方向:地下水利用与保护。[通讯作者]周金龙(1964-),男,浙江龙游人,教授,主要从事灌区土壤水—盐运移监测与模拟、干旱区地下水利用与保护等教学与科研工作。

[中图分类号]P641.13

[文献标识码]A

[文章编号]1004-1184(2016)01-0005-04

猜你喜欢

分类法水化学组分
组分分发管理系统在天然气计量的应用
秦皇岛北部地表水和地下水水化学特征及水质评价
柴达木盆地南里滩地区卤水钾矿水文地质与水化学特征及其开采前景分析
分类法在高中化学中的应用
黑顺片不同组分对正常小鼠的急性毒性
金雀花中黄酮苷类组分鉴定及2种成分测定
K 近邻分类法在岩屑数字图像岩性分析中的应用
筠连煤层气井产出水化学特征及意义
基于贝叶斯分类法的股票选择模型的研究
ABC分类法在介入耗材库存管理中的应用