基于K均值聚类地下水水化学特征的水文地质单元划分分析
2015-03-26李明
李明
[摘要]文章结合自身工作经历,首先介绍了传统水文地质单元划分的主要影响因素。接着分析了k均值聚类的基本概念和计算方法及步骤。最后联系平顶山煤田水文地质单元划分的实际情况,探讨基于k均值聚类地下水水化学特征的水文地质单元划分应用效果。以期为水文地质单元划分提供新的理论计算依据。
[关键词]k均值聚类 水化学特征 水文地质单元
[中图分类号] P332.7 [文献码] B [文章编号] 1000-405X(2015)-3-225-2
1引言
水文地质单元划分是根据水文地质条件的差异性将所要研究的对象分成若干个小的区域,然后将研究对象进行分类,以期找到研究对象的某些规律的手段。一般而言,水文地质条件的差异性主要体现在研究对象的地形地貌、地质构造、地层条件以及气象和水文等方面。然而,在实际操作中,由于地下条件的复杂性,我们根本无法准确了解整个区域的地质和水文条件。如局部区域可能存在小断层和小溶洞等可以大大改变整个区域地下水的补给、径流以及排泄条件的类外因素。但是从另一个角度来讲,由于每个水文地质单元一般都具有统一的径流、补给、排泄条件。
2传统水文地质单元划分方法的主要影响因素
2.1地形地貌的影响
所要研究区域的地形地貌虽不是影响水文地质单元划分的主要因素。但是由于该区域的湖泊、河流等地表水可能成为地下含水层的补给水源,因此也可以将其作为水文地质单元划分的依据。然而,依靠现有的科技水平,我们还无法将地下水和地表水的沟通情况准确确定,所以区域的地形地貌等只能作为进行水文地质单元的辅助划分因素。
2.2地层条件的影响
地层条件必须首先考虑地层岩性。由于不同岩性的裂隙发育程度会有明显差异,因此其富水性也会有所不同。所以在岩性变化较大的地区应进行分区处理。但如果是要研究某一含水层的地下水时情况时,由于其岩石的性质较为相似,故此时岩石性质应作为水文地质单元的辅助划分因素。其次,还要考虑不同岩性的连通及渗透情况。一般而言,地下水在其中的运行情况会大大影响地下水水害的程度。最后,我们还要考虑隔水层和含水层的分布、产状及其在地表的出露情况。如图1所示为潜水、承水以及滞水含水层的产状及分布情况,这些都会在一定程度上影响到水文地质单元的划分。但在实际考察中发现,由于隔水层和含水层的产状及分布特性可以很容易地在大范围内被掌握。而局部小范围的缺失或是厚度变薄,则无法精确判断,因此可能会造成含水层的沟通,进而影响到整个区域的局部径流、补水和排泄条件。 此时如果还是按照原来的隔水层及含水层的性质来划分水文地质单元,则会造成较大误差。
2.3地质构造的影响
地质构造是影响水文地质单元划分的主要因素。我们既要考虑研究区域的断裂带、区域性断层的分布情况,还要掌握该区域的断层破碎带以及节理密集带的显著特点。一般来说,断层分布区的规模越大,该区域表现为岩溶水强径流带的概率就越大。但是,如果该断层是不导水的,那么就可以划分为2个水文地质单元。另外,由于断裂或节理的存在,使得断裂或节理两端的地层径流通道堵塞或畅通,从而形成2个不同的径流、补给和排泄的区域,导致该区域可能成为2个水文地质单元。
2.4气象及水文因素的影响
若在较大区域范围内进行水文地质单元的划分,那么气象及水文因素的影响较大。此时我们必须将其列为主要依据对象。但是若在特定的规模不大的地区内划分水文地质单元,由于此时气象和水文因素在此范围内相似甚至相同,所以不能将其作为主要的参考因素。
3 K均值聚类
3.1基本概念
k均值聚类是目前最著名的区域划分聚类算法,而且由于该方法简洁、效率高,逐渐成为所有聚类算法中应用最广泛的一个。它的基本原理是首先通过给定数据点集合以及需要的聚类数目k(k值由用户指定),然后再根据某个特定的距离函数反复地把数据分入k个聚类中直至结束。
3.2计算方法及步骤
首先,随机选取K个对象作为开始的聚类中心。然后,计算每个所要划分的对象与子聚类中心之间的距离。并将其分配给距离自己最近的聚类中心。聚类中心以及分配到其中的对象就代表一个聚类。一旦所有对象都被分配完毕,每个聚类的聚类中心就会被重新计算。该过程将不断重复,直至满足相关终止条件为止。(如图1所示)一般而言,终止条件既可以设定为没有对象被重新分配给不同的聚类,也可以设定为没有聚类中心再发生变化,还可以设定为误差平方和局部最小。
4实际案例分析
4.1基本资料
以中国平顶山煤田寒武系灰岩的水文地质单元划分为例,该区域的自然地理条件、构造条件如下:
(1)自然地理条件:东起洛岗一号正断层,南起庚组煤(一煤)层露头,西北至郏县断层,东北至襄郏断层。含煤面积为650km2。平顶山煤田的中部和北部为低山,而西南部为丘陵。区内较大的河流为汝河和沙河,且区内在沙河上建有白龟山水库和昭平台水库。
(2)构造条件:主体构造为宽缓复式向斜以及李口向斜。整个复式向斜呈现东部封闭、西部开放的状态。如图2所示。由于李口向斜的轴部寒武系灰岩常年深埋于煤系地层之下,使得来自西南豁口补给区的岩溶水很难越过李口向斜的轴部,造成向斜两翼的岩溶水系统之间水力联系极其微弱。
4.2计算分析结果
根据矿区地形地貌、地质构造、地层条件以及水文地质特征和区域地下水的径流、补给与排泄条件,可将平顶山煤田划分为3个一级水文地质单元。即宝丰岩溶水系统(I单元)、平顶山岩溶水系统(II单元)以及襄县岩溶水系统(III单元)。如图3所示。
下面利用k均值聚类地下水水化学特征进行矿区水文地质单元划分。首先采集矿区内具有代表性的寒武系灰岩水样进行水质化验,并将得到的数据进行k均值聚类分析。k均值聚类分析步骤如下:
(1)确定聚类个数。为了提高数据处理效率和准确率,这里k=3;
(2)选择3个初始聚类中心。根据欧氏距离最小原则将所有的其他样本分给各个聚类中心;
(3)求各聚类中所包含的样本均值向量,并确定新的聚类中心;
(4)判断聚类中心是否变化。如果没有变化则表明聚类完毕,如果有变化则继续进行聚类,直至聚类中心不发生变化。
本次计算过程需要多次迭代,所以使用SPSS统计软件的K-Means Cluster,经过2次迭代,得到如表1结果。
由表1可知,平顶山煤矿被划分为四个一级水文地质单元和四个二级水文地质单元。即五矿、九矿、七矿以及十一矿为一个水文地质单元,十二矿、十矿、十三矿以及首山一矿为一个水文地质单元。聚类划分结果与传统方法结果较接近。这些表明,锅底山断层的阻水效果比较明显,而李口向斜影响较小。8号水样被划为第3类,最可能的原因是在8号水样的取样点有隔水层和构造局部缺失,导致水样混入了其他含水层。
5结束语
综上所述,我们可以得出传统的依据研究对象的地形地貌、地质构造、地形条件、地层条件以及气象和水文等因素划分水文地质单元的方法具有不确定性以及参数的不可知性。而基于k均值聚类地下水水化学特征的水文地质单元划分可在一定程度上克服参数的不可知性,具有较好的效果。
参考文献
[1]董小舟,懂小辉.白城市水文地质分区探析[J].华北水利水电,2011(6)
[2]黄秋艳.基于特征级的智能化图像融合技术研究[D].中国石油大学(华东),2012.