基于主成分层次聚类模型的采空塌陷场地稳定性评价
2021-01-14郭广礼李怀展杨向升
郭 松,郭广礼,李怀展,杨向升
(1.中国矿业大学江苏省资源环境信息工程重点实验室,江苏 徐州 221116;2.中国矿业大学环境与测绘学院,江苏 徐州 221116)
0 引言
采空塌陷是典型的由地下资源开采引起的地质灾害问题,其产生的根源是地下资源开采改变原岩应力状态后反映在地表的采动损害[1]。随着城市建设用地日益紧张,采空塌陷场地不仅限制了矿区土地资源利用,也阻碍了城市建设用地的拓展,为处理好地下开采与地面建设的关系,定性分析与定量评价采空塌陷场地稳定性是践行资源环境承载能力和国土空间适宜性评价的重要前提,对实现资源型城市的可持续发展具有重要的现实意义。
采空塌陷场地稳定性主要是以采空区场地与拟建工程相互影响程度为主要判别依据,综合考虑拟采取的抗采动影响技术措施的难易程度及工程造价等因素进行采空塌陷场地稳定性划分[2]。采空塌陷场地稳定性评价方法主要有:①开采条件判别法:以采空区终采时间为主要因素,结合地表移动变形特征、顶板岩性及松散层厚度等因素进行判别;②地表移动变形判别法:按地表移动变形判别准则对采空区场地稳定性进行评估;③煤(岩)柱稳定性分析法:以采空区内残留煤(岩)柱安全稳定性系数确定场地稳定性等级。实际采空塌陷场地稳定性是地质采矿因素相互影响的时空动态过程,上述采空塌陷场地稳定性评价方法没有明确的综合判别准则,使用难度较高,存在较大的局限性。
目前,围绕采空区场地稳定性评价的研究形成了以理论分析及综合评价为主的分析体系。GUO等[3]提出了固体充填开采的沉陷控制方法,较可靠地预测了固体充填后地表移动变形情况;谭志祥等[4]建立了采动区建筑地基、基础和上部结构协同作用的力学模型,分析了不同影响因素下建筑物附加应力的变化规律;张永波[5]提出了建筑物荷载大小、相对位置等对建筑物地基稳定性的影响及其变形破坏规律。随着地下资源开采规模不断扩大,地表塌陷面积持续增加,采空塌陷场地的开发与治理需求日趋迫切,唐山南湖公园与徐州潘安湖小镇是采空塌陷场地综合治理与规划的典型案例[6-7],通过将采煤塌陷区整治成生态或建设用地,突破了传统的农业复垦方式,实现矿产资源开发与城市建设协同发展的有效统一[8]。张曦沐等[9]针对国外典型资源型城市,如德国鲁尔区、法国洛林地区、英国煤炭城市盖茨黑德、日本产煤地域等采空塌陷区开展了人居环境建设研究。在采空塌陷场地稳定性综合评价方面,机器学习理论与方法已逐渐得到应用并取得了许多研究成果:聚类分析通过对无标记训练样本的学习揭示数据内在性质及规律,为采空塌陷场地的数据分析提供了基础[10],聚类方法从K均值(k-means)聚类将采空塌陷场地稳定性评价的样本集按最小化平方误差聚类迭代优化来近似得到簇划分,发展到多层次空间聚类、模糊C均值聚类(Fuzzy C-means, FCM)等“软聚类”(soft clustering)算法评价体系,允许每个样本以不同程度同时属于多个原型[11-12]。随着样本数据量大、影响因素多,针对聚类不客观的缺陷,开展以主成分降维层次聚类分析的算法模型研究将成为解决多因素影响下的采空塌陷场地综合评价问题的有效途径。
1 采空塌陷场地地质采矿条件概况
研究区域位于连云港市区北郊(图1)所示。该磷矿共5个可采矿体,均进行了不同程度的开采,采矿方式为地下开采,采用竖井、盲竖井开拓。采空区主要有底板埋深-440 m以上的7P采空区、13P采空区、11P采空区和底板埋深-120 m以上的8P采空区。在受到外力(如拟建建(构)筑物基底扩散压力、地下水位升降或地震等)的影响后,采空塌陷区域内破裂岩体失稳的可能性很大,是诱发采空区“活化”的主要区域。
图1 研究区域卫星影像图Fig.1 Satellite images of the study area
矿界范围内采空塌陷场地作为拟规划建设场地,地表塌陷的破坏程度不仅有连续移动变形,还存在以突发性、隐藏性为特点的非连续移动变形并形成了较大面积的采空区。开采历史过程中已发生3次较大塌陷事故,第3次地面塌陷发生在-120 m中段,形成长轴约130 m,短轴约100 m的倒立圆台塌陷坑,塌陷面积约9 400 m2。同时,地裂缝发育较明显的区域集中在矿区北侧道路,该段北部裂缝走向147°~162°,南部走向50°~75°,缝宽1~2 cm,沿走向呈羽状展布(图2)。
图2 研究区域采空塌陷现状Fig.2 Present situation of goaf-collapse in the study area
2 主成分层次聚类原理与模型检验
2.1 主成分层次聚类的基本原理
层次聚类(Hierarchical Clustering Method)是非监督机器学习聚类算法的一种,是基于簇间相似度在不同层次对数据集进行划分所形成的树形聚类结构[13]。AGNES (AGglomerative NESting)算法作为自底向上聚合策略的层次聚类聚合算法,其基本原理是:以指标个数为维度的空间数据集,把数据集中的每个数据看作一个簇,采用最短欧式距离[14]将距离相近的两簇合并为一个新簇;再计算新簇与其他各簇间的距离,继续合并距离最近的两类为一个新类,循环以上过程,直至达到预设的聚类簇个数。对于给定的聚类簇中心Ci和Cj通过式(1)计算聚类簇之间的最小距离:
(1)
式中,dist(x,z)为两样本之间的距离,dmin(Ci,Cj)对应于簇Ci与簇Cj最近的间距。AGNES算法的聚类簇个数即对应的《采空塌陷勘查规范》(以下简称为《规范》)中采空塌陷场地稳定性评价分级:“稳定”“基本稳定”和“不稳定”。
针对采空塌陷场地稳定性评价影响因素多、数据维度高的问题,在进行层次聚类前,引入主成分分析方法对高维度数据进行降维后再参与模型训练,以实现训练效率的提升。主成分分析的基本步骤如下:
(1)假设采空塌陷场地稳定性评价样本数据集为D={X1,X2,…,Xn},其中Xi=(xi1,xi2,…,xim)T,即数据集中的每个样本均为一个m维列向量,第i个样本数据Xi的第j维分量为xij,构造标准化样本值Zij:
(2)
式中,uj和sj分别是样本数据集D中第j维分量的均值和标准差,即
(3)求出协方差矩阵C的全部特征根并按从大到小次序排列,将前k个特征值对应的特征向量按行排列构成变换矩阵W;
(4)保留变换后的样本数据的前k个分量,则得到相应累计方差贡献率Ω:
(3)
式中,λ1,λ2,…,λn为协方差矩阵C的特征值由大到小顺序排列。
2.2 聚类要素的模型检验
(4)
(5)
(6)
(7)
其中,集合SS表示包含了在C中隶属于相同簇且在C*中也隶属于相同簇的样本对,集合SD包含了在C中隶属于相同簇但在C*中隶属于不同簇的样本对,由于每个样本对(xi,xj)(i (8) 显然,RI的取值范围为[0,1],其值越大表征聚类分析的准确率越高。 根据拟建设场地初步规划,采空塌陷范围内的用地性质主要有公园绿地,城市道路用地、商业用地等。结合拟建建筑结构特点与采空塌陷影响宽度基岩移动影响角的取值,综合考虑研究区域基岩移动角为60°,松散层移动角为45°,对该急倾斜矿层采空塌陷场地圈定稳定性评价范围(图3)。评估范围内涉及的主要采空区有7P、8P、11P和13P采空塌陷区。 图3 岩层移动角和松散层移动角推测示意图Fig.3 Schematic diagram of strata movement and soil layer angle 采空塌陷场地的覆岩破坏和地表塌陷主要受开采深度、采厚、矿层倾角、采矿方式、地质构造、覆岩物理力学性质及顶板管理方式等因素综合影响。对于不同地质采矿条件下的采空塌陷场地稳定性评价,通过上述因素的不同组合作为定性与定量评判的主要依据。 结合研究区域的覆岩破坏和地表塌陷特征,选取采空塌陷场地稳定性的8个主要因素进行主成分层次聚类分析建模,分别为:X1采厚,m;X2采深,m;X3围护带宽度,m;X4走向工作面面长,m;X5倾向工作面面长,m;X6矿层倾角(°);X7停采年限,a;和X8顶板管理方法。评估范围内的采空塌陷场地稳定性的主要影响因素如表1所示。 表1 层次聚类的主要影响因素Table 1 Main influencing factors of hierarchical clustering 对初始变量进行极差标准化处理,采用最短欧氏距离定义样本数据之间的距离,标准化后的样本数据如表2所示。 表2 标准化后的初始变量Table 2 Standardized initial variables 综合考虑主成分分析对数据空间维数与损失信息的相关性,经主成分分析降维后的各因素贡献率如图4所示。前4项主成分的累计贡献率为81.8%。 图4 各主成分贡献率Fig.4 Contribution rate of principal components 以前四项主成分作为输入参数建立AGNES层次聚类的采空塌陷场地稳定性判别模型,图5所示即为采空塌陷场地稳定性的聚类过程。 在聚类图的特定层次上进行分割,得到相应的簇划分结果,结合采空塌陷场地实际稳定性情况,经主成分层次聚类后的采空塌陷场地稳定性分级如表3所示。 表3 采空塌陷场地稳定性分级Table 3 Stability classification of goaf-collapse sites 图5 采空塌陷场地稳定性的聚类过程Fig.5 Clustering process of stability in goaf-collapse site 经主成分层次聚类后,研究区域4个主要采空塌陷区域稳定性等级分属3类,将拟规划建设的采空塌陷场地的稳定性分为A区(不稳定)、B区(基本稳定)、C区(稳定)(图6)。 图6 采空塌陷场地稳定性区划示意图Fig.6 Diagram of site stability zoning of goaf-collapse site 根据评估范围内的采空塌陷特征,采用开采条件判别法对采空塌陷场地稳定性进行评价,以终采时间为主控因素,综合考虑地表变形特征、采深、顶板岩性和松散层厚度等因素,该场地稳定性综合评价结果(表4)。 表4 按开采条件判别法评价采空塌陷场地稳定性Table 4 Stability evaluation based on discrimination method of mning conditions in goaf-collapse site 对比分析主成分层次聚类模型与开采条件判别法的评价结果,聚类性能度量的外部指标Rand指数为0.75。研究区域场地稳定性总体呈现中部稳定性差,周边区域稳定性好的情况。其中,采空塌陷场地的中部7P和8P采空塌陷场地为不稳定区域,其场地仅能满足一般城市绿地的用地需求;11P和13P采空区为稳定与基本稳定区,其特点是地表沉陷变形小,具有建设使用价值和经济价值。总体上,采空塌陷场地能够与研究区域城市规划的不同用地性质的土地承载力相适应,主成分层次聚类模型判别场地稳定性分区符合实际情况。 (1)主成分层次聚类模型对研究区域采空塌陷场地稳定性的判别结果与采用开采条件综合判别方法的场地稳定性结果基本一致,模型针对急倾斜矿层消除了各地质采矿影响因素间的相关性,有较强的判别能力。 (2)主成分分析对高维特征数据集进行降维,前4项主成分包含了原始数据序列的主要特征,为后续层次聚类算法提供了数据基础,提高了计算效率。层次聚类算法以最短欧式距离作为度量簇间的链接准则,模型检验的Rand指数为0.75,聚类谱系图包含了整个算法过程的信息,结果直观。 (3)通过对比采空塌陷场地稳定性评价结果验证了主成分层次聚类判别方法能够处理非线性高维度数据,为地下开采覆岩破坏与地表塌陷场地时空演化机理研究提供一种新途径,在采空塌陷场地稳定性评价缺少判别准则时提供了理论支撑。3 主成分层次聚类模型的效果分析
3.1 急倾斜矿层采空塌陷影响范围的确定
3.2 采空塌陷影响因素的降维层次聚类
4 稳定性评价结果与区划分析
5 结论