APP下载

基于空间统计的采煤工作面内断层识别方法

2023-11-06冯雅杰文广超吴冰洁胡祖栋

煤田地质与勘探 2023年10期
关键词:瓦斯断层聚类

冯雅杰,文广超,吴冰洁,胡祖栋

(河南理工大学 资源环境学院,河南 焦作 454003)

我国大部分煤田的地质构造十分复杂,在煤炭开采的过程中,小断层容易引起瓦斯突出、矿井突水、顶板冒顶等事故,严重威胁着煤炭开采安全[1-2],因此,在开采过程中对整个工作面的构造进行深度感知,精准识别工作面内部的异常地质环境,实现对工作面地质构造的超前探测,对保障煤炭的安全开采至关重要[3-5]。

目前的断层识别方法主要分为钻探法和物探法。物探法是对地层进行物理勘探的一种间接观测的方法[6],孙振宇等[7]根据振幅和相位等特征,在地震剖面上通过目视解译识别出5 m 以上断层,但是小于5 m的小断层由于变化微小,很难通过目视解译直接划分;An Yu 等[8]开源了一个用于地震图像的专家标记字段数据集,通过对专家标记的图像数据集进行深度卷积神经网络训练,实现了断层边缘的检测,该方法缩短了断层的识别周期,但依赖于大量地震图像的专家解译标记;A.Cunha 等[9]使用迁移学习技术开发分类器标记地震数据,能够几分钟内在CPU 上完成模型的调整和训练,但基准模型敏感度低,容易遗漏大部分断层;路鹏飞[10]、丰超[11]、常德宽[12]等利用地震数据训练深度学习网络的方法对断层进行自动智能识别,但是这种方法需要大量的训练时间[13],而且识别精度受地区构造的复杂度影响[14-17],据此可知,现有的物探方法在探测煤层中小断层方面还有待深入研究。钻探法是在采煤工作面内实施专门的勘探钻孔工程[18],通过对地层打孔取样进行勘探的一种直接观测的方法,但是这种方法不仅工作量大并且成本很高。根据《防治煤与瓦斯突出细则》要求,突出矿井需要开展瓦斯预抽工作,瓦斯预抽实施了大量的钻孔工程,高密度的瓦斯抽采孔为断层识别积累了丰富的地质资料,有助于突破工作面断层识别瓶颈。崔洪庆等[19]提出通过瓦斯抽采钻孔数据绘制等高线及三维立体图,对隐伏小断层定量预测,但是需要有专业地质知识的人员对绘制结果目视解译;薛洪来等[20]在崔洪庆提出的方法上构建数学模型绘制等高线图,通过对绘制结果进行图像处理来识别断层,但是对落差小于1 m 的断层识别能力较弱。

本文以煤矿井下采煤工作面小断层有效识别为研究目标,拟基于高密度瓦斯抽采孔数据,采用统计分析方法,建立小断层识别模型,为采煤工作面安全回采提供技术支撑。

1 数据与方法

1.1 基础数据

基础数据源自某矿采煤工作面,共获取到两个研究区域内的665 个钻孔的钻探数据,其中A、B 研究区钻孔分别为303、362 个,钻探数据包含瓦斯抽采孔原始记录表、底抽巷施工平面图。瓦斯抽采孔原始记录表是施工过程中钻孔数据表,包含了钻孔所属地点、孔号、钻孔的夹角、倾角、方位角、孔深、钻孔见煤情况和距离拱基线的高度等基础数据。

依据底抽巷施工平面图(图1)中建立局部坐标系,获取钻孔终点坐标和控制点坐标信息,建立钻孔终点坐标解算模型(图2),计算钻孔终点的高程值。利用瓦斯抽采孔的数据记录中的终孔坐标、见煤情况、倾角和方位角的信息分别计算钻孔与煤层的交点,得到巷道线和煤层顶底板平面(图3)。从底抽巷施工平面图中拾取真实断层边界,采用Shpfile 格式存储二维断层的空间位置和属性信息。

图2 钻孔终孔高程计算剖面Fig.2 Calculation profile for the final hole elevation of a borehole

图3 钻孔分布示意Fig.3 Schematic showing borehole distribution

1.2 聚类方法

1.2.1K-Means 聚类

K-Means 聚类算法的原理是通过特征数据之间的相似性对数据进行聚类[21],一般选择欧氏距离作为相似性评价指标,最佳聚类簇数除了通过经验人为给定,还可以通过手肘法和轮廓系数法自动确定,手肘法通过计算误差平方和确定最佳聚类簇数,轮廓系数法通过计算轮廓系数来度量最佳聚类簇数的选择是否合理。误差平方和ESS和轮廓系数S(n)的计算公式如下:

式中:k为最佳聚类簇数;Ci为第i簇;p为Ci中的数据点;mi为Ci的质心。

式中:n为样本数据点;an为样本点所属簇内其他样本的平均距离;bn为样本点与其他簇的样本平均距离的最小值。

1.2.2凝聚层次聚类

凝聚层次聚类算法的原理是将样本中的每一个数据点作为一个簇,然后合并2 个相似度最高的簇得到一个新簇,重复这个过程直到满足停止循环的条件时结束聚类,最后形成树形结构,停止循环的条件一般为目前存在簇数。

凝聚层次聚类算法中的相似度遵循一定原则,Scikit-learn 库中提供了3 种度量相似度的策略。

(1) Ward 策略。将所有的类簇之间距离的方差最小化。

(2) Maximum 策略。将所有类簇之间距离最大值最小化。

(3) Average linkage 策略。将所有类簇之间距离的平均值最小化。

1.2.3算法对比

根据数据特征选择合适的聚类算法能够提高分类准确度,4 种聚类算法对比见表1。高密度的瓦斯抽采孔数据在计算距离时会大大增加算法的时间成本,结合数据特点,选择原理简单且适合高维数据的K-Means聚类算法,选择手肘法为K-Means 聚类算法计算最佳聚类簇数。

表1 聚类算法优缺点对比Table 1 Comparison of clustering algorithms

1.3 精度评价方法

1.3.1聚类精度评价

聚类内部评价指标有3 种:CH 分数、戴维森堡丁指数DBI 和轮廓系数,其对比见表2。瓦斯抽采孔是按照一定距离间隔打孔,煤层上钻孔点的二维空间分布不聚集,煤层除了异常地质条件带来的地层起伏之外还有正常的地层起伏,高程上同样不具有高聚集、簇类少的特点,所以本文中选取了戴维森堡丁指数作为评价指标,选择欧氏距离作为评价指标的评价因子。

表2 聚类精度评价指标对比Table 2 Comparison of clustering accuracy evaluation indices

1.3.2拟合精度评价

常见的拟合评价指标有3 种,分别为误差平方和ESS、均方根差ERMS、决定系数R2。如果单纯利用和方差进行评价,受到变量绝对大小的影响,会影响到同一个断层在不同岩层面中的拟合精度评价结果,所以本文选择决定系数R2进行拟合精度评价。R2的计算公式如下:

式中:TSS为总离差平方和;RSS为回归平方和,即类间方差。

1.3.3断层参数评价

断层参数评价以走向、倾角及落差3 个参数为主,通过误差值量化识别精度,评价标准见表3。

表3 断层识别评价指标Table 3 Fault identification evaluation indices

需要说明的是,倾角和落差的误差具有同向性,即FP和FD应同为正或同为负,走向误差与倾角、落差误差之间相互独立,走向误差的绝对值越小代表断层走向的识别精度越高。

不同工作面中由于地质概况不同,对断层识别精度的要求有所不同,以本文矿区的工作面为例,走向误差和倾角误差的绝对值小于5°,落差误差的绝对值小于0.5 m 属于正常误差。

2 小断层识别技术流程

小断层识别包括数据预处理、断层识别及精度验证、断层可视化三步(图4):(1) 数据预处理。基于钻孔及控制点数据计算煤层数据,基于断层位置、走向和落差构建断层Shpfile 文件。(2) 断层识别及精度验证。通过K-Means 聚类算法构建多层次聚类模型,识别不同埋深范围下的异常点用于拟合断层面,对聚类结果,拟合结果和识别结果进行评价,反复修正模型参数直到精度评价满足要求,最后计算断层参数。(3) 将断层在三维场景中进行可视化[22-24],通过目视解译判断识别结果的合理性和准确度。

图4 小断层识别技术流程Fig.4 Technical flow chart of minor fault identification

3 小断层识别结果

本节根据第2 章的技术流程对2 个研究区域中的断层分别进行识别,然后与真实揭露的断层数据进行对比,评估该方法对断层识别的有效性和合理性。

3.1 断层点识别结果

采用图4 所示的技术流程识别位于断层破裂面上的异常点(图5),通过对异常点的埋深进行聚类分析,得到2 个埋深范围内的异常点,这两类异常点分别分布在断层上下盘。从图5a 中可以看出A 研究区内异常点呈现聚集状态,异常点的埋深范围为2.4~3.3 m,其中埋深较大的异常点分布在真实断层的上盘,埋深较小的异常点分布在真实断层的下盘;从图5b 中可以看出B 研究区的异常点呈条带状分布,异常点的埋深范围为7.6~10.4 m,其中埋深较大的异常点分布在真实断层的上盘,埋深较小的异常点分布在真实断层的下盘。

图5 异常点识别结果Fig.5 Anomalous point identification results

从图6 可知,两类异常点投影的趋势线存在一定高程差,即异常点满足位于断层两盘的条件。可见根据煤层顶板点的埋深和空间分布识别出异常点,可以准确识别出小断层的位置。

图6 异常点分类Fig.6 Anomalous point classification

3.2 断层面拟合结果

对异常边界之间的异常点进行线性拟合,得到拟合精度符合要求的拟合断层线(图7),通过拟合断层线计算断层走向;对异常点空间平面拟合得到拟合断层面(图8),通过断层面与平面的夹角计算断层倾角。

图7 拟合走向线Fig.7 Fitted fault strikes

图8 拟合断层面Fig.8 Fitted fault planes

根据埋深范围计算断层落差,A 研究区拟合断层面的埋深范围为2.4~3.3 m,计算得到拟合断层的落差为0.9 m,落差误差0.1 m;B 研究区拟合断层面的埋深范围为7.6~10.4 m,计算得到拟合断层的落差为2.8 m,落差误差0.2 m,2 个拟合断层面的倾角和落差均小于真实断层,且倾角和落差呈正相关。

拟合断层参数和真实断层参数结果见表4,拟合断层走向、倾角和落差的误差均在允许范围内,拟合结果与真实情况相符。

表4 断层参数对比Table 4 Comparison of fault parameters

3.3 可视化

通过Rhino 三维建模软件构建煤层和断层面(图9),根据可视化结果可知,A 研究区中的煤层不平整,从整体来看,东北方向的煤层高程高于西南方向的煤层,由于采煤工作面的煤层厚度变化远小于东北方向煤层和西南方向煤层的高程差,由此可推断出东北方向上的煤层面抬升是由于沉积环境引起的,在拟合断层面附近,断层上下盘发生小错动,上盘抬升,下盘下降,可知该断层是断距较小的逆断层,和真实断层的上下盘一致,都是逆断层;B 研究区中的煤层较为平整,但在拟合断层面附近,断层上下盘的错动较大,上盘抬升,下盘下降,可知该断层也是逆断层。

图9 断层三维可视化Fig.9 3D visualization of faults

4 讨论

为了说明数学统计分析和空间拟合方法对断层识别的有效性,将某工作面内2 个研究区的瓦斯抽采孔数据作为基础数据进行断层识别,同时采用多种评价方法评估模型精度,对比2 个拟合断层面和真实断层的参数,拟合断层面的相关参数略小于真实断层,属于正常误差范围,拟合结果基本一致。工作面的可视化结果可以清晰看到工作面中的2 个断层都属于上盘抬升,下盘下降的逆断层,与真实断层情况一致。此结果说明数学统计分析方法能有效识别出受断层影响的异常数据点,空间拟合方法可以根据异常点数据有效拟合断层面,证明了这一方法在断层识别中的可行性。

为了评估断层的识别精度,选择本文中2 个研究区的瓦斯抽采孔数据作为基础数据,与崔洪庆等[25]提出的绘制煤层底板等高线图的断层识别方法进行对比,其中孔深误差设为1.0~2.5 m 区间内的随机数,使用克里金插值绘制受孔深误差影响的煤层等高线,结果如图10 所示。A 研究区中真实断层落差较小,等高线受断层干扰较大,需要根据地质因素对孔深误差进行校正,由结果图可知断层位置大概一致,断层落差约为0.7 m;B 研究区中落差较大,等高线受断层干扰较小,从结果图中可知高程4~8 m 和12~16 m 处的等高线间距远小于8~11 m 处等高线间距,断层位置清楚可辨,落差约为3 m。与前人的研究结果相比,断层的识别结果基本一致,表明本方法的合理性和有效性。

图10 等高线法验证识别断层识别结果Fig.10 Verification of fault identification results using contours

本文采用未经插值的高密度瓦斯抽采孔数据作为基础数据,进行异常点识别及断层面拟合,通过Python 语言将识别模型程序化,准确完成数据预处理,自动识别工作面中1 m 以下的小断层。但断层面的拟合仍存在一些缺陷,通过异常点数据拟合断层面,将实际断层面近似为一个规则平面,在复杂地质构造的工作面中难以反映真实断层的三维形态。在后续研究中将继续对空间拟合方法进行改进,提高拟合断层面对真实断层形态的表达,为透明工作面中断层的可视化研究提供更加精细的断层模型。

5 结论

a.提出基于数学统计和空间拟合的煤层小断层识别方法,并对某工作面中断层进行识别,结果表明:未经插值的高密度瓦斯抽采孔数据可以最大程度保留煤层的真实埋深,为异常数据识别提供大量的样本数据。

b.相较于绘制煤层底板等高线等断层识别方法,采用数学统计分析和空间拟合方法构建断层自动识别模型,通过Python 对识别模型程序化,具有较高的自动化和识别精度,在对1 m 以下小断层的识别上,识别结果更加接近真实断层情况。

c.本文提出的方法具有较高的识别精度,但断层面的拟合近似为规则平面,对真实断层三维形态的表达存在不足,根据异常点的空间位置,提高对拟合断层面对真实断层形态的表达是下一步研究中需要解决的问题。

猜你喜欢

瓦斯断层聚类
11采区永久避难硐室控制瓦斯涌出、防止瓦斯积聚和煤层自燃措施
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
高瓦斯矿井防治瓦斯异常涌出措施的应用
瓦斯探钻钻头的一种改进
一种层次初始的聚类个数自适应的聚类方法研究
断层破碎带压裂注浆加固技术
煤与瓦斯突出矿井瓦斯抽放技术应用研究
关于锚注技术在煤巷掘进过断层的应用思考
自适应确定K-means算法的聚类数:以遥感图像聚类为例