基于门循环单元神经网络模型的煤层底板突水动态预测
2021-09-22张召千
邓 强,张召千,王 震
(1.太原理工大学 矿业工程学院,太原 030024;2.秦皇岛工程设计研究院有限公司,河北 秦皇岛 066000)
煤炭是我国的战略性能源,在贫油、少气、富煤的能源结构下,煤炭依然会被长期依赖[1]。而在煤矿开采过程中,经常会存在大量的安全隐患[2]。其中煤层底板突水问题一直是受到专家学者关注的安全问题[3-6]。目前,煤炭开采环境复杂,煤层底板突水频发,但突水预测能力依旧不足,对煤矿的安全生产造成了重大威胁。
国内外专家学者研究煤层底板突水问题时,会将其与煤层底板突水机理有效地结合,科学提出煤层底板突水影响因素指标体系,再通过一系列静态预测模型,如回归分析[7]、数据挖掘[8-9]、支持向量机[10-12]、神经网络[13-15]及极限学习机[16-17]等方法对煤层底板突水进行预测。这些煤层底板突水预测模型在煤矿生产中的应用,提高了煤矿突水的预测能力,防范于未然。
但在煤矿的实际开采过程中,某一回采点对煤层底板突水影响是由多种因素组成的,如地质构造、煤层厚度、煤层倾角等,并且这些因素会随着采动的进行影响权重,所以煤层底板突水预测不能简单地当成一个静态问题处理,需要考虑采动影响下的动态变化[18]。针对该问题,本文提出了动态预测模型:门循环单元(gated recurrent unit,简称GRU)神经网络预测模型,该模型能够充分利用采动过程中收集的时间序列数据,过滤监测过程中的缺失数据及干扰数据,通过对一系列样本数据变化规律的学习,实时更新影响因素的变化,精确地对煤层底板突水进行预测,提高煤矿生产安全。
1 煤层底板突水指标体系
煤层底板突水是复杂的非线性问题,它受到多种因素的影响,并且随着开采的进行其影响因素也会产生动态变化。早在20世纪60年代就有学者提出突水系数法用于煤层底板突水预测[19]。后来的许多学者不断对突水系数法进行完善,同时,“下三带”理论、薄板理论、“强渗通道”说及关键层理论等基于经验公式和力学模型的突水理论也相继发展起来[18]。
通过总结以往煤层底板突水理论,本文选择煤矿突水实例的工作面煤层底板突水数据以及正常回采实测数据进行分析,如表1所示。
表1 矿区部分现场实测数据Table 1 Partial field measured data in mining area
影响突水的因素是多方面的,突水机理是非常复杂的,一般影响突水的因素包括地质构造、底板隔水层、底板承压水、矿山压力和开采活动等几个方面。这些因素对煤矿突水影响程度各不相同,具体到某突水事故可能是单个因素的作用结果,也可能是几个因素组合反映的作用。我们需要具体研究分析每一种因素对矿井突水的影响方式和作用,就可以有针对性地进行预测和采取有效的预防措施。
抗突水的唯一重要因素阻抗突水能力的大小取决于岩石的力学性质隔水层的厚度及其组合关系。底板承压水对突水的影响受到水压大小和所含水量等因素的影响,水压是造成底板突水的前提条件和动力源泉,其作用主要是对底板岩层中的裂隙和节理进行冲刷,使得承压水渗透量上升,当遇到不同路径的通道接近煤层时,承压水可能趁势流入导致突水。除了导水断层造成工作面突水或采掘工作揭露充水之外,矿山压力对采煤工作面底板突水有着非常大的影响。因此,开采活动对底板突水的影响是通过对以上几个方面的部分或综合影响表现出来。但是随着回采工作的进行,煤层自身及上覆和下覆岩层的原始应力状态发生了变化,承压含水层和底板各岩层之间所处的相对平衡状态发生改变,其开采活动的影响正是表现在使原始的应力状态重新分布,顶底板岩层受到破坏的过程。
本文提出了煤层底板突水影响因素指标体系,如表2所示。煤层底板突水影响因素指标体系被划分成5个一级指标和15个二级指标。
表2 煤层底板突水影响因素指标体系Table 2 Index system of influencing factors of water inrush from coal floor
2 GRU神经网络
数据在传统神经网络中传递是先从输入层到隐含层,再从隐藏层进入输出层,层间传播呈现全连接形式,而层内的节点之间不存在联系,模型无法很好地处理数据的时间序列问题。循环神经网络(recurrent neural networks,RNN))的提出很好地解决了数据的时间序列问题,但RNN在计算时存在梯度消失问题,GRU的出现彻底解决了这个问题[20]。图1为GRU神经网络结构图。GRU是RNN的改进版本,它在RNN的基础上通过增加状态c来确保在长期状态下能够长久保存,解决了之前仅仅一个隐层状态h的局面。
图1 GRU神经网络结构图Fig.1 GRU neural network structure
图2为GRU神经网络模型单位结构图。GRU单元中含更新门zt、重置门rt、输入xt、输出ht,t-1表示上一时刻,t表示当前时刻。重置门决定上一时刻的单元信息是否被记住或者遗忘,更新门决定单元信息是否被删除或新信息是否被添加。隐藏层通过使用One-Hot编码进行二维向量输出,在隐藏层传递最后一个时间单元的输出值给输出层后,SoftMax分类器会对其进行解码,将其转化为代表预测结果的0和1,其中1代表突水,0代表不突水。
图2 GRU神经网络模型单元结构图Fig.2 GRU neural network model unit structure
式(1)表示此模型的损失函数:
J(θ)=-∑(x(i),y(i))∈Dlog(p(y=y(i)|x(i),θ)) .
(1)
式中:θ为模型参数;D表示样本数据构成的训练集;(x(i),y(i))表示训练集中第i个样本数据,x(i)是10维的向量,y(i)的取值仅有0和1,分别表示不突水和突水;p(y=y(i)|x(i)),θ)表示样本(x(i) ,y(i))突水(不突水)的概率。
3 煤矿实测数据采集及处理
3.1 数据来源
本文研究的某煤矿含煤层为侏罗系中统延安组,根据岩性、岩相、沉积旋回及煤岩组合特征分为三段:第一段含4、4-1、4-2煤,第二段含4上-2、4上-1煤,第三段含3煤。矿井目前开采4煤层,4煤层属于稳定可采煤层,底板为泥岩。矿区主要属中生代承压水盆地范畴,勘探阶段未揭露大型断层,仅在采掘过程中揭露部分小型断层,因此该矿的充水通道主要受采动影响。
回采工作面位于矿区二采区中部。煤层顶板为深灰色炭质泥岩和灰白色中砂岩,工作面地质构造相对简单。工作面三岔口以北263 m存在一正断层,断层面胶结性良好,透水性较差。三岔口以北516 m处存在一逆断层,断层发育高度较小,掘进过程中顶板存在淋水现象,水量较小且持续时间较短。NY103工作面中部有一走向EW的向斜构造,北翼倾向SW,倾角3°~8°,南翼倾向NW,倾角3°~11°.回采过程中顶板淋水、NY105工作面采空区积水等将全部流向向斜轴部,有可能造成工作面突水。
本文选取该煤矿突水实例的工作面煤层底板突水数据以及正常回采实测数据进行分析(如表1所示)。
3.2 数据归一化处理
由于原始数据中各项数据相互间有较大的差别,例如其数据类型有差别、数据采用的量纲也不同、绝对值存在较大的差值,因此需要对数据进行归一化处理,否则会对模型的运行产生较大影响。输入样本中包含逻辑型数据和数值型数据,前者使用0和1表示,后者运用线性转换方式把输入数据的范围投射到[0,1]区间,其转换方式如式(2)所示:
(2)
式中:x(p,i)为样本p中第i个数据进行归一化处理后的数值;x0(p,i)为样本p中第i个数据进行归一化处理前的数值;xmin(i)为全部样本中第i个数据的最小值;xmax(i)为全部样本中第i个数据的最大值。
3.3 基于Wrapper评价的特征选择
特征选择是将冗余特征去掉,将输入向量空间维数减小,同时将学习样本进行优化,是对输入数据使用降维操作的一个步骤,可以明显提升训练效率。针对煤层底板突水预测问题,各个地区的煤矿处于不同的地理位置,并且各个地区煤矿的主控因素千差万别,因此存在各种各样导致突水的原因。在现场收集的数据不仅数据量非常大,同时存在许多无关紧要的冗余数据,而这些数据会对模型的训练效率产生影响,所以需要预先去掉这些冗余数据。
在突水预测问题方面,可以采用Wrapper评价策略,因为原始样本的数据量比较小,其数据特征只有15维,在保证准确率的情况下,运算速度也不至于太慢。因此本文选用基于Wrapper评价策略的特征选择方法[21]。
以下为该特征选择方法的详细过程和计算结果:
将原始特征集合内的所有特征进行编号,开始第一轮的特征选择,号码“1,2,…,15”分别代表“煤层倾角、煤层厚度、构造有无、断层落差、裂隙带有无、采动破坏深度、采高、开采面积、走向长度、含水层厚度、水压、距工作面距离、灰岩段厚度、砂岩段厚度、泥岩段厚度”。在15维的原始特征集合内每次删掉号码i的特征(i=1,2,…,15),把剩下的14维特征用特征子集Mi(i=1,2,…,15)表示,从而获得M1,M2,…,M15共15个特征子集;并且,用子集M0表示原始特征集合。把子集M0,M1,M2,…,M15按顺序输入模型,对GRU神经网络模型进行训练,将预测准确率的大小用作评判结果好坏的标准,选用“十折交叉验证法”对错误率进行运算。Mi(i=0,1,…,15)的错误率分别由xi(i=0,1,…,15)表示。把xi(i=1,2,…,15)分别与x0做对比,如果相互间的差值很小,就假设仅去掉号码i的特征之后,对整体的误差率不会产生太大影响,将其认定为待定冗余特征。
图3为各个子集第一轮特征选择时的误差率计算结果,由图可知,“x0,x3,x9,x12,x15”这5个点的误差率较低,将不去除子集中任意特征的误差率设为x0,“x3,x10,x13,x15”代表在原始的特征子集中仅单独去掉“构造有无、含水层厚度、灰岩段厚度、泥岩段厚度”这四个特征后的误差率。故而,“构造有无、含水层厚度、灰岩段厚度、泥岩段厚度”被判定为待定冗余特征。同时,因为x3和x0最为相近,因此认定与其对应的“构造有无”为冗余特征,再把该特征从原始集合中剔除,集合变成14维,然后进行第二轮特征选择。和第一轮相同,第二轮特征选择对每个特征重新编号,重复一遍第一轮的过程。
图3 各个子集在第一轮特征选择时的误差率Fig.3 Error rate of each subset in the first round of feature selection
图4为各个子集在第五轮特征选择时的误差率。如图所示,从集合中单独去除某一特征后,都显著影响了最后的误差率,可以表明“煤层倾角、煤层厚度、断层落差、裂隙带有无、采动破坏深度、采高、开采面积、走向长度、水压、距工作面距离、砂岩段厚度”这11项特征和煤层底板突水是密切相关的。同时前四轮已去除的4项特征被认定为冗余特征,分别为“构造有无、含水层厚度、灰岩段厚度、泥岩段厚度”。
图4 各个子集在第五轮特征选择时的误差率Fig.4 Error rate of each subset in the fifth round of feature selection
4 煤层突水GRU神经网络预测模型的建立
4.1 GRU预测模型的训练
GRU神经网络模型可以学习时间序列数据。由上文可知,数据维数已由15维降到11维,在进行分类和划分数据集后,就可输入到模型中。通过回采点与时间段的差异,对数据进行排序分组,然后把分组好的数据分为训练集、验证集和测试集;每个部分所占的比例不同,其中训练集是分组好的数据中随机抽取60%所构成,验证集为20%,测试集为20%.
在训练过程中,每次训练输入一组数据,把模型预测结果和实际结果对比,从而得到误差率,之后采用优化算法对权重矩阵进行更新,提高预测准确率。在全部数据都输入模型得到预测结果,并进行权重调整后,对模型的一轮训练才算结束。同时,根据实际情况确定训练的轮数。
4.2 训练结果分析
图5为GRU神经网络模型准确率及损失情况。图5(a)代表训练集上预测的准确率变化动态,图5(b)表示训练集上损失值变化动态,图5(c)表示验证集上预测的准确率变化动态,图5(d)表示验证集上损失值变化动态。因Dropout的启用,一部分节点被隐藏,模型的准确率以及损失会随迭代次数的加大而发生抖动,而训练集准确率低于验证集,同时明显的过拟合显现没有发生。由图5可以得到,GRU预测模型在训练集上的准确率可以达90.42%,在验证集上的准确率可以达96.29%.
图5 GRU神经网络模型准确率及损失情况Fig.5 Accuracy and loss of GRU neural network model
5 煤层底板突水动静态模型预测对比
结合前文矿区的现场实测数据,本文使用支持向量机、BP神经网络、极限学习机这三个静态神经网络预测模型与动态的GRU神经网络预测模型进行对比。每个模型均按前文所述方法,将数据划分成训练集、验证集及测试集,应用各模型将训练集数据进行训练,以测试集准确率为准进行模型预测精度评估。
不同预测模型的准确度结果如图6所示,动态的GRU神经网络预测模型在训练、验证和测试三个阶段的准确率均要高于静态的支持向量机、BP神经网络和极限向量机。尤其是在最终的测试阶段,动态的GRU神经网络预测模型的准确率要达到95.23%,而其他的静态预测模型的准确率均低于90%.
图6 不同预测模型在训练、验证及测试阶段的准确率Fig.6 Accuracy of different prediction models in the training, verification, and testing phases
GRU神经网络模型与BP神经网络等向前反馈的静态预测模型相比,GRU神经网络模型依靠对大量的数据样本进行学习,并自身总结出煤层底板突水的变化规律及该动态变化对突水的影响,从而对突水变化因素进行高精度的筛选,较其余三种静态神经网络预测模型在煤层底板突水预测能力上具有更高的准确率,运用到煤矿开采中可以极大地提高生产安全。
工程现场表明,大部分矿井突水都与断层、陷落柱等构造密切相关。该矿统计的大部分数据中都是有构造的,但通过Wrapper评价的特征选择,最终确定“构造有无”为冗余特征;相反,“煤层厚度、开采面积”却被特征选择为与煤层底板突水密切相关。后续研究需要进一步改进相关的特征选择方法。
6 结论
1) 以煤矿突水理论及现场实测数据为依据,建立了煤矿突水影响因素指标体系,并基于Wrapper评价策略的特征选择,确定“煤层倾角、煤层厚度、断层落差、裂隙带有无、采动破坏深度、采高、开采面积、走向长度、水压、距工作面距离、砂岩段厚度”这11项特征和煤层底板突水密切相关。
2) 煤层突水GRU神经网络模型通过对现场实测数据的学习,确定其在训练集上的预测准确率达90.42%,在验证集上的准确率达到96.29%,可以很好地进行煤层突水预测测试。
3) 将动态的GRU神经网络预测模型与支持向量机、BP神经网络及机器学习机这三个静态的神经网络预测模型进行比较,发现动态的GRU预测模型预测的准确率在训练、验证及测试阶段都要高于其他的静态模型。因此,GRU模型比其他静态神经网络预测模型要更适合应用到煤层底板突水预测。