基于数据优化的BP神经网络煤层底板破坏深度预测
2021-12-01薛喜成田凡凡
薛喜成, 田凡凡
(西安科技大学地质与环境学院,西安 710054)
0 引言
在煤矿生产工作中,煤炭资源的采出造成围岩应力的重新分布,导致煤层底板形成各种裂隙。裂隙的发育使底板隔水层降低甚至失去隔水能力,成为工作面与含水层之间的导水通道,增加底板突水的危险性[1]。因此在煤层底板突水危险性评价及预测研究中,底板破坏深度是一个重要的评价因子[2],开展采场底板破坏深度的研究,对于防治矿井突水灾害具有重要的指导意义。
目前,关于煤层底板破坏深度的研究方法主要包括,规范计算[3]、经验公式法[4]、现场实测[5]以及数值模拟法[6]。规范计算考虑因素不全面,其预测仅能作为参考;经验公式法和数值模拟法存在样本数据获取困难以及模型严重简化的问题;现场实测法准确度最高,但存在工作量大和周期长的局限性;相比于现场实测,数值模拟具有工作量小和周期短的优点,但存在模型简化严重的局限性。
于小鸽等[7]在分析底板破坏深度发育影响因素的基础上,建立了BP神经网络预测模型;张文泉等[8]基于灰色理论得出了影响底板破坏深度发育的主次因素,得到了新的底板破坏深度计算公式;路畅等[9]基于灰色理论,确定了预测底板破坏深度的GM模型参数;施龙青等[10]运用主成分分析法对6组变量因素进行降维处理,建立了PCA-GWO-BP神经网络模型。以上学者在数据样本的参数选取过程中,主要存在以下不足:一是未量化性研究各因素与底板破坏深度之间的拟合度程度;二是未给出各影响因素的权重占比。鉴此,本文首先对数据样本中各影响因素进行方差分析,剔除最低拟合度的影响因素;采用熵权法计算剩余影响因素的权重占比,并运用主成分分析法进行去冗余性处理;最后将主成分变量作为BP网络的输入数据,构建煤层底板破坏深度预测模型。
1 煤层底板破坏深度影响因素的选取
1.1 煤层底板破坏深度影响因素
参照前人的成果,将工作面斜长、煤层埋深、采高、倾角、底板抗破坏能力以及有无切穿型断层和破碎带作为考虑因素[7,10]。研究发现:①工作面斜长越大,则受采动影响的空间更大,底板更加容易发生破坏[11]。②相比于浅部煤层开采,深部煤层开采所诱发的底板破坏强度和发育深度有着明显的区别。③采高的增加,一方面使得采场受采动影响范围增加,另一方面造成采场上覆顶板岩块垮落量也在增加,对底板造成二次扰动[12]。④煤层倾角影响到底板破坏特征以及应力的分布规律[13]。⑤底板抗破坏能力是一项关于底板岩层力学、岩性组合以及裂隙发育的综合性评价指标[14]。⑥断层或破碎带降低了底板岩层的力学强度,形成各种力学成因的派生裂隙,与岩层存在的原生裂隙相互沟通,加剧底板的破坏程度。
1.2 样本获取
根据上述分析,本文收集了34组底板破坏深度实测数据(表1)。其中0和1来定量描述是有无软弱面(F)这一因素,0代表不存在,1代表存在。
表1 底板破坏深度实测数据[7,10]Table 1 Floor failure depth measured data (after reference [7] and [10])
2 影响因素分析及处理
2.1 单因素方差分析
运用SPSS软件对表1中的6个影响因素进行方差分析(表2)。将显著性检验F值和P值以及拟合优度系数R2,作为各因素与破坏深度相关性程度的评价指标。
表2 各影响因素与底板破坏深度方差分析Table 2 Variance analysis for impacting factors andfloor failure depths
由表2可得,在埋深、倾角、采高因素方差分析中,P值均小于0.05,检验效果显著,且斜长因素的P值接近于0.000 1,检验效果接近极显著,而底板抗破坏能力和有无软弱面的P值均远大于0.05,且R2和F值最小,检验效果不显著,说明样本中的底板抗破坏能力和有无软弱面实测数据,不适用作分析的基础数据,因此对这两个因素进行剔除。
2.2 因素权重及相关性分析
熵可以度量系统的无序程度,对于某一影响因素的离散程度,可以根据熵值来反映,对应的信息熵值越小,则该影响因素的离散程度越大,权重值则越大;皮尔森相关系数法是统计学中用于衡量变量之间相关性的一种方法,通常用r来表示,变量间的相关性程度以|r|所处的区间来判断:|r|<0.3、0.3≤|r|<0.5、 0.5≤|r|<0.8、 |r|≥0.8, 分别表示变量间具有无相关性、低度相关性、中度相关性和高度相关性。
运用熵权法对埋深、倾角、采高以及斜长4个量化因素的权重进行计算,得到各影响因素的信息熵和权重占比(表3)。可见4个影响因素对于底板破坏深度的发育均具有较高的贡献度。
表3 影响因素信息熵和权重占比Table 3 Impacting factor entropy of information andweight proportions
对上述4个量化因素进行相关性分析,得到因素之间的相关性系数(表4)。表明各因素之间的相关程度为低相关性,但两两之间均存在着一定的相关性。
表4 底板破坏深度各影响因素相关性Table 4 Correlativity between floor failure depth andimpacting factors
2.3 因素冗余度处理
主成分分析法可以多组相关性变量进行降维处理,得到少数且包含了原始变量大部分信息的互不相关变量,对埋深、倾角、采高以及斜长4个量化因素进行主成分分析,结果见表5,可以看出,前3个主成分方差贡献率达到93.058,因此可以用3个主成分变量来反映原始的4个变量因素信息,最后根据主成分因子得分系数(表6),求得对应的主成分变量。
表5 影响因素总方差解释Table 5 Total variance interpretation for impacting factors
表6 各主成分得分系数Table 6 Principal component scoring coefficients
3 BP神经网络的训练和预测
研究表明,隐含层数为一的BP神经网络可以实现任意n维到m维的映照[15],因此确定采用隐含层数为一的BP神经网络,通过多次运算,确定神经网络结构为3-9-1。进行神经网络训练,并利用7组主成分变量测试样本,对训练好的网络进行预测检验,结果见表7。
据表7中可得:BP网络和PAC-BP网络两者的预测值,只存在个别值的相对误差偏大; PCA-BP网络相比与前三种预测方法,预测值相对误差明显偏低,最小相对误差仅为0.135 7%;规范公式预测值的RMSE最大,为15.13,考虑埋深、倾角、采高、斜长、底板抗破坏能力以及有无软弱面6个因素和埋深、倾角、采高以及斜长4个因素的BP网络模型预测值分别为11.16%和9.74,PCA-BP模型的预测值最小,仅为4.199。
可见在剔除样本低拟合、不相关因素后,并采用PCA优化的BP神经网络预测模型,具有着更高的预测准确度,从RMSE的大小可以得出各预测精度的排序为:PCA-BP>BP(4因素)BP(6因素)>规范公式。
4 应用实例
4.1 研究区概况
山西苗庄煤矿位于沁水煤田襄垣矿区,属温带大陆性季风气候,年均降雨量532.8mm,全年平均气温为9.5 ℃,地貌属黄土残垣-沟壑侵蚀地貌,海拔为+930m~+1 103.90m。区内由老到新依次为奥陶系、石炭系、二叠系、第四系;大地构造位置处在我国东部新华夏构造体系第三隆起带;地下水主要类型有松散岩层孔隙水、基岩裂隙水以及岩溶水三类。该矿井采用走向长壁式一次采全高采煤法,全部垮落法管理顶板。目前井田主采煤层为15-3号煤层,底板标高为+290~+780m,其中奥灰水位标高为+643~+648m,该矿属于典型的带压开采矿井,因此对于煤层底板破坏的预测研究对于底板带压开采具有重要的意义。
4.2 煤层底板采动破坏深度预测
利用构建好的预测模型对山西襄矿苗庄煤业15-3号煤层的15100工作面进行底板破坏深度预测。为了验证预测模型结果的可靠性,整理了三组学者关于煤层底板破坏深度计算的改进公式,将BP网络模型的预测结果与改良公式的预测值进行对比,结果见表8。
h=0.017 5H+0.146 3α+3.381 7M+0.050 8L
-7.669 5
(1)
h=2.023 4+1.48×10-26H9+0.191 3α+1.063 7M
+0.101 6L-5.553 6D+7.507 0F
(2)
h=0.042H-0.416α+0.013L-3.276M
+7.255
(3)
式中:h为煤层底板破坏深度,m;H为埋深,m;M为采高,m;α为倾角,(°);F为有无软弱面;D为底板抗破坏能力。
表7 预测结果比较Table 7 Comparison between predicted results
表8 工作面参数及底板破坏深度预测Figure 8 Prediction of working face parameters and floor failure depths
据表8中可以看出,相比于规范计算得到的结果,预测模型的预测值和改进的公式的计算结果是很接近的。最终确定井田15-3煤层15100工作面底板破坏深度为24.02m。
5 结论
1)通过单因素方差分析量化了各影响因素与底板破坏深度的拟合度,并结合熵权法权重分析,认为埋深、倾角、采高以及斜长是底板破坏深度发育的主要影响因素。
2)以主成分变量为基础,建立了BP神经网络底板破坏深度预测模型。结果表明,在剔除样本低拟合、不相关数据后,建立的PCA-BP神经网络预测模型具有着更高的准确度,最终得出山西襄矿苗庄煤业15-3煤层15100工作面底板破坏深度为24.02m。