煤层底板突水预测的PCA-Fisher判别模型
2022-04-29薛峰李希建
薛峰 李希建
摘 要:为提高小样本数据预测煤层底板突水状态可靠性,结合主成分分析(Principal Component Analysis,PCA)与Fisher判别法构建煤层底板突水预测模型。以华北典型矿区为例,选取12项可直接测量指标作为煤层底板突水评价指标,采用主成分分析处理评价指标,用5项主成分代替原有12项指标,定性分析煤层底板突水状态。利用Fisher判别法分析主成分分析处理结果,确定评价集与两类突水状态的距离,进行样本归类判别。研究表明:回判15组训练样本并预测3组待测样本,误判率为0%。PCA-Fisher判别模型可减弱指标间关联度,在煤层底板突水样本数据有限的情况下,可获得良好的预测效果。
关键词:煤层底板突水 主成分分析(PCA)判别法(Fisher)模型研究
由于我国煤田水文地质条件的复杂性,在煤层开采过程中极易受水害威胁。尽管采取了大量防治措施,但随着开采深度的增加,煤层水压逐渐升高,突水灾害日益加深。煤层底板突水受多种因素的控制,其机理非常复杂,且突水数据难以获得。因此,基于小样本数据高效准确预测煤层底板突水状态已成为目前研究的迫切需求。
近年来,诸多学者对煤层底板突水问题的研究取得了一定成果。刘磊、赵德康、申建军、徐德宝等分别采用灰色理论、熵权-未确知测度理论、可拓物元模型和突变理论确定指标权重,对煤层底板突水危险性趋势进行了预测,但对煤层底板突水影响因素重要程度赋值具有主观性及随意性,影响预测精度。LSTM(Long Short-Term Memory,长短时记忆)神经网络、改进脆弱性指数法、未确知测度理论等方法利用现场实测数据,验证预测煤层突水模型准确性;尽管上述研究方法可预测煤层底板突水状态,但评价指标间重叠性强,计算过程复杂,在样本数据有限的情况下,难以精准预测突水状态。Fisher判别法可很好预测小样本数据,周健、孙文洁、毕建武、侯恩科等利用Fisher判别法分别预测了地下矿山矿柱稳定性、矿井水文地质类型、煤与瓦斯突出类型、风化基岩富水性,减少样本数据有限时对预测精度的影响。但预测模型中评价指标众多且关联性强,仅采用Fisher判别法预测,计算过程冗杂,影响预测精度。
为此,笔者基于主成分分析(PCA)和Fisher判别法建立煤层底板突水预测模型,选取12项可直接测量指标作为煤层底板突水评价指标,减少赋值主观性,提取煤层底板突水评价指标特征信息,用少量主成分代替原有众多评价指标,减弱指标间关联度,简化计算过程,确定评价集与两类突水状态距离,提高预测精度,以期在样本数据有限情况下,得到更合理、可靠的煤层底板突水预测结果,为矿井防治煤层底板突水事故提供一定理论支撑。
1 建立PCA-Fisher判别模型
1.1 主成分分析方法
主成分分析本质上是一种有效的降维手段,其核心是将原始数据通过线性组合,利用矩阵正交变换将初始信息提炼,用较少主成分线性函数与特定成分之和表达原有众多指标,消除指标间相关性,降低预测样本复杂度、提高预测精度。分析步骤如下:
1)建立原始数据矩阵,表达式为:
2)将原始数据标准化,可表示为:
3)求相关系数矩阵G,表达式为:
4)计算矩阵G特征值及特征向量,表达式为:
经计算得出特征值λi(i=1,2,3,,p),并按其大小顺序进行排列后分别求出特征值所对应的特征向量。
5)确定主成分数目。计算单个主成分的贡献率及主成分累计贡献率,取累计贡献率S≥85%所对应的前h个主成分。
第h个主成分的贡献率,可表示为:
前h个主成分累计贡献率,可表示为:
6)经线性组合后可得y=AX,即:
式(7)中线性变换要满足以下条件:①;②;③yi是与y1,y2,…,yi-1都不相关的x1,x2,…,xi全部线性组合中方差最大者。
组合中方差最大者。
1.2 Fisher判别模型
Fisher判别法中心思想为投影,即将原始的n组p维数据依据方差分析原理投影到某方向,将原始的多维数据简化为一维函数。设从总体中选取m组具有p项指标的样本作为观测数据,运用方差分析原理构造一个或多个判别函数为[15]。
预测煤层底板是否突水时Fisher判别准则如下:
煤层底板突水样本共有2个类别,即突水与未突水。设样本数为ni,每个样本有p项指标,协方差矩阵及均值分别为x(i),。为判定新样本是否突水,构建判别函数为:
式中。
y(x)在总体上的样本均值及样本方差为:
式中,和Si表示总体内x的样本均值向量和样本协方差阵。若为样本总均值向量,则。
最大离差比γ可表示为:
式中,,为组内离差平方和;,为组间离差平方和。
根据极值存在必要条件,经代数计算,可构造t(t为E-1B非零特征值个数)个判别函数。
单个判别函数的判别能力定义为:
式中,λ为E-1B对应的特征值。
前h个判别函数的判别能力定义为:
若Ps≥85%,可采用前h判别函数进行判别。将新样本p项指标函数带入判别函数中即可求出y值,将其与判别临界值进行比较,即可判定该样本是否突水。
2 煤层底板突水主成分分析
2.1 煤层底板突水预测指标的确定
煤层底板突水事故的影响因素多而复杂,所选取的指标将直接影响评价结果。为减少主观性,提高预测准确性,根据华北典型矿区资料,结合前人研究结果选取12项可直接测量指标作为煤层底板突水评价指标,18组煤层底板样本数据进行分析,编号为1~18。X1为含水层厚度、X2为水压、X3为隔水层厚度、X4为砂石比、X5为泥石比、X6为煤层底板标高、X7为煤层倾角、X8为断层落差、X9为距断层距离、X10为开采高度、X11为开采深度、X12为采动速度。具体煤层底板突水样本数据见表1。
2.2 主成分分析结果
利用SPSS(Statistical Product and Service Solutions),统计产品与服务解决方案软件),对表1中18组样本数据、12项评价指标进行主成分分析,由此得出煤层底板突水各主成分的特征值及贡献率,见表2;煤层底板突水PCA碎石特征值及累计贡献率图,见图2。由表2可知,前5项主成分的累计贡献率为85.044%,说明前5项主成分包含原有指标数据85.044%的信息。由图2可知,前5个主成分特征值散点图呈陡坡形,后5个主成分特征散点图趋于平缓,表明前5项主成分可以较好的解释煤层底板突水原始指标的绝大部分信息,且各成分间的重叠性弱。因此,提取前5项主成分代替原有的12项指标更为合适。
利用SPSS软件,求得煤层底板突水5个主成分的因子载荷矩阵,见表3。其中,第1主成分Y1与指标X6、X1、X12、X8、X4、X5、X10、X11显著相关,表明Y1包含煤层底板标高、含水层厚度、采动速度、断层落差、砂石比、泥石比、开采高度及开采深度的指标信息;第2主成分Y2与指标X2显著相关,表明Y2包含水压的指标信息。同样可以确定,第3主成分Y3包含X3隔水层厚度的指标信息;第4主成分Y4包含X9距断层距离的指标信息;第5主成分Y5包含X7煤层倾角的指标信息。
2.3 主成分分析煤层底板突水状态
表4为主成分得分数据。根据主成分Y1和Y2得分数据,画出样本得分散点图,如图3所示。由表4和图3可知:Y1和Y2主成分分别包含原始指标信息的38.632%和18.080%。样本编号为1、5、11、15、17的5个样本分布在主成分Y1、Y2的正向区间(第Ⅰ象限),Y1、Y2主成分得分较大,结合实际情况可知,这5个样本都属于突水状态。样本编号为4、12、13、16、18的5个样本分布在主成分Y1、Y2的负向区间(第Ⅲ象限),结合实际情况可知,这5个样本都属于未突水状态。
由表2和图3可知:Y1和Y2主成分得分散点图包含原始数据54.712%信息,且Y1、Y2特征值均大于2。除Y1、Y2外,其他主因子对原有信息涵盖较少,无法定性描述煤层底板突水状态。
3 评价煤层底板突水状态
3.1 预测煤层底板突水状态
基于主成分分析法,将提取的5个主成分,即Y1~Y5作为Fisher判别指标输入层,将样本编号1~15组数据作为训练样本输入,16~18组数据作为预测样本输出,输出参数为煤层底板突水状态。利用SPSS软件,由Fisher判别法计算可得判别函数,见式(13)。
判别函数G对应的特征值为7.066,典型相关性达到0.936,大于0.85,说明其判别能力显著,方差为100.00%,表明运用函数G即可解释样本全部信息。
煤层底板突水状态中心值,见表5。在判别函数G中,未突水的中心值为-2.645,突水的中心值为2.315。通过比较预测样本函数值与突水状态中心值的距离,即取两者差值绝对值,根据绝对值最小所在类别确定样本最终突水状态。
为检验PCA-Fsher判别模型的准确性及可靠性,将15组训练样本数据逐一回代,通过比较样本函数值与突水状态中心值的距离,确定样本的突水状态。1~15组回判函数、16~18组判断函数值,结果见表6。
3.2 结果分析
PCA-Fisher判别对1~15组训练样本回判结果全部正确,16~18组预测样本全部正确,回判及预测过程中都没有造成误判。主成分分析提取影响煤层底板突水指标主成分,减弱各指标间关联性。Fisher判别模型预测煤层底板突水状态,利用判别函数对训练样本进行回判,提高小样本预测效率及精度。综上表明:PCA-Fisher判别模型预测小样本煤层底板突水稳定程度高且较为可靠,能满足突水判别的实际要求。
4 结论
1)采用主成分分析对影响煤层底板突水指标进行降维处理,确定5个主成分代替原有的12项评价指标,降低指标信息间关联度,提高预测精度。
2)将确定的主成分,带入Fisher判别中,前15组样本数据逐一回判,后3组样本数据进行预测,结果均与实际数据一致。
3)煤层底板突水预测的PCA-Fisher判别模型具有较高的稳定性及可靠性,简化了判别模型,提高了预测效率。
参考文献
[1]李博,武强,班文韬。 掘进巷道富水型断层突水多场灾变演化规律研究[J]。 煤炭科学技术,2019,47(12):161-167。
[2]陈星明,曹树凯。 石炭-二叠系煤层底板高承压岩溶水防治技术[J]。 煤炭科学技术,2018,46(3):182-187。
[3]刘磊,于小鸽,王丹丹等。 基于灰色理论的底板突水危险性评价[J]。 矿业安全与环保,2016,43(5):45-49+61。
[4]赵德康,张健。 基于熵权-未确知测度理论的煤层底板突水危险性评价数学模型[J]。 煤炭工程,2016,48(S2):121-124。
[5]申建军,刘伟韬,许珂。 基于可拓物元模型的煤层底板突水危险性评价[J]。 河南理工大学学报(自然科学版),2016,35(4):451-457。
[6]徐德宝,曹始友,徐孚效等。 基于突变理论的煤层底板突水危险性评价[J]。 煤矿安全,2014,45(12):197-200。
[7]董丽丽,费城,张翔等。 基于LSTM神经网络的煤矿突水预测[J]。煤田地质与勘探,2019,47(2):137-143。
[8]陈建平,李金柱,王雪冬等。 改进脆弱性指数法在煤矿底板突水评价中的应用[J]。 中国地质灾害与防治学报,2019,30(3):67-74。
[9]叶世雄,贾明涛,潘传鹏,陈建宏。 基于未确知测度理论的煤层底板突水危险性评价[J]。 安全与环境学报,2015,15(1):26-30。
[10]孙文洁,武强,董东林等。 矿井水文地质类型划分的Fisher判别分析法-以开滦矿区为例[J]。 中国矿业大学学报,2012,41(2):231-235。
[11]毕建武,贾进章,赵博琦等。 煤与瓦斯突出预测的Fisher判别分析法及应用[J]。 安全与环境学报,2014,14(5):57-60。
[12]侯恩科,童仁剑,王苏健等。 陕北侏罗纪煤田风化基岩富水性Fisher模型预测方法[J]。 煤炭学报,2016,41(9):2312-2318。
[13]任雪松,于秀林。 多元统计分析(第2版)[M]。 北京:中国统计出版社,2011:184-198。
[14]张紫昭,陈凯,程文瑜等。 基于Fisher判别分析法的井巷围岩质量分类研究[J]。 煤炭科学技术,2016,44(11):36-41。