煤与瓦斯突出预测PCA-距离判别法研究∗
2016-11-07刘庆军陈坤刘晓光
刘庆军陈 坤刘晓光
(1.中国矿业大学(北京)资源与安全工程学院,北京市海淀区,100083;2.中国平煤神马能源化工集团有限责任公司,河南省平顶山市,467000)
★ 煤炭科技·机电与信息化★
煤与瓦斯突出预测PCA-距离判别法研究∗
刘庆军1,2陈 坤1刘晓光1
(1.中国矿业大学(北京)资源与安全工程学院,北京市海淀区,100083;2.中国平煤神马能源化工集团有限责任公司,河南省平顶山市,467000)
将主成分分析与距离判别法应用于煤与瓦斯突出预测中,建立了煤与瓦斯突出预测的PCA-距离判别法模型。通过PCA法提取煤与瓦斯突出影响因素的主成分,选取贡献率大于85%的3个主成分指标来代替原有的8个指标,同时确定这3个主成分为距离判别分析法的输入参数。以平宝公司试验工作面的17组原始数据为学习样本,5组原始数据为预测样本,对该方法进行了检验,预测结果与实际符合,可以作为煤与瓦斯突出预测的一种新方法。
煤与瓦斯突出 预测 主成分分析 距离判别法 检验
煤与瓦斯突出是威胁煤矿安全生产的一种自然灾害。在进行煤与瓦斯突出预测时要综合考虑诸多因素,但是各因素间存在错综复杂的关系。单项预测指标法操作简单,易于掌握,但只侧重考虑影响煤与瓦斯突出的单个因素,预测精度不高。现代数学理论方法被应用于煤与瓦斯突出预测中,主要包括模糊数学理论、人工神经网络、灰色理论、距离判别分析法、支持向量机算法、可拓聚类方法、免疫遗传算法等。但是现有这些评价方法中由于评价指标间存在相互影响,在分析时容易造成数据和信息的重叠,使得计算过于复杂并且容易导致对突出的误判。
以主成分分析的方法对突出预测指标进行信息提炼,把多个彼此相关、信息重叠的指标变量通过适当的线性组合转化为相互独立的综合指标。然后结合距离判别分析法对处理过的样本数据进行判别,建立了煤与瓦斯突出危险性预测的PCA-距离判别法模型。以平宝公司己16-17-11061工作面为例对煤与瓦斯突出危险性进行预测,实例证明了该模型能够预测煤与瓦斯突出。
1 理论与算法
1.1主成分分析
主成分分析实际上是一种降维方法。通过对原始变量协差阵或相关阵的研究,利用原始变量的线性组合形成少数几个综合变量。这些综合变量在保留原始变量主要信息的前提下,起到简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。
用原始数据矩阵X的p个变量X1,X2,…,Xp做线性组合F=AX,即:
式(1)中线性变换要满足下面几个条件:
(2)Fi与Fj不相关,Cov(Fi,Fj)=0(i,j=1,2,…,p;i≠j)。
(3)F1是X1,X2,…,Xp的一切能满足条件(1)的线性组合中方差最大者;F2是与F1不相关的X1,X2,…,Xp所有线性组合中方差最大者;…;Fp是与F1,F2,…,Fp-1都不相关的X1,X2,…,Xp所有线性组合中方差最大者。
1.2距离判别分析
距离判别法根据已知分类的数据分别计算各类的重心,即分类均值。距离判别准则是对于任意给定的一组新样品的观测值,若它与第i类的重心距离最近,就认为它是来自第i类。
1.2.1马氏距离
设X=(x1,x2,…,xp)′和Y=(y1,y2,…,yp)′是从期望为μ=(μ1,μ2,…,μp)′和协方差阵的总体G抽得的两个观测值,则称X与Y之间的马氏平方距离(Mahalanobis)为:
样本X和Gi类之间的马氏平方距离定义如下:
1.2.2多个总体的距离判别函数及判别准则
现设有n(n≥2)个p元总体G1、G2、…、Gn,其均值分别为μ1,μ2,…,μn,协方差矩阵为且x是一个等待判别的样品,则x到总体Gi(i=1,2,…,n)的距离为:
对其中任意两个总体GA和GB计算x到两个总体的平方差:
所以判别准则写成:
一般情况下,总体GA、GB的数量特征是未知的,它们的取值需要用训练样本进行估计。
1.2.3距离判别效果评价
判别方法是否可靠主要从对于即将进行分类的样本具有很高的判断正确率和对于已知分类的样本其回代判断准确率极高两方面来衡量。
为了考察上述判别准则的准确性采用回代估计法计算误判率。把属于总体G1的样本错误判断为应该属于另一个样本的个数记为n12;把属于总体G2的样本错误判断为应该属于另外一个样本的个数记为n21;总的误判个数为n12+n21,而两总体训练样本的总数是n1+n2,误判率η的回代估计为η=(n12+n21)/(n1+n2),误判率越小说明通过学习样本训练所建立的模型越准确。
2 煤与瓦斯突出模型及应用
2.1煤与瓦斯突出预测指标的确定
根据综合作用假说,并借鉴国内外相关研究成果,同时考虑到现场预测中指标的广泛性和易取性,选取能够间接反映煤与瓦斯突出的影响因素作为煤与瓦斯突出预测的参数。本文选取影响煤与瓦斯突出的8项指标来预测煤与瓦斯突出,X1为瓦斯放散初速度(ΔP)、X2为煤的坚固性系数(f)、X3为地质构造复杂度、X4为钻屑量(S)、X5为软分层厚度(h)、X6为钻孔瓦斯涌出初速度(q)、X7为瓦斯涌出量最大值(Qmax)、X8为残存瓦斯含量。
2.2模型的建立及应用
以平宝公司己16-17-11061工作面机巷为试验工作面,在工作面机巷开口不同位置采集煤样,测定煤体结构参数ΔP和f,并收集整理相关的突出预警指标数据,见表1,其中组别0代表无突出危险性,组别1代表有突出危险性。
表1 平宝公司己16-17-11061工作面煤与瓦斯突出各影响因素原始数据
2.2.1主成分分析
应用SPASS数学分析软件,对平宝公司试验工作面的煤与瓦斯突出影响因素提取主成分步骤:
(1)原始数据标准化。根据主成分分析原理首先将数据进行标准化处理。使数据平均值为0,标准差为1,将不同量纲的数据放到一个矩阵中进行综合测试分析。
(2)求相关系数矩阵R。计算所得的相关系数矩阵R如表2所示。
表2 平宝公司各突出影响因素相关系数矩阵
(3)求R的特征值及相应的特征向量和贡献率,并提取主成分。计算结果如表3所示。选取主成分是根据特征值的大小从大往小取,特征值越大相对应的主成分数据越重要。选取的主成分数据一般占到85%以上即可。由表3可知前3项主成分包含了原始数据88.12%的信息,可以代表原始标量的绝大部分信息。
表3 平宝公司各突出影响因素的主成分及其贡献率
(4)求主成分因子载荷矩阵。主成分因子载荷矩阵如表4所示,其中Y1主要由原始变量X5、X6、X7、X8表征,由Y1的主要组成来看其反映的是瓦斯因素,它反映了原始变量58.41%的信息;Y2主要由原始变量X3、X4表征,由Y2的主要组成来看其反映的是地质构造因素,它反映了原始变量19.08%的信息;Y3主要由原始变量X1、X2表征,由Y3的主要组成来看其反映的是煤体结构因素,它反映了原始变量10.63%的信息。得到的3个主成分分别代表影响煤与瓦斯突出的瓦斯因素、地应力因素和煤体结构因素。其中第一个主成分代表瓦斯因素作用下的综合指标,贡献度在3个主成分中最大,说明瓦斯是影响平宝公司煤与瓦斯突出的主导因素。
(5)计算因子判别式。根据主成分因子的载荷矩阵,表4中给出因子Y1、Y2、Y3与原始变量之间的关系,其因子表达式为:
根据式(6)、(7)、(8)对标准化后的数据进行主成分分析计算,计算的样本数据见表5。
表4 平宝公司各突出影响因素的3个主成分因子的载荷矩阵
表5 平宝公司各突出影响因素原始数据进行主成分计算后数据
2.2.2距离判别模型的建立及应用
(1)建立模型。对表1中17组突出危险性确定的样本数据进行学习。以0和1这两组样本作为两个不同的总体,并假设2个样本总体的协方差矩阵相等。将通过主成分分析方法得到的第一主成分Y1、第二主成分Y2和第三主成分Y3作为距离判别分析模型的判别因子,按照本文提出的距离判别分析法进行建模,得到判别公式:
(2)验证模型的可行性。利用回代估计法考察所得模型的误判率,利用该模型对表1中17组突出危险性确定的训练样本数据进行回代判别,回判过程中没有造成误判,说明所建立的煤与瓦斯突出预测模型的稳定程度高,而且比较可靠,能满足突出判别的实际要求。
(3)模型的应用。根据学习过的主成分分析与距离判别模型对其余5组突出危险性未知的待判样本进行判别,判别结果见表6。现场跟踪情况表明,地点10、13、20在掘进过程中出现严重夹钻、喷孔等突出预兆,应按照突出危险块段管理;地点12、14未出现过突出预兆,应作为无突出危险地段管理,预警结果与实际突出情况基本吻合。本文预测方法与实际情况一致,未出现误判现象,能够为矿井安全生产提供技术支持。
表6 平宝公司己16-17-11061工作面煤与瓦斯突出预测结果
3 结论
(1)运用主成分分析法对试验工作面数据进行分析表明影响煤与瓦斯突出的因素可以提取为3个主成分,分别是代表瓦斯因素的软分层厚度(X5)、钻孔瓦斯初速度(X6)、瓦斯涌出量最大值(X7)和残存瓦斯含量(X8);代表地应力因素的地质构造复杂程度(X3)、钻屑瓦斯量(X4);代表煤体结构因素的瓦斯放散初速度(X1)和煤的坚固性系数(X2)。
(2)利用主成分分析方法对煤与瓦斯突出预测的指标进行提取,降低了信息的维度。并结合距离判别理论以提取的主成分Y1、Y2和Y3作为判别因子进行突出危险性判别,建立了煤与瓦斯突出预测的PCA-距离判别模型。简化了预测模型、提高了预测效率。
(3)平宝公司己16-17-11061工作面的具体实例表明,基于主成分分析的距离判别模型能够预测煤与瓦斯突出。PCA-距离判别模型为煤与瓦斯突出预测提供了一个新途径。
[1] 于不凡.煤矿瓦斯灾害防治及利用技术手册 [M].北京:煤炭工业出版社,2005
[2] 辛士波,孙超.基于主成分分析法的煤矿安全生产预警分析研究[J].中国煤炭,2010(11)
[3] 彭立世,袁崇孚.瓦斯地质与瓦斯突出预测 [M].北京:中国科学技术出版社,2009
[4] 郭德勇,范金志,马世志等.煤与瓦斯突出预测层次分析-模糊综合评判方法 [J].北京科技大学学报,2007(7)
[5] 苗琦,杨胜强,欧晓英等.煤与瓦斯突出灰色-神经网络预测模型的建立及应用 [J].采矿与安全工程学报,2008(3)
[6] 伍爱友,肖红飞,王从陆等.煤与瓦斯突出控制因素加权灰色关联模型的建立与应用 [J].煤炭学报,2005(1)
[7] 王超,宋大钊,杜学胜等.煤与瓦斯突出预测的距离判别分析法及应用 [J].采矿与安全工程学报,2009(4)
[8] 师旭超,韩阳.煤与瓦斯突出预测的支持向量机(SVM)模型[J].中国安全科学学报,2009(7)
[9] 郭德勇,郑茂杰,郭超等.煤与瓦斯突出预测可拓聚类方法及应用[J].煤炭学报,2007(6)
[10] 朱玉,张虹,苏成.基于免疫遗传算法的煤与瓦斯突出预测研究[J].中国矿业大学学报,2009(1)
[11] 范金城,梅长林.数据分析[M].北京:科学出版社,2002
[12] 周健,史秀志,王怀勇.矿井突水水源识别的距离判别分析模型[J].煤炭学报,2010(2)
(责任编辑 张艳华)
Research on PCA-distance discriminance for coal and gas outburst prediction
Liu Qingjun1,2,Chen Kun1,Liu Xiaoguang1
(1.College of Resources&Safety Engineering,China University of Mining&Technology,Beijing,Haidian,Beijing 100083,China;2.China Pingmei Shenma Group Energy and Chemical Industry Co.,Ltd.,Pingdingshan,Henan 467000,China)
Through applying principal component analysis and distance discriminance to coal and gas outburst prediction,PCA-distance discriminance model for coal and gas outburst prediction was established.The PCA was used to find out influence factors of coal and gas outburst,three principal component indexes whose contribution rate greater than 85%was adopted instead of eight original indexes,and the three principal components were took as input parameters of distance discriminance.Taking 17 sets of original data of a test working face of Pingbao Company as learning samples and 5 sets of original data as prediction samples,the method was confirmed that could be a new method for coal and gas outburst prediction,as the prediction result was agree with the actual situation.
coal and gas outburst,prediction,principal component analysis,distance discriminance,inspection
TD713.2
A
∗国家自然科学基金重点项目(41430640),教育部博士点基金项目(20110023110016)
刘庆军(1973-),男,河南平顶山人,在职研究生,高级工程师,研究方向为矿山安全。