基于PCA和案例推理的煤与瓦斯突出动态预测*
2015-11-18阎馨,付华,屠乃威
基于PCA和案例推理的煤与瓦斯突出动态预测*
阎 馨*,付 华,屠乃威
(辽宁工程技术大学电气与控制工程学院,辽宁葫芦岛125105)
为了实现对煤与瓦斯突出快速、准确和动态预测,提出了一种基于主成分分析(PCA)和案例推理(CBR)的煤与瓦斯突出预测方法。考虑煤与瓦斯突出多种影响因素,利用案例推理技术对煤与瓦斯突出危险性进行预测。同时采用一种基于PCA的案例描述特征权值确定方法,以提高案例检索效率以及煤与瓦斯突出预测准确率。利用实测数据对所提方法进行验证,实例验证结果表明,所提方法预测结果的准确性和稳定性更高,预测平均误差和最大误差分别仅为0.154%和0.77%,远小于模糊神经网络方法和专家给定权值的案例推理方法。
煤与瓦斯突出;动态预测;特征权值;主成分分析;案例推理
煤与瓦斯突出是破碎的煤、岩和瓦斯在地应力、瓦斯的共同作用下,由煤体或岩体内突然向采掘空间抛出的异常动力现象,是严重威胁煤矿安全生产的重大自然灾害之一。进行煤与瓦斯突出快速、准确和动态预测对有效防治矿井煤与瓦斯突出灾害尤为重要。目前,煤与瓦斯突出危险性预测方法有很多,如D指标方法、钻屑量指标方法、电磁辐射监测方法[1-4]、人工神经网络方法[5-7]、支持向量机方法[8]和案例推理方法[9]等。现有煤与瓦斯突出预测的各种方法都还存在一些不足,其中D指标法、钻屑量指标法和电磁辐射监测法预测时无法考虑影响煤与瓦斯突出的多种因素从而导致预测的准确性不高;神经网络方法建模复杂,为了保证预测的准确性必须频繁进行模型校正,预测模型的稳定性也不高,而且建模时易出现过拟合现象;支持向量机方法利用大规模样本数据建模较困难;案例推理是人工智能领域中较新的一种推理方法,是一种基于记忆的推理,符合人的认知过程。最近几年已有部分学者将案例推理应用于煤矿安全决策领域,如煤与瓦斯突出预测[9]、煤矿安全评价[10]、煤矿瓦斯爆炸预警[11]和煤矿瓦斯事故应急决策[12]。而在上述案例推理应用中,案例检索与匹配所涉及的特征权值确定均要利用专家知识。文献[9]利用案例推理进行煤与瓦斯突出预测时,考虑影响煤与瓦斯突出的多种因素,利用煤与瓦斯突出多种影响因素数据对当前煤与瓦斯突出危险性进行智能化预测。其中,采用基于专家确定的特征权值进行案例检索与匹配,导致预测结果直接受专家的主观影响,最终预测结果的准确性难以保证。
本文将主成分分析引入到煤与瓦斯突出预测的案例推理方法中,使主成分分析和案例推理相结合,考虑煤与瓦斯突出多种影响因素,进行矿井煤与瓦斯突出快速、准确和动态预测。通过对案例数据进行主成分分析,确定出案例检索与匹配过程所需的案例描述特征权值。利用多传感器进行煤与瓦斯突出的多种影响因素数据在线检测,并利用基于均值的分批估计融合方法进行数据融合,为煤与瓦斯突出预测提供可靠、准确的数据。最后利用实例验证本文所提方法的有效性。
1 煤与瓦斯突出的影响因素
煤与瓦斯突出是一种复杂的矿井动力现象,煤与瓦斯突出的影响因素是多方面的。
①瓦斯压力
煤体的瓦斯压力与游离和吸附的瓦斯有关,是预测煤层瓦斯含量的前提。瓦斯压力特性可以反映煤与瓦斯突出发生及其危险程度。因此,煤体的瓦斯压力可以作为估计煤与瓦斯突出的一项重要指标。
②瓦斯放散初速度
煤体的瓦斯放散初速度与煤体表面放散瓦斯的微孔大小和瓦斯渗透流动的孔隙通道有关。当煤体空隙具有相同的大小时,瓦斯放散初速度越大,瓦斯含量越大。一般情况下,煤层瓦斯含量越高,瓦斯放散初速度越大;当煤体被破坏程度很大时,瓦斯放散初速度越大,越容易发生瓦斯突出。
③地质构造
地质构造对煤与瓦斯突出影响巨大,高瓦斯煤矿及受局部集中影响的低瓦斯煤矿均易发生煤与瓦斯突出。
④煤层坚固性系数
煤层坚固性系数是表征煤体强度和微硬度大小的一个参数。煤层坚固性系数越小,煤与瓦斯突出危险性越大。
⑤开采深度
随着矿井开采深度增加,煤层瓦斯含量也增加,煤层的透气性越低,煤与瓦斯突出危险性也增大。
上述的煤与瓦斯突出各种影响因素本身具有不精确性、模糊性,而且突出的影响因素与突出事件之间的相互关系具有不精确性或模糊性。要对煤与瓦斯突出危险性进行准确预测,就必须充分考虑煤与瓦斯突出的多种影响因素。
2 基于PCA和案例推理的煤与瓦斯突出预测
基于PCA和案例推理的煤与瓦斯突出预测结构如图1所示。
图1 基于PCA和案例推理的煤与瓦斯突出预测结构
考虑到煤矿井下环境恶劣,如果通过单个传感器获取某一信息(如瓦斯压力)的数据,检测到的传感器信号常常因为干扰信息的存在而不准确,甚至当传感器故障时无法检测到信号,为此文中采用多个传感器检测某一信息数据并利用基于均值的分批估计融合方法对检测到同一信息的多传感器数据进行融合[9],消除测量过程的不确定性,得到准确测量结果,以提高煤与瓦斯突出预测的准确性。
预测时首先利用基于PCA的描述案例特征权值确定方法,确定出描述案例特征权值,接着根据当前检测到的煤与瓦斯突出多种影响因素数据在案例库中检索和匹配出相似案例,再依据相似度阀值进行重用,得到当前煤与瓦斯突出多种影响因素数据描述的案例解,即煤与瓦斯突出的预测结果。最后通过煤与瓦斯突出的实际结果与案例推理的估计结果进行误差分析和精度评价,如达不到预期的精度,就进行案例修正,若精度符合要求的,则根据相应规则进行案例存储。
2.1 案例的表示
案例表示是指以一种适当的形式将要求解的问题在计算机中表达出来,它是案例推理研究的基础和核心。煤与瓦斯突出预测的初始案例可以利用煤与瓦斯突出历史数据来构建。对于第k条案例Ck,是由案例描述特征Tk和案例解Sk所组成,即Ck={Tk,Sk},以列表形式表示的案例结构如表1所示。其中,Tk=(tk1,tk2,…,tko),tki(i∈{1,2,…,o})为煤与瓦斯突出的影响因素,如瓦斯压力、煤层坚固性系数和开采深度等,o为判别煤与瓦斯突出的影响因素数量,Sk表示煤与瓦斯突出危险性。
表1 案例结构
2.2 案例的检索与匹配
案例的检索与匹配是实现案例推理的关键。设当前煤与瓦斯突出状况为C,其状况描述为X=(x1,x2,…,xo),其解为S,那么C与案例库中第k条案例Ck的相似度定义为:
式中,θi为案例描述特征权值,sim(xi,tki)为第k案例的描述特征tki与当前煤与瓦斯突出状况的第i个描述特征xi的相似度,当tki和xi为布尔型数据时采用式(2)计算sim(xi,tki),当tki和xi为数值型数据时采用式(3)计算sim(xi,tki)。
记SIMmax=k∈m{1,2a,…x,m}[SIM(C,Ck)](m为案例库中的案例数量),相似度阀值SIMth按下式确定:
式中,a为给定的常数,a∈[0,1]。
案例库中所有与当前的煤与瓦斯突出状况的相似度达到SIMth的案例都被检索出来作为相似案例。
2.3 基于PCA的案例描述特征权值确定
各个描述特征在案例中所起的作用不同,因此案例描述特征权值θi的确定是案例检索和匹配的关键,直接关系到案例检索和匹配的结果[13-15],最终影响矿井煤与瓦斯突出预测的结果。
描述案例特征权值θi反映的是煤与瓦斯突出影响因素的重要程度。传统权值确定方法有专家咨询法、领域知识法、调查统计法,这些方法虽然简单,但是过分依赖主观判断和经验,结果难以令人信服,有时偏差会很大;非传统方法有粗糙集方法、遗传算法等,这些方法克服了传统方法的不足,但粗糙集要求对案例进行离散化处理,会产生案例相似度测量误差,导致数据丢失,案例检索和推理结果不准确。遗传算法具有全局搜索能力,但局部搜索能力差,存在早熟和收敛速度慢问题。
主成分分析PCA借助一个正交变换,将其分量相关的原随机向量H=(h1,h1,…,hp)T转化成其分量不相关的新随机变量V=(v1,v2,…,vp)T,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统。主成分分析方法首先对采集到的样本数据进行标准化处理,接着计算其相关系数矩阵,再求解出相关系数矩阵的特征值和特征向量,进而确定出主成分个数,最后根据已经求得的相关系数矩阵的特征值和特征向量计算出因子载荷矩阵,确定出主成分[16-17]。
主成分因子载荷矩阵是原指标和主成分的相关系数,反映的是各指标与主成分的相关程度,即各指标在主成分中的重要程度,因此可以根据主成分因子载荷矩阵计算出各指标的权值。
利用PCA进行案例描述特征权值确定方法如下:
Step 1 对煤与瓦斯突出预测的案例描述特征数据 tk1,tk2,…,tko(k=1,2,…,m)构成的数据矩阵进行标准化处理,计算标准化后的数据矩阵Y的相关系数矩阵R,Y和R的表达式如公式(5)和式(6)所示:
Step 2 用雅克比方法求得相关系数矩阵R的特征值λi(i=1,2,…,o,λ1≥λ2≥…≥λo)和特征向量 μij(i,j=1,2,…,o);
Step 3 先按式(7)确定主成分个数n,接着依据式(8)计算主成分因子载荷矩阵βij(表示第i个指标与第 j个主成分的相关系数,-1≤βij≤1);
Step 4 βij越趋近0,第i个指标在第 j个主成分上重要性越小,第i个指标对第 j个主成分的影响也就越小;而 βij越远离0,即 |βij|越大,第i个指标在第 j个主成分上重要性越大,第i个指标对第 j个主成分的影响也就越大。可见只要求得每一个指标在每一个主成分上的重要性(权值)θij(i=1,2,…,o,j=1,2,…,n),再使θij在主成分上进行加和得到θi(i=1,2,…,o),最后对θi进行归一化处理即可得到每一个指标的权值,即o个案例描述特征权值θ1,…,θi,…,θo。其中θij、θi和θi的表达式分别如式(9)、式(10)和式(11)所示。
利用PCA进行案例描述特征权值确定方法的具体流程如图2所示。
图2 利用PCA进行案例描述特征权值确定方法的流程图
2.4 案例的重用
一般情况下,案例库中不存在与当前煤与瓦斯突出状况完全匹配的案例,因而检索出的案例的解并不能直接作为当前瓦斯突出状况的解,需要对检索到的相似案例进行案例重用。
案例重用后,将本次煤与瓦斯突出状况描述特征及解存入历史数据库。
2.5 案例存储与维护
对准备加入案例库中的新案例,按照前述的相似度计算公式,计算其与案例库中所有案例的相似度。若求出的相似度不大于某一个给定阀值φ(0<φ<1),则加入该案例;若至少存在一相似度大于φ,则改写具有最大相似度且时间较早的旧案例;若存在一个相似度为1,则表明该案例与新案例完全匹配,不予存储。另外对案例库中时间久远、不适应目前工况及长时间不用的案例应进行适当删减。若发现案例不一致,即两个案例的案例描述相近而解相差甚远,则找出不一致的原因并加以修正。
3 实例验证
本文采用国内某矿井中的20组典型的煤与瓦斯突出实测数据(通过多个传感器并行测得),对本文提出的方法进行验证。利用前15组数据构建煤与瓦斯突出预测的初始案例库,利用后5组数据作为测试数据。初始案例库中的各案例描述特征和案例解如表2所示。
表2 案例库中的各案例描述特征和案例解
对表2所示案例的描述特征数据,首先利用公式(5)进行标准化处理后得到数据矩阵Y,并依据Y利用公式(6)计算相关系数矩阵R;再用雅克比方法求得相关系数矩阵R的特征值λi(i=1,2,…,5)和特征向量 μij(i,j=1,2,…,5),并根据得到特征值计算得到的特征值以及累计贡献率如表3所示。
根据表3,依据公式(7)选取3个主成分,即n=3,再依据公式(8)计算主成分因子载荷矩阵 βij(i=1,2,…,5,j=1,2,…,3)如表4所示。
表3 特征值及贡献率
根据表4所示的主成分因子载荷矩阵βij,依据公式(9)、(10)和(11)计算得到案例的各描述特征权值θ1=0.2462,θ2=0.1465,θ3=0.2584,θ4=0.2121,θ5=0.1367。针对预测数据,令参数a=0.75(反复试算后获得),利用计算得到各案例的描述特征权值,采用文中方法进行煤与瓦斯突出危险性预测,同时在预测结果上与模糊神经网络方法和专家给定权值的案例推理方法进行了对比,具体结果如表5和表6所示。专家给定权值的案例推理方法利用测试数据进行预测时,专家给定的案例特征权值为θ1=0.16,θ2=0.16,θ3=0.30,θ4=0.19,θ5=0.19,其它过程同文中方法;模糊神经网络方法首先以表2数据为样本数据建立预测模型,再根据测试数据利用预测模型进行预测。其预测模型由模糊量化部分和BP神经网络两部分组成,共4层网络。
表4 主成分因子载荷矩阵
从表5可以看出,三种方法所得预测结果均很接近实际值。但从表6可以看出,采用模糊神经网络方法得到预测结果与实际结果的相对误差最大值为11.42%,相对误差的平均值为4.91%;采用专家给定权值的案例推理方法得到预测结果与实际结果的相对误差最大值为8%,相对误差的平均值为1.6%;而采用本文提出方法得到预测结果与实际结果的相对误差最大值仅为0.77%,相对误差的平均值仅为0.154%,两项指标值远远小于其它两种方法。可见本文提出方法相比其它两种方法预测的准确性和稳定性均更高,而且采用基于PCA的案例描述特征权值确定方法所确定的各案例的描述特征权值相比专家给定的更科学和准确,同时本文所提方法针对每组测试数据预测所消耗最大时间为15 ms,有较好的实时性。
表5测试结果
表6 三种方法所得结果的对比
当考虑矿井煤与瓦斯突出影响因素较多且样本数据较大时,采用模糊神经网络方法所建模型更为复杂,难度更大,网络训练时间长且常常出现过拟合,导致模型精度不高,然而本文提出的方法不会出现这样问题,会快速、准确地给出预测结果,而且随着案例库中的案例数量的不断增加,本文提出方法预测的准确性将逐步增加。
4 结论
针对矿井煤与瓦斯突出预测问题,本文提出了一种基于PCA和案例推理的煤与瓦斯突出预测方法。
①考虑矿井煤与瓦斯突出的多种影响因素,克服了以往以单因素为主的指标经验判断法导致的煤与瓦斯突出预测不准确的问题。
②给出基于PCA的描述案例特征取值确定方法,进行案例描述特征权值的科学客观确定,提高案例检索与匹配结果的准确性,确保矿井煤与瓦斯突出危险性的预测准确性。
③利用基于均值的分批估计融合方法对煤与瓦斯突出影响因素数据进行处理,以获取煤与瓦斯突出预测所需更为准确、可靠的数据。
④充分利用案例推理技术的求解高效性和持续不断的学习能力,实现对矿井煤与瓦斯突出危险性的快速、准确、动态、智能化预测。通过实例验证表明,本文所提方法预测结果优于模糊神经网络方法和专家给定权值的案例推理方法,本文提出方法是有效的。
[1] Yuliang,Li Wuwen.Study on Technology of Electromagnetic Radiation of Sensitive Index to Forecast the Coal and Gas Hazards [J].Procedia Engineering,2010,7:327-334.
[2] Zhang Shijie,Sun Xiaoyuan,Li Chengwu,et al.The Analysis of Coal or Rock Electromagnetic Radiation(EMR)Signals Based on Hilbert-Huang Transform(HHT).Procedia Engineering,2011,26:689-698.
[3] Wang Enyuan,He Xueqiu,Wei Jianping.Electromagnetic Emission Graded Warning Model and Its Applications Against Coal Rock Dynamic Collapses[J].Internation Journal of Rock Mechanics and Mining Sciences,2011,48(4):556-564.
[4] He Xueqiu,Nie Baisheng,Chen Wenxue.Coal-Rock Dynamic Disaster Assessment Model Based on Electromagnetic Emission and Least-Squares Support Vector Machine[J].Internation Journal of Risk Assessment and Management,2010,14(6):459-467.
[5] Wang Fuzhong,Liu Weizhe.Prediction Strategy of Coal and Gas Outburst Based on Artificial Neural Network[J].Journal of Computers,2013,8(1):240-247.
[6] Zhang Rulin,Lan S Lowndes.The Application of a Coupled Artificial Neural Network and Fault Tree Analysis Model to Predict Coal and Gas Outburst[J].Internation Journal of Coal Geology,2010,84(2):141-152.
[7] 付华,王馨蕊,王志军,等.基于PCA和PSO-ELM的煤与瓦斯突出软测量研究[J].传感技术学报,2014,27(12):1710-1715.
[8] Wang Yongbao,Zhao Yong.Forecasting Coal and Gas Outburst Based on Support Vector Support Vector Machine[C].2009 IEEE International Conference on Information Engineering and Computer Sciences,2009:1-4.
[9] 阎馨,付华.基于案例推理和数据融合的煤与瓦斯突出预测[J].东南大学学报,2011,39:59-63.
[10]王闵,韩心灵.案例推理技术在煤矿安全评价体系中的应用研究[J].科技和产业,2007,7(11):30-32.
[11]田水承,魏权.基于CBR在煤矿瓦斯爆炸预警应用探讨[J].陕西煤炭,2008(4):19-21.
[12]袁晓芳,李红霞,田水承.煤矿重大瓦斯案例推理应急决策方法[J].辽宁工程技术大学学报,2012,31(5):595-599.
[13]Liu Changchun,Shen Zhongqi,Wu Like.The Modular Configuration System Based on Case-Based Reasoning[J].Journal of Advanced Manufacturing Systems,2012,11(2):135-142.
[14]Li Peigang,Feng Xianying,Song Yaqing.The Case-Based Reasoning Technology Based on Functional Mode[J].Journal of Advanced Manufacturing Systems,2011,10(1):199-206.
[15]汤旭翔,刘伟,韩圆圆,等.基于电子鼻和非线性特征分析的鸡肉鲜度检测方法[J].传感技术学报,2014,27(10):1443-1446.
[16]Cabir Vural,Murat Yildiz.Determination of Sleep Stage Separation Ability of Features Extracted from EEG Signals Using Principle Component Analysis[J].Journal of Medical Systems,2010,34 (1):83-89.
[17]Wen Chenglin,Wang Tianzhen,Jing Hu.Relative Principle Component and Relative Princle Component Analysis Algorithm[J]. Journal of Electronics,2007,24(1):108-111.
阎 馨(1978-),女,辽宁沈阳人,硕士,研究方向为智能检测与智能控制,发表论文10余篇,申请专利3项,yanxin781204@126.com;
付 华(1962-),女,辽宁阜新人,博士(后),教授,博士生导师。主要从事智能检测和数据融合等方面的研究。主持国家自然基金2项、主持及参与国家863和省部级项目30余项,发表论文50余篇,申请专利24项,fxfuhua@163.com。
Dynamic Prediction of Coal and Gas Outburst Based on PCA and Case-Based Reasoning*
YAN Xin*,FU Hua,TU Naiwei
(Faculty of Electrical and Engineering Control,Liaoning Technical University,Huludao Liaoning 125105,China)
In order to realize the accurate,speed and dynamic prediction of coal and gas outburst,a prediction method based on principal component analysis(PCA)and case-based reasoning(CBR)was proposed.Considering multiple influencing factors of coal and gas outburst,the hazard prediction is done with CBR technology.At the same time,a method based on PCA is used in weights allocation for case retrieval and matching to improve the retrieval efficiency and prediction precision.The proposed method was validated using practical measured data.The simulation example shows that the proposed method provides more accurate and robust prediction results and the average prediction error and maximum prediction error are 0.154%and 0.77%,respectively.The prediction errors are much less than that obtained from the fuzzy neural network method and the CBR method using weights given by experts.
coal and gas outburst;dynamic prediction;case system feature weights;principal component analysis;case-based reasoning EEACC:7230
TD713
A
1004-1699(2015)07-1028-07
10.3969/j.issn.1004-1699.2015.07.015
项目来源:国家自然科学基金项目(70971059,50874059,61202266);辽宁省教育厅科学技术研究项目(2008281)
2015-01-04 修改日期:2015-03-25