APP下载

煤与瓦斯突出预测的NN-SVM模型*

2016-10-26谢国民谢鸿闫孝姮

传感技术学报 2016年5期
关键词:约简粗糙集邻域

谢国民,谢鸿,付 华,闫孝姮

(辽宁工程技术大学电气与控制工程学院,辽宁葫芦岛125105)

煤与瓦斯突出预测的NN-SVM模型*

谢国民*,谢鸿,付华,闫孝姮

(辽宁工程技术大学电气与控制工程学院,辽宁葫芦岛125105)

为提高煤与瓦斯突出预测的精度和速度,通过基于邻域粗糙集(NRS)理论对特征向量降维,提取出影响煤与瓦斯突出的核心致突因素,采用改进的支持向量机(NN-SVM)理论来构建煤与瓦斯突出风险与由各种致突因素组成的特征向量之间的非线性关系。从而建立了基于邻域粗糙集(NRS)与改进的支持向量机(NN-SVM)相结合的煤与瓦斯突出预测模型。实验结果表明,该预测模型预测精度高,运算速度更快,同时还具有很好的泛化能力。

煤与瓦斯突出;预测模型;邻域粗糙集理论;改进的支持向量机

EEACC:7230doi:10.3969/j.issn.1004-1699.2016.05.019

煤与瓦斯突出是煤矿重大灾害之一,制约着我国煤矿的安全生产和煤矿工业的发展。由于煤与瓦斯突出的产生是受地应力、煤层瓦斯、煤层机构等因素共同作用的结果[1],导致突出发生的各种因素和条件又相互制约,相互影响,所以煤与瓦斯突出的预测一直是世界性难题。如何更加科学地精确地对煤与瓦斯突出进行预测和防治一直是近年来国内外学者不懈探索的目标。近年来涌现了许多新方法:神经网络[2-3]、耦合算法[4]、模糊神经网络[5]、灰色关联分析[6]等多种学习算法和预测模型,而这些研究中也存在着自己的局限性,神经网络的学习效率不高,模糊神经网络预测的精度有待提高等问题。针对这些问题,本文提出了一种基于邻域粗糙集(NRS)和改进的支持向量机(NN-SVM)相结合的瓦斯突出预测模型。

邻域粗糙集(NRS)理论可对原始属性约简,克服经典的粗糙集理论需要对数据离散化处理而丢失原有信息重要成分的缺陷[7-8],直接处理数值型属性。改进后的支持向量机(NN-SVM)算法,能够对样本集有效地删减,减少所需评价样本的数量,降低不同类别之间的混淆程度,同时兼备缩短训练时间、处理致突因数与突出强度之间的非线性关系的能力。融合NRS和NN-SVM的优点,构造了通过两者相结合的煤与瓦斯突出预测模型,模型训练和样本试验证明,该方法具有很好的运算速度、较高的预测精度和泛化能力。

1 煤与瓦斯突出的致突因素选取

由于煤与瓦斯突出是受多方面因素的共同影响,是受地应力、煤层瓦斯、煤层机构、物理特性等共同作用的结果。而影响因素的选取与最终的预测结果有密切的联系,因此对于影响因素合理的选取至关重要。本文根据国内外学者的研究和理论分析并查阅相关文献[9-12],选取了以下11个属性作为了煤与瓦斯突出预测的原始指标:①开采深度:随着开采深度增加,煤层所积聚的能量增加,发生煤与瓦斯突出的机率和强度也会增加;②地质构造:有无褶皱、有无断层影响着煤与瓦斯突出的强度和次数;③瓦斯含量:瓦斯含量是煤与瓦斯突出发生的必要物质条件,发生突出的物质基础;④煤的普氏系数:反映煤抗击外力的一个综合指标。煤层越坚固,抵抗煤与瓦斯突出能力越强;⑤瓦斯放散初速度:瓦斯含量越高,瓦斯放散初速度越大。煤体破坏的程度越大,瓦斯的放散初速度越大,突出可能性越大;⑥瓦斯涌出初速度:在一定程度上反映了煤层构造的破坏程度;⑦瓦斯压力:瓦斯压力特性反映出煤与瓦斯突出的危险程度。煤层中瓦斯压力越大,突出可能性越大。

除了以上的7个列出的指标外,煤层的顶板岩性、煤层变异系数、瓦斯含量是否变化、工作面风速等共11个指标作为了本文预测煤与瓦斯突出的具体指标。

2 邻域粗糙集(NRS)理论

2.1邻域粗糙集基本原理

邻域粗糙集模型是在经典的粗糙集理论上进行的延拓[13-14]。邻域粗糙集理论无需进行离散化处理,减少样本比较次数,提高分析效率,在属性约简上较经典的粗糙集理论更有优势。

建立关于煤与瓦斯突出预测的邻域决策系统NDS=(U,A,V,f),决策属性D,条件属性C是11个致突因数组成,决策属性D将论域U划分为N个等价类(x1,x2,…,xN),A=C⋃D,如果∀B⊆A,V为各属性值Va的集合,为信息函数,则有如下的定义:

①决策属性D关于子集B的上、下近似以及决策边界分别定义如下:

上近似:

其中,-NBX={xi/δB(xi)⋂X≠φ,xi∈U};

下近似:

决策边界:

②定义邻域决策系统的正域为:

正域:

③决策属性D对条件属性子集B的依赖度为:

④对于煤与瓦斯突出的邻域决策系统(U,A,V,f),B⊆A,∀a∈B-A;则定义a对B的重要度:

2.2基于邻域粗糙集的煤与瓦斯突出属性约简

采用向前贪心约简算法,不仅能够删除冗余特征,还能保证重要特征属性优先被加入到约简集中。向前贪心约简算法以空集为出发点,根据邻域粗糙集模型中重要度值依次选择重要度最大的属性,增加到约简集中,直到剩余属性重要度为0。约简算法如下:

步骤1∀a∈A,对属性进行邻域划分,得到邻域关系矩阵Na;

步骤2φ→red;

步骤3对任意属性ai∈A-red,计算重要度:SIG(ai,red,D)=γred⋃ai(D)-γred(D)

和red⋃ai的正域Posred⋃ai(D);

步骤4得到重要度最大的属性和其正域Posred⋃a(D);

步骤5如果SIG(ai,red,D)>0,red⋃ai→red,返回到步骤③;

步骤6否则输出red,约简结束。

3 改进的支持向量机NN-SVM

3.1样本集修剪

本文采用一种改进的支持向量机NN-SVM[15-16],针对训练样本中每一个样本点,找出它的最近邻点,根据样本点的类别归属度是否大于设定的阈值来决定其取舍。然后将修剪后的样本集输入到SVM中训练分类。

给定训练样本为(x1,y1),(x2,y2),…,(xn,yn),x∈Rm,用矩阵表示训练集TRn×(m+1)=(XY),X=(x1,x2,…,xn)T,Y=(y1,y2,…,yn)T。利用欧氏距离定义每个样本点xi与其他样本点xj的距离为:

用1/Di表示第i个点从距离因素上考虑样本类别归属的影响因子。如果T个样本中有r个与考察样本是同一个类的(假设距离为D1,D2,…,Dr),而剩余的T-r个与考察样本都不是同一个类的(假设距离为Dr+1,Dr+2,…,DT),定义类归属度为:

对样本集的修剪算法如下:

步骤1计算每一个样本点与其他样本点的距离Di,其中定义样本点与自身距离为∞;

步骤2找出最短距离以及相应的点(即最近邻);

步骤3判断样本点的类归属度Ei;

步骤4将样本的类归属度与设定的阈值ε比较,删除Ei小于ε的样本;

步骤5将经过上述方法删除后的样本集TR,再利用SVM训练分类。

3.2支持向量机(SVM)[17-20]

支持向量机通过寻求结构风险最小来提高学习机泛化能力,实现经验风险和置信范围最小化,达到在统计样本较小的情况下,也能获得良好统计规律的目的。

针对样本集T={(x1,y1),(x2,y2),…,(xn,yn)},其中xi∈Rm,i=1,2,…,n,m为每个训练样本向量的维数,yi则为决策属性。构造分类函数:

式(5)中φ(x)是输入空间到高维特征空间的非线性映射,ω→为权系数向量,b为分类阈值。

SVM构造的分类函数可转化为二次规划问题:在约束条件yi(ωTxi+b)≥1-ξi(其中,i=1,2,…,n, ξi≥0)下,求函数的最小值,式中ξi为松弛变量,C为惩罚函数。采用lagrange乘子法,并引入满足mercer条件的核函数k(xi,xj)=φ(xi)φ(xj)。

常用核函数有线性核函数、多项式核函数、径向基核函数(RBF)以及神经网络核函数,本文主要从以下方面考虑:①RBF可以将样本映射到更高维的空间,与线性核函数不同,它可以处理类别和特征之间是非线性时的样本,并且线性核函数是RBF的一个特例;②与多项式核函数相比,RBF需要确定的参数要少,模型更加简单,训练速度更快;③RBF与神经网络核函数相比,不易陷入局部最优。

综上考虑,RBF核函数具有较强的回归能力,较准确的预测性能,因此本文选取了工程上应用性较好的RBF核函数再通过常用的网格搜索法确定RBF核函数的参数C和σ。

将上述的二次规划问题转化为:

并得到非线性问题的分类函数:

3.3多分类器系统

考虑到煤与瓦斯突出是一个多分类问题,支持向量机实质上是一个两类分类器,因此采用基于SVM的多层次分类系统[21],构造分类器原则如下:使用SVM的分类思想在训练数据中的任意两个子类数据之间构造出一个分类器。假设需要分类第i类和第j类的数据,则需要解决下面的两类分类问题:

通过核函数φ将训练数据xi映射到高维空间。求解上式,便可得到分类结果[22-23]。

4 基于NRS与NN-SVM在煤与瓦斯突出预测中的应用

将上述的NRS和NN-SVM应用到煤与瓦斯突出预测中,不但能够实现对冗余信息的删减,还能加快预测速度,提高预测精度。充分地体现了利用NRS和NN-SVM两种算法相结合的优势。具体地实现煤与瓦斯突出预测的流程图如图1所示。

图1 基于NRS和NN-SVM预测流程图

针对本文选取的开采深度x1(m)、地质构造x2、瓦斯含量x3(m3/t)、煤的普氏系数x4(f)、瓦斯的放散初速度x5(ΔP/(L/min))、瓦斯的涌出初速度x6(P/(L/min))、瓦斯压力x7/MPa、顶板岩性(渗透率)x8(%)、煤层变异系数x9(%)、瓦斯含量是否变化x10、工作面风速x11(m/s)等11个指标,一共100组原始数据建立了煤与瓦斯突出的知识决策表,截取了第81~第90组数据列举如表1所示。

为了消除原始数据中存在的数量级和量纲带来的差异,本文采用了最大最小值法对知识决策表归一化处理[24]。然后采用邻域粗糙集算法对上表的数据进行降维,提取出影响煤与瓦斯突出的核属性。由于邻域粗糙集属性约简过程运算的复杂性,因此利用MATLAB编程实现属性约简过程。约简结果得到8个核属性,消除了3个冗余属性,简化了NN-SVM的输入变量,提高NN-SVM的处理速度和泛化能力。约简结果见表2所示。

表1 煤与瓦斯突出预测知识决策表

表2 降维后的煤与瓦斯突出预测知识决策表

将100组数据的前75组数据作为训练样本集送入到NN-SVM模型中进行训练得到经验模型。为了显示出对模型的训练效果,本文将经过NRS属性约简后的前75组数据分别输入到NN-SVM,SVM和BP模型中训练,将训练精度与训练次数进行比较分析,见图2所示。

通过图2可以看出:对NN-SVM模型训练了45次以后训练精度的曲线变化趋于平缓,较SVM以及BP模型相比,经NRS处理后的NN-SVM模型的收敛速度更快;从图2中还可以发现,NN-SVM模型的训练精度变化曲线变化幅度明显小于其他两种预测模型,说明NRS与NN-SVM相结合的模型稳定性很好,性能优于BP和SVM模型。

图2 不同模型的训练次数与训练精度对比

经过训练之后,将剩下25组数据输入到NNSVM中预测突出强度,并将预测结果与实际突出强度进行比较,得到煤与瓦斯突出预测结果,表3为最后5组预测结果。

表3 煤与瓦斯突出预测结果表

从表中结果可以看到,在样本集有限的情况下,通过本文提出的模型进行训练之后能够得到较准确的煤与瓦斯突出强度预测结果,与煤矿现场实际情况吻合良好。NRS和NN-SVM相结合的预测模型很好地解决了煤与瓦斯突出与影响因素之间的非线性映射关系。说明采用的NRS和NN-SVM相结合的预测模型具有很好的泛化能力和预测效果。

为了分析本文提出的NRS和NN-SVM相结合的模型的优劣性,进行了如下对比实验。将经过NRS降维前和降维后的原始数据分别输入到NN-SVM,SVM和BP模型中,预测准确率和运行时间如表4所示。

表4 不同模型的属性约简前后预测效果对比表

根据表4预测结果表明:无论是采用NN-SVM,SVM还是BP模型,经过NRS算法对致突因数属性约简去除冗余属性之后,三种模型的预测结果的准确率都得到了提高,且NN-SVM方法在NRS约简前后均优于SVM和BP方法;同时,属性约简后的预测模型的预测速度也比降维之前速度有显著提升,并且NN-SVM模型所需运行时间最短。实验数据表明,本文采用的NRS算法对原始属性约简的方法行之有效。

通过对比表4可以明显看出,经NRS约简后的SVM准确率为91.215%,BP神经网络的准确率为86.478%,本文采用的预测模型的准确率达到94.444%,比SVM以及BP更有优势。对比运算速度,NRS与NN-SVM相结合的预测模型运算速度为0.1334S,在保证较高准确率情况下,比SVM的0.1958S和BP模型的0.3646S的速度都快。

5 总结

将邻域粗糙集(NRS)属性约简的方法引入到煤与瓦斯突出预测中,不仅克服了常规的支持向量机在选择致突因素上的盲目性,科学地保留了致突因数中的特征属性,并且大大地减少了模型预测的工作量,提高了工作效率。

利用改进的支持向量机(NN-SVM)中基于结构风险最小化原则和小样本处理学习算法,较好地处理煤与瓦斯突出预测模型中的致突因素与突出等级之间的非线性关系。在NN-SVM中对训练样本进行修剪,相比传统方法,不仅能够提高分类的准确率,而且大大提高了运算速度,同时其泛化能力也有显著提升。

基于邻域粗糙集(NRS)与改进的支持向量机(NN-SVM)相结合的煤与瓦斯突出预测模型设计实现简单,而且克服了传统预测模型和预测方法精度低、速度慢以及泛化能力差等问题,实验结果表明该方法适用矿井煤与瓦斯突出实时预测,具有较好的工程实用性及理论研究价值。

[1]李希建,林柏泉.煤与瓦斯突出机理研究现状及分析[J].煤田地质与勘探,2010(1):7-13.

[2]曲方,张龙,李迎业,等.基于BP神经网络的煤与瓦斯突出预测系统开发[J].中国安全科学学报,2012(1):11-16.

[3]付华,刘汀,张胜强,等.基于SOM-RBF算法的瓦斯涌出量动态预测模型研究[J].传感技术学报,2015,28(8):1255-1261.

[4]付华,姜伟,单欣欣.基于耦合算法的煤矿瓦斯涌出量预测模型研究[J].煤炭学报,2012(4):654-658.

[5]郝天轩,宋超.基于模糊神经网络的煤层瓦斯含量预测研究[J].中国安全科学学报,2011(8):36-42.

[6]王天瑜,刘勇,徐德宇.滴道矿立井28#煤层瓦斯含量灰色关联分析及预测[J].安全与环境学报,2014(1):13-16.

[7]张庆宝,程浩忠,刘青山,等.基于粗糙集属性约简算法和支持向量机的短期负荷预测[J].电网技术,2006(8):56-59+70.

[8]谢国民,丁会巧,付华,等.基于FRS与GA-ELM的煤与瓦斯突出预测研究[J].传感技术学报,2015,28(11):1670-1675.

[9]国家安全生产监督管理总局.防治煤与瓦斯突出规定[J].北京:煤炭工业出版社,2009.

[10]闫江伟,张小兵,张子敏.煤与瓦斯突出地质控制机理探讨[J].煤炭学报,2013(7):1174-1178.

[11]陈祖云.煤与瓦斯突出前兆的非线性预测及支持向量机识别研究[D].中国矿业大学,2009.

[12]朱莉.基于SVM的煤与瓦斯突出预测模型研究[D].西安科技大学,2009.

[13]胡清华,于达仁,谢宗霞.基于邻域粒化和粗糙逼近的数值属性约简[J].软件学报,2008(3):640-649.

[14]韩虎,党建武,任恩恩.基于邻域粗糙集的支持向量机分类方法研究[J].计算机科学,2010(2):229-231+285.

[15]李红莲,王春花,袁保宗.一种改进的支持向量机NN-SVM[J].计算机学报,2003(8):1015-1020.

[16]于秋玲.基于改进NN-SVM算法的网络入侵检测[J].系统工程理论与实践,2010(1):126-130.

[17]孙玉峰,李中才.支持向量机法在煤与瓦斯突出分析中的应用研究[J].中国安全科学学报,2010(1):25-30,179.

[18]Wu Yuping.Application of Support Vector Machine in Coal and Gas Outburst Area Prediction[C]//Proceedings of 2009 IEEE In⁃ternational Conference on Intelligent Computing and Intelligent Systems(ICIS2009).2009:5.

[19]Du Anli,Wang Yingchun,Wang Jie,et al.Research of Fault Diag⁃nosis Based on Rough Sets and Support Vector Machine[C]//Pro⁃ceedings of IEEE 2011 10th International Conference on Electron⁃ic Measurement&.2011:4.

[20]付华,王馨蕊,杨本臣,等.基于MPSO-CWLS-SVM的瓦斯涌出量预测[J].传感技术学报,2014,27(11):1568-1572.

[21]孙涵,诸克军.基于邻域粗糙集与支持向量机的油层识别研究[J].计算机工程与应用,2008,30:219-222.

[22]周雪忠,吴朝晖.文本知识发现:基于信息抽取的文本挖掘[J].计算机科学,2003(1):63-66.

[23]单玉刚,王宏,董爽.改进的一对一支持向量机多分类算法[J].计算机工程与设计,2012(5):1837-1841.

[24]柳小桐.BP神经网络输入层数据归一化研究[J].机械工程与自动化,2010(3):122-123+126.

谢国民(1969-),男,辽宁阜新人,博士,副教授,研究生导师。主要为从事工业自动化和智能检测及电气控制方面的研究工作,Lngdxgm@163.com;

谢鸿(1992-),男,重庆铜梁人,硕士研究生,主要为研究智能检测与电气控制,91017907@qq.com。

Prediction Model for Coal and Gas Outburst Based on NN-SVM*

XIE Guomin*,XIE Hong,FU Hua,YAN Xiaoheng
(School of Electrical and Control Engineering,Liaoning Technical University,Huludao Liaoning 125015,China)

In order to improve the accuracy and efficiency of coal and gas outburst prediction,NRS theory is used to do the feature vector dimension reduction and extract the main sudden factors which affect coal and gas outburst,and then,the relationship between coal and gas outburst risk and the feature vectors which consist of the factors that affect coal and gas outburst is analyzed by the NN-SVM theory.So,the coal and gas outburst prediction model is es⁃tablished based on the NRS theory and NN-SVM.The experiment results show that:NRS theory can do well in the knowledge reduction about the original characteristics.The model has a high prediction accuracy and the generaliza⁃tion ability is well.

coal and gas outburst;prediction model;neighborhood rough sets(NRS)theory;improved support vec⁃tor machine(NN-SVM)

TP39;TP183;TP212

A

1004-1699(2016)05-0733-06

项目来源:国家自然科学基金项目(51274118);辽宁省教育厅基金项目(UPRP20140464)

2015-12-14修改日期:2016-01-20

猜你喜欢

约简粗糙集邻域
基于Pawlak粗糙集模型的集合运算关系
稀疏图平方图的染色数上界
基于二进制链表的粗糙集属性约简
基于邻域竞赛的多目标优化算法
实值多变量维数约简:综述
基于模糊贴近度的属性约简
多粒化粗糙集性质的几个充分条件
关于-型邻域空间
双论域粗糙集在故障诊断中的应用
两个域上的覆盖变精度粗糙集模型