APP下载

矿井突水水源辨识的改进SVM和GA-BP神经网络模型

2015-04-15阳富强刘广宁郭乐乐

有色金属(矿山部分) 2015年1期
关键词:突水水源遗传算法

阳富强,刘广宁,郭乐乐

(福州大学环境与资源学院,福州350108)

矿井突水水源辨识的改进SVM和GA-BP神经网络模型

阳富强,刘广宁,郭乐乐

(福州大学环境与资源学院,福州350108)

及时辨识突水水源是有效预防和控制矿井突水灾害的重要工作之一。基于河南焦作某矿区不同水层的测试样本,利用嵌入梯度的支持向量机(SVM)对常用的[SO4]2-、K+、Mg2+、Na+、Ca2+、Cl-、[HCO3]-、F-8种水化学成分进行因子约简,确定以K+、Mg2+、Ca2+、Cl-、[HCO3]-、F-作为矿井突水水源辨识的主要判别因子。运用遗传算法优化BP神经网络(GA-BP)对新体系下的30组学习样本进行训练拟合,用所建立的分析模型对10组待检验水源类别进行辨识,预测平均正确率达到了94.27%。研究结果表明,该指标体系在矿井突水水源辨识中具有可行性,且GA-BP模型分类性能好,误判率低,可以用于矿井突水水源的辨识。

矿井突水;水源判别;SVM;GA-BP

矿井突水灾害一直制约着我国矿山的健康发展,快速判别突(涌)水水源是有效预防矿井突水事故发生的重要工序之一。鉴于离子含量差异性较大的地下水,其水文地球化学成因及来源各不相同,因此水化学方法已成为辨识突水水源的有效方法[1]。当前大部分研究主要围绕突水水源中的化学成分含量进行测定,再基于数理统计和各种判别预测方法进行分类判别预测,但对于选取水中哪些化学成分作为判别体系并没有一个明确的定论,过多的指标测试不仅增加了测试的难度而且可能会影响测试的准确性。目前针对矿井突水水源的辨识,研究人员提出了多种判别方法,如等效数值法[2]、模糊综合评判法[3]、最大效果测度值法[4]、距离判别法[5]等。等效数值法是将数据转化为(0,1)区间后进行模拟,适合转化不同量纲的换算,但其优越性在突水判别中难以体现;模糊综合评判法由于受主观因素影响较多,容易造成预测结果不准确;最大效果测度值在矿井透水预测中应用较多,但其理论基础薄弱,未能得到普遍认可;距离判别法的界限优势难以区分,对于离子种类含量少的样本会给判别结果造成较大误差。

随着矿山开采深度的逐渐增加,地下水混合程度逐渐增强,多类水源组分参与了混合作用,导致地下水水质组分过渡类型增多,这些方法在矿井突水辨识中均存在明显不足。为此,本文拟采用嵌入梯度支持向量机对矿井突水水源进行分类指标确定,并利用GA-BP在新指标下进行分类预测,旨在提高矿井突水水源判别的准确率。

1 判别指标选取

1.1 嵌入梯度的SVM理论

SVM多用于指标多、样本少的模型判别,已成为当前国际机器学习界的研究热点,具有适应性强、全局优化、适应时间短等优点,在实际生产中得到广泛应用。例如,王成武利用支持向量机建立了室内轰燃预测模型[6];师旭超基于支持向量机建立的煤与瓦斯突出模型也取得了较好的预测效果[7];舒彤等将支持向量机应用到供应链风险评估的研究中[8];赵吉文等利用支持向量机为直线电机建模[9];黄东利用模糊支持向量机进行了车辆碰撞信号的检测[10],均取得了较好的应用效果。

梯度能够反映各个维度的投影变化,而且每个维度投影可以描述维度的重要性。设在二维空间有梯度A=ax+by,如图1所示A在x方向的投影a要小于在y方向的投影b,则梯度A在y方向的重要性更大。

图1 二维梯度在2个维度的重要性比较Fig.1 Two-dimension gradient importance on two dimensions

为了评测各个指标对决策超曲面g(c)的影响,首先求取该函数在点x的梯度:

其中,n为样本数目。

采用径向基函数:

对应的梯度为:

1.2 嵌入梯度选择分量与实例分析

利用嵌入梯度对指标体系进行优化的过程主要包括嵌入梯度分量选择和指标体系优化约简两个方面。选择分量的过程主要包括SVM分类器的生成,求取集合Iε中各样本点处"xg(x)值,在集合Iε中将"g(x)归一化后求和:V=(其中 lε为满足的样本集合),令,依次筛选出各分量中比较大的指标体系作为优化结果。

矿山突水水源识别指标体系优化约简过程如图1所示,利用分类器确定初级指标的重要度;根据其大小建立多个评价指标体系,利用SVM进行训练、预测得出不同体系下的预测正确率,进而获得最优评价体系。

图1 指标体系优化、约简过程Fig.1 Reduction process of index system

矿井突水的主要来源为大气降水及地表水的渗漏、相邻含水层地下水的突涌以及老窑水的揭露[12]。一般矿区地下含水层包括奥灰水、太灰水、第四系水和砂岩水。不同突(透)水水源都有其特殊的化学特征。当前,水化学方法被认为是识别矿井突水的有效手段之一,离子含量差异性较大的地下水,其水温、地球化学成因、来源都不相同[13-14]。

在此,本文选取河南焦作矿区40个样本数据[15],如表1所示,以[SO4]2-(X1)、K+(X2)、Mg2+(X3),Na+(X4)、Ca2+(X5)、Cl-(X6)、[HCO3]-(X7)、F-(X8)8种常用判别离子的浓度作为判别分析模型的原始判别因子。将4种水源类型分别用数字表示:1(奥灰水)、2(太灰水)、3(第四系水)、4 (砂岩水),实际类型是指水质经过测定后综合分析得到的结果。

表1 地下水样水化学分析及预测结果 /(mmol·L-1)Table 1 Chemical analysis and predicting results of groundwater samples

利用林智仁开发的Libsvm软件包对支持向量机的参数进行仿真模拟,SVM的各项参数经过交叉验证,设置值见表2,其中核函数是根据不同核函数对样本的预测结果准确率高低确定的(RBF核函数的准确率最高),惩罚参数和参数Gamma则是利用程序Python27和Gnuplot进行演算得出的,且给出寻优准确率为100%。

将各项参数和样本数据输入到MATBLE的嵌入梯度支持向量机程序中运行,各指标重要性从低到高依次为X1、X4、X2、X8、X6、X3、X5、X7。为进一步验证重要度分析的正确性,根据指标重要度大小分成8个不同的指标体系,从F1-F8依次剔除指标重要度相对较低的指标。对实际矿样的前30组进行训练后,在不同指标体系对10个待测样本进行预测,得到判别结果正确率如表3所示。可以看出,指标体系F1、F2的正确识别率始终保持在70%,说明指标X1对判别结果影响并不大,剔除指标X4,F3的预测正确率达到80%;之后继续剔除新指标,体系F4-F8的识别率降低,说明剔除过多的指标会影响分 类的 效 果,确 定 K+,Mg2+,Ca2+,Cl-,[HCO3]-,F-作为最佳判别体系,此时该指标体系预测准确率最高。

表2 SVM参数设置Table 2 SVM parameter setting

表3 不同指标体系对应符号以及预测正确率Table 3 Symbols and prediction accuracy of different index systems

2 基于遗传算法优化BP神经网络(GA-BP)的矿井突水水源判别分析

BP神经网络应用广泛,但存在易陷入当学习率选择过小时收敛速度慢,反之又可能因回馈过度而产生震荡等缺陷[16]。遗传算法(Genetic Algorithm,GA)是模拟生物进化和遗传而发展起来的一种搜索和优化算法,具有较强的群体寻优学习能力[17]。因此,将遗传算法与神经网络相结合,通过遗传算法对BP神经网络的结构或参数加以优化,将优化后的权值和阀值参数赋给BP神经网络,不仅能发挥神经网络强大的非线性映射能力,而且能使神经网络具有更快的收敛性和更强的学习能力。

遗传算法优化BP神经网络算法应用领域广泛,例如,王德民将应用遗传算法优化BP神经网络对风电功率进行预测[17];可华明利用遗传算法优化的BP神经网络对遥感图像进行了分类[18];汤井田应用该算法对异丙酚血药浓度进行了预测[19],均取得了较好的效果。

以文献[2]、[4]、[5]、[15]中所测得的大量实验数据作为参考,选取其中30个典型矿样的突水水样指标测试值作为训练样本,10个作为待预测样本,如表1所示。遗传算法优化BP神经网络的各项参数设定如表4所示,根据评价因子和预测结果确定其节点为6、输出节点为1,其隐节点根据经验公式(m=2n+1),预测的结果并没有满足要求,继续根据m值上限浮动选优,最终得到隐节点为6,训练步数和变异、交叉根据经验试验得出。

表4 遗传算法参数设置Table 4 Genetic algorithm parameter settings

将样本和各参数输入到MATBLE程序中运行,得出最佳权值和阀值分别为0.877和21,将该权值和阀值赋值给BP神经网络后。对样本序号1~30号样本进行训练拟合,并对待预测样本进行预测,判别分析结果如表5所示(括号内为GA-BP的预测结果)。可见,40*号样本的预测值和实际值的误差达到20.6%,与实际相差较大;测试样本33*、34*、36*、37*、39*的预测误差都在1%以下,整体样本预测平均正确率达到94.27%。为验证优化后结果的优越性,利用GA-BP判别模型对指标优化之前的相同样本进行预测,结果见表5,预测平均正确率仅为44.73%。这充分表明利用该指标体系的优越性和GA-BP分析模型对矿井突水水源划分的适用性。

表5 判别分析结果Table 5 The results of discriminant analysis

3 结论

利用嵌入梯度的支持向量机方法对国内某矿井突水水源判别的指标评系进行了优化,根据各指标的梯度重要度大小和对不同体系下预测矿井突水水源正确率的比较,对[SO4]2-、K+、Mg2+、Na+、Ca2+、Cl-、[HCO3]-、F-等8项水化学成分进行约简,最终选择K+、Mg2+、Ca2+、Cl-、[HCO3]-、F-等6项离子含量作为突水水源的判别因子。

选用遗传算法优化BP神经网络对新指标指体系下的河南焦作矿区的30个突水水源离子测试数据进行训练,并对10个待测样本进行判别,预测正确率达到了94.27%。这表明新的指标体系应用于矿井突水水源识别判定是合理、有效的,同时也验证了GA-BP在矿井突水水源预测领域的适用性,为矿井突水水源识别提供了一条新途径。

[1]鲁金涛,李夕兵,宫凤强.基于主成分分析与Fisher判别分析法的矿井突水水源识别方法[J].中国安全科学学报,2012,22(7):109-115.

[2]李明山.等效数值法在矿井突水水源判别中的应用[J].矿业安全与环保,1998(4):35-38.

[3]余克林,杨永生,章臣平.模糊综合评判法在判别矿井突水水源中的应用[J].金属矿山,2007(3):47-50.

[4]洪雷,彭华,燕文,等.最大效果测度值法研究矿井突水水源[J].中国煤田地质,2002,14(2):45-46,73.

[5]王心义,徐涛,黄 丹.距离判别法在相似矿区突水水源识别中的应用[J].煤炭学报,2011,36(8):1354-1358.

[6]王成武.基于支持向量机的室内轰燃预测模型研究[J].中国安全科学学报,2011,21(4):45-52.

[7]师旭超,韩阳.煤与瓦斯突出预测的支持向量机(SVM)模型[J].中国安全科学学报,2009,19(7):26-32.

[8]舒彤,葛佳丽,陈 收.基于支持向量机的供应链风险评估研究[J].经济经纬,2014,31(1):130-135.

[9]赵吉文,汪娅骅,陈盼盼,等.组合核函数多支持向量机的直线电机建模[J].电机与控制学报,2014,18(2):90-95.

[10]黄东.基于模糊支持向量机的车辆碰撞信号检测[J].计算机仿真,2014,31(1):157-160.

[11]苏盈盈,刘兴华,李景哲,等.矿井通风系统指标体系的约简及其安全评价[J].中国安全科学学报,2013,23(9):83-89.

[12]Jiang Y,Yuan D,Xie S,et al.Groundwater quality and land use change in a typical karst agricultural region[J].Journal of Geographical Sciences,2006,16(4):405-414.

[13]姚银佩,李夕兵,宫凤强,等.加权距离判别分析法在岩体质量等级分类中的应用[J].岩石力学与工程学报,2010,29 (增刊2):4119-4122.

[14]王敏,张占松,胡松.基于主成分分析的Fisher判别法在L地区水淹层识别中的应用[J].长江大学学报,2010,7(4):79-82.

[15]黄平华,陈建生.基于多元统计分析的矿井突水水源Fisher识别及混合模型[J].煤炭学报,2011,36(增刊1):131-137.

[16]曾孟佳,程兆麟.改进GA神经网络在可持续发展水平研究中的应用[J].系统工程理论与实践,2007,27(4):120-125.

[17]王德民.基于遗传算法优化BP神经网络的风电功率预测[J].电子设计工程,2013,21(22):95-98.

[18]可华明,陈朝镇,张新合,等.遗传算法优化的BP神经网络遥感图像分类研究[J].西南大学学报,2010,32(7):128-132.

[19]汤井田,曹扬,肖嘉莹,等.遗传算法优化BP神经网络的异丙酚血药浓度预测[J].科学技术与工程,2013,13(13): 3552-3558.

Improved SVM and GA-BP neural network model of mine water inrush sources identification

YANG Fuqiang,LIU Guangning,GUO Lele
(College of Environment and Resources,Fuzhou University,Fuzhou 350108,China)

Timely identification of water inrush is one of the most important jobs to prevent and control the mine water inrush disaster effectively.Based on the test samples with different water layers in Jiaozuo mine area,the embeded gradient Support Vector Machine(SVM)is used to rank eight kinds of water chemical compositions,including[SO4]2-,K+,Mg2+,Na+,Ca2+,Cl-,[HCO3]-,F-.The compositions of K+,Mg2+,Ca2+,Cl-,[HCO3]-,F-are selected as the main distinguishing factors of mine water inrush sources identification.Thirty groups of learning samples under the new system are carried out to train fitting by BP neural network genetic algorithm(GA-BP).The established analysis model is used to predict ten groups of water sources,and the average accuracy rate of forecast is 94.27%.The research result shows that the new index system is feasible in the mine water inrush identification,and the GA-BP model classification performance is effective with low misjudgment rate,which can be used for identification of mine water inrush water.

water inrush;source identification;SVM;GA-BP

TD74

Α

1671-4172(2015)01-0087-05

国家自然科学基金(51304051);福建省自然科学基金(2012J05088);福州大学科技发展基金(2013-XQ-18);福州大学科研启动基金(XRC-1174)

阳富强(1982-),男,副教授,博士,安全工程专业,主要从事矿山安全领域的教学与科研工作。

10.3969/j.issn.1671-4172.2015.01.020

猜你喜欢

突水水源遗传算法
保护水源
矿井突水水源的判别方法
峰峰矿区突水类型划分及突水模式
岩溶隧道突水灾害形成机制及风险评价研究进展
矿井水害发生机理及防治技术研究
南水源头清如许
基于遗传算法的智能交通灯控制研究
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
寻找水源
基于改进的遗传算法的模糊聚类算法