APP下载

基于深度神经网络的煤矿突水水源判别分析

2017-04-26曹超凡

无线互联科技 2017年6期
关键词:水化学突水贝叶斯

曹超凡

(西安建筑科技大学,陕西 西安 710055)

基于深度神经网络的煤矿突水水源判别分析

曹超凡

(西安建筑科技大学,陕西 西安 710055)

通过研究已有突水水源判别方法,发现其存在收敛速度慢和目标函数存在局部极小点的问题,导致判别准确率较低。为了提高突水水源判别的准确率,文章提出使用深度神经网络判别煤矿突水水源,选择突水水化学数据、矿化度、总硬度、碳酸硬度、非碳酸硬度、负硬度、总碱度和总酸度等指标属性作为判别因子,建立水源判别模型。通过对比实验,结果表明,DNN模型可以有效提高突水水源识别的准确率。

煤矿突水;水源判别;DNN

煤矿的突水灾害是仅次于瓦斯灾害的第二大灾害,给煤矿安全生产和煤矿工作者的生命带来了严重的威胁。突水事故发生时,及时判识突水水源,为突水事故的分析处理和水灾预防处理的决策提供技术支持。国内外学者针对突水水源判识提出了很多理论,从水化学特征分析,到聚类分析、灰色关联分析、贝叶斯判别法。通过分析已有方法和判识指标,针对其存在的问题,提出采用深度神经网络(Deep Neural Network,DNN)模型判识突水水源,并与已有方法作对比,验证模型的有效性。

1 水源判别方法

1.1 Piper三线图法

Piper 三线图是一种常用的水化学离子成分图示法,通过分析不同水源的水化学特判别水源,以3组阳离子Mg2+,Ca2+,Na++K+和3组阴离子SO42-,Cl-,HCO3-+CO3

2-作为分析指标,将6组离子每升毫克当量的百分比投影到Piper三线图上,确定各含水层的水质类型,然后取突水点的水样进行水质对比,突水点的水质与哪个含水层水质相近,即可判断为突水水源。此方法主要适用于水质差别较大的单层充水水源。

1.2 聚类分析法

聚类分析法聚类就是按照某个特定的标准把所选取的一定数量的样本数据分割成不同的类别组,利用代表点聚类(Clustering Using Representative,CURE)是一种新颖的层次聚类算法,将所有矿井突水层水样样本(包括标准数据样本和待检测样本)各自作为一类,并规定样本之间的距离和类与类之间的距离,然后将聚类最近的两个类合并成一个新的类,计算新类与其他类之间的距离,重复执行此操作,每次减少一个类,直到所有样本合并为n个类,n为水样类别总数。

1.3 灰色关联分析法

灰色关联分析方法是分析灰色系统中各个因素间关联程度的一种量化方法,它的基本思想是根据矿井水样样本(包括标准水样与待判水样)序列曲线几何形状的相似程度来判断待判水样与标准水样联系是否紧密,曲线越接近,相应序列之间的关联度就越大,反之就越小。

在灰色关联分析中,设Xi为系统因素,其在序号p上的观测数据为:

xi(p),p=1,2,…,n

则称Xi=(xi(1),xi(2),…,xi(n))为因素Xi的行为序列。其中p为指标序号,xi(p)为因素Xi关于第p个指标的观测数据。

1.4 贝叶斯判别方法

贝叶斯判别是用一个先验概率描述对研究对象已有的认知,然后通过样本数据修正先验概率,得到后验概率,并给予后验概率识别水源类别。对于识别6类水源的贝叶斯判别公式为:

其中,Gj是已知的6个水源类别;X是需要进行分类的待判突水水样;P(X|Gj)表示某一类Gj成立时待判水样X的概率;P(Gj)代表待判水样在判别之前拥有的初始概率,即Gj的先验概率,其计算方法如下:

由贝叶斯公式直接计算得到的结果P(Gj|X)就是突水待判水样属于某一类别的后验概率。

1.5 深度学习方法

深度学习(Deep Learning,DL)源自于人工神经网络的研究,是DNN等一系列机器学习方法的总称,例如,含有多个隐藏层的多层感知机,就是其较为简单的一种结构形式。最近几年,DL在NLP和语音识别等众多领域都取得了非常不错的突破。它有大规模的并行处理和分布式的信息存储能力,良好的自适应性、自组织性和很强的学习、联想、容错及抗干扰能力.在判别这类具有模糊性的问题上有明显的优势。

2 DNN在突水水源判别中的应用

2.1 DNN模型结构

深度神经网络一般由输入层、隐层和输出层组成。输入层神经元的个数为输入信号的维数,本文设置为22,隐藏层个数以及隐藏层节点的个数一般首先取经验值,然后通过实验确定最优参数,由于本文所处理的问题规模不是非常大,所以隐藏层不宜过深,优先考虑1~3个隐藏层的网络结构。隐层节点数确定的最基本原则是:大于1且小于样本数,隐藏层节点数过少时模型无法学习到有效特征,过大时容易过拟合,因此,在满足精度要求的前提下取尽可能紧凑的结构,即取尽可能少的隐层节点数。输出层神经元个数为输出信号的维数,本文的判别类型为6类,因此,对输出做one-hot编码后的输出维数是6,最后将输出向量解码就可以获得对应的水源类别。

如图1所示,输入向量为X=(x1,x2,x3,…,x22),第一个隐藏层的向量值为Y1,第二个隐藏层的向量值为Y2,模型的输出为O。输入层与第一个隐藏层的权重矩阵为V,两个隐藏层之间的权重矩阵为W,第二个隐藏层与输出层之间的权重矩阵为U,则有:

公式中矩阵V大小为n×m,m为输入向量维数22,n为第一层隐藏层节点个数,矩阵W大小为k×n,k为第二个隐藏层节点数,矩阵U大小为l×k,l为输出层维数6。

隐藏层的激活函数f(x)选择ReLU(Rectified Linear Unit),ReLU是一个分段函数,能有效解决深度神经网络梯度消失问题。其函数表达式为:

2.2 煤矿突水水源判别因子

煤矿中各含水层由于其所处的地质环境不同,形成了各自不同的水化学特征,根据出水点的水化学特征分析结果可以初步判定突水水源。判定水源的过程中,评价指标的选择与含水层及评价的目的有密切的关系,一般选择含水层中的主要因素作为评价因子。

本文所研究的矿井突水水源主要分为6种,分别为:K2灰岩、奥灰水、采空区水、地表水、第四系、砂岩裂隙水。通过测量与分析煤矿突水含水层水样,综合考虑建立指标体系的科学性、系统性、可操作性、定性与定量相结合等原则,结合矿井水质的基本概念,在矿井水质中选择pH值、游离 CO2、钾离子、钠离子、钙离子、镁离子、三价铁、二价铁、铵离子、氯离子、硫酸根、碳酸根、碳酸氢根、硝酸根、亚硝酸根、矿化度(Z1)、总硬度(Z2)、碳酸硬度(Z3)、非碳酸硬度(Z4)、负硬度(Z5)、总碱度(Z6)、总酸度(Z7)等22个评价因素作为分类标示指标,单位均为mg/ L,总共分为6种类别(T),1代表K2灰岩水,2代表奥灰水,3代表采空区水,4代表地表水,5代表第四系水,6代表砂岩裂隙水,判别突水水源类型效果良好,部分数据如表1—2所示。

2.3 DNN突水水源判别模型的应用于评价

本文采用62条样本数据作为训练集,每条输入数据包含22维,对20条待判样本数据进行分析,判定每一个水样所属的水源类型。

本文采用权重初始化采用MSRA方法,隐藏层激活函数选取ReLU函数,输出层激活函数选择Softmax,由于是二分类算法,选择交叉熵损失函数categorical_crossentropy,即logloss。DropOut可以有效防止模型过拟合,提升模型性能,一般设置为0.5,训练算法采用目前最好的Adam算法。batch_size选择12,隐藏层节点数为32。

图1 双隐藏层的DNN模型

表1 部分数据

表2 部分数据

图2 模型训练精度和损失变化

本文构建了双隐藏层的DNN网络用于处理突水水源判识问题,模型精度明显高于聚类分析和灰色关联分析以及Bayes方法,判识结果如表3所示,且DNN的预测精度会随着训练样本的增加而提高。

表3 实验结果精度对比

3 结语

本文首先总结并分析了常用的水源判别方法,针对已有方法存在的缺点,提出采用DNN模型判别突水水源,选择水化学指标、pH值等22项指标作为模型输入,使用62个样本数据训练模型,20个样本做测试集,并与聚类分析、灰色关联分析和贝叶斯模型的分类精度作对比,验证了DNN模型在突水水源识别上的准确性。

[1]HINTON G E, OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets[J]. Neural Computation, 2006(7):1527-1554.

[2]NAIR V, HINTON G E.Rectified linear units improve restricted boltzmann machines[C].International Conference on Machine Learning, 2010:807-814.

[3]李燕,徐志敏,刘勇.矿井突水水源判别方法概述[J].煤炭技术,2010(11):87-89.

[4]卫文学,卢新明,施龙青.矿井出水点多水源判别方法[J].煤炭学报,2010(5):811-815.

[5]朱衍利,石磊,李万业,等.水化学特征分析法在突水水源判别中的应用[J].山东煤炭科技,2010(1):189-190.

Source Identification of coal mine water inrush based on deep neural network

Cao Chaofan
(Xi’an University of Architecture and Technology, Xi’an 710055, China)

By studying the existing method of water inrush, it is found that there is a problem that the convergence rate is slow and the local function has a local minimum point, resulting in a lower accuracy. In order to improve the accuracy of water source identification, the paper proposes to use the Deep Neural Network (DNN) to determine the water inrush from coal mine. The water source identification model is established by using the index attributes such as chemical data, salinity, total hardness, carbonic acid hardness, non-carbonic acid hardness, negative hardness, total alkalinity and total acidity as the discriminant factors. Through the comparison experiment, the results show that DNN model can effectively improve the accuracy of waterfront identification.

coal mine water inrush; water source identification; DNN

曹超凡(1992— ),男,陕西西安。

猜你喜欢

水化学突水贝叶斯
矿井突水水源的判别方法
矿井滞后突水机理探讨
秦皇岛北部地表水和地下水水化学特征及水质评价
贝叶斯公式及其应用
李雅庄矿滞后突水主控因素分析
基于贝叶斯估计的轨道占用识别方法
衡水市新近系馆陶组地热水水化学特征与分布规律研究
一种基于贝叶斯压缩感知的说话人识别方法
大相岭隧道高压突水机理与预测分析
筠连煤层气井产出水化学特征及意义