基于深度学习方法的矿山微震信号分类识别研究
2022-01-11赵洪宝刘瑞刘一洪张一潇顾涛
赵洪宝刘瑞刘一洪张一潇顾涛
1. 中国矿业大学(北京)能源与矿业学院,北京 100083;
2. 河北省物联网监控工程技术研究中心,河北廊坊 065201
近年来,微震监测系统作为一种岩石状态监测手段,已广泛应用于矿山监测中[1-5]。微震信号的高精度识别对于提高检测系统可靠性,预测灾害发生具有重要的意义。但现存的矿山微震信号的识别方法精度和效率较低,因此需要开发新的识别方法进行识别。微震信号为一系列非线性随机信号,相对于其他信号较为复杂[6-7]。同时,矿山生产过程中还存在大量背景或者人为干扰信号,这些干扰信号对矿山微震信号的准确识别造成了困难[8-9]。国内外学者对微震信号识别开展了广泛研究,并取得了丰硕成果。赵国彦等[10-11]提出一种基于希尔伯特黄变换和分形维数相结合的识别方法;尚雪义等[12]将支持向量机与希尔伯特黄变换相结合,实现了机器学习方法与传统方法的结合;董陇军等[13]对波形参数进行扩充,将Fisher 判别法进行改进,提高了识别精度;Zhang 等[14]融合决策树与VMD,为矿山微震信号识别模型的构建提供了一种新思路;朱权洁等[15]采用分形维数与小波包变换结合的方法,并用支持向量机(SVM)的方法对矿山微震信号进行了分类识别;Bi 等[16]基于DCNN 和SVM 相耦合进行了矿山微震信号进行识别。目前上述方法已运用在机器学习领域中,但是未能深入到深度学习领域当中。
王国法等[17]认为,矿山领域中的深度学习是将来研究发展的重点。而目前存在的大量方法均为机器学习,无法深入到深度学习,因此开发深度学习识别模式非常有必要。同时,特征深度学习区别于机器学习,关键因素是机器是否自动提取[18]。因此需要研究开发新的深度学习网络识别方法,以实现矿山生产过程中信号特征的自动提取和信号种类的自动识别。
卷积是深度学习中一种常用的计算方法,最先应用于信号处理识别方向。在深度学习卷积神经网络(Convolutional Neural Networks,CNN)中存在卷积和池化两种计算方法,可以对波形整体的信号进行把握,适合大量计算且具有较高的鲁棒性[19]。故本文提出一种采用深度学习卷积神经网络对微震信号识别的模型,即VGG4-CNN 模型。
1 矿山微震信号时域特点
目前针对矿山微震信号的识别方法主要分为两类,一类为时域识别,另一类为频域识别。时域识别主要依靠信号在波形上的一些特征进行识别,该特征主要包括尾波发育特征、分形维数特征、峰值特征等。依据时域特征,可以将矿山微震信号主要分为随机干扰信号(A)、规则干扰信号(B)和难识别信号(C)三类[15]。在数据方面,本文选取在矿山生产过程中具有代表性的9 类信号进行识别,9 类信号包括铲煤、背景、爆破、锄煤、破裂、喊话、矿车、敲击、镐刨,其波形图像如图1 所示。
如图1 所示,对尾波衰减特征而言,岩石破裂信号、敲击信号和爆破信号的波形较为相似,其峰值会突然出现并存在衰减,在该过程中拥有相似的波形;手镐刨煤作业、锄头刨煤和铲子铲煤三类信号,波形均具有瞬时性且尾波发育较少;人员喊话是由于某一时刻的突发性事件而造成的震动,因而尾波较少。对于波形分形而言,背景噪声所呈现的微震信号的波形图像为杂乱和无序;敲击信号与爆破信号呈现出一定周期;镐煤、锄煤和铲煤等人为干扰信号无任何周期性。在峰值方面,爆破峰值最高,喊话与破裂信号峰值较为相近,由人员作业引起的微震信号峰值较小。
图1 各类矿山微震信号波形Fig.1 Waveforms of microseismic signals of various types of mines
可见,从单一特征进行多类信号识别较为困难,因此开发更为细致和精确的多类型波形信号识别方法尤为关键。
2 微震信号识别方法
深度学习神经网络在近些年被广泛应用于分类识别任务中,具有较强鲁棒性。本文采用深度学习神经网络模型对矿山微震信号进行识别,进而提高微震信号的识别精度与速度,实现多类识别。深度学习神经网络主要由数据预处理、主干神经网络和损失函数三部分构成[18]。数据预处理包括数据收集、数据标注和数据集构建;主干神经网络是深度学习神经网络模型核心,需要依据需求进行设计;损失函数则是控制主干神经网络学习路径和学习结果的一种方法。
2.1 微震信号数据预处理
数据预处理需要先对数据进行收集,再对数据进行标注和数据集构建。在数据收集和数据标注方面,本文以山西某矿的矿山微震信号为数据基础,由人员在现场跟进并记录发生事件和时间,实现对数据的标注。在数据集构建方面,采用K 折交叉验证方法(K-fold Cross Validation)将整体数据分为三类集合(学习集、交叉验证集、测试集[21])。神经网络通过对学习集进行学习,不断通过交叉验证集对训练过程进行修正和对已有的学习过程进行测试,最终通过测试集进行性能测试与评价。在K 折交叉验证方法中,学习集与测试集按一定数值进行划分,该比例值被称为K值。在一般计算中K值取5,本文同样取5。K 折交叉验证流程如图2 所示。
图2 神经网络数据流程示意图Fig.2 Schematic diagram of the neural network data flow
2.2 识别模型的数学表达
深度神经网络的学习过程,本质上是通过数据集和损失函数对主干神经网络中参数进行求解的过程。同时,深度学习神经网络在进行分类时,同样依靠主干神经网络,将微震信号从一种较复杂的高维空间表达方式转换为容易的低维空间表达方式,进而实现区分不同类别。主干神经网络的运算方法一般为卷积运算。结合离散卷积性质可知,第i层主干神经网络的卷积信号可以表达如下:
式中,i为卷积层数;m为离散采样点数;Si(t)为经过i-1 层卷积核卷积后的信号特征;k为卷积核迭代次数;n为卷积步伐;(n-t)为第k次迭代后的第i-1 层卷积核;a、b为池化层尺寸;L为激活函数。
对于新构建的Si(t)信号特征,采用Softmax 损失函数进行分类和损失计算:
式中,j为Si(t)第j个数;为特征向量的第j个特征。
2.3 主干神经网络的建立
主干神经网络作为神经网络核心,是神经网络学习和识别的基础。VGG4-CNN 模型当中的主干神经网络结构参数如下:卷积层(C)3个,池化层(P)2 个,全连接层(F)1 个,Softmax层1 个。在数据输入C1层前,将数据由(1×10 000)的向量变换为(100×100)的矩阵进行预处理;第C1层采用(5×5)的卷积核进行16 次卷积,形成(16×100×100)张量。在C1层卷积结束以后,P1层对卷积生产的数据进行(2×2)池化,将大小(100×100)的数据格式转化为单个(50×50)的数据矩阵。C2卷积层对P1层每层数据进行32 次卷积,形成深度为256 的张量;同时C3层继续对C2层中的输出数据进行16 次卷积,最终得到(4 096×50×50)结构张量;在C2和C3卷积层中,卷积核大小为(3×3),步伐为(1×1)。为方便特征提取和减少计算量,在C3卷积层卷积后对产出数据进行池化,对(5×5)的P2池化层进行处理,形成(4 096×8×8)的池化张量;在池去化层P2结束以后,加入全连接层对P2层数据进行空间拓扑化。为提高整体神经网络预测效果,在全连接层结束后布置Softmax 层[14]。对于激活函数,本次神经网络均采用Relu 激活函数,分别存在于C1与P1、C2与C3、C3与P2层之间,总计3 次使用。主干神经网络结构如图3 所示。
图3 VGG4-CNN 神经网络示意图Fig.3 Schematic diagram of VGG4-CNN neural network
3 实例验证
为对本文提出的神经网络模型效果进行验证,采用数据集中的测试集对神经网络进行性能测试。在本次测试中,神经网络运行训练采用GPU 处理器,设备型号为:GeForce RTX 2060;最高线程7、最低线程5;计算最高频率1.2 GHz。设备性能属于中层次。此外,为防止出现过拟合状态,神经网络将设置随机失活参数(Droup Out)[12],参数设定见表1。
表1 神经网络训练各项参数Tab.1 Parameters of neural network training
为方便展示,将输出信号进行绘制,对9 种波形型号的预处理图像、VGG4-CNN 神经网络过程中卷积层和池化层进行可视化输出,其结果见表2。
表2 VGG4-CNN 神经网络对于不同种类信号各层输出情况Tab.2 VGG4-CNN neural network output for different types of signals
如表2 所示,因喊话、敲击、手镐刨煤三类信号在P2-1的输出较为相似,对P2-2特征层进行可视化表明差异性。P2-2特征层可视化图像见表3。
表3 三类矿山微震信号P2-2 特征层Tab.3 P2-2 layer characteristics of microseismic signals of three types of mines
由表2 和表3 可知:
(1) 在噪声的处理方面,除喊话以外,余下信号在通过C3层时,已经将噪声过滤,说明VGG4-CNN 神经网络具有一定的抗干扰性和滤波性。
(2) 在数据保真方面,数据C2层处理后,数据值发生变化,其中最明显的是喊话、矿车、敲击、镐煤事件等瞬发无尾波发育的信号,对峰值这一重要区分度的信息进行了保留。这表明在传递过程中卷积核和主干神经网络对信号中重点信息有着合理的把控。
(3) 在神经网络对各波形的差异把控方面,爆破信号P2-1输出特征值先小幅度上升(紫色变浅黄色)再大幅度上升(紫色变黄色);在敲击信号中,P2层体现了信号的后续震荡,但短于爆破信号,体现了神经网络对于波形整体的把控性。
(4) 在喊话、敲击、手镐刨煤三类事件中,P2-1层较为相似,而在P2-2层中表现出来一定的差异性。该状况符合神经网络学习过程,即多层神经网络层共同作用于信息,而非采用单一神经网络层进行作用。
4 训练及性能分析
为对本文提出的神经网络模型性能进行合理评价,将VGG4-CNN 模型的训练过程、特征提取效果、训练结果等进行纵向分析,并与LSTM-RNN、BP 和DCNN 识别方法进行比对和分析。
4.1 训练过程分析
训练过程中的损失和准确率是考察学习过程变化的重要指标。VGG4-CNN 在训练过程中损失和准确率变化情况如图4 所示。
图4 VGG4-CNN 训练过程中准确率和损失变化情况Fig.4 Accuracy and loss changes in VGG4-CNN training process
由图4 可知,在准确率方面,随着训练次数增加,出现逐渐上升趋势,上升速度逐渐下降,且靠近1 但永远小于1;在损失方面,损失逐渐降低收敛于0。在训练过程中,VGG4-CNN 模型的损失和准确率变化趋势符合神经网络训练的变化情况。
4.2 特征提取分析
特征可视化是检验神经网络的卷积特征提取层提取效果的一种方法。因神经网络提取后特征维度高于2 维,因此需要对其进行降维处理。t-SNE 是基于SNE 提出的,是一种流行非线性降维方法,可以将高维特征进行可视化降维,以观察神经网络模型特征提取效果。降维效果如图5 所示。
由图5 可知,各类微震信号出现了族群聚类效应;岩石破裂信号(绿色)族群明显远离其他信号族群,表明模型有效提取了岩石破裂信号时域特征;干扰信号主要集中在中部位置,说明了噪声信号的混杂性。
图5 各类信号经t-SNE 降维后的平面分布Fig.5 Plane distribution of various signals after dimensionality reduction by t-SNE
4.3 训练结果分析
训练结果分析是对神经网络性能的另一种重要评价方法。该方法在神经网络进行训练结束以后,采用全新数据进行预测分类,从而实现对神经网络性能的分析。对于训练结果存在着3 种重要的评价指标,分别为精准率、召回率、F1系数。VGG4-CNN 神经网络测试结果及耗时见表4。
表4 VGG4-CNN 神经网络对于各项数据识别结果及耗时Tab.4 Identification results and time consuming of VGG4-CNN neural network
由表4 可知,当有较大数据样本进行学习时,预测较为精准;当数据集较小时,可能会出现一定的偏差。
4.4 方法对比
对传统的BP 神经网络、LSTM 神经网络和DCNN 分类方法进行建模和分析,并与本文提出的模型进行对比,结果见表5 和图6。
表5 4 类神经网络耗时及准确率对比Tab.5 Comparison of time consumption and accuracy of four types neural networks
由表5 和图6 可知,传统的BP 和DCNN 两类神经网络在多分类任务方面出现了过拟合现象。DCNN 耗时过高,原因为该程序需要先对波形进行去噪、绘图再进行识别;VGG4-CNN 与LSTM-RNN因对数据直接进行分析省略了绘图步骤,降低了耗时,但VGG4-CNN 识别模型精度高于LSTM-RNN模型。
图6 4 种神经网络训练过程损失及准确率对比Fig.6 Comparison of loss and accuracy of 4 types neural network training process
训练结果显示,DCNN 未能有效区分爆破作业、敲击、手镐刨煤和锄头刨煤信号,其原因为它们的波形结构较为相似。除此之外,VGG4-CNN 神经网络在训练上耗时较大,存储空间大约为2.29 GB,占用内存较大。
5 结 论
(1) 本文提出的VGG4-CNN 深度学习神经网络在对矿山微震信号识别时,正确率为94% ,且响应时间短、正确率高、鲁棒性强,具有一定的优越性。
(2) VGG4-CNN 神经网络对于噪声具有一定的过滤效果,在采用神经网络进行识别时,可以适当放弃去噪过程以加速学习。
(3) 构建的VGG4-CNN 神经网络,虽然对单个识别耗时较少,但是在训练上存储空间占用较大,约为2.29 GB。减少训练时间和存储空间为下一步研究方向。