APP下载

基于多输入卷积神经网络的天然地震和爆破事件识别

2022-05-05田宵汪明军张雄王向腾盛书中吕坚

地球物理学报 2022年5期
关键词:时频台站识别率

田宵, 汪明军, 张雄, 王向腾, 盛书中, 吕坚

1 东华理工大学地球物理与测控技术学院, 南昌 330013 2 江西省地震局, 南昌 330039

0 引言

近年来,由人类活动引起的人工爆破的频度逐年增加.例如,用于工业生产的化学爆破(Ma et al., 2021), 2006年至2017年六次朝鲜地下核试验 (谢小碧和赵连锋, 2018) 和事故性爆炸如2015年天津爆炸、2019年江苏响水爆炸(江文彬等,2020)和2020年黎巴嫩爆炸等.如果不能及时地进行识别分类,人工爆破事件可能被误认为天然地震,从而增加地震的误触发率,影响地震预警、地震速报以及地震应急的时效性和准确性(和雪松等,2006;Astiz et al., 2014).因此,发展天然地震与爆破事件的自动识别方法对安全生产以及国家防震减灾事业具有重要意义.

天然地震与人工爆破的震源性质不同,天然地震多发生在地壳深部,震源为非对称剪切源;而人工爆破多发生在浅层地表附近,为对称膨胀源(黄汉明等,2010).然而,天然地震和爆破事件引起的地面震动,在台站记录上均显示为波动的曲线,需要一定的经验才能将其区分开来.一直以来,地震台网的工作人员主要是手动识别天然地震和爆破事件,手动识别事件性质不仅需要持续的观测和分析,识别效率较低,而且要求地震工作者具有丰富的经验,否则容易造成事件性质判断不准确,混淆地震目录,对后续的科研和防震减灾工作造成较大的影响.

早在20世纪50年代初,国内外很多地震学家便开始对天然地震和人工爆破的识别进行了广泛的研究.经过近五十年的研究积累,地震学家基于地震波的辐射图形、地震波谱分析和震相特征提出了多种识别天然地震和人工爆破的判断依据,主要包括P波初动符号(王婷婷和边银菊,2011;刘莎等,2012)、振幅比值(边银菊等,2010;Yavuz et al., 2019;Koper et al., 2016)、频谱分布范围(Kiszely,2001;Kekovalet al., 2012;靳玉贞等,2015)等分析方法.另外,小波算法、遗传算法等也被广泛用于天然地震和人工爆破事件的识别中.例如,和雪松等(2006)利用小波包识别天然地震和矿震,通过小波包对信号进行变换,并利用奇异值分解提取不同的信号特征,从而进行分类.黄汉明等(2010)利用波形记录的小波特征对天然地震和人工爆破事件进行识别;Beccar-Varela等(2016)运用小波分析对采矿爆破监测的地震波形与该区域的天然地震进行识别.Orlic和Loncaric等(2010)利用遗传算法进行天然地震和爆破事件识别,分类精度为85%.这些方法在一定程度上能够作为区分爆破事件和天然地震的依据,但大多数方法局限于使用单一的输入参数,不仅识别速度较慢,而且准确率相对较低.

近年来,随着计算机领域人工智能的发展,深度学习相关技术在计算机视觉、自然语言处理等多个领域取得了巨大的成功(Hinton et al., 2012).深度学习算法也被广泛地应用在地震学领域,包括地震信号的检测与拾取(Zhu and Beroza, 2019;于子叶等,2018;赵明等,2019; Duan and Zhang, 2020;Zheng et al., 2020; Wong et al., 2021; Zhou et al., 2021)、震源定位(Perol et al., 2018; Zhang et al., 2020)等.人工智能的发展也为天然地震和爆破事件的自动识别提供了新的研究思路.王军(2018)利用支持向量机对上海周边区域的天然地震和人工爆破进行识别,识别精度高达85%.陈润航等(2018)利用梅尔频率倒谱系数图作为样本,利用卷积神经网络进行天然地震和爆破事件分类,正确识别率约为97.1%; 任涛等(2019)利用Bagging机器学习算法对天然地震和非天然地震的事件性质进行区分,测试数据的准确度可达85%以上.Linville等(2019)分别使用卷积神经网络和递归神经网络对美国犹他州近五年的采石场爆破事件和天然地震事件识别,使用时频图作为输入数据的准确度高达98%.隗永刚等(2019)利用残差网络模型对河北三河采石场的爆破事件和天然地震进行分类.Kim等(2020)使用波形信息作为输入样本,并利用支持向量机进行爆破和天然地震事件识别.毛世榕等(2020)结合RBF 神经网络技术,利用天然地震震源和人工爆破震源之间信号能量分布的差异进行分类,识别率高达88.1%.

卷积神经网络(Convolutional Neural Network,简称CNN)是一种非常著名的深度学习方法,具有强大的图像识别能力(Krizhevsky et al., 2012).相比于传统的天然地震和爆破事件检测方法,CNN不需要提前给出定性化的指标或特征,而是通过大量已标定事件性质样本的训练,使计算机从输入的样本中自动学习爆破和天然地震特征,从而实现对新的输入样本进行预测.目前,已有的基于深度学习的事件属性识别网络大都采用单一的样本信息,即输入样本多为单个台站记录的波形(Kim et al., 2020)或时频数据(Linville et al., 2019).Tian等(2020)利用多道数据的P波初至信息进行地面微地震极性预测,相比单道数据精度显著增加.因此,我们提出使用混合数据作为训练样本的多输入卷积神经网络模型.混合样本包括单道波形的时频数据和同一事件多个台站的波形记录,使神经网络可以学习到天然地震和爆破事件的时频、波形和极性特征.本文的研究数据为犹他州的天然地震和采石场爆炸事件,先使用2012年的数据作为样本训练网络模型,然后将该区域2013—2016年的监测数据用于网络模型验证.

1 数据处理

1.1 数据收集和预处理

以美国犹他州及其周边地区为研究区域(114°W—109°W,37°N—42°N),本文根据Linville等(2019)提供的地震目录,从IRIS上下载了2012—2016年犹他州大学地震台站(University of Utah Seismograph Stations,简称UUSS)记录的1471个局部的天然地震事件(Local earthquake,简称le)和1426个采石场爆破(Quarry blast,简称qb)事件.震级范围为ML-0.8~3.7,震中距范围为0.1~432 km,信噪比范围为0.2~6.研究区域有167个监测台站,最后得到11756个天然地震震相和11714个爆破事件震相.图1为研究区域的地震台站、天然地震和爆破事件的分布图.其中,三角形为台站,红色点为爆破事件,蓝色点为天然地震事件.利用地震目录中拾取的P波到时,截取P波到时的前10 s和后70 s的波形为研究数据.首先对原始波形进行100 Hz重采样、去仪器响应和均值倾向,然后对数据进行1~20 Hz带通滤波.

图1 台站(黑色三角形)、天然地震(蓝色点)与 爆破事件(红色点)分布Fig.1 Map of stations (black triangles), earthquakes (blue dots), and quarry blasts (red dots)

1.2 数据特征

由于震源性质不同,时域波形和频谱是常用的区分天然地震和爆破事件的有效工具.考虑到频域分析只适用于稳态数据,不能反映频率随时间的变化.而地震数据属于非稳态数据,因此时频分析能够更好地分析地震信号的时频特性.Linville等(2019)利用时频数据作为输入样本进行爆破事件和天然地震事件识别.根据地震目录中给出的标定结果,图2画出了一个天然地震事件的波形数据和时频图,波形数据长度为80s,每个台站的波形均归一化到[0,1]区间.时频图的横坐标是时间,纵坐标为频率,时频数据也归一化到[0,1]区间.

波形图和时频图包含了天然地震和爆破事件的震相能量、频率分布等绝大多数信息,但是P波初至极性特征(爆破事件的P波初动方向一般向上,而天然地震的P波初动方向为四象限分布)很难在单台站记录中体现.例如,当单台的P波初至向上时,无法通过极性判断天然地震还是爆破事件.本文提出采用多台站波形作为输入样本,不仅有助于神经网络学习到天然地震和爆破事件的极性特征,相邻台站的记录组合更有利于特征提取.图3给出了2012—2016年的天然地震和爆破事件的台站记录个数直方图.据统计,接近90%的事件同时被4个以上的台站记录到.因此,本文采用某台站和其相邻的三个台站的波形作为输入样本,如图4所示.测试结果表明,多台站波形只使用30s的波形数据便可以得到较好的精度,同时可缩短训练时间.

波形数据、时频数据和多台站波形数据均可作为训练样本,并采用相同的标签:天然地震样本标定为0,爆破事件样本标定为1.本文采用UUSS在2012年记录的数据进行模型训练,共有5529个天然地震震相和4358个爆破事件震相.将所有样本分为训练集和测试集,其中训练样本集和测试样本集分别占3/4和1/4,两个样本集的样本互不重叠.

图2 天然地震的(a)波形图和(b)时频图Fig.2 The waveform (a) and spectrogram (b) of an earthquake

图3 天然地震和爆破事件的记录台站数直方图Fig.3 Histogram of the number of recorded stations for natural earthquakes and quarry blasts

2 方法

CNN是一类包含卷积计算且具有深度结构的前馈神经网络.CNN每个卷积层由一组滤波器组成,这些滤波器对前一层的输出结果进行卷积计算,以此来提取数据集的属性特征从而用于天然地震和爆破事件识别.一般通过优化学习过程和网络结构,微调整个网络的权重和偏差可以最大限度地提取这些特征.本文基于Keras平台分别设计了单输入CNN模型和多输入CNN模型进行天然地震和爆破事件分类.

图4 天然地震和爆破事件的多台波形数据Fig.4 Multi-waveforms of earthquake and quarry blast

2.1 单输入卷积神经网络

CNN的输入层可以处理多维数据,可以是一维数组,也可以是二维或三维数组.根据单道波形、时频图和多道波形数组维度的区别,可分为以下三种CNN模型:

(1)基于波形的单输入CNN模型(简称CNN-waveform):截取80s的波形记录作为输入样本,大小为1×8000的向量,其中1代表道数,8000为时间域采样点的个数.

(2)基于时频的单输入CNN模型(简称CNN-spectrogram):对波形数据进行短时傅里叶变换,得到的时频信息作为输入样本,大小为39×48.其中39为采样时间个数,48为采样频率个数.

(3)基于多道波形的单输入CNN模型(简称CNN-multi-waveform)利用同一事件在多个台站的波形记录作为输入层,大小为4×3000,其中4个台站个数,3000为时间域采样点的个数.

输入样本经过若干个相互交替的卷积层、池化层提取极性特征后,再经过一个或一个以上的全连接层,最后由Softmax分类器输出两个值,分别对应输入样本为天然地震和爆破事件的概率值,其中最大概率值所对应的类别即为该网络的预测结果.分类问题一般采用交叉熵损失函数来优化网络参数,交叉熵通常用于衡量输入(真实)概率分布p和预测概率分布q之间的差异:

(1)

公式(1)中,N是训练数据集的大小.损失函数可使用随机梯度下降算法迭代求解,每次迭代后,卷积核和权重将会被更新.在训练过程中,损失值(‘loss’)和准确度(‘accuracy’)为判断CNN模型的性能指标.

图5 多输入卷积神经网络框架示意图. 该模型 具有两个输入分支,最终合并产生一个输出Fig.5 Diagrammatic sketch of the multi-input convolutional neural network. This model has two input branches that ultimately merge and produce one output

2.2 多输入卷积神经网络

以上三种单输入CNN模型不能够同时利用波形和频率信息.多输入CNN利用Keras的函数式API构建,网络框架示意图如图5所示.经过测试,采用时频数据和多道波形作为神经网络的输入得到的模型精度较高.因此,多输入CNN包括时频和多道波形两个输入分支,先各自经过卷积层、池化层、激活函数、全连接层的处理,分别提取天然地震和爆破事件的时频特征和波形特征,然后进行模型融合,再通过一个或一个以上的全连接层,最后由Softmax分类器输出为天然地震和爆破事件的概率.

3 结果

3.1 训练过程

利用美国犹他州2012年监测数据分别训练三个单输入CNN模型和一个多输入CNN模型.在喂入神经网络前,所有输入样本均进行归一化处理.四种网络模型均使用四组卷积层,每组卷积层包含卷积层,最大池化层和Dropout层.其中卷积操作通过ReLu激活函数实现从输入数据中提取特征.在卷积层之后紧跟着是最大池化层,主要功能为降维、对特征进行压缩、简化网络复杂度等.Dropout层是指按照一定概率将神经元从网络中丢弃,从而降低模型的过拟合风险.CNN的最后一层是全连接层,用于连接所有的输出,并用Softmax激活函数计算分类概率.基于波形的CNN网络在全连接层加入L2正则化以减小过拟合问题.三个单输入CNN模型的网络结构参数如表1、表2和表3所示.多输入CNN的两个分支仍采用表2和表3的参数,只是在128通道的全连接层后进行模型融合,然后利用Softmax实现分类.所有的CNN网络均采用随机梯度下降优化方法进行训练,学习率设定为0.01.基于波形数据的CNN模型的批量大小为8,迭代次数为200,另外三种CNN模型的批量大小为16,迭代次数为100.

表1 CNN-waveform网络参数Table 1 The architecture parameters of CNN-waveform

表2 CNN-spectrogram网络参数Table 2 The architecture parameters of CNN-spectrogram

表3 CNN-multi-waveform网络参数Table 3 The architecture parameters of CNN-multi-waveform

四个CNN模型训练都是在英伟达(NVlDIA)GTX1080图像处理单元上进行的.基于波形、时频和多道波形的CNN模型的训练时间分别为0.57、0.24和0.45 h,多输入CNN模型的训练时间为0.52 h.四个CNN模型的准确度-损失曲线如图6所示.经过多次迭代,训练集和测试集的准确度-损失曲线均得到收敛.四个模型的训练数据集准确度均接近99%.基于波形、时频和多道波形的CNN模型的测试集准确度分别为90.07%、94.13%和97.08%;基于时频和多道波形的多输入CNN模型的测试集准确度为97.41%.

图6 四种网络训练过程的准确度和损失曲线Fig.6 The training accuracy and cross-entropy loss function curves for four CNNs

3.2 卷积神经网络和支持向量机对比

支持向量机(Support Vector Machine, SVM)是机器学习领域中常见的分类算法,也被广泛用于爆破事件和天然地震识别.相比于SVM,CNN的优势在于能够直接从已标定样本中自动学习特征,不需要提前提取爆破事件和天然地震的数据特征.表4分别对比了卷积神经网络和支持向量机基于波形、时频和多道波形数据作为训练样本的测试集准确度.结果表明,当SVM直接采用波形数据(单道波形或多道波形)作为样本特征时,SVM的准确度远远低于CNN.而当SVM使用时频数据作为训练样本时,即采用频谱作为数据特征,此时的测试集准确度高达90%,但仍低于CNN模型的准确度(94%).由此可以看出,CNN在没有预先提取数据特征的情况下,具有较高的准确度.

表4 卷积神经网络和支持向量机的测试集准确度对比Table 4 Comparison of test accuracy between CNN and SVM

3.3 犹他州2013—2016年的数据验证

将训练好的四个CNN模型对犹他州2013—2016年发生的天然地震和爆破事件进行分类.本文选用的事件分为:2013年的217个天然地震、2014年544个天然地震、2013年283个爆破事件、2014年158个爆破事件、2015年224个爆破事件以及2016年363个爆破事件.首先,对预测数据集进行数据预处理,分别产生波形数据、时频数据和多道波形数据.然后,根据预测结果与地震目录中标签的差异评价网络模型的准确度.

首先,以每个测试样本(台站记录)识别的正确率作为衡量标准,简称为基于台站的识别率.图7和表5为基于波形、时频以及多道波形样本的单输入CNN模型以及多输入CNN模型对犹他州2013—2016年记录数据的预测结果与地震目录标签的差异.对比不同的CNN模型可以发现,基于波形的CNN模型的识别率最低,而基于多道波形数据的CNN模型的识别率在大多数情况下优于基于时频数据的CNN模型.此外,对比图7的三角形和正方形线段,可以发现采用时频数据和多道波形数据作为训练样本时,能够有效提高爆破事件的识别率.从数据类型上来看,天然地震(le2013,le2014)的识别率要普遍高于爆破事件(qb2013,qb2014,qb2015,qb2016).

图7 基于台站的识别率对比Fig.7 Comparison of station-based discrimination rate

表5 基于台站的识别率对比Table 5 The comparison of discrimination accuracy based on station records

然后,以每个事件被识别的正确率作为衡量标准,简称为基于事件的识别率.图8为基于波形(图8a)、时频(图8b)、多道波形的单输入CNN模型(图8c)以及多输入CNN模型(图8d)对犹他州2013—2016年记录事件的识别率.图8中的横坐标为事件被所记录台站识别的正确率,0代表所有台站记录均识别错误,1代表所有台站记录均识别正确.从图8中能够明显看出,采用多道波形作为输入样本(图8c和图8d),事件的台站识别率得到了大幅度的增加.表6和表7分别给出了四种网络基于50%记录被正确判别的识别率和基于90%记录被正确判别的识别率.通过对比基于50%记录被正确判别的识别率可以发现,使用多道波形数据样本并没有优势,但是基于90%的台站记录的识别率得到了很大的提高.结合图8分析可知,利用多道波形数据作为输入样本,使CNN能够结合多个台站记录一起判断事件属性,提高识别率.

图8 基于事件的识别率对比 (a) 基于波形样本的CNN; (b) 基于时频样本的CNN; (c) 基于多道波形样本的CNN; (d) 基于时频数据和多道波形数据的多输入CNN.Fig.8 Comparison of event-based discrimination rate (a) CNN-waveform; (b) CNN-spectrogram; (c) CNN-multi-waveform; (d) CNN-mixed.

表6 4种网络基于事件的50%识别率对比Table 6 Comparison of the four networks with 50% event-based discrimination accuracy

表7 4种网络基于事件的90%识别率对比Table 7 Comparison of the four networks with 90% event-based discrimination accuracy

最后,分析了事件的震级和信噪比对多输入CNN模型的准确度的影响.图9a为波形信噪比与识别准确度的关系,可以看出当信噪比较低时(0.2~0.6),多输入CNN模型的准确度只有72%.随着信噪比的增加,准确度逐渐增加到90%左右,当信噪比大于1时,准确度趋于稳定.由此可以看出,多输入CNN模型具有较强的抗噪能力.图9b为不同的震级对应的事件100%识别率,图中可以明显看出,随着震级的增加,地震事件和爆破事件的识别率线性增加,当震级大于2时,识别率基本上稳定在74%左右.卷积神经网络是基于数据驱动的算法,样本标签的准确度会直接影响模型的检测能力.当数据信噪比较低、震级较小时,人工给定的数据标签的正确率也会降低,从而导致事件误识别率增加.

图9 波形数据的信噪比(a)和事件震级(b)对多输入CNN模型准确度的影响 Fig.9 The effect of the signal-to-noise ratio (a) and event magnitude (b) of the recorded data on the discrimination accuracy of the multi-input CNN

4 结论

本文将卷积神经网络算法应用到美国犹他州的天然地震和爆破事件识别中.不同于传统的机器学习算法,卷积神经网络不需要手动提取特征数据,而是直接从输入样本中自动提取天然地震和爆破事件的特征.因此,输入样本所包含的特征信息对卷积神经网络算法至关重要.通过比较天然地震和爆破事件属性识别的四种CNN分类网络:基于波形、时频数据、多道波形的单输入网络和基于时频数据和多道波形的多输入网络,我们发现以时频数据作为训练样本的单输入CNN模型精度远高于以波形数据为样本的模型.多输入CNN模型不仅能够学习到波形、时频和极性信息,还可以通过多台站的相互约束提高网络模型的精度.根据美国犹他州2012年已知事件属性标签的地震资料,对卷积神经网络进行训练,并将此模型应用于2013—2016年间的数据,验证了多输入CNN模型的有效性.

本文训练的多输入CNN模型的不足之处在于限制了事件的台站数,只有台站数大于等于4的事件才能够利用该模型进行属性识别.在实际应用中,可根据研究区域的台站分布训练出不同台站数的多输入CNN模型,当事件的台站数不满足模型要求时,可使用基于时频数据的单输入CNN模型进行预测.此外,文中训练的多输入CNN模型能够用于美国犹他州未来的天然地震和爆破事件识别,但对其泛化能力还有待测试研究.本文提出的基于时频数据和多道波形的多输入CNN网络算法对于其他区域的事件属性识别,包括天然地震、爆破和塌陷事件的分类具有一定的参考意义.

致谢感谢IRIS网站提供的地震数据(https:∥www.iris.edu)以及审稿人提出的宝贵意见.

猜你喜欢

时频台站识别率
中国科学院野外台站档案工作回顾
地震台站基础信息完善及应用分析
一种适用于高铁沿线的多台站快速地震预警方法
高聚焦时频分析算法研究
铁路无线电干扰监测和台站数据管理系统应用研究
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
基于稀疏时频分解的空中目标微动特征分析
提升高速公路MTC二次抓拍车牌识别率方案研究
高速公路机电日常维护中车牌识别率分析系统的应用