深度学习在地震定位中的应用综述
2023-02-13程先琼
谢 俊, 程先琼
(成都理工大学地球物理学院, 四川 成都 610059)
0 引言
近年来,地震、海啸等自然灾害的频发造成了严重的人员伤亡与经济损失,引起了人们对地震的广泛关注,对地震学的深入研究显得日益重要。快速且准确地实现地震事件的定位是地震预测的关键,震源位置的快速测定为地震灾害评估以及应急救援提供了极其关键的信息[1]。同时,高精度的震源位置信息对于判别发震断层,研究地震孕育以及触发过程都具有重要意义[2]。早期地震定位主要依赖人工分析,随着计算机技术和数字化台网的发展,现代地震学方法产生了巨大的进步,一系列算法能够有效地进行地震检测,实现地震事件的快速自动定位。随着人工智能的快速发展,其方法广泛应用到各个行业,促进了相关行业的快速发展,人工智能也应用到地震学领域中,促进了地震学的发展。人工智能的发展能够帮助研究人员更有效地提取地震波中的有效信息,使研究人员能够更关注于信息的分析与解释。以深度学习为代表的人工智能方法被运用到地震定位中,与传统方法相比,其定位速度与精度都有所提高。深度学习的概念源于人工神经网络的研究,含多隐藏层的多层感知器(Multi-layer Perceptron,MLP)就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示(属性类别或特征),以发现数据的分布式特征表示[3]。不管是中国地震局地球物理研究所与阿里云举办的“余震捕捉AI大赛”[4],还是华为在地震学方面的涉足,以及SEG会议有关“深度学习+地震学”论文数量的快速增加,都充分表明以深度学习为代表的人工智能在地震学领域的广泛研究与应用。
1 深度学习方法及基本流程
深度学习是机器学习的一个分支,可以划分为监督学习与无监督学习两个类别。监督学习是输入有标签的数据构建模型,来预测新数据的标签;无监督学习是在使用无标签数据的情况下发现数据集中隐藏的模式和结构。回归与分类是监督学习的两大主要领域,两者的区别在于:回归用于预测的输出是连续数值,设法预测连续值的属性;分类用于预测的输出是离散数值,设法预测离散值的属性。深度学习所得到的深度网络结构包含大量的单一元素(神经元),每个神经元与其他神经元相连接,神经元间的连接强度(权值)在学习过程中修改并决定网络的功能[5]。通过深度学习得到的深度网络结构符合神经网络的特征[6],深度神经网络是由多个单层非线性网络叠加而成的[7]。按照神经网络的编码与解码情况,可将其划分为3大类:前馈神经网络、反馈神经网络、双向神经网络。前馈神经网络由多个编码器叠加而成,模型的输入与输出之间没有反馈连接,参数从输入层向输出层单向传播,如多层感知机[8]、卷积神经网络[9]等。反馈神经网络由多个解码器叠加而成,每个神经元同时将自身的输出信号作为输入信号反馈给其他神经元,如反卷积网络[10]、层次稀疏编码网络[11]等。双向神经网络通过叠加多个编码器层和解码器层构成,如深度玻尔兹曼机[12]、栈式自编码器[13]等。
深度学习的方法众多,但在实际应用过程中的基本流程大致相同,可以总结为:收集数据,制作数据集;研究问题,构建模型;训练模型,优化参数。依据所研究的对象,收集获得的数据,对数据进行预处理,比较常见的数据处理方式有:向量化的处理、标准化的处理、缺失值的处理。数据集划分为:训练集、验证集、测试集,其中训练集用于训练模型,测试集衡量模型的优劣,验证集可以避免信息泄露,其作用是为了调整模型配置、优化参数。数据处理是深度学习最为重要的部分,数据的好坏对模型训练的优劣程度有重要影响。根据所研究的项目构建出合适的模型,具体为:定义网络结构、选择损失函数、选择优化器等。通过迭代训练模型,优化模型参数,使模型在训练集上表现更好,并让其具有良好的泛化能力,能够在从未见过的数据上达到准确预测的效果。
2 深度学习在地震定位中的应用
地震定位的主要任务是确定震源位置和发震时刻,这是地震学中一个最基本的问题。地震定位信息有助于人们对地球内部构造和地震震源过程及形成机制的研究[14],快速而准确的地震定位有利于提高地震预警系统的可靠性和稳定性,地震定位是实现地震预警的关键一环。早期的地震定位方法(几何作图法)主要是以走时方程为理论依据,根据台站位置及走时资料,通过作图确定震源位置,其精度较低[15]。数字化时代的到来,各种自动实现地震定位的方法孕育而生。
为了实现地震事件的自动定位,研究人员提出了多种方法。传统的定位主要是利用人工收集到的有限信息进行定位,定位方法有:基于走时的定位方法、波形的定位方法、单台站定位与多台站定位、相对定位与绝对定位等,包括走时反演[16-17]、网络搜索[18-19]、双差定位[20-23]以及波形匹配方法[24]等。基于走时拾取的方法非常稳定和高效,但对信噪比要求高。波形匹配方法能够得到更为精确的地震位置解,但会增加计算时间和工作量。数字台站的发展使获得大量数据成为可能,因此深度学习方法应用到了地震定位中。该技术耗时短、省人力,可智能化应用,在地震定位方面表现良好。
目前,在地震定位方面所运用的深度学习方法主要有以下几种。
2.1 卷积神经网络方法
卷积神经网络(Convolutional Neural Network,CNN)是一种较为常见的深度神经网络,因其具有稀疏交叉、权值共享和降采样的设计思想,减少了特征构建负担,提高了计算速度,在图像处理、语义理解和感知任务等领域得到广泛应用。利用CNN处理地震波形图时,能够自动提取波形特征,轻松处理大型地震数据集,因而广泛应用于地震检测、震相拾取、地震定位等地震学领域,能获得较好的地震检测与定位结果,更为重要的是其数据处理能力与传统地球物理方法相比有较大的提升。
Perol等[25]将地震检测作为监督分类问题,提出了一个用于地震检测与定位的卷积神经网络(ConvNetQuake),并运用该网络对美国俄克拉荷马州地区进行地震定位以及地震活动性研究。他使用K-means算法[26],将整个研究区域细分为6个小区域,用不同颜色的点表示各区域内的地震事件,其中彩色的点表示用于训练模型的地震数据,黑色的点表示用于测试模型的地震数据,OK029和OK027为地震台站,如图1所示。同时,Perol构建了一个层数较深的卷积神经网络,输入数据为三分量地震波形,经过卷积层和全连接层后输出聚类预测,如图2所示。为了评估该模型,使用俄克拉荷马州中部的诱发地震数据对模型进行测试,将预测结果与俄克拉荷马州地质调查局(OGS)记录的标准目录进行对比。结果表明:该模型的地震定位准确度达74.5%,且计算效率与前人的研究相比大幅提升,能够快速确定震源位置。这对于地震的早期预警很有用,但该方法需要大量的数据集对网络进行训练,因此不适用于低强度地震活动的地区。
图1 俄克拉何马州的地震与地震台站[25]Fig.1 Earthquakes and seismic stations in the region of Oklahoma[25]
图2 ConvNetQuake网络结构[25]Fig.2 ConvNetQuake structure[25]
Lomax等[27]通过改进ConvNetQuake,提出了一个新的方法ConvNetQuake_INGV。该方法能够自动检测与定位地震事件,其网络结构由1个输入层、9个卷积层和1个全连接层构成。与ConvNetQuake相比,ConvNetQuake_INGV多了1个卷积层,且输出的类别更多,对地震事件的分类更细,总共127个类别,如图3所示。该网络通过计算地震事件的震源深度、震中距和反方位角完成地震事件的定位任务。为了评估算法的性能,Lomax选取欧洲南部的MedNet地震台网于2009年记录到的部分地震事件对模型进行测试,结果显示模型检测的准确度达87%,但是对于震中距和反方位角的预测出现了较大的偏差,需要对其进一步优化处理。测试中使用的训练与测试数据都是来自同一地震台网,而使用单一台网收集到的数据容易出现过拟合的现象,导致模型的预测误差较大,使用不同地震台网记录的地震数据对模型进行训练与测试可能效果更好。
图3 ConvNetQuake_INGV结构[27]Fig.3 ConvNetQuake_INGV network structure[27]
在地震学中,相较于仅利用单台P波记录进行震中定位,多台站地震定位具备更高的精度[28],并且相对于传统地球物理方法,卷积神经网络在数据的预处理过程中不会出现数据信息丢失的情况。Kriegerowski等[29]直接使用多台站的三分量地震波形数据训练卷积神经网络,并应用于地震定位。为了评估该方法,Kriegerowski运用训练好的模型对波西米亚西部所记录的2 000多个地震事件进行定位,与使用双差定位法所得到的标准目录相比,卷积神经网络方法成功定位了其中908个地震事件,计算效率大幅提升。
2.2 PreSEIS方法
Bose等[30]开发了用于地震预警的新方法PreSEIS,并将其应用于伊斯坦布尔的地震预警。相较于前人的研究,PreSEIS在预测地震震级、地震破裂和震源位置方面取得了较大的成功。PreSEIS的网络结构是基于人工神经网络构建的,与传统方法相比,人工神经网络在处理非线性地震数据方面有着明显的优势。PreSEIS的结构是由1个输入层、1个隐藏层和1个输出层组成的两层前馈(Two-layer Feedforward,TLFF)神经网络,其中w为网络的权重参数,如图4所示。PreSEIS使用3个前馈神经网络完成了地震预警的工作,如图5所示。第1个前馈神经网络使用同一地震台网不同台站记录到的P波到时差预测震源的位置,不同台站记录的P波到时差用ΔTi表示:
ΔTi=Ti-Ti0
(1)
式中:Ti表示第i个台站接收到的P波到时;Ti0表示第1个台站接收到的P波到时。
图4 两层前馈(TLFF)神经网络结构[30]Fig.4 Structure of the TLFF neural network[30]
图5 预测震源参数的3个TLFF网络[30]Fig.5 Three TLFF networks for predicting seismic source parameters[30]
第2个网络利用震源位置以及绝对累积速度(Cumulative Absolute Velocity,CAV)预测地震震级,第3个网络通过前两个网络的输出结果以及CAV数值预测地震破裂。Bose将不同台站记录的P波到时差作为神经网络的输入,将震源位置作为神经网络的输出。PreSEIS在第1个台站接收到地震信号0.5 s后就能给出预测结果,其在地震预警上表现良好,能够为应急管理与灾害预防做出较大的贡献。
2.3 循环神经网络方法
循环神经网络(Recurrent Neural Network,RNN)在处理时间序列数据方面有着显著的优势,是一个擅长学习时间序列的深度学习算法。通常网络前后间的输入没有关联,然而在处理前后输入数据之间有关联的问题时,卷积神经网络等深度学习算法难以发挥作用,而循环神经网络能够较好地解决这类问题。我们可以把地震波形看作前后相关联的时间序列,能够利用RNN预测地震发震时刻、P波和S波走时等与时间序列相关的地震学问题。
循环神经网络通常与其他深度学习算法或传统地球物理方法相结合完成地震定位。Kail等[31]将循环神经网络与卷积神经网络相结合应用于日本地区,为地震定位工作提供了新方法。Janbakhsh等[32]将循环神经网络、自编码器(AE)与卷积神经网络(CNN)相结合,提出CNN+AE+RNN的方法,完成了地震检测、预测震级和震中距的工作。Panakkat等[33]基于循环神经网络的方法提出了预测地震位置和发震时刻的方法,能够同时确定地震位置与发震时刻,其将研究地区细分为多个小区域,用记录的地震事件数据训练循环神经网络,使得网络具备预测地震位置的能力。由于Panakkat将循环神经网络用于地震定位的时间比较早,人工智能还未发展完备,因此该神经网络的结构比较简单,由1个输入层、1个隐藏层和1个输出层构成。Panakkat使用南加州地区1951—1995年记录到的地震事件数据训练神经网络,并将该网络应用于南加州地区5.5级以上的地震事件,将预测结果与标准目录对比,发现预测误差为24~63 km。此外,循环神经网络与其他深度学习算法相结合能够应用于多种地震学研究。
2.4 贝叶斯深度学习方法
贝叶斯深度学习算法与其他机器学习算法不同,它认为神经网络中每一个权重(weight)与偏置(bias)的值都应该是一个概率分布,而不是一个确切的数值。通过对权重和偏置的分布多次采样,获得多个参数的组合,参数的改变能够影响模型结果。贝叶斯神经网络能够衡量模型的不确定性,即能让神经网络知道自己不知道的内容,这是贝叶斯深度学习算法的一个显著优势。科研人员注意到了贝叶斯神经网络的这一优势,将贝叶斯深度学习方法运用到了地震定位的研究中。
将地震定位作为一个回归问题,Mousavi等[34]提出了一种基于贝叶斯深度学习的地震定位方法。该方法的网络结构由两个贝叶斯神经网络构建:一个网络预测震中距、P波走时和随机不确定性,如图6所示;另一个网络用于预测反方位角,如图7所示。Mousavi等[35]使用斯坦福地震数据集训练和测试模型,挑选了亚洲、非洲和北美洲的部分地震事件数据测试模型,结果发现其预测的震中距和P波走时的绝对平均误差分别为0.23 km和0.03 s,反方位角的平均误差为1°。对于地震位置的预测,Mousavi利用两个网络的输出数据测得震中、发震时刻和震源深度的平均误差分别为7.3 km、0.4 s和6.7 km。贝叶斯神经网络结构是该地震定位方法的一个显著优势,它可以衡量数据与模型的不确定性。Mousavi对不同的任务采用不同的网络框架,对震中距与到时的预测,由于两者的相关性比较强而采用同一网络,对反方位角的预测则使用单独的网络,从而提高了模型的整体性能。此外,该模型结构不复杂,网络需要训练的参数较少,因此不需要大量的数据训练网络,可用于地震数据记录较少的区域。
图6 预测P波走时和震中位置的网络结构[34]Fig.6 Network structure for predicting the P-wave travel time and epicentral location[34]
图7 预测后方位角的网络结构[34]Fig.7 Network structure for predicting the back azimuth angle (BAZ)[34]
传统的地球物理算法面临着数据爆炸式增长、运算效率低下和成本高昂等问题,深度学习能够规避这些问题,并且已经开始应用于多种地球物理研究当中。前人的研究很少考虑模型的不确定性,然而模型的不确定性会给油藏产量、地面运动和地震位置的预测等带来严重影响。贝叶斯深度学习方法能够解决这一问题,Gu等[36]将该方法应用于地震定位,并量化地震定位模型的不确定性,利用实际地震数据对模型进行测试。给定的测试数据为x*,预测结果y*的概率分布用贝叶斯神经网络可以表示为:
X,Y)dw
(2)
式中:X和Y分别为训练数据的输入和输出;w为网络的参数。
在这项研究中,构建了一个贝叶斯卷积神经网络,网络的输出为一个三维向量,表示地震位置,模型结构如图8所示。为了增强模型的抗干扰能力,最后一个卷积层和全连接层之间加了一个dropout层;网络中加入回归损失函数是为了衡量训练过程中的误差,便于调整模型参数。Gu已将该方法应用于荷兰地区诱发地震的定位工作,结果表明贝叶斯神经网络能够量化模型的不确定性,并且在地震定位的精度以及处理速度方面均有较好的效果。
图8 贝叶斯卷积神经网络结构[36]Fig.8 Structure of Bayesian convolutional neural network[36]
2.5 全卷积神经网络方法
全卷积神经网络(Fully Convolutional Neural Network,FCN)最初是为图像分割、医学图像重建和从文本描述中生成高质量图像而开发的。CNN是在卷积层之后使用全连接层,得到固定长度的特征向量进行分类,而FCN以整幅图像为输入,通过一次前向传播直接输出分割图形,它具有逐块扫描的平移不变性,且计算量大幅减少[37]。FCN与CNN最大的不同在于FCN将CNN末尾的全连接层转化为卷积层,最终参数层的输出是一个网格而不是一个向量,网格中的每个位置对应像素的预测类别[38],不含全连接层的FCN,适用于任意尺寸的输入。此外,增大数据尺寸的反卷积结构使得网络输出结果更加精细,因此FCN能够广泛应用于地震定位、遥感影像云检测等方面。
对于低信噪比的微地震,目前大部分地震定位方法的定位精度较差。为了解决这个问题,Zhang等[39]开发了一种利用全卷积神经网络对微小地震进行定位的方法,以三分量地震波形数据为输入,生成震源位置为输出的概率分布,并用该方法监测俄克拉荷马州的地震活动。与标准目录相比,该方法预测的震中误差为3.6~4.7 km,满足俄克拉荷马州的地震监测要求。此外,该方法定位速度快,在短时间内就能完成地震定位的任务。这项研究表明,深度学习方法能够实时处理大量的地震数据,实现微震监测。
地震预警(Earthquake Early Warning,EEW)系统能检测地震,并向公众发送警报。传统的EEW算法依赖于P震相的提取和分析。Zhang等[40]利用全卷积神经网络开发了一种全新的地震预警系统,使用深度学习方法直接学习地震波形数据中的隐含特征,不需要利用人工定义的特征,提升了模型的性能。该方法能够在检测地震事件的同时预测震源位置,在部分台站接收到地震记录后,系统就能预测地震位置,并且随系统接收数据的增加,给出更为准确的预测结果。神经网络的输入是来自12个台站的三分量地震波形数据,输出为地震位置的概率分布。将该系统应用于2016年意大利中部发生的6.0级地震,在地震发生数秒后,系统预测的地震位置平均误差范围为4.7~8.5 km,结果证明了在地震预警系统中使用深度学习方法的可行性。
2.6 PALM方法
一般来说,深度学习方法对地震事件检测与定位结果的影响因素大致有3个:所使用的AI模型(U-net,Transformer,CNN & RNN等)、所使用的训练数据、工作流程结构(整个流程将AI放在怎样的位置)。绝大多数方法在于调整AI模型,然而AI模型应该在流程的哪个位置、如何组合可以达到最好的效果同样也很重要。Zhou等[41]基于深度学习算法开发了一种新的方法PALM (Phase picking,Association,Location,and Matched filter),完成了地震检测和地震定位的工作。在不需要任何参考目录的条件下,将PALM应用于连续地震记录就能生成较高质量的地震目录。PALM的结构由PAL(Picking,Association,Location)与MESS(Match,Expand,Shift,Stack)两部分组成,如图9所示,其中MFT是指匹配滤波技术。PAL首先利用震相拾取算法与震相关联算法实现地震事件的检测。在完成地震检测后,Zhou使用Hypoinverse算法[42]实现地震事件的绝对定位,并使用HypoDD算法[43]实现了双差重定位。然后将PAL获得的地震目录作为模板,在MESS部分利用匹配滤波技术对PAL获得的初始地震目录进行完善,增加了新检测到的地震事件,使得该地震目录更加准确。Zhou将PALM应用于2019年美国Ridgecrest地震,发现利用该方法获得的地震目录比南加州地震台网的地震目录更丰富,并将PALM所获得的地震目录与其他方法[44-45]所获得的地震目录进行对比,结果表明:PAL拾取的地震相位精度高,地震检测与定位的性能也较好。
图9 震相拾取、震相关联、地震定位和匹配滤波技术的工作流程[41]Fig.9 Workflow of the phase picking,association,location, and matched-filter (PALM) technique[41]
3 结论
本文总结了深度学习在地震定位方面的研究,分析了几种深度学习算法在地震定位中的实际应用,发现深度学习方法能够实现地震事件的自动定位,但是在定位的精度方面还有所不足,与标准目录存在一定的误差。与传统地震定位方法相比,深度学习方法的运算速度快,极大地缩短了地震定位所需的时间,这对于地震预警、应急管理与灾害预防有着重要的意义。当然,深度学习在地震定位中也存在一些问题:
(1) 利用某一地区的数据训练好的模型,在当地的定位效果可能比较好,一旦将该模型用于其他地区,效果通常不太理想。
(2) 对于一些地震低发区域,难以收集足够多的地震数据,而深度学习需要大量的地震数据训练模型。
(3) 数据共享和获取的便捷性还有待提升。
随着地震大数据时代的来临,深度学习提取数据特征的能力能够提高我们对地震的物理解释。相信随着深度学习的不断发展,其定位效果会越来越好,在地震学领域也会发挥更大的作用。未来能够对小震级、信噪比低的地震事件进行定位,并具有较高的泛化能力是深度学习在地震定位中的发展方向。