APP下载

基于CNN-LSTM 的地震震级预测研究

2020-06-21

科技与创新 2020年11期
关键词:强震卷积神经网络

(上海工程技术大学 电子电气工程学院,上海 201620)

传统地震仪可以提供地震发生时间、地震波相关数据等必要信息,能帮助迅速判断地震震级等内容,为预警与后续救灾措施提供帮助。但是宽频带地震仪在需要密切关注的强震预测方面表现不佳。文献[1]中指出强震会导致传统地震仪数据缺失,无法完整反映相关数据,且难以准确获得地壳形变信息,并提出引入强震仪数据作为补充手段,完善预警能力。文献[2]中同样提到了了强震仪数据对传统地震仪的补足能力。文献[3]给出了利用长短期神经网络对补全GPS 数据的办法。而在深度学习方面,文献[4]早已证实卷积神经网络与长短期神经网络的联合使用,并加以验证。文献[5]则是机器学习领域在地震预警方面的应用,结合分类算法与数学优化算法来尝试解决复杂的地震预测问题。

本文认为可以通过把卷积神经网络出色的特征提取能力与长短期记忆神经网络在时间序列数据方面的学习能力结合在一起,学习地震监测时间序列数据与震级之间的关系。借鉴孪生神经网络的设计思想,来快速预测震级。以下将就该神经网络模型如何实现进行说明。

1 实验结构

将地震震级预测看成一个多分类问题来求解。

考虑到数据分传统GPS 数据与strong-motion(强震)数据,因此作为将两个输入作为一组样本,一起放入神经网络模型中进行训练与测试。由于GPS 数据与strong-motion数据在时间间隔、基站经纬度,甚至部分海拔高度也不尽相同,因此,包括与地震波相关的N、E、U三个方向上的差异量在内,额外增加经度、纬度、海拔高度、时间间隔等共七个特征数据,形成时间序列,以地震震级作为标签。在神经网络模型上,借鉴孪生神经网络的设计,内部采用卷积神经网络(CNN)与长短期记忆神经网络(LSTM)联合使用的方式来处理。

2 方法实现

首先介绍本文使用的几个神经网络具体实现,接着说明选取的损失函数。实验整体框架如图1 所示。

图1 实验整体框架

2.1 孪生神经网络

孪生神经网络(Siamese Network)用于衡量两个输入的相似程度,其最大的特点是两个神经网络权重相同且完全相同。这两个神经网络分别将输入映射到新的空间,形成输入在新的空间中的表示,最终通过损失函数计算来评判输入相似度。最早出现在支票上的签名验证[5]。随着发展,也有伪孪生神经网络(Pseudo-Siamese Network),特点在于两边不共享权值。本实验模型主体参考传统孪生神经网络设计。传统孪生神经网络如图2 所示。

图2 传统孪生神经网络

2.2 卷积神经网络与长短期记忆神经网络

人工智能发展至今,卷积神经网络可以说是最广为人知,也是最具代表性的神经网络之一。这主要得益于它在图像特征提取方面上非常出色的表现。也正是通过这一特点,让它在与图像特征提取相关的应用场景都有着难以撼动的地位并取得了许多卓越成就。近些年,其主要与其他神经网络联合使用以进一步提高准确度。

长短期记忆网络是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。作为循环神经网络(RNN)的变体,它保留了RNN 的功能:向前传递相关信息,同时处理当前信息。变化在于,它在这基础上增加了遗忘门、输入门、输出门,通过这三个门获得了保留或者遗忘信息的能力。因此,LSTM 拥有着记住长期信息的能力。本文实验主要是卷积神经网络与长短期记忆神经网络的联合运用。本文神经网络结构如图3 所示。

图3 本文神经网络结构

2.3 交叉熵

对于一个二分类问题,一般做法是将神经网络节点的输出通过某一个激励函数转化为属于某一类的概率。多分类问题神经网络最常用的方法是根据类别个数n,设置n个输出节点,这样每个样本神经网络都会给出一个n维数组作为输出结果。

本文将地震震级预测可以看作为一个多分类问题,因此,在网络模型后将softmax 作为激励函数,将交叉熵(Cross entropy)作为损失函数。现在大多数框架都将两个函数合并在一起使用,使代码实现变得十分简单。

3 结论

本文主要以海外地震相关信息作为数据进行研究,且较少量数据情况下,也能取得较好的预测结果。数据有5 172组的情况下,有效准确率在87.12%。

猜你喜欢

强震卷积神经网络
基于全卷积神经网络的猪背膘厚快速准确测定
7.0级强震袭击菲律宾
基于神经网络的船舶电力系统故障诊断方法
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
花莲强震!
三次样条和二次删除相辅助的WASD神经网络与日本人口预测