基于智能手机MEMS 的地震早期预警决策方法研究*
2022-07-09霖王跻权石利飞侯建民赵莎刘杰董霖郑增威
孙 霖王跻权石利飞侯建民赵 莎刘 杰董 霖郑增威*
(1.浙大城市学院 计算机与计算科学学院,浙江 杭州 310015;2.浙江大学 计算机科学与技术学院,浙江 杭州 310017;3.中国地震台网中心,北京 100045;4.每日互动股份有限公司 浙江 杭州 310012)
近些年来,我国地震频发,从2019 年到2021年,地震台网中心报道5.0 级以上地震85 次。 较大的地震会造成大量财产损失和人员伤亡,尤其在人口密集的城市区域[1-2]。 为了减少地震造成的人员伤亡,日本、墨西哥等国家相继建立了地震早期预警(Earthquake Early Warning,EEW)系统。 地震早期预警依托震源地附近的地震台网,在震后数秒内快速估算地震的相关参数(如震级,震中,地震发生时间等),在破坏性的S 波和面波到达前发布警报,给人们带来几秒甚至几十秒的预警时间[3-4],及时采取相关措施,例如,提前找寻安全区域避险、工厂机器提前停止运转以避免机器在地震中损坏、附近的高铁提前停止运行以避免脱轨[5-8]。
地震预警系统需要部署高密度的地震台网才能及时地监测地震,发布预警消息[9]。 我国疆域辽阔,建立全国性的地震预警系统需要投入巨额资金建设地震台网[10-12]。 研究人员尝试利用MEMS 加速度传感器来提供地震早期预警信息服务[13],来解决地震早期预警系统高昂的建设成本问题。 美国地质调查局(USGS)DYFI 项目采集了震区用户感知的地震强度和位置信息[14-15]。 DYFI 项目利用这些信息评估地震参数,建立了社区地震网络(Community Seismic Network,CSN)[16]。 CSN 网络利用内置或者外联MEMS 的联网计算机,监测地面震动,并通过云服务计算地震事件。 在监测到地震发生后,该系统可以通过几秒钟内地面震动情况估计出地面峰值加速度分布图。 地震监测网( Quake-Catcher Network,QCN)[16]将内置或者外联MEMS 的联网计算机改造成地震监测站,用这些设备填补地震监测站的空缺,建立了实行分布式计算的地震网络,能够对大中型地震提供早期预警。
随着智能手机的广泛普及,得益于其广泛的地理分布和传感计算能力,研究者们开展了基于智能手机的地震早期预警(Smartphone based Earthquake Early Warning,SEEW)研究[17-18]。 孔庆凯等人[19-20]开展了MyShake 项目的研究,设计了一种手机端-服务器端架构的EEW 系统。 在MyShake 系统中,当手机因为震动而触发后,MyShake 会使用人工神经网络(ANN),根据触发后10 s 的数据判断该震动是否是地震引起的。 然后中央服务器会统计系统部署区域内手机触发的比例,若该比例达到阈值,就最终确认发生了地震。 通过两阶段判断,降低系统虚警率。 此外,MyShake 还会要求手机在触发后计算一些必要的参数上传到服务器,如PGA、手机位置、手机触发时间。 中央服务器会根据这些信息计算震中和震级。
Earthquake Network(EN)项目[21]也采用手机端-服务器端架构,并利用统计模型计算和监测地震事件。 在EN 的系统中,手机使用基于标准控制图(Standard Control Chart Technique)的触发算法来监测地面震动。 当手机因震动触发后,会直接将其触发时间和触发所在的位置发送至中央服务器。 中央服务器中的地震监测器会根据系统部署区域内可用手机数量、手机平时触发频率以及30 s 时间窗口内触发手机的数量来综合判断当前是否发生了地震。
大多数现有的SEEW 系统使用手机端-服务器架构。 当手机出现震动时,它会计算震动的开始时间并确定当前的振动是否是由地震引起的。 当判断为地震引起时,它发送触发信息(时间和所在的位置)到SEEW 服务器。 这类系统的缺点是:手机处于高度复杂的环境中,用户日常生活中的震动都可能导致发送触发信息。 因此,无论地震发生还是不发生,SEEW 服务器都可能会接收到来自手机的触发信息。 通常情况下,地震发生是小概率事件,所以在SEEW 服务器上对触发信息进行合理性分析,进而确定是否有地震发生,是十分必要的。
在地震判别上,SEEW 服务器需要根据手机触发信息辨别是否发生地震。 通常设置一个规则来区分两种不同的触发信息,来确定地震是否发生。MyShake 和EN 项目都表明,当地震发生时,在短时间内SEEW 服务器收到的触发信息多于平时。 My-Shake 项目采用60%手机在20 s 内触发来判定地震的策略[19]。 EN 项目则经过构建统计模型来判断是否地震发生,模型中包含手机数量、触发比例等多种因素[21]。
然而,由于智能手机所处环境复杂,容易受到人们活动、行走、交通工具等因素的干扰,地震预警的准确性一直困扰着预警系统的研究者。 当地震发生时,地震能量以一定的速度由震源向外传播,手机离地震源距离不同,收到地震信号的时间也不同。 宏观上,触发时间与震源距离之间存在正相关性。 没有地震时,虽然手机会因为用户活动触发,但是触发时间和震源距离缺乏正相关性。 基于此,本文提出了一种基于触发比例统计推断的地震早期预警方法(Trigger Ratio Statistical Inference based SEEW,TRSI),旨在利用地震触发手机震动在时间和空间上的一致性,大幅降低人们日常行为导致手机震动的虚警信息,提高地震预警系统的准确性。 在MyShake和EN 项目中,主要采用单一阈值方式降低地震虚假报警,阈值的选择缺乏模型和数据支撑,无法在现实中推广应用。 本文方法则利用大规模日常触发数据,基于地震触发的时间和空间关系,在服务器上建立统计推断模型。 与MyShake 和EN 项目等方法相比,在鲁棒性和预警性能上更优。
1 地震预警决策方法
1.1 基于智能手机的地震早期预警
SEEW 系统框架图如图1 所示。 设定一个SEEW系统和地震观察点Q。 设T(Q,D)是以Q为中心,直径为D的区域。 SEEW 利用区域T(Q,D)内的智能手机监视地震是否在地震观察点Q附近发生,其中D表示地震的影响范围。 设该部署区域T(Q,D)在时刻t内活跃手机的个数为M(T(Q,D),t)。 SEEW 系统每10 min 统计一次活跃手机的分布情况。
图1 SEEW 系统示意图
1.2 基于LSTM 的手机地震信号触发模型
为了提高地震预警性能,在手机触发预警消息时,我们首先建立手机端地震信号触发模型。 当手机振动时,该模型对该振动是否由地震引起做初步判断。 如果判断为地震信号触发,才将触发时间和手机所在位置发送至SEEW 服务器,从而减少用户活动对地震预警的干扰。
设时刻t采集的三轴加速度分别为ax(t),ay(t)和az(t),at=[ax(t),ay(t),az(t)]。 地震判别模型的输入为A=(a1,a2,…,aT),其维度为3×T。将加速度序列A输入到长短期记忆网络(Long-Short Term Memory,LSTM)模型中,如图2 所示。 在LSTM 网络中,为了更准确地捕捉地震触发信号,我们引入了注意力机制。 注意力机制根据信号重要性进行局部加权,动态地提取信号中与地震触发事件相关的重要信息。 设LSTM 网络的隐含层输出H=(h1,h2,…,hT),注意力权重attt定义为:
图2 基于注意力机制的LSTM 模型
式中:W∈RT×dh,softmax 是归一化指数函数。 然后,将H输入到由全连接网络构成的二分类器中,并用交叉熵损失函数训练模型。
1.3 基于时空一致性的手机触发比例算子
设在区域T(Q,D)上,时间间隔内,SEEW 服务器收到的触发信息的时间和位置分别为τ1<τ2<…<τK和P1 设地震P波传播速度为Vp。 若地震在Q处发生,第k个触发手机可以准确获得地震到达该手机的时间和位置信息,则地震发生的时间可以表示为: 根据式(4),可以计算得到在区域T(Q,D)上,在时间间隔=(t-ε,t)内的触发手机集合{k|t-ε≤tk≤t}。 在理想情况下,如果手机预警是由震源Q触发的,那么不同手机估算得到地震时刻tk应该误差很小。 实际上,由于地质环境和网络延迟的差异,不同位置手机估算出的tk存在差异。设满足时间间隔条件的智能手机个数为: 式中:N[T(Q,D),]表示区域T(Q,D)中,时间间隔=(t-ε,t)内触发点的个数。 在系统实现中ε设置为10 s。 设T(Q,D)区域在时刻t活跃手机的个数为M(T(Q,D),t)。 我们定义区域T(Q,D)内触发手机占该区域内活跃手机的比例为: 当手机触发预警,会向SEEW 服务器发送触发信息。 如果手机所受震动是由地震引起的,我们称这个触发信息为真触发信息,否则称之为假触发信息。 当SEEW 服务器根据收到的触发信息综合判断发生了地震,则其会向公众发布警告。 若此时真的发生了地震,我们称该警报为真警报,否则称之为假警报。 通常在没有发生地震时,N[T(Q,D),Itε]一般维持在较低的水平。Q附近发生地震后的小段时间内N[T(Q,D),Itε]会突然增大。 这导致发生地震时R[T(Q,D),t,ε]会比没有发生地震时大。 所以我们根据下列公式判断地点Q附近是否发生地震: 当式(7)条件满足时,SEEW 系统将认为Q附近发生了地震。 否则认为Q附近没有发生地震。误警率定义为条件概率: 漏检率定义为条件概率: 阈值h1作为参数,在误警率和漏检率之间权衡选择。 当h1增大,误警率会降低,但同时漏检率会增大。 当h1减小,误警率会增大,但同时漏检率会降低。 高误警率会造成不必要的恐慌,所以优先将误警率控制在很低的水平。 在本文中,我们设计了一种基于R[T(Q,D),t,ε]概率分布的地震判别模型。 通常情况下,R[T(Q,D),t,ε]的概率分布无法直接计算得到,但可以通过地震没有发生时SEEW服务器收集的大量数据计算得到R[T(Q,D),t,ε]的经验分布。 假设SEEW 服务器平均间隔时间Y会触发一个假警报信息。 在地震没有发生时,将h1设置为满足误警次数足够小的分位数: 那么,阈值h1可以保证SEEW 服务器平均间隔时间Y才会触发一个假警报信息。 在固定地震点Q基础上,进一步将区域T均匀划分成I×J个子区域,来判别区域T内的任意位置地震是否发生。 方法如下:我们在每个子区域中心处设定一个地震观察点{Qi,j|1≤i≤I,1≤j≤J}。 我们定义: 表示所有子区域中最大地震感应量。 在没有发生地震时,子区域集合j≤J}内的数值一般都比较小,所以Btε也比较小。当地震在部署区域T的地震观察点Qi,j附近发生时,R[T(Qi,j,D),t,ε]会快速增大,那么Btε也会快速增大。 所以,根据以下公式判断是否发生地震: 则SEEW 系统误警概率为: SEEW 系统漏检概率为: 类似h1的计算方法,我们可以通过构造Mtε的经验分布来得到阈值h2,保证SEEW服务器平均间隔时间Y才会收到一个假触发信息: 最后,我们将本文提出的服务器端SEEW 地震判别算法总结如表1 所示。 表1 SEEW 地震判别算法 为了验证所提出方法在SEEW 系统上的有效性,我们采用了MyShake 和EN 项目的实验方法,即通过构建仿真平台来模拟SEEW 服务器可能会收集到的大量触发信息。 仿真数据用以定量评估在不同地区不同人口密度条件下,SEEW 系统的地震监测性能。 下面介绍仿真平台,仿真平台包括地震仿真平台和日常仿真平台,用于生成地震发生时和无地震时的数据,并发送给SEEW 系统。 我们使用的仿真平台结合了MyShake 和EN 项目仿真平台的优势,由四部分构成,如图3 所示。 和MyShake 项目一样,我们也使用人口采样来确定仿真SEEW 网络中智能手机的空间分布。 地震中,活跃手机可能因为某些原因不被触发,我们根据EN 项目定义的触发比例ϕ决定哪些手机触发。 触发比例ϕ表示当前区域内活跃手机中因地震而触发的手机比例。由于强烈的地震会导致更多比例的手机触发,所以触发比例ϕ可以用来描述地震能量的大小。 图3 地震仿真平台及服务器地震监测示意图 在地震仿真中,我们假设P 波和S 波的传播速度分别是6.1 km/s 和3.55 km/s。 根据地震的时间和地点,可以计算地震波到达每部手机的时间。 不同手机的时间不完全一致,而且地震波到达手机也不一定立即预警地震。 因此,为了表达这种随机性,通过在手机观测到的触发时间中添加白噪声,来模拟地震波到达手机的实际时间。 和MyShake 项目一样,噪声采样自方差为2 s 的半正态分布。 SEEW 系统的手机处于嘈杂的环境中,在没有地震发生时,手机也可能会被意外事件触发,例如用户突然拿起电话。 在这种情况下,手机也会向SEEW 服务器发送地震触发信息。 在SEEW 服务器端,也有一定概率误判地震发生,发布虚假地震预警信息。 为了准确测量SEEW 服务器的误报频率,我们同时搭建了一个非地震日常仿真平台,来获取SEEW 服务器在地震没有发生时可能接收到的预警数据。 图4是非地震日常仿真平台示意图,由三个部分组成。 和MyShake 模拟平台类似,我们也使用人口采样的方式,根据感兴趣区域的人口密度分布图,随机采样手机分布。 由于用户的手机处于复杂的环境中,可能会因周围的非地震振动而随时触发。 我们在这个非地震模拟平台中模拟了这种现象,使这些手机在平均时间间隔内随机触发。 最终,我们把日常手机触发的数据收集起来,形成一个数据集。 图4 日常仿真平台及地震监测示意图 非地震日常仿真平台可以根据我们感兴趣的区域快速、大规模地模拟多年数据,在部署前对SEEW系统性能进行粗略评估,并相应地调整其内部参数。如果在该地区部署SEEW 系统来收集此类数据,则需要耗费很长时间。 在实验中,对模型的评价指标主要包含两方面:一是在无地震前提下,模型误警的可能性;二是发生地震的前提下,模型检测到地震的可能性。 由于模型误警会造成不必要的恐慌,且影响人们对地震早期预警系统的信心,所以我们优先控制模型的误警率。 与EN 项目的设定类似,我们设置模型平均两次误警的时间间隔为一年,即公式(10)和(15)中参数Y设置为一年(365×24×60×60 s)。 基于此参数,我们测试TRSI 方法在地震发生时检测地震的性能。 为了与EN 项目方法进行比较,我们通过地震仿真平台模拟了美国圣地亚哥的部署环境,因为该地区也部署了EN 项目。 我们采用人口采样的方法,基于人口数据确定模拟SEEW 网络的空间分布,其中人口数据来自2015 年世界网格化人口第四版(GPWv4)[22]。 在相对空间分布方面,GPWv4 与全国人口普查和人口登记相一致。 比例分配网格算法使用国家和地区以下约1 250 万个行政单位,将人口值分配到30弧秒(约1 km)的网格单位,全球人口密度分布如图5所示,图中颜色越深的区域,人口越密集。 随机采样感兴趣区域的人口比例,作为SEEW 系统用户。 采样比例为0.05%时,产生了183个SEEW 系统用户。 在圣地亚哥地图网格(如图6 所示)上,根据该单元的人口密度采样,并模拟这些用户的位置信息。 图5 全球人口密度分布图 图6 通过人口密度采样得到SEEW 系统的用户分布图 表2 列出TRSI 模型中的参数设定值。 地震监测系统目标设置为:无地震发生时,TRSI 模型的平均误警时间间隔达到1 年。 为了到达这个目标,日常仿真平台生成的100 年触发数据被输入到TRSI 模型中,并且每隔1 s 更新一次Btε的值。 我们通过统计来构造Btε的经验分布。 然后将h2设置为该经验分布的上1/Y分位数,其中Y=365×24×60×60。 这样在无地震前提下,不等式Mtε>h2成立的时间间隔会达到平均一年一次。 表2 SEEW 系统参数设置 手机地震信号触发模型序列时间长度为5 s,手机加速度计的采集频率为100 Hz,输入数据采样时刻的数量为T=500。 LSTM 网络隐含层神经元个数为30,mini-batch 大小为512,优化器为Adam,学习率为2e-4。 我们采用F1、精确度(Precision)和召回率(Recall)指标来评价手机地震信号触发的准确率。 3.3.1 手机端地震信号触发性能 在中国地震局工程力学研究所,通过振动台模拟地震,并将手机放置在振动台上来采集数据。 实验使用的48 部手机固定和自由地摆放在振动台上,然后将46 条地震记录(震级5.0~8.0)依次输入到振动台中模拟地震,持续时间为10 s,共采集4 416条记录。 日常手机振动数据,则通过随机信号产生。 将数据划分为训练集合和测试集合(比例为4 ∶1),我们还测试了SVM、CNN 模型在数据集上的性能,测试结果如表3 所示。 结果表明基于注意力机制的LSTM 模型(LSTM+Att)取得了最佳性能。 表3 手机端地震判别模型性能比较 3.3.2 SEEW 服务器地震判别性能 在本节中,我们测试了TRSI 模型,并将其与地震网(EN)项目提出的Detector 模型进行了比较。在构建TRSI 时,与EN 项目设置相同,平均误警时间间隔设置为一年一次。 我们使用地震仿真平台生成的触发数据测试TRSI 模型和EN Detector 模型的地震监测性能。 地震仿真平台模拟的183 部手机按人口密度分布在200 km×200 km 的系统部署区域内。 地震仿真平台的触发比例ϕ参数为地震发生时系统部署区域内系统用户手机中触发手机的比例。 EN 项目在测试实验中使用触发比例ϕ来描述地震的强度。借鉴EN 项目测试方案,我们在不同触发比例ϕ(地震强度)下模拟100 次地震。 然后测试TRSI 模型和EN 项目的Detector 模型在100 次地震中成功预警的比例,以及预警发布的平均时延。 图7 比较了各系统在不同触发率下的成功预警率。 随着触发比例的增加,TRSI 模型和Detector 模型成功预警的比例都快速增加。 这说明当地震震动剧烈,地震会被更多比例的手机监测到,系统成功预警的比例增加。 TRSI 模型取得了比Detector 模型更高的成功预警比例,其中,当触发比例ϕ属于[0.2,0.4]区间时,TRSI 模型的成功预警比例比Detector 模型平均高35.6个百分点;当触发比例ϕ为0.3 时,TRSI+手机地震信号触发模型的成功预警比例达98.2%。 图7 地震监测器在不同触发率下的成功预警率 图8 比较了各系统在不同触发率下的平均报警延迟。 随着触发比例的增加,TRSI 模型和Detector 模型平均预警延迟都会降低。 这说明当地震震动剧烈时,系统预警所需的延迟会降低。 图8 曲线表明,TRSI 模型预警延迟低于Detector 模型平均1.9 s,说明TRSI 模型可以对地震做出更快地预警反应。 图8 地震监测器在不同触发率下的平均报警延迟 同时,图7 和图8 中的实线显示了TRSI 模型在手机端增加地震信号触发判别后的SEEW 地震预警性能,我们可以看到系统在成功预警率和平均预警延迟上性能都有一些提升。 本文深入研究了基于智能手机MEMS 的地震早期预警技术,基于地震向外传播的特性,由手机触发时间反向估计地震发生时间,设计提出了一种基于触发比例统计推断的地震早期预警方法。 本方法基于大规模日常触发数据,建立了统计推断模型,参数的计算模型和方法可以推广到实际应用系统中。实验表明,本方法可以有效过滤掉大部分日常触发事件。 通过与EN 项目Detector 模型比较,在平均误警间隔为一年的低误警率要求下,所提出的TRSI 模型在成功预警比例和检测延迟等方面性能更优。 同时,基于注意力机制的改进LSTM 手机地震信号触发模型,与CNN、SVM 等基准模型相比,性能最佳。1.4 基于统计的SEEW 地震判别模型
1.5 基于任意位置的改进SEEW 地震判别模型
1.6 算法总结
2 数据集
2.1 地震仿真平台
2.2 日常仿真平台
3 实验
3.1 人口分布采样
3.2 仿真参数设定
3.3 实验结果
4 结束语