人工神经网络在地震预测中的应用★
2013-08-13姜金征赵建明
姜金征 薛 伟 赵建明
(1.铁岭地震台,辽宁 铁岭 112001; 2.河北省地矿局第五地质大队,河北 唐山 063000)
0 引言
地震是一种严重的自然灾害,具有不可预测性、破坏性大、不可防范性等特征。目前,国际上还不能够准确预测出地震将要发生的时间和强度。由于地震学异常与地震之间存在着一定的不确定性因素,且一种地震学指标通常只出现在某一次地震中,所以地震学指标的单一适用性体现出自身的局限性。截止现阶段,我国地震研究学者一直为确定预测结论的权值和各指标组合时相互间的非线性联系对最终预测结论产生的影响问题而烦恼,为此,利用神经网络为解决上述难题打开了缺口,有助于进一步提升地震预报的精确性。本文针对于人工神经网络在地震预报中的应用做了分析和研究。
1 人工神经网络知识
人工神经网络实质上是一种以模仿人脑结构及其功能的信息处理系统。其通常受两方面因素的影响:一方面是网络的学习和运行规则,即网络中连接权值的调整规则;另一方面是网络的拓扑结构,即人工神经元之间相互连接的方式。
1.1 人工神经元的结构
在图 1 中,x1,x2,…,xi,…,xn是指来自其他神经元轴突的输入,wj1,wj2,…,wji,…,wjn是指神经元1,2,…,i,…,n 与第 j个神经元的突触联结强度,即权值。权值包括正权值和负权值,不同的权值表现出不同的涵义,即正权值表示兴奋型突触,负权值表示抑制型突触,而f(·)表示转移函数,又称之为激活函数,其具有模拟生物神经元等功能。
图1 人工神经元的结构
1.2 人工神经网络的拓扑结构
就人工大脑皮层来说,其具有多层结构(横断面上具有3层~6层神经细胞)。同时人工神经网络也按照层次排列。另外,多层网络由单层网络级联而成,即网络中各神经元可接受前一层各神经元的输出,而介于输出层和输入层之间层被定义为隐层,隐层通常不与外部发生联系,因为有隐层的存在使得人工神经网络对信息的处理能力大幅度提高。人工神经网络受引入隐层及其非线性转移函数的影响,使其具有实现矩阵X转成矩阵Y的任意非线性映射的能力。
1.3 人工神经网络的工作过程
自主学习能力高是人工神经网络的显著特性。一般情况下,人工神经网络只有经过训练才能够存在某种智能。就人工神经网络来说,其学习和工作过程中实质上便是网络输入样本模式的过程,之后,运用学习算法对网络各层的权矩阵做出有效调整,直至网络的各权值收敛到一定值,从而宣告学习和工作过程结束。
2 误差反传播(Error Back Propagation)算法:BP算法
BP算法是误差反传播算法重要的组成部分。本章将针对于BP算法相关内容做出全面分析:近年来,BP网络在我国突飞猛进的发展,并在较短的时间内遍及各领域,如图像识别、预测预估、数据压缩、语声变换、自动控制以及模式辨识等。据有效统计显示,截止现阶段,我国应用BP算法的神经网络已达到80%,为此,实现BP算法在地震预报中的应用,将能够取得良好的成效。
BP算法的学习过程由信号的正向传播和误差的逆向传播两个过程组成。信号的正向传播步骤为:输入样本→输入层→各隐层(处理)→输出层;误差的反向传播步骤为:输出误差(某种形式)→隐层(逐层)→输入层。同时,BP算法的实现步骤为:初始化→输入训练样本对,计算各层输出→计算网络输出误差→计算各层误差信号→调整各层权值→检查网络总误差是否达到精度要求。信号的正向传播和误差的逆向传播的各层权值调整过程是周而复始进行的,而权值调整过程实质上为神经网络学习的过程,该过程需进行到将网络输出的误差减少到可接受的程度为止。
每组数据有6个项目作为输入,目的是预测震级,因此选择输入层为6个节点,输出层为1个节点,隐层节点采用几何金字塔规则确定为2个。因为单极性Sigmoid函数g(s)=1/(1+e-λs)s可使同一网络既能处理小信号,也能处理大信号,所以作为转换函数。
累计误差BP算法的具体步骤:
先给出 P 个训练对(X1,T1)…(Xi,Ti)…(Xp,Tp)。
1)预置较小的随机权矩阵。
2)施输入模式Xp于网络,计算各层的输入:
其中,Y(s)j为s层上第j个神经元的输出值;W(s)ji为s-1层第i个神经元至第s层第j个神经元的连接权。
3)修改权值:W(s+1)ji=W(s)ji(t)+ ηe(s)jXti。
其中,Xti为该权值的输入信号;η为学习率;t为学习次数;e(s)j为s层第j个神经元的误差。
对于中间层的神经元:
对于实际输出:
其中,tj为第j个神经元的期望输出。
4)计算全局误差:
5)返回步骤2),向网络加下一个模式对,直到P个模式对均循环一遍,再进行步骤6)。
6)若E<Emax(预先设定值),则停止;否则,令E=0,返回步骤2)。
3 神经元的选取、内符检验与预测效能评估
3.1 神经元的选取
为满足神经网络的需求,输入需为影响输出的因素,并且各输入变量间不存在任何相关性且选定的输入变量数必须具有足够的代表性。当输入变量数超过网络隐层节点数时,此时神经网络便能够充分揭示其间隐藏的各种规律,并使神经网络获得较强的外推能力。本文将以福建及其沿海东经117°~120°,北纬22°~26°范围内的地震在时间、空间、强度为例,以频度、蠕变、能量、b值、缺震以及η值指标的29组数据为网络输入,输出该地区下一年可能发生地震的最大震级。
表1 学习样本集及内符结果
3.2 迭代次数的确定
训练次数是影响神经网络外推能力的核心因素。在隐层结点确定的情况下,神经网络可能出现训练次数问题,即训练次数过大时,神经网络将呈现“训练过头”现象,此时,训练误差减少,测试误差增大,外推能力大幅度下降;反之亦然。因此,神经网络需合理控制训练次数,从而将训练误差和测试误差控制在最佳状态,将外推能力提升到最大限度。
3.3 内符检验与预测效能分析
在确定神经元、训练次数的前提下,需要内符检验神经网络对地震预报震级的效能及其预报精度。由内符检验情况表1可知,当前,我国神经网络模型识别训练样本准确率过低,如取|ΔM|≤0.5,内符检验正确率为97%。同时,若运用交叉法检验外推能力,将相同的训练样本划分为10,10,9三个子集,当开展检验时需随机抽调一个子集,仅由剩下的子集参与训练,从而实现神经网络外推能力的测试,其分析结果如表2所示,由该表可计算出最大预测震级与实际震级之差,为0.6。如限定|ΔM|≤0.5为预报正确,此时地震预报震级的准确率为86%,之后开展内符检验及预测效能分析,以检验和分析结果为依据构建高精确度的神经网络模型。
表2 预测效能分析
4 应用实例
神经网络模型的应用需以2011年某地区的地震学指标:频度、蠕变、能量、b值、缺震以及η值作为其输入,预报该地区2012年的最大震级,即4.7±0.5,此预报结果用事实得到了进一步验证。
综合上述,BP神经网络在地震预报中应用时,使选定的各个指标间“集体”智慧得到充分验证,进一步提升了地震预报的准确度,通过分析和研究神经元的选取、层面的确定和迭代次数的变化能够体现出神经网络预测效能的主观随意性。基于不同作者构造神经网络模型时具有不同的输入、训练次数,因此其所得的结果存在着较大的差异,以此表明,无论哪种预测方法均存在着一定的局限性。究其原因在于:一方面,本文选用的测震学指标仅是地震活动的表象的指标,与发震物理实质的指标关系不大;另一方面,所选取的指标难以满足输入元相互完全的“独立性”要求。
[1] 王晓霞,王 涛,谷根代.基于改进粒子群优化的神经网络及应用[J].华北电力大学学报(自然科学版),2009,36(5):99-102.
[2] 王 凤,黄力宇,张宇翔.基于MATLAB的BP预测模型在地震前兆预测中的应用研究[J].华北地震科学,2009,27(1):48-51.
[3] 杨居义,易永宏.基于BP神经网络的地震预测研究[J].微电子学与计算机,2008,25(10):129-132.
[4] 陈一超,曾三友,张好春,等.基于遗传神经网络的地震预测研究[J].计算机应用与软件,2008,25(4):135-137.