APP下载

改进的神经

2018-03-10宋建国李赋真徐维秀

石油地球物理勘探 2018年1期
关键词:权值神经元神经网络

宋建国 李赋真 徐维秀 李 哲

(①中国石油大学(华东)地球科学与技术学院,山东青岛 266580; ②中国石油集团东方地球物理公司大港物探处,天津 300280; ③中国石化石油工程地球物理公司胜利分公司,山东东营 257600)

1 引言

地震资料初至拾取技术是静校正[1]、层析成像[2]及VSP等技术的关键,初至拾取的正确与否,在很大程度上影响后续处理精度。截至目前,尽管初至拾取技术经历了几十年的发展,但在地表复杂及信噪比较低的情况下,要想取得好的拾取效果依然存在困难。随着初至波层析技术向三维方向[3]发展,初至拾取变得更为繁重,探寻稳定可靠的自动拾取技术显得势在必行。

在地震数据处理过程中,通常都是根据地震信号的振幅、能量、频率或相位等的变化确定地震波的初至时间,此外还可根据相邻道之间的相关特征判断初至时间。迄今为止,人们已提出多种初至波拾取方法,如能量比值法[4]、瞬时强度比法[5]、神经网络法、图像处理法[6]、分形法[7]等。其中能量比值法、瞬时强度比法、分形法等都是基于单一地震道时窗特征判断初至时间,未考虑多个地震道之间的相互关系。此外,这类方法通常仅考虑单一特征,没有综合考虑其他特征,造成这类算法稳定性欠佳,在资料信噪比较低时拾取效果不理想。因此,要想提高初至拾取算法的稳定性和精确度,需综合考虑多种地震属性及相邻道之间的相互关系,而神经网络初至拾取方法就做到了这些。

由于BP神经网络结构简单,算法易于实现,因此早已被应用于初至拾取领域[8-10]。但该算法存在收敛慢、易陷于局部极值、网络结构难以确定等问题; 且因BP网络是静态网络,不能学习额外样本集以扩展网络知识,难以满足复杂地形区初至拾取要求,因此未被推广应用[11]。而采用级联相关(Cascade-Correlation,简称CC)算法[12,13]就能很好地解决BP算法存在的问题,具有更强的应用潜力。

神经网络初至拾取是通过神经网络对样本的学习来建立一个分类规则,以此对初至波进行模式识别并拾取。该分类规则是否合适取决于两个方面: ①神经网络训练的好坏; ②地震属性选取是否恰当。由于CC算法起始于一个最小网络(无隐含神经元),这意味着在训练初始阶段将经历繁杂过程和花费大量时间,也必定增加计算量且降低网络收敛速度[14,15]。本文力图改进CC算法,即从适合的初始网络结构开始学习,使其具有计算更高效和收敛更快速的特性。同时为了保证级联神经网络的泛化能力,本文在CC算法训练候选隐含神经元的目标函数中加入正则化项,这样就可有效防止候选神经元权值的病态增长,提高网络的泛化能力,并加快神经网络的收敛速度。

地震属性中不仅含有地下地质体[16]信息,也含有反映地震波类型的信息,这是利用地震属性识别初至波的基础。地震属性种类众多,初至拾取的效果取决于地震属性的选取,所选地震属性必须具有一定的稳定性[17],通常还可选取多种地震属性进行组合以更利于正确区分初至波和非初至波。

2 级联相关算法

级联相关算法是一种神经网络自底向上构造算法[12,13],是Fahlman等[12]为了解决传统BP算法收敛速度慢的缺点而提出的。该算法的命名即反映了其主要特征:新的隐含神经元与以前的网络拓扑结构呈级联相关关系。通过相关性学习算法,调整输入权值,使新增神经元输出与原网络输出残差的相关性最大。

与BP算法相比,CC算法具有以下优点: ①能自行决定算法网络结构; ②学习速度较快; ③当样本集改变时,依然能保留已建立的网络结构和知识体系; ④若需训练一个额外的样本集,CC算法能扩展网络大小,并把新样本合并到原有知识体系中。

CC算法的实现包含下列步骤。

(1)初始化网络。构建两层网络结构:输入层、输出层,并对其权值进行随机初始化设置。

(2)训练输出层。选取适用算法迭代调整输出层权值,以误差无明显改进(变小)为迭代停止条件;当停止迭代后,根据对误差的标准,选择停止训练,或转入下一步。

(3)训练候选隐含神经元。根据级联、相关的特征,迭代训练候选隐含神经元的权值,直到原网络与新网络输出残差关联度最大。

(4)冻结和连接新隐含神经元。固定新隐含神经元的权值并连接它的输出到网络输出层。重新调整输出层,转到步骤(2)。

将CC算法应用于初至拾取还需解决以下问题: ①由于CC算法从仅有输入层和输出层的最小网络开始学习,逐一自动地增加隐含神经元,直到目标网络收敛,这就意味着需大量的过程步骤和时间来学习,从而增加了计算量并使收敛速度减慢[14,15]; ②CC算法构建的是一个多层神经网络,每增加一个隐含神经元,在效果上相当于增加了一个新的隐含层,新增隐含神经元越多,即新构建的神经网络就越复杂,这样常易导致神经网络对训练样本产生过拟合[13]; ③最大化候选隐含神经元的输出与原网络输出残差的关联度(即协方差)往往会使候选隐含神经元的权值对误差进行过度补偿,这被称为“权值病态增长”[18],该现象会严重影响网络泛化能力。

2.1 级联相关算法的改进

常规CC算法起始于一个最小网络(无隐含神经元),这样必定增加计算量,同时也降低了网络收敛速度。若从某个适当网络开始训练,则能显著提高网络收敛速度[14]。改进后的CC算法包括初始网络训练、候选隐含神经元训练、输出层训练三个阶段。

(1)

图1 初始网络(a)与增加1个(b)、2个(c)隐含神经元网络示意图

为了防止最大化相关性C时候选节点权值病态增长,在式(1)中引入正则化项

(2)

式中λ为正则化系数。在候选隐含神经元训练的目标函数中加入正则化项,可有效地对权值进行衰减,防止权值的病态增长,降低网络复杂程度,提高了网络的泛化性能。

当所有候选隐含神经元与原网络的相关性不再变化时,停止训练; 再从多个(通常为4~8个)候选隐含神经元中选取关联度最大的候选隐含神经元作为新隐含神经元,使其输出端与网络输出神经元的输入端相连接,并冻结新隐含神经元的输入端权值,删除其他候选隐含神经元,进而对新网络进行输出层训练。

在输出层训练阶段,通过调整连接输出层权值,使全局均方误差最小化。全局均方误差可表示为

(3)

式中:tp,o为输出层神经元o中样本p的期望值;yp,o为输出层神经元o中样本p的网络输出值。

训练算法可采用梯度下降法或Quickprop算法,但Quickprop算法在收敛速度方面更具优势。训练过程中设定原隐含神经元仍然对目标函数有效,因此保持所有原隐含神经元输入端权值不变,仅允许输出神经元输入端权值改变。当全局均方误差不再明显减小时,终止训练。同时,新一轮候选隐含神经元训练阶段开始。在整个学习过程中,候选隐含神经元训练、输出层训练阶段交替出现,直到全局均方误差小于目标值为止。

2.2 Quickprop算法

Quickprop算法由Fahlman[19]提出,这是一种利用误差平面弯曲部分的信息来加快学习的一种算法,因此需计算误差的二阶导数。该算法有两个基本假设: ①误差函数对每个权值的曲线都是二次曲线; ②每个权值的误差曲线的斜率变化不受其他权值的影响。Quickprop算法计算每个权的方向导数。基于这两个假设,根据当前时刻和前一时刻的斜率和权值,通过计算抛物线的最小值,求出当前时刻的最优调节量

(4)

式中: Δwij是神经元i和j的连接权值(wij)的调节量;S(t+1)和S(t)是当前时刻与前一时刻的误差函数对wij的偏导数。

另外,当S(t+1)与S(t)方向相同,但S(t+1)与S(t)的值接近,或S(t)大于S(t+1)时,式(4)会有很大的调节量,或反向调节到抛物线的最大值点。若单纯采用式(4)调整权值,算法出现不稳定甚至难以收敛。本文采用的权值调整公式为

Δwij(t+1)=μβΔwij(t)-(1-μ)ηS(t)

(5)式中:η为学习速度;μ为0~1之间的一个调节量,取为0时,式(5)退化为梯度下降法公式,由下式得出

(6)

选取合适参数可使算法稳定且快速收敛。在算法开始时, Δwij为零值,不能用式(5)进行调整,而是用梯度下降法计算下一时刻的权值调节量

(7)

2.3 仿真试验

为了验证CC神经网络改进前后的收敛性能及其泛化能力,进行了仿真试验。神经网络训练的目标函数为

(8)

训练样本从0到1之间等间隔取样,即输入xi如下式所示

(9)

由此可获得50个样本对{(x1,y1),…,(xi,yi),…,(x50,y50)}作为神经网络的训练样本,测试样本为500个,其输入xi为区间[0,1]之内的随机值,将其输入到训练过的神经网络可得函数的逼近值,实际函数值由式(8)计算得出。

初始网络结构为1—2—1(即一个输入节点,两个隐含节点,一个输出节点)的三层BP网络,激励函数采用Sigmoidal函数,初始权值取(-1.0,1.0)范围内随机值,候选隐含神经元训练过程中同时训练8个候选节点。图2是改进前、后CC算法的均方误差对比图,可见改进CC算法仅需添加7个隐含神经元就可完全收敛,均方误差为0.0001,而常规CC算法需添加17个隐含神经元才收敛到目标误差。

在[0,1]之间随机取500个测试样本,输入到已训练好的神经网络,用于验证神经网络的函数逼近效果。图3为两种神经网络输出结果: 常规CC算法函数逼近出现“锯齿”形状,权值病态增长影响了网络的泛化能力(红色曲线); 绿色曲线是改进后CC算法函数逼近效果,“锯齿”现象消失,与实际曲线吻合很好。

仿真过程中,对训练和测试重复了30次。表1为算法改进前、后的对照效果,可见改进后的CC算法不仅提高了收敛速度,而且在一定程度上提高了神经网络的泛化能力。

图2 均方根误差对照图

算法平均新隐节点数平均训练误差平均训练时间/s平均测试误差常规CC16.57.82×10-443.61.63×10-3改进CC7.04.15×10-45.75.19×10-4

3 地震属性提取及交会分析

地震属性的选取是神经网络初至拾取过程中重要一环,地震属性的稳定性影响初至拾取精度。不同的地震属性在不同地区以及针对不同的震源会有不同的拾取效果,因此稳定的地震属性以及能正确区分初至波的地震属性是神经网络识别初至波的前提。

通过算法编程从地震资料中提取多种地震属性,然后进行分析对比,最后选取瞬时强度比、振幅、频率、曲线长度比、相邻道相关性这五种地震属性来综合识别初至波。瞬时强度比是通过先对地震道做希尔伯特变换,通过复地震道分析技术可求得瞬时振幅,然后再计算前后两时窗内瞬时振幅的平方和之均方根之比便可求得瞬时强度比。频率是为了考察地震道局部波形的主频,一般在一个高斯时窗内对地震数据做短时傅氏变换可求得主频。图4为振幅和频率与瞬时强度比的三维交会图,可看出初至波与非初至波有明显的分类边界。

相邻道相关性是在选定时窗内考察当前道与前后相邻n道局部波形的相似性而提出的一个地震属性,可用于检测初至波同相轴。即通过倾角扫描相关法[20]求得当前道与前后n道互相关函数平均值的极大值,其值介于0~1之间。在初至波处,当前道与前后n道一般有很强相似性,即属性值为一较大值。如图5所示:在初至波之前为随机噪声,其属性值为一个较小值;初至波之后的有效波若存在同相轴,其属性值仍为一较大值,故该属性是半稳定的,需结合其他地震属性共同识别初至波。

图5 相邻道相关性随道号的分布

曲线长度比是将时窗内的地震波包络线长度的变化作为一种地震属性,用以识别初至波。曲线长度比即为前后相邻两时窗内线积分比值,它体现了地震波的振幅和频率特征[21],其变化情况能反映波形的变化情况。图6是曲线长度比与相邻道相关性的交会图,图7是曲线长度比与振幅、频率的三维交会图,从两图可看出初至波与非初至波同样分类边界依然非常明显。

图6 相邻道相关性与曲线长度比的交会图

图7 振幅和频率及曲线长度比的交会图

瞬时强度比、振幅、频率、曲线长度比、相邻道相关性这五种地震属性的组合适应于不同地形的神经网络初至波拾取的要求,其组合有较强的稳定性,对低信噪比数据的初至也有较强的识别能力。

4 神经网络在初至拾取中的应用

4.1 输入及输出数据的处理

神经网络训练需要可靠的训练样本,本文采用手工拾取的初至波作为训练样本。为了方便进行手工拾取并保证神经网络的拾取精度,仅考查初至波波峰,手工拾取初至波的波峰时间。考虑到地层的吸收衰减及波前扩散效应,地震数据的近炮检距振幅值与远炮检距的振幅值差异较大,在提取地震属性前先对地震数据进行归一化,消除近炮检距和远炮检距地震数据的振幅差异,这样有利于提高初至拾取的精度。提取地震属性时,根据人工拾取的初至波峰时间提取初至波的属性值,然后再求取初至波前后四个非初至波波峰的地震属性值作为神经网络的训练样本数据。

采用Sigmoidal函数作为神经网络激励函数,根据其“倒钟”分布特性,当数据在远离0的区域里进行学习时,处于饱和区段,学习收敛速度很慢,甚至出现麻痹现象,因此需要对样本输入进行规范化。规范化公式如下

(10)

式中:x′为规划化后的特征样本;xmax为特征样本极大值;xmin为特征样本的极小值。

图8为噶尔盆地M工区测线的地震数据初至拾取效果,从中可看出,初至波到达前存在一定的噪声干扰,但初训练样本进行规范化后,输入数据都在区间[0,1]内,确保在不减少数据间联系的前提下,提高了网络训练和学习的速度。

将训练成功之后的神经网络用于初至拾取时,考虑到其工作效率,不可能逐个考察每个采样点,因此,为了提高拾取效率,对初至波搜索范围进行了限制。其方法是对手工拾取的初至波峰时间(必须包含近炮检距与远炮检距的初至数据)与其炮检距进行最小二乘法曲线拟合,得到初至波峰时间与炮检距的近似关系式。在随后的拾取过程中再调用这个关系式,根据炮检距信息估算初至波时间,然后以此估算的初至波时间为中点开了一个搜索时窗,神经网络在此时窗内搜索初至波波峰即可。考虑到折射波的传播特征[22],可以设定一个最小折射波速度和一个最大折射波速度,根据这两个速度以及炮检距信息来确定初至波的搜索范围。

神经网络拾取的是初至波的波峰时间。对可控震源,其初至时间即为波峰时间; 对炸药震源,其初至时间则为初至波起跳时间[23]。炸药震源初至波起跳点与初至波峰点之间的时间差与初至波周期有关,一般为3/4个周期。因此,要想得到炸药震源初至波起跳点时间,则需对拾取初至的位置做时移。可直接利用地震属性提取过程中得到的初至波频率信息,若初至波频率为f,则时移量可由Δτ=3/(4f)求得。

4.2 实际地震资料处理

为了检验本算法的拾取效果,对中国西部三个不同地区的地震数据进行了初至拾取测试。上述图8为取自准噶尔盆地的地表起伏不大、初至波清晰的地震数据,可见拾取效果非常理想。

图9为宁夏银川盆地L工区的地震资料。该测线贯穿沙漠和山前砾石带的交界,图9中炮集左侧为沙漠中采集的地震数据,右侧为山前带采集的地震数据。图中地震折射波非常明显,能量较强,甚至超过直达波,运用本算法拾取的初至波峰依然能取得了好的效果。图10为图9的局部放大,图中红色水平小线段对应本文方法拾取的每一道的初至波,这些红色的小线段密集地排在一起,形成了图9中的红色曲线。可看到图10中直达波与折射波交界处拾取效果也非常理想。

图11、图12为延安黄土塬地区的原始地震资料及其拾取结果,图中的红色线段意义与图9一样。

图8 准噶尔盆地M工区地震数据拾取结果

图9 宁夏银川盆地L工区地震数据拾取结果

图10 图9放大效果

图11 延安黄土塬地区地震数据的拾取结果

图12 图11放大效果

该地区地表起伏大,未做高程校正之前,初至波高低起伏不定,常规初至拾取方法难以取得较好效果,采用本算法初至拾取正确率达到95%以上,图12为图11局部的放大,图中极个别点存在误差。

5 结束语

CC算法较之BP算法在初至拾取方面有较大优势,不仅收敛速度快,而且能自行确定网络的拓扑结构,更重要的是这种算法能扩展网络大小以学习新样本(BP算法不具备的)。改进的CC算法进一步提高了收敛速度和泛化能力。地震属性的选取是影响初至拾取精度的一个重要方面,本文所选的五种地震属性能够较好地用于识别初至波; 五种地震属性的组合对初至波的区分能力较强,效果相对稳定性; 实际地震资料的拾取取得了良好的效果。

当然神经网络不是万能的,对于品质较差的地震资料,其拾取结果也存在一定误差,如何从拾取结果中剔除不可靠的初至波是进一步研究的重点。

[1] 曾庆才,曾同生,欧阳永林等.复杂山地层析反演静校正新方法及应用.石油地球物理勘探,2017,52(3):418-425,441. Zeng Qingcai,Zeng Tongsheng,Ouyang Yonglin et al.A new tomographic inversion for static corrections in complex mountain areas.OGP,2017,52(3):418-425,441.

[2] 谢春,刘玉柱,董良国等.基于声波方程的有限频伴随状态法初至波旅行时层析.石油地球物理勘探,2015,50(2):274-282. Xie Chun,Liu Yuzhu,Dong Liangguo et al.First arrival tomography with finite frequency adjoint state method based on acoustic wave equation.OGP,2015,50(2):274-282.

[3] 杨国权,丁鹏程,李振春等.应用线性程函方程和整形正则化的三维初至波旅行时层析.石油地球物理勘探,2017,52(2):264-272. Yang Guoquan,Ding Pengcheng,Li Zhenchun et al.3D first arrival traveltime tomography with linearized eikonal equation and shaping regularization.OGP,2017,52(2):264-272.

[4] 左国平,王彦春,隋荣亮.利用能量比法拾取地震初至的一种改进方法.石油物探,2004,43(4):345-347. Zuo Guoping,Wang Yanchun,Sui Rongliang.An improved method for first arrival pickup using energy ratio.GPP,2004, 43(4):345-347.

[5] 张伟,王彦春,李洪臣等.地震道瞬时强度比法拾取初至波.地球物理学进展,2009,24(1):201-204. Zhang Wei,Wang Yanchun,Li Hongchen et al.Seismic first arrival pickup using instantaneous intensity ratio.Progress in Geophysics,2009,24(1):201-204.

[6] 牛沛琛,张建中.基于数字图像处理的地震波初至时间检测.计算机与现代化,2007,(4):27-30. Niu Peichen,Zhang Jianzhong.First arrival picking based on image processing methods.Computer and Modernization,2007,(4):27-30.

[7] 曹茂森,任青文,万林梅等.Length分形维算法拾取地震波初至.石油地球物理勘探,2004,39(5):509-514. Cao Maosen,Ren Qingwen,Wang Linmei et al.Length fractal dimension method for picking siemic first break.OGP,2004,39(5):509-514.

[8] 裴正林,余钦范.基于小波变换和BP神经网络的地震波初至拾取方法.勘察科学技术,1999,(4):61-64. Pei Zhenglin,Yu Qinfan.A wavelet transform and BP neural network-based algorithm for detecting first arrivals on seismic waves.Site Investigation Science and Technology,1999,(4):61-64.

[9] Murat M E and Rudman A J.Automated first arrival picking:A neural network approach.Geophysical Prospecting,1992,40(6):587-604.

[10] 王金峰,罗省贤.BP神经网络的改进及其在初至波拾取中的应用.物探化探计算技术,2006,28(1):14-17. Wang Jinfeng,Luo Shengxian.The improved BP neural network and its application in seismic first breaks picking.Computing Techniques for Geophysical and Geochemical Exploration,2006,28(1):14-17.

[11] Kusuma T and Brown M M.Cascade-correlation learning architecture for first-break picking and automated trace editing.SEG Technical Program Expanded Abstractsx,1992,11:1136-1139.

[12] Fahlman S E,Lebiere C.The cascade-correlation learning architecture.Advances in Neural Information Processing Systems,1990,524-532.

[13] Baluja S,Fahlman S E.Reducing Network Depth in the Cascade-Correlation Learning Architecture.School of Computer Science,Carnegie Mellon University,1994,1-11.

[14] 杨钟瑾,史忠科.快速自底向上构造神经网络的方法.数学实践与认识,2004,34(9):114-118. Yang Zhongjin,Shi Zhongke.Fast approach for cascade-correlation learning.Mathematics in Practice and Theory,2004,34(9):114-118.

[15] 杨慧中,王伟娜,丁锋.神经网络的两种结构优化算法研究.信息与控制,2006,35(6):700-705. Yang Huizhong,Wang Weina,Ding Feng.Two structure optimization algorithms for neural networks.Information and Control,2006,35(6):700-705.

[16] 王治国,尹成,唐何兵等.沉积模式约束的地震多属性水下扇岩相划分.石油地球物理勘探,2015,50(2):357-362. Wang Zhiguo,Yin Cheng,Tang Hebing et al.Submarine fan lithofacies identification with depositional model and seismic attributes.OGP,2015,50(2):357-362.

[17] Hart D I.Improving the reliability of first-break picking with neural networks.SEG Technical Program Expanded Abstracts,1996,15:1662-1665.

[18] Wu Q,Nakayama K.Avoiding weight-ill growth:cascade correlation algorithm with local regularization.Neural Networks,1997,3,1954-1959.

[19] Fahlman S E.Fast learning variations on back-propa-gation:An empirical study.In Proceedings of the 1988 Connectionist Models Summer School,1989,38-51.

[20] 顾汉明,周鸿秋,张学强.初至时间的自动拾取.物探与化探.1992,16(2):120-129. Gu Hanming,Zhou Hongqiu,Zhang Xueqiang.Automatic pick of first arrival time.Geophysical and Geochemical Exploration,1992,16(2):120-129.

[21] 印兴耀,韩文功,李振春等.地震技术新进展(第一版).山东东营:中国石油大学出版社,2006,58-75. Yin Xingyao,Han Wengong,Li Zhenchun et al.New Progress in Seismic Technology (First Version).The Publishing House of China University of Petroleum,Dongying,Shandong,2006,58-75.

[22] McCormack M D,Zaucha D E and Dushek D W.First-break refraction event picking and seismic data trace editing using neural networks.Geophysics,1993,58(1):67-78.

[23] 刘志成.初至智能拾取技术.石油物探,2007,46(5):521-530. Liu Zhicheng.First break intelligent picking technique.GPP,2007,46(4):521-530.

猜你喜欢

权值神经元神经网络
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
神经网络抑制无线通信干扰探究
跃动的神经元——波兰Brain Embassy联合办公
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
ERK1/2介导姜黄素抑制STS诱导神经元毒性损伤的作用
毫米波导引头预定回路改进单神经元控制