数据增广和主动学习在波阻抗反演中的应用
2021-08-18伊小蝶吴帮玉孟德林曹相湧
伊小蝶 吴帮玉 孟德林 曹相湧
(西安交通大学数学与统计学院,陕西西安 710049)
0 引言
地震波阻抗反演将地震数据转换成反映地层物性参数的阻抗信息,是岩层和储层精细刻画的关键技术。近半个世纪以来,阻抗反演技术从直接反演发展到基于模型的反演,从线性反演发展到非线性反演,从叠后反演发展到叠前反演,受到了广泛的关注[1]。
近年来,以卷积神经网络(CNN)为代表的深度学习方法在解决地震反演问题中得到了成功的应用[2-8]。这类方法大多基于有监督学习,即利用网络从给定的数据和反演结果(标签)凭经验寻找二者之间的联系,从而得到预测网络模型。深度网络由多隐藏层构成,通过最小化网络预测结果与标签之间的误差迭代更新内部参数,该训练过程需要足够多的标签。在标签足够多和质量足够好的情况下,与传统地球物理反演方法相比,深度学习方法可以产生精度更高的反演结果。Das等[9]利用Kennett反射率法产生合成数据,结合阻抗标签训练CNN并测试了网络模型的稳健性;Mustafa等[10]把地震数据和声波阻抗当作序列数据,使用时域卷积网络(TCN)模型学习二者之间的映射关系;Du等[11]提出用残差网络进行叠前反演,获得了P波阻抗、S波阻抗等岩性和物性参数;孙宇航等[12]基于序列数据假设,利用测井数据训练门控单元(GRU)神经网络预测横波速度;王俊等[13]将GRU网络用于测井曲线重构。
在前人基于深度学习的波阻抗反演研究中,网络的训练样本大多从合成数据中获得,很难直接用于实际数据。而实际标签样本从测井数据中生成,由于成本的原因,可用的测井曲线通常数量少,不足以充分训练网络,容易产生过拟合。因此,利用大量合成数据对网络进行预训练后,应用少量实际标签对网络进行迁移学习,是提升网络实际数据反演精度的有效策略[14-16]。
在制作合成数据标签时,保证标签的典型性和多样性,避免大量特征相近标签的出现,是提升网络收敛速度的关键。本文提出基于数据增广和主动学习的策略进行波阻抗反演网络训练。主动学习[17-18]不仅可以有效减少标签数量,而且能够优选出典型标签。通过对这些优选单道阻抗标签数据以内插重采样的方法进行增广,可对深度神经网络进行有效训练。Marmousi 2模型测试结果表明,仅用14道阻抗增广后的数据训练网络,即可获得整个模型3400道数据的高精度反演结果。
1 内插重采样的波阻抗增广方法
1.1 增广原理
一般常用的增广方式有裁剪、复制、增强特征、统计分布再抽样等,通过增加数据多样性提高网络模型泛化能力。对于时间序列源数据,增广方式主要从采样频率和时间窗着手,常见的增广方式有缩小采样频率的上采样、放大采样频率的下采样和同等采样频率的重采样。插值方法也有许多种,常用的有线性插值、三次样条插值等。为保证时间维度上的走势一致性,本文采用三次样条插值[19]。
用N维列向量d、r、I分别表示地震剖面的一道数据及对应的反射系数序列和波阻抗,通过Toe-plitz型子波矩阵W,可将地震子波与反射系数序列的卷积运算写为[20-21]
d=W*r
(1)
I与r的关系可表示为
(2)
引入时移循环矩阵K为随机核,与式(1)等号两边相乘。对于时不变地震子波,K与W可交换次序[22],可得
K*d=W*K*r
(3)
(4)
上述纵向内插重采样的具体步骤如下:
(1)任取一个N维波阻抗I,通过三次样条插值为N*维波阻抗(本文实验中,取N*=10N);
在实际应用中,子波在水平或垂直方向上经常发生变化。地质和岩性的非平稳性变化会给估计子波带来挑战。本文增广方法的最大优势是可以避开关于地震子波W的大量运算,从而减小误差[23]。
1.2 初步验证
图1 原始波阻抗曲线(红色粗线)与增广后曲线对比
图2 增广地震道(a)和反射系数(b)与原始曲线(红色粗线)的对比
2 反演网络的搭建
2.1 全卷积残差网络结构
全卷积网络(FCN)是一种没有全连接层的卷积神经网络,能够根据任意大小的输入进行预测,可用于解决反演问题[24]。在深度学习中,基于恒等映射的残差网络可缓解网络随着层数增加出现性能退化的现象[25]。结合这两种网络优点而设计的全卷积残差网络(FCRN),在提高预测精度的同时,缓解了网络训练困难的问题[26]。
FCRN结构如图 3所示,由首尾两个一维卷积 层(Conv)和中间三个残差块组成。首端卷积层由16个大小为300×1的核组成;每个残差块由两个一维卷积层组成,其中第一层拥有16个大小为300×1的核,第二层拥有16个大小为3×1的核;末端卷积层拥有1个大小为3×1的核。所有卷积层中使用零填充,以保证每个卷积层的输入和输出大小相同。为了加快网络收敛速度,FCRN选择了整流线性激活单元(ReLU);并且除了最后一层外,对所有卷积层的输出应用了批量归一化处理(BN)[27-28]。
图3 FCRN结构[24]
Wu等[26]提出的FCRN网络是以单道对单道的形式进行训练的,即在训练集中,一道地震数据输入对应一道波阻抗输出。令Ireal(d)表示地震道d对应的波阻抗真值,F表示训练出的反演网络,Θ表示网络参数的集合,则可用FΘ(d)表示网络预测出的一道波阻抗。网络的损失函数可用均方误差计算,定义为
(5)
由于小批量训练方法能够提高网络的泛化能力,本文设置Batch(批处理)大小为10;更新权重部分选择Adam算法优化网络中的参数,权重衰减设置为10-7;Epoch(训练集中的样本遍历次数)的数目设为10,学习率设置为0.001。为避免过拟合,当验证损失开始增加时,停止网络训练[29-30]。
2.2 基于主动学习的网络迭代
主动学习是机器学习算法之一。在数据集十分庞大时,可利用较少的训练数据,在更短时间内获得相同甚至更好的学习效果。减少标签数据、利用很少的数据训练出强泛化能力的模型,是主动学习最大的优势。
在实际训练过程中,训练一次后的网络尽管在训练集上表现良好,但在验证集上仍与目标值存在一定差距。这时便需要借鉴主动学习的思想,根据误差对此次训练集中的数据进行调整,直至下一次训练出的网络在验证集上的误差小于目标误差值。
2.2.1 初始选择策略
2.2.2 网络迭代方法
(6)
则第i次预测整体误差为
(7)
为避免峰值误差对判断的负面影响,减少主动学习迭代次数,本文引入平滑窗的概念,对剖面上的单道误差做平滑处理,改进最大误差的计算方法。
图4 主动学习每次迭代后选取新数据的流程蓝线为单道预测误差曲线,红线为平均误差曲线
(8)
图5 反演网络迭代总流程
3 实验
本文实验的所有数据基于减采样后的Mar-mousi 2模型[31](图 6),横向共有3400道,纵向有2800个时间采样点,采样间隔为1ms。
图6 Marmousi 2波阻抗模型及初始训练样本位置(红色竖线所示)
在网络迭代之前,人工选取了7道作为训练样本,其道号分别为249、599、1674、1799、2199、2499、2999。
图7 网络迭代误差曲线随迭代次数的变化
图8 纵向数据增广波阻抗预测剖面及误差曲线
4 方法对比
4.1 与横向增广的对比
与纵向内插重采样不同,横向数据增广的过程如下。
假设现有7道波阻抗数据,其位置与图 6相同,将其按位置顺序展开如图9a所示。在横向上,采用最简单的线性内插方法,内插成7×100道作为示例,如图9b所示。
图9 7道波阻抗信息(a)及其横向内插结果(b)
当主动学习根据图4流程完成一次对新位置的选取后,横向增广要将新位置按横坐标插入训练集中,再进行内插。横向数据增广和主动学习的地震波阻抗反演的流程如图10所示。
图10 横向内插数据增广和主动学习的波阻抗反演流程
横向内插数据增广和主动学习的地震波阻抗反演8次迭代后得到的结果如图11所示。其最大误差为0.3139,整体误差为0.1197,均高于图8中的误差。说明本文所提出的内插重采样波阻抗增广方法优于横向内插方法。
图11 横向数据增广波阻抗预测剖面及其误差曲线
4.2 主动学习与非主动学习网络训练方法对比
与主动学习不同,非主动学习网络训练方法采用随机选择初始训练样本进行数据增广训练网络;且前后迭代之间并无任何关系,每一次的网络训练都是独立的,重新随机选取训练样本。
随机迭代的效果在同样规模的训练集下,预测精度低于主动学习方法。将14×1000道的数据规模作为标准,考察在同样数据规模下的随机选择样本网络预测效果。但由于没有借助主动学习策略,其预测效果欠佳,并不具有可比性。
在随机选择140个位置,每个位置增广100道数据时,反演结果如图12所示,最大误差为0.0609,整体误差为0.0218,比图8的最大误差和整体误差略小。
对比图12与图8可知,虽然随机迭代的整体预测效果与主动学习迭代效果相近,但随机迭代选取了140个位置的数据,主动学习迭代只选取了14个位置的数据。而且,基于随机样本选取的预测结果误差主要集中于结构复杂横向变化剧烈的1600~2200道。该结果说明主动学习迭代方式可挑选更为典型的训练样本,使预测误差在整个数据集上得到有效控制,而不是集中于少数变化强烈位置。
图12 随机迭代方法的波阻抗反演剖面及误差
5 结束语
本文首先在理论上推导了单道内插重采样的增广方法,生成了反演网络训练集;然后应用主动学习,配置了反演网络参数并确定了参数更新方式。Marmousi 2模型实验结果表明,本文提出的算法只需14道真实的地震波阻抗信息,就可以反演出相对真实的波阻抗剖面。
本文并未对网络性能提升以及泛化能力展开研究。首先,可以通过优化FCRN网络结构的方式,提高反演精度,减少迭代次数,并使反演误差在整个剖面上较为均衡,更有利于实际应用;其次,对实际数据进行增广,并与迁移学习结合,检验本文方法在实际数据上波阻抗反演效果;再次,本文仅为单参数反演,在对多个弹性参数进行反演时如何利用主动学习策略对网络进行训练,也是值得研究的方向之一。