APP下载

基于稀疏诱导特征选择神经网络的储层预测方法研究

2022-02-19李克文苏兆鑫王兴谋朱剑兵

计算机应用与软件 2022年2期
关键词:正则特征选择岩性

李克文 苏兆鑫 王兴谋 朱剑兵

1(中国石油大学(华东)计算机与通信工程学院 山东 青岛 266580) 2(中国石化胜利油田分公司 山东 东营 257022)

0 引 言

随着我国油气勘探技术的不断提升,中、浅层大型背斜等构造油气藏的勘探数量逐渐减少,原油产量逐渐降低,勘探向更深、更隐蔽的储层发展。储层预测对油气勘探工作显得愈加重要。

深度学习作为近年来兴起的一类机器学习算法,已经在储层预测与岩性识别等工作上有了一定的应用。杨柳青等[1]使用卷积神经网络[2]建立测井参数与孔隙度之间的非线性映射关系。安鹏等[3]使用自然伽马(GR)等测井数据作为深层网络的输入进行岩性预测,取得了较好效果。项云飞等[4]结合多元线性回归与神经网络建立了储层参数预测模型,得到了比单模型更好的效果。然而现有方法大多使用测井参数作为输入数据,得出的模型无法在未打井的区域使用。

地震属性是地震勘探中得到的地震波数据,在一定程度上包含了对地下构造的响应,并且具有较高横向分辨率。地震属性种类高达百种。特征维度高但样本量稀少的数据容易产生“维数灾难”与“过拟合”问题。随着维度增加,还有可能造成学习性能的下降[5-6],特征选择是解决这一问题的有效手段。特征选择主要是寻找信息最丰富的特征来构造特征子集,从而在较低的维数上保持原始数据的固有结构[7-8],并不改变变量的原始表示,而只是选择其中的最优或次优的一个子集,保留了变量的原始意义。现有的特征选择方法一般分为过滤式、包裹式和嵌入式。神经网络也已经被应用于特征选择领域[9-12]。使用稀疏诱导正则化技术结合神经网络,在网络训练过程中进行特征选择已经有了诸多研究。基于L1范数惩罚的最小绝对收缩选择算子(Lasso)方法是中常见的稀疏性特征选择方法。在此之上,L1/2与Group Lasso等更多改进的正则方法也被用于特征选择[1,4,12]。

本文提出使用平滑的L1/2正则项结合神经网络的特征选择方法,进一步将输入层权值与ReLU函数结合构建特征选择层,加入到神经网络模型中,实现网络训练过程中输入层的稀疏化,进而实现特征的自动剔除与选择。使用此方法进行多种地震属性的特征选择,并构建基于DenseNet与SENet的储层预测模型提取并组织东营埕岛某区块的地震属性数据,通过与常规机器学习方法对比,验证了深度学习模型与特征选择层的有效性。

1 使用平滑L1/2正则项进行神经网络稀疏化的特征选择方法

图1 单隐层的全连接BP网络

(1)

以文献[13]提出的方法为例,将Lasso惩罚项集成到网络的输入层中,损失函数变为:

(2)

(3)

(4)

除了Lasso正则惩罚项,L2正则项更加光滑但不具有稀疏性,L1/2是近年来较为流行的一种正则项方法,具有更好的稀疏性和剪枝能力,但其非凸性、非光滑性使神经网络训练过程易于出现数值振荡现象[14]。将L1/2正则项加在输入层上时,惩罚项变为:

(5)

由于带有L1/2正则项的误差函数在原点处不可微,所以当权重向量接近原点时,使用平滑的函数代替L1/2正则惩罚,其平滑函数表达式为:

(6)

式中:α为一个小的常数。此时损失函数变为:

(7)

使用此方法训练神经网络模型,当模型精度不在提升时,提取每一个输入节点对应的连接权值的L1范数wn=(wn1,wn2,…,wnm),组成与输入层大小一致的向量W=(wnm)N×M=(w1,w2,…,wN),此向量则是经过正则项惩罚的神经网络训练后得到的每一个输入特征对应的稀疏权值。

将此向量与输入层相乘,起到了对输入特征的缩放效果,接着在后面继续加上ReLU[15]激活函数,构成特征选择层。ReLU函数对特征集合进行截断,偏置b为特征选择的阈值。考虑到输入特征权重已经变化,故重新训练神经网络,网络在优化w和b的同时,起到了对输入特征自适应选择的效果。工作过程如图2所示。

图2 ReLU函数对特征集合的截断过程

使用此方法进行特征选择可根据网络模型进行适配,在模型的训练过程中自动进行特征的剔除,简化网络结构,是一种对神经网络通用的方法。

2 储层预测模型构建

不同地震属性之间数值差异巨大,首先对地震数据进行归一化处理,在模型首端加入特征选择层进行输入层的稀疏化,而后基于DenseNet[16]的连接思想与SENet[17]的通道关联思想构建网络模型。

2.1 DenseNet结构原理

ResNet(Residual Neural Network)使用恒等连接的思想大大加深了网络的深度,并且极大地缓解了网络加深带来的退化问题[18]。这种短路连接的思想影响了许多网络模型,也成为加深网络的常用手段。DenseNet则将这种连接应用到了整个块结构上,将所有层直接相互连接,对于每一层,它前面所有层的特征图都当作输入,而其本身的特征图作为所有后面层的输入,确保网络中各层之间的最大信息流。这种结构可以缓解梯度消失问题,加强特征在整个网络的传播,并加强了特征重用。DenseNet的结构如图3所示。

图3 DenseNet块结构

2.2 SENet结构原理

SENet(Squeeze-and-Excitation Networks)可以显式地建模通道之间的相互依赖关系,自适应地重新校准通道方向的特征响应[17]。它的主要操作有两个:挤压(Squeeze)和激活(Excitation),Squeeze将每个二维的特征通道变成一个实数,这个实数某种程度上具有全局的感受野,它表征着在特征通道上响应的全局分布。而Excitation类似于LSTM网络中的门控机制,为特征通道生成权重,显式地建模特征通道间的相关性。最后通过scale操作使用得到的权重对原特征图进行缩放。SENet主要结构如图4所示[17]。

图4 SENet主要结构

2.2.1Squeeze操作

为了挖掘通道之间依赖关系,利用一个全局平均池化操作来生成通道级别的统计数据。Squeeze操作的计算式表示为:

(8)

式中:uc表示输入特征图的一道,H与W为特征图的维度;zc∈Rc表示Squeeze操作后得到的该道的统计数据。

2.2.2Excitation操作

Excitation的目的是构建通道统计数据之间的依赖关系,为了限制模型复杂性使用了两个具有减速比r的全连接层,然后使用ReLU激活函数得到通道级别的权重。Excitation操作计算式为:

s=Fex(z,W)=σ(g(z,W))=σ(W1δ(W2z))

(9)

(10)

2.3 储层预测模型构建

模型使用原始振幅、平方根振幅、瞬时相位和瞬时频率等49个叠后地震属性,组成大小为7×7的输入层,加上与此尺度对应的特征选择层。模型的中间部分为堆叠的Dense_SE_block结构,如图5所示,每个卷积层使用3×3大小的卷积核,并使用Squeeze与Excitation操作融合通道间特征,使用elu[19]激活函数,在卷积层与激活函数之间加BatchNormalization层,可有效地防止梯度消失。以每五个特征图为单位,堆叠DenseNet结构,特征图之间两两相连,每一个特征图接收之前的特征,同时也向后面所有的特征层传播,使的每一个特征在网络中得到最的保留,网络靠前的特征也可以被靠后的部分使用到。

网络使用特征选择层后接若干个Dense_SE_block叠加的形式,Dense_SE_block个数根据模型性能进行调整,最后加三个全连接层与Sigmoid层进行砂岩、泥岩二分类。使用adam算法进行网络训练,整个流程如图6所示。

图6 储层预测模型训练过程

3 实验与结果分析

3.1 实验数据与处理

以东营埕岛区块作为研究对象,提取SEGY地震数据体、测井岩性数据、时深转换数据以及层位信息等。使用原始振幅、平方根振幅、瞬时相位、瞬时频率等49个叠后地震属性作为网络输入,以及对应的经过时深转换匹配后的井上岩性数据作为标记。共得到45 450个样本数据,以6 ∶2 ∶2的比例划分训练集、验证集与预测集。

3.1.1地震属性处理

根据地震数据采集时的地理坐标位置以及inline和cdp的范围,计算segy文件中每一道数据所在位置,双程旅行时范围为1 025,inline范围为627至2 267,cdp范围为1 189至1 852。由于每一种属性数值范围差别巨大,所以对数据进行归一化处理,其计算公式为:

(11)

3.1.2岩性标记处理

表1 岩性列表

3.2 预测方法对比

神经网络模型使用8个Dense_SE_block块与特征选择层构成的网络,对比方法分别为没有特征选择层的网络以及常规机器学习算法,包括决策树算法、KNN算法、XgBoost算法。网络模型取测试集准确率最高时的结果,其他方法采用十折交叉验证结果。各方法的准确率、查准率、查全率如表2与表3所示。

表2 各方法训练集效果(%)

表3 各方法预测集效果(%)

由表2和表3可见,本文提出的Dense_SE_net卷积神经网络模型在预测集准确率、查准率均高于常规机器学习算法,并且使用特征选择的神经网络模型比不带特征选择层的模型具有更高的预测集准确率,同时训练集准确率几乎相当,证明了特征选择对于模型性能的提升,并有一定程度抑制过拟合的作用。FS_Dense_SE_net模型的预测集准确率可达到72.95%,在所有预测结果为砂岩的样本中,有66.83%的样本预测正确,所有真实砂岩样本中有55.95%预测正确。

3.3 岩性预测仿真实例

使用FS_Dense_SE_net模型对井CB11、CB111进行岩性预测,结果分别如图7至图10所示,左图为预测结果,右图为真实情况,纵坐标为双程旅行时,黑色部分为砂岩,其余部分为泥岩。在砂岩密集的井CB11与砂岩稀疏的井CB111均取得了较好结果。

图9 CB111预测情况 图10 CB111真实情况

使用FS_Dense_SE_net模型进行地下纵向切片岩性预测,取主测线inline为1 328,共深度道集CDP为1 189到1 852的数据进行砂岩标记成像,结果如图11所示。

图11 inline=1 328岩性预测结果

4 结 语

本文提出了一种使用正则惩罚进行网络稀疏化的特征选择方法,以及一种结合此方法的使用DenseNet与SENet结构的储层预测模型。使用平滑改进的L1/2正则对网络输入层的权值进行稀疏化,当模型不再收敛时得到输入层每个节点对应的连接权值的范数,以此作为每个输入特征的权重。使用ReLU函数在进一步的训练中对部分低权值特征进行截断,进而实现网络训练过程中的自动特征选择。结合此方法,提出了基于DenseNet短连接与SENet通道连接思想的神经网络储层预测模型。使用胜利油田埕北某工区的地震属性数据与岩性数据进行模型的训练与验证,验证了深度学习模型相比传统机器学习算法在该问题的优越性与本文提出的特征选择方法的有效性。

猜你喜欢

正则特征选择岩性
任意半环上正则元的广义逆
sl(n+1)的次正则幂零表示的同态空间
绿色建筑结构设计指南
黔中地区土壤酶活性对岩性的响应
测斜仪在钻孔施工中的应用技术
渠道运行多年后渠体中各土体物理力学性质对比情况分析
基于智能优化算法选择特征的网络入侵检测
渠道运行多年后渠体中各土体物理力学性质对比情况分析
故障诊断中的数据建模与特征选择
reliefF算法在数据发布隐私保护中的应用研究