APP下载

基于支持向量机由海洋地震勘探数据对海洋水体温度的预测❋

2022-09-05彭阳阳

关键词:反演海水向量

彭阳阳, 张 进,2,3❋❋

(1. 中国海洋大学海洋地球科学学院, 山东 青岛 266100; 2. 海洋矿产资源评价与探测技术功能实验室, 山东 青岛 266237;3. 中国海洋大学海底科学与探测技术教育部重点实验室, 山东 青岛 266100)

海水的温度结构的精细划分有利于研究水体的温度结构和海水运动等问题。常规的海水温度测量多采用CTD,XBT等方式,虽然这些方式所测得的海洋水体垂向温度分辨率高,但是横向连续性较差。地震海洋学通过反射地震勘探方法来研究物理海洋现象,相对于传统的接触式温盐深测量方法,该方法具有较高的横向分辨率和能快速对整个海水剖面成像等优点[1]。

Holbrook等[2-3]首次用地震学方法获得海水的地震叠加剖面,并揭示了海洋锋处的温盐结构。随后Nandi等将常规反射地震与XCTD数据有效结合,验证出温度剖面和地震剖面有很好的一致性,并成功刻画水团边界[4],更加验证了将地震学应用到海洋温度反演是可行的。Páramo等[5]利用AVO技术分析海洋地震数据,反演出海水温度参数,结果表明利用AVO技术虽然能得到海水声速和温度的差异,但对地震资料要求较高,并且反演得出海水密度参数不准确。为了提高反演准确度,Wood等[6]利用一维全波形反演方法尽可能的利用丰富的波场信息求取海水温度参数,但Kormann等人分析出初始模型对一维全波形反演海水温度参数结果有影响[7]并且运算速度低。为提高温度剖面反演速度同时考虑到海水的温度参数与地震数据的非线性关系,Padhi等人分别利用遗传算法与非线性最小二乘反演方法结合反演海水的温度,并且应用效果显著[8]。然而这些方法在反演海洋水体温度参数方面,需要大量的温度标签数据,限制了地震海洋学的发展。

支持向量机(Support Vector Machine,SVM)可以在小样本数据情况下得到较好的反演结果[9]。通过文献的调研,前人利用SVM在储层预测和海浪预测等方面行之有效,例如:金权等人利用SVM对海洋波高进行预测,证明支持向量机在海浪预测的可行性[10]。高伟等人提出一种基于支持向量机对海底声学参数快速统计反演的方法[11]。周凡等[12]利用支持向量机对流体进行识别,其预测准确率达90.48%。唐小彪提取了地震属性并且基于支持向量机对地震储层进行预测,预测结果与设计的储层地质模型十分吻合[13]。

支持向量机可以在小样本情况下能够充分的利用样本信息,该算法不仅易实现还具有较好的“鲁棒”性[14]。本文将一种基于支持向量回归机的方法应用于海水温度反演研究中。首先,提取海洋地震数据的属性参数,将主成分分析方法优化后的地震属性作为输入,再利用网格交叉验证的手段训练支持向量回归机,结合地震数据和CTD数据来预测海水温度。结果表明支持向量回归机在少量海水温度样本的情况下,对海水温度预测的效果显著,能够精准的划分水层,拟合优度达到98%,为后续的海洋研究奠定基础。

1 支持向量回归机(ε-SVR)模型

(1)

式中:b为偏置量;Φ为映射核函数;w为权向量。通过求解以下原始的优化问题(如(2)式所示)获得最佳的逼近函数:

(2)

对原始的优化问题求解复杂,将求解原始问题通过拉格朗日乘子法和强对偶关系转换为求其对偶问题,如(3)所示:

(3)

(4)

式中:Xj为核函数中心;σ为函数的宽度参数。

(5)

2 基于SVR的海水温度实例预测

本文数据来自渤海海区,渤海海区是深入中国大陆的近封闭性浅海,其平均水深只有18 m,最深处也只有83 m[15]。本文截取1 000道渤海浅剖数据,地震采样间隔为0.5 ms,截取每道86个样点,记录时长43.0 ms,深度32 m。8月份在渤海测量CTD为共3道(此时海水温跃层最强),截取深度32 m,如图1所示,研究海区的海水温度随深度总体上呈现下降趋势。根据CTD测量的海水深度和速度转换到地震数据时间刻度如图2所示。

(从左向右依次:CTD1,CTD2和CTD3。From left to right: CTD1, CTD2 and CTD3.)

(位于85、471和854地震道的三条黑线表示编号为CTD1、CTD2和CTD3的3个CTD。CTD1, CTD2 and CTD3 are located at CDP85, 741 and 854, respectively.)

利用主成分分析的方法优选出对温度敏感的地震属性,将CTD标签数据和优选后的地震属性作为输入向量,利用网格交叉验证方式训练SVR,预测海水温度并分析效果。海洋温度参数与地震属性存在非线性关系,通过ε-SVR构造非线性逼近函数,具体流程包括以下步骤:

第一步:分析并处理原始地震数据与CTD数据,建立二者时空对应关系。

第二步:从地震数据中提取并优化地震属性。

输入:数据集P={p1,p2,……,pn},需要降到k维。

(1)去平均值(即去中心化),即每一维特征减去各自的平均值。

(2)计算协方差矩阵PPT,其中n为样本数目。

(3)用特征值分解方法求协方差矩阵PPT的特征值。

(4)观察特征值,选择其中占比较重的特征值对应的地震属性。然后将其对应地震属性向量组成支持向量机输入集x。

第三步:归一化处理。对地震属性和CTD样本温度标签进行归一化处理,其转换函数如式(6)所示:

(6)

第四步:网格交叉验证寻找SVR中C和g最优参数组合。选取高斯核函数进行模型训练,网格离散区间为[-5,5],枚举其中C和g的组合,选择最优的组合,使得SVR误差最小。

第六步:反归一化处理并对模型进行评价。对ε-SVR输出值进行反归一化处理求取温度。本文利用拟合优度R2和均方误差函数(MSE)参数评价模型的表现性能,其具体公式如式(7)和(8)所示:

(7)

(8)

第七步:预测拟合CTD3的温度值并对模型评价。将CTD3对应的地震属性输入ε-SVR,预测函数如式(9)所示,对预测模型评价不仅采用拟合优度(R2)和均方误差函数(MSE)的方法,还分析了预测温度值偏离真实值百分比,公式如(10)所示。

(9)

式中:L为CTD3对应的86个样本数目;x为一个对应地震属性向量的样本。

(10)

第八步:预测整个海水温度剖面。将所有道地震属性向量作为样本输入,预测整个剖面的海水温度,并分析效果。

本文提取地震属性共13种:方差(var)、瞬时频率(Freq)、均方差振幅(Rmms Ampl)、瞬时带宽(Int)、瞬时相位(Phase)、一阶导数(D1)、二阶导数(D2)、时间(Time)、原始振幅(Ampl)、时间增益(Time Gain)、相对声波阻抗(Rel Ampl)、道梯度(Trace Grad)、道增益(Iterative AGC),对地震属性进行主成分分析。

如图3主成分分析表明7种属性值(时间、原始振幅、道梯度、道增益、时间增益、一阶导数、二阶导数)占比较重且可表达总属性95%的信息,因此提取该7种属性作为输入数据集。

图3 13种地震属性主成分分析

使用RBF作为核函数的SVR需要考虑参数C和g,确定好C,g使得分类器能正确的预测未知数据,参数的选择没有先验知识,必须做某种类型的模型选择(参数搜索)。本次选择网格交叉验证方法,5折交叉验证充分地利用已知信息提高预测精度,遍历网格所有参数C和g,求取最优参数C和g作为SVR的参数,其寻优步骤为:

(1)确定实际应用中参数的范围:

-5≤log(C)≤5,-5≤log(g)≤5。

(2)训练支持向量回归机并预测。将训练集样本分为5组,支持向量回归机模型遍历网格中的C和g取值并计算每个样本的预测值与实际标签的温度误差。

(3)寻找温度误差最小值,输出最佳的组合参数。

利用网格交叉验证方法编程计算得出最优参数组合参数C和g分别为4,0.088 4。构建支持向量回归机模型,优化后的地震属性作为输入,温度作为输出。本次将CTD1和CTD2进行训练,其训练效果如图4所示。

图4 CTD1和CTD2预测结果对比

其中红色代表CTD温度的真实值,蓝色代表预测值。通过训练集可以看出其均方误差为0.7 ℃,拟合优度为97%,训练效果较好。抽取其CTD3对应处的温度信息与样本温度标签比对,其拟合优度达到98%,均方误差为1.1 ℃,吻合较好,如图5所示。

图5 CTD3预测结果和标签对比

将CTD3预测值和真实值做差,误差如图6所示,温度最大差值为1.46 ℃,此时对应的标签温度为23.43 ℃,预测的温度为21.96 ℃,其误差最大百分比为5.92%。误差主要来源于海水温度差异小,CTD曲线之间差异较大以及支持向量回归机在数值上存在四舍五入的误差。

图6 CTD3温度预测误差百分比

将CTD数据组合,对数据集划分测试集和预测集,对组合效果进行测试,其拟合优度平均值为0.976,误差函数平均值为0.010,可见支持向量机预测效果良好,其CTD数据集组合效果测试如表1所示。

表1 CTD数据集组合效果测试

将CTD组合方式1训练好的支持向量机推广到整个地震数据,反演得到的温度剖面如图7所示。

图7 海水温度预测剖面

可以看出,反演的海水温度水平分层明显,其温度范围大致在14.50~25.50 ℃,主要分为5层,温度变化明显的层对应深度大致在3.04,9.12,15.96和26.22 m,其对应层的温度范围为:25.5~24.48,24.48~22.21,22.21~19.10,19.10~16.20和16.20~14.50 ℃,计算其温度随深度变化的梯度,发现在第三层,即深度为9.12~15.96 m之间温度变化最明显,判断其为温跃层,厚度大致为6.84 m,该结果与文献[15-16]相符。从整个剖面可以清晰的看出海水温度分层明显,横向连续性较好,分辨率高。表层海水由于受太阳辐射,水温25 ℃左右,随着深度的增加温度逐渐降低,由于海浪和海水流动的动压力致使层与层之间有些许起伏,底层海水层区分明显。

4 结论

本文利用主成分分析方法进行地震属性优化,利用CTD温度标签数据和优选后的地震属性训练支持向量回归机,成功的反演出海水温度剖面。得到以下结论:

(1)利用主成分分析方法在13种地震属性中优选出了7种相对海水温度敏感的地震属性,应用到海水温度预测中效果明显。

(2)支持向量回归机在海水温度标签少的情况下可以预测海水温度,但是海水温度本身差异小,再加上标签在差异性较大以及支持向量机在实际应用中带有一定的舍入误差导致预测的海水温度存在一定的误差。

猜你喜欢

反演海水向量
反演对称变换在解决平面几何问题中的应用
向量的分解
聚焦“向量与三角”创新题
喝多少杯海水能把人“渴死”?
海水为什么不能喝?
基于低频软约束的叠前AVA稀疏层反演
基于自适应遗传算法的CSAMT一维反演
海水
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线