APP下载

基于SVM算法的地震小断层自动识别

2017-12-22孙振宇彭苏萍邹冠贵

煤炭学报 2017年11期
关键词:采区曲率断层

孙振宇,彭苏萍,邹冠贵

(中国矿业大学(北京) 煤炭资源与安全开采国家重点实验室,北京 100083)

基于SVM算法的地震小断层自动识别

孙振宇,彭苏萍,邹冠贵

(中国矿业大学(北京) 煤炭资源与安全开采国家重点实验室,北京 100083)

为了提高小断层解释的准确率,构建基于支持向量机(SVM)算法的断层自动识别方法。通过分析构造部位和非构造部位地震属性特征,建立SVM两分类的断层识别模型。首先,研究支持向量机两分类算法的基本原理和结构,表明支持向量机在两分类问题上具有准确率高的优点;然后建立断层正演模型,分析不同地震属性的断层响应特征,表明断层分布与属性值变化趋势相关;通过对支持向量机算法和正演模型的分析,表明利用地震属性作为支持向量机的输入,预测小断层具有可行性。从叠后地震数据中提取方差、曲率等与断层相关的属性集合;通过相关性分析和聚类分析评估属性,确定4种互相关性低的地震属性。利用14口钻井、3条巷道的地震属性和断层信息共606个数据,选取400个作为训练样本,构造SVM断层识别模型;206个数据作为测试样本,进行断层识别,识别正确率达到98%。利用地震属性建立的SVM断层自动识别模型,能够有效识别小断层,降低人为主观因素的影响,缩短了解释周期;钻孔分布越均匀、数目越多,解释精度就越高。

支持向量机;断层;自动识别;地震属性

常规的断层解释通过观察地震剖面上振幅、相位和时差等特征识别断层,由于小断层在时间剖面上的变化微小,难以肉眼识别[1],解释结果受到解释人员主观因素影响较大。地震属性是地震数据通过数学计算得到的运动学、动力学、几何学及统计学特征。在构造解释,地层岩性解释等领域得到了广泛应用[2],能够解释时间剖面难以解释的小断层。相干属性与曲率属性是与断层密切相关的地震属性,相干属性使用相邻地震道信号的相似性描述地层的横向不均匀性,能表示地层的不连续性;地层曲率属性反映地层受构造应力挤压时层面弯曲的程度,曲率的绝对值越大,说明弯曲程度越大,小构造越发育[3-5]。相干体和曲率体都被用于解释断层,相干体常用于解释发生错断的断层,而曲率体常用于解释褶曲性的断层,故某一种属性只能解释地质现象的某一个方面。因此,采用多属性融合识别断层的方法既能避免单一属性的局限性,也能解决人工解释不能识别的小断层问题;多属性融合的优点是把大量的地震属性信息整合在一起,可充分挖潜数据内含信息,去除重复冗杂信息[6],提高断层解释的精度和效率。

支持向量机(Support Vector Machine,简称SVM)为一种新型的模式分类方法[7],是使用最为广泛的核学习算法,应用于煤层气和瓦斯涌出量预测[8-9]、煤层顶板导水断裂带高度预测、底板突水量预测及突水危险性评价[10-12]。支持向量机在解决小样本、非线性及高维模式识别中表现出特有优势,具有优良的泛化能力并且对解决分类问题和回归问题具有鲁棒性。

1 断层的地震属性响应特征

岩体在构造应力的作用下发生破裂,破裂面两侧的岩体发生显著位移或失去连续性或完整性,形成断层[13]。空间上与某一断裂带有关的高裂缝岩石变形区都可以称为破碎带[14],断层破碎带的规模与地质条件有关。断层破碎带由于张应力或挤压力的作用,使破碎带处岩石经历复杂的地质作用,甚至破碎带两侧岩体的物性发生变化,如岩石密度、硬度、孔隙度,出现断层泥和断层角砾岩等。由于断层处的物性发生变化,其地震上的响应也会发生一定变化,可以利用地震属性,比如频率、振幅、倾角等,分析这种地质变化。图1,建立的断层正演模型参数如下:模型分为3层:上、下两层为砂岩层,速度均为3 000 m/s,密度为2.7 g/cm3;中间为煤层,埋深300~330 m,速度为2 000 m/s,密度1.5 g/cm3,层厚为10 m。煤层含有4个断层,其中2个为正断层,2个为逆断层,自左至右断层落差分别为10,5,10,5 m,对应地震道号为40,60,95和135道。模型地震道间距为1 m,震源为雷克子波,频率60 Hz,采用垂直激发,模型正演剖面,如图2所示。

图1 断层模型Fig.1 Model of faults

图2 断层模型正演剖面Fig.2 Cross-section of fault forward modeling

图3 各属性与断层的关系Fig.3 Relationship between attributes and faults

对上述的正演模型提取方差、走向曲率、信号嘈杂程度、反射强度、瞬时相位、瞬时频率、倾角导数、倾角连续性、衰减系数以及最大振幅共10种地震属性。在属性数据上,有断层则用‘1’表示,无断层则用‘0’表示,构成属性值和断层信息的数据集。将每种属性值和断层信息分别投到平面直角坐标系中,由于每种属性的数量级不同,为将这些属性用同一坐标系显示,对每个属性进行归一化处理。通过观察属性值变化和断层信息变化的特征,可以看出:断层信息大致随属性值的变化呈现一定的规律性(图3),图中“竖直虚线”表示有断层存在。图3(a)显示:无论是正曲率还是负曲率,一定范围内无绝对值最大处有断层存在;方差属性值在一定范围内的最大值处,有断层存在;一定的范围内,混沌体数值大位置,有断层存在;倾角偏差的局部极大值位置,存在断层;倾角连续性绝对值的局部极大值位置,存在断层;图3(b)显示:瞬时频率在局部极小值位置,存在断层;一般情况下,发生正负相位转换的位置,存在断层;衰减系数的局部最小值处,存在断层;局部范围内,反射强度最小的位置,存在断层;最大振幅属性的局部极小值的位置,存在断层。

以上10种属性都能识别物性或几何形态的变化;但反过来,地层物性变化和几何形态变化,不一定是由断层引起的。如图3(a)中方差属性的第95道是局部最大值有断层,第85道也是局部最大值,但没有断层,所以单独使用方差体,不能完全正确识别断层。同一数据点,两个属性识别的结果不同,说明单一属性识别存在多解性,而两种属性同时识别能够有效的减少多解性。

通过对上述属性与断层分布的分析,可以看出10种属性都与断层存在一定的关系;同时,单独利用某一种属性,存在多解性。因此,应该综合利用上述属性,减少断层预测的多解性,提高识别精度。

2 地震属性的评估与选择

2.1 地震属性评估

通过对断层与地震属性响应特征的分析,可以知道地震属性与断层存在密切的关系,但是这些属性可能与断层有相似的关系,因此需要对属性进行评估。属性评估的主要目标是找到独立的变量,标记出相关性好的属性。首先,沿着目的层T0波开1个宽度为10 ms的时窗,提取上述的10个属性,组成属性集合;然后,计算各属性的相关系数,见表1。表1中的数值越大,两个属性的相关性越强,即说明两种属性与断层的关系更加相似。这种数值方法,与在属性剖面上通过视觉的定性解释类似,但是由于是通过数值计算得到的,因此拥有更多的定量描述。对这些属性进行评估,可以降低潜在的伪相关性。伪相关性是偶然发生的相关性,不是真正的物理相关性。伪相关性出现的概率与用于分类的地震属性的数量成正比,与数据控制点的数量成反比。为了把出现伪相关性的概率降到最低,应尽量多地选择样本数量。数据评估的结果证明了一些地震属性的密切关系,表明属性集中的一些属性需要剔除。

为了更进一步的评估各属性之间的相关关系,通过统计测试,进行R型聚类分析,根据聚类分析的结果,选择相互独立的属性,即关系较小的属性。

2.2 地震属性选择

属性评估之后,从属性集合中剔除无效的属性完成属性选择,为了确定一个选择有效属性的客观流程,需要制定一套属性选择的标准:① 选择有限个属性,在分类中限制地震属性的数目,降低伪相关性发生概率,这对识别断层尤为重要;② 每个属性都有一个突出的地质意义,一些地震属性受多个地质因素的影响,但是确定每个属性所代表的地质意义是非常必要的,见表1;③ 每个属性都是独立统计的,通常情况下,相关性强的属性是不能用来进行分类的。相关性强的属性共同组成一个属性簇,因此每个属性簇里只能选择一个属性。

表1各地震属性的地质意义
Table1Geologicalmeaningofsomeseismicattributes

地震属性沉积环境结构连续性断层厚度走向曲率——瞬时频率——方差—混沌体—瞬时相位——衰减系数—倾角偏差——反射强度——倾角连续性——最大振幅——

注:‘—’表示具有该地质意义。

3 模型构建

某一种地震属性单独识别断层,具有多解性。因此需要综合利用地震属性共同识别断层。该问题可以看作二分类问题,即将样本分为‘断层’和‘非断层’两类;每个取样点的各个属性为样本特征,即每个样本点由各属性值组成,利用支持向量机能够解决二分类问题。利用已知断层信息和选择的地震属性组成学习样本,构建支持向量机模型,对采区未知区域进行断层识别。

WTX+b≥0,di=+1

WTX+b<0,di=-1

图4 非线性可分数据映射到高维空间Fig.4 Non-linear data mapping to high-dimensional space

构建支持向量机模型需要选择合适的核函数参数g和惩罚参数c,使模型识别的准确率达到要求。人工选择这些参数需要不断的改变参数,对比准确率,工作量很大,并且很难短时间内找到最合适的参数,利用粒子群算法来寻找最合适的参数,可以做到自动寻优。

粒子群算法是一种模拟鸟类相互协作寻找食物的智能算法[20]。鸟类寻找食物,首先在个体飞行过程中找到距离食物最近的地方,同时和其他同伴交流,找到群体中最接近食物位置,不断缩小与食物的距离,最后找到食物。在粒子群算法中,每个解决方案称为粒子,通过最优粒子解决问题[21]。粒子群算法是基于群体的,不依赖个体的演化,而是根据对环境的适应度,找到群体的最优值。在一维空间中,某个个体的位置表示为xi,该个体运动过程中,适应值最好的位置为pi,群体中所有个体中适应值最好的位置为pg,个体的运动速度为vi,则对于每一代,个体的位置和速度将进行以下变化:

vi=wvi+c1rand( )(pi-xi)+

其中,w为惯性权重;c1和c2为加速常数;rand( )和Rand( )为在0到1范围内的随机值。w保证在全局范围内寻优,c1使个体在自身运动中寻优,c2在群落中信息共享。寻优时,重复(1),(2)直到找到最优适应值或达到最大代数时停止。粒子群算法易实现,收敛速度快,所以在许多领域都广泛应用,如人工神经网络的训练、函数优化、模式识别[22]、数据挖掘中的优化问题等[23]。

利用学习样本对支持向量机进行训练,同时应用粒子群算法寻找到最适合的参数c和g,使模型分类正确率最高,得到最优支持向量机模型。利用构建的支持向量机模型,进行采区未知区域的断层识别。

4 断层识别实例

以羊东矿的2号煤层为例,通过区内测井标定该煤层,利用斯伦贝谢公司捐赠我校的Petrel地震解释软件,解释得到2号煤的层位;采区地震数据的面元为5 m×10 m,在解释软件中的面元为5 m×5 m,对采区地震数据提取上述10种地震属性,形成采区属性数据;属性数据同样为5 m×5 m的网格,采区内共48 000个数据点;将钻井处、巷道处的属性值和断层信息,汇总成网络的样本数据。采区内共有钻井14口、巷道3条;提取钻井处2号煤层和巷道处的10种属性值,其中巷道中除揭露的断层外,每5 m一个采样点提取属性值,并记录每个取样点处,是否存在断层,“存在”用‘1’表示,“不存在”用‘0’表示,共提取606个样本数据。

4.1 采区地震属性评估与选择

分析样本数据,计算各属性间的相关系数,见表2;然后进一步分析,利用R型聚类分析,评估各属性间的相关性,如图5所示。可以得出:方差、倾角连续性、混沌体的相关性较高;反射强度、瞬时频率和最大振幅3种属性的相关性高;根据相关系数的计算和R型聚类分析的结果,可知:方差、走向曲率、瞬时相位和最大振幅相关性较差,相对独立,同时4种属性都具有断层的地质意义。因此,选择这4种属性作为支持向量机的样本。

表2地震属性相关系数
Table2Correlationcoefficientsofseismicattributes

参数1234567891011-0.0743-0.0771-0.5490.0051-0.14310.04750.23430.68320.63822-0.07431-0.06310.23570.44090.06490.0540-0.1151-0.0127-0.14583-0.0771-0.063110.27940.03790.22320.0772-0.1420-0.1003-0.00154-0.54900.23570.27941-0.00500.37140.3575-0.2144-0.3505-0.513050.00510.44090.0379-0.005010.1327-0.39690.06830.06700.07756-0.14310.06490.22320.37140.132710.31740.0039-0.1985-0.031570.04750.05400.07720.3575-0.39690.317410.0746-0.19440.107880.2343-0.1151-0.1420-0.21440.06830.00390.074610.04910.258890.6832-0.0127-0.1003-0.35050.0670-0.1985-0.19440.049110.0987100.6382-0.1458-0.0015-0.51300.0775-0.03150.10780.25880.09871

注:1—方差;2—衰减系数;3—走向曲率;4—反射强度;5—瞬时相位;6—最大振幅;7—瞬时频率;8—倾角偏差;9—倾角连续性;10—混沌体。

图5 R型聚类分析Fig.5 R cluster analysis1—方差;2—衰减系数;3—走向曲率;4—反射强度;5—瞬时相位;6—最大振幅;7—瞬时频率;8—倾角偏差;9—倾角连续性;10—混沌体

4.2 构建模型及参数优化

由于4种属性的量纲不同,影响网络训练结果,所以在训练之前,对样本进行归一化处理,以消除量纲。从处理后的数据中,选出已知的606个样本数据,其中断层样本105个,非断层样本501个。从样本数据中选取400个数据作为训练样本,206个样本作为测试数据。

利用粒子群算法,把预测断层的支持向量机模型的正确率作为适应度函数,将模型的惩罚参数c和核函数参数g作为待优化参数,优化预测断层的支持向量机模型。通过优化得到进化代数和适应度关系的曲线(图6),可知进化到20代后最佳适应度值就不再发生变化,此时最佳的惩罚参数c=70.644 6,核函数参数g=62.326 0。经过训练后的支持向量机模型的权值向量为w=[5.634 6,-2.792 0,-1.004 3,-4.607 8]T,偏置b为0.007 9,对训练后的模型进行测试,模型预测的正确率达到了98.54%(表3)。

图6 进化代数与适应度关系Fig.6 Relationship between evolutionary algebra and fitness

预测错误个数数据总个数正确率/%均方误差(MSE)平方相关系数(R2)320698.540.01460.9291

4.3 模型属性因子权重分析

利用支持向量机,通过对采区的断层预测分析,得到断层预测模型中各属性的权值,见表4。由表4可以得出:预测断层的属性因子中由几何特征和信号特征主导;瞬时相位等与运动特征相关的属性相对来说权值较小,对断层预测结果的影响较小。

表4属性因子权重分析
Table4Analysisofattributeweight

判别因子几何特征方差走向曲率运动特征瞬时相位信号特征最大振幅权值5.6346-2.7920-1.0043-4.6078顺序1342

4.4 预测结果对比

图7(a)为常规的振幅剖面,巷道揭露6个断层,图7箭头所指的位置,巷道揭露A处断层的落差为10~15 m,B处断层落差为8~10 m,C处断层的落差为4~5 m,D处断层落差为3~4 m,E处断层落差为7~8 m,F处断层落差为6~7 m。利用训练好的支持向量机,对该剖面进行断层识别,结果如图7(b)所示。图7(a)中断层的位置,在支持向量机模型识别的结果中均有断层,说明模型识别具有很高的正确率。将支持向量机模型与常规剖面解释、单属性解释的断层分布情况进行对比分析:常规剖面解释如果仅利用同相轴的错断、扭曲、分叉、相位转换等断层的标志,2号煤层的4个断层,只解释出断层A,B,E,F,这4个断层的落差较大,而C处和D处的同相轴没有错断、扭曲等断层的标志出现,落差较小,因而不能识别C,D这种落差小的不明显断层;而图7(b)中将常规剖面不能识别的C,D处的断层识别出来,体现了支持向量机模型较常规剖面识别小断层方面的优越性。

图7 支持向量机模型与常规解释的断层识别对比Fig.7 Comparison of SVM model with conventional interpretation

利用方差体属性识别断层,剖面中错断型断层均识别出来,但因为C处和D处没有错断,所以没有方差值异常,显示无断层存在;利用走向曲率体属性识别断层,C处有颜色变化,说明有断层存在,但是D处没有颜色变化,走向曲率值接近于0,依然不能识别D处的断层;利用瞬时相位属性识别断层,D处位于两个不同相位的分界处,同时D处前后取样点的瞬时相位值分别为26.74和-35.58,瞬时相位发生反转,说明有断层存在。瞬时相位属性将方差属性与走向曲率属性不能识别的D处断层识别出来,但是通过瞬时相位属性剖面,很难直接看出断层的分布情况和趋势。通过对比,每个属性在识别断层方面各具优势,但支持向量机模型能够准确、直观地识别断层,更重要的是能够识别出落差3~5 m的小断层。

总体来看,支持向量机模型综合每种属性的识别能力,具有识别准确率高,断层倾向明显、直观,能够识别小断层的特点,有效减少了断层解释的多解性,这些特点是常规剖面解释和单属性断层解释所不能比拟的。

通过支持向量机模型识别断层,得到采区断层分布,如图8所示,可以看出:向量机模型预测断层相对连续。

图8 模型预测与人工解释对比Fig.8 Comparison between model prediction and manual interpretation

在图8的A处,利用方差体、走向曲率、瞬时相位单属性预测均无断层特征,说明无断层存在;但利用最大振幅属性预测有断层存在。向量机模型预测结果表明A处存在断层,与常规人工解释的结果相同,同时与钻井资料吻合。表明支持向量机模型能够融合各个属性的特征,从不同角度挖掘断层信息,发挥各属性的优势。

在图8的B处,利用方差体、走向曲率单属性预测无断层,而瞬时相位和最大振幅单属性预测存在断层,但是利用向量机模型预测的结果B处没有断层,与常规人工解释B处存在断层的结果相悖。由于B处没有钻井,就是说B处没有钻井提供学习样本,使得向量机模型存在误差。因此,提高支持向量机模型预测断层的准确率,除了模型本身的准度之外,对钻井的数量和分布情况也有一定的要求:首先,钻井的数目不能过少。学习样本越丰富,模型学习的断层信息就越全面,预测断层的效果就越接近实际情况;其次,钻井的分布要均匀,这样得到的学习数据具有代表性,能够代表整个采区断层的特征。

通过对比模型解释和人工解释的结果,两者的差异不是很大,断层的主要分布格局基本相同,贯穿全区的3条大断层,基本吻合,只有一些规模较小的断层不吻合。同时,模型解释与人工解释相比缩短了解释周期,该采区利用模型解释从属性数据处理、评估到模型训练、预测所用的时间不到人工解释时间的一半。

综合从剖面和平面两个角度的分析对比:无论是常规断层解释,还是单属性断层识别,都无法识别出所有类型的断层,但支持向量机模型能够识别所有种类的断层,同时还具有快速、准确、直观、识别小断层等优点。

5 结 论

(1)支持向量机模型融合了各属性预测断层的优势,从不同角度挖掘断层信息,较单属性预测的结果更准确,基本与人工解释相吻合,降低了解释人员主观因素对解释结果的影响。

(2)采区钻井空间分布的密度及均匀情况都直接影响到模型预测的准确率。钻井分布越密集,越均匀,学习样本就越丰富,越具有代表性,预测的结果准确率就越高。若采区的钻井或巷道信息较少,也可以考虑利用常规剖面上能够确定的断层,作为学习样本,这样可以增加学习样本的丰富程度,提高模型预测的准确率。

(3)方差、走向曲率与最大振幅是影响断层预测的主导因素,权重分析验证了属性选取的科学性。因此,可以通过权重分析反证属性选择的合理性。

(4)在构建支持向量机模型时,模型本身的结构,如输入样本种类多少、参数选择、直接影响模型识别准确率外,地震属性的选择更加重要。采区不同,断层类型不同,选择的地震属性也会不同,因此,选择哪些地震属性,需要根据采区断层的具体情况决定。

(5)支持向量机模型预测断层工作周期较常规人工解释大幅缩短,能更有效的指导生产工作,提高生产的效率。

[1] 董守华,石亚丁,汪洋.地震多参数BP人工神经网络自动识别小断层[J].中国矿业大学学报,1997,26(3):14-18.

[2] 王开燕,徐清彦,张桂芳,等.地震属性分析技术综述[J].地球物理学进展,2013,28(2):815-823.

WANG Kaiyan,XU Qingyan,ZHANG Guifang,et al.Summary of seismic attribute analysis[J].Progress in Geophysics,2013,28(2):815-823.

[3] DI Haibin,GAO Dengliang.A new algorithm for evaluating 3D curvature and curvature gradient for improved fracture detection[J].Computer & Geosciences,2014,70:15-15.

[4] 杜文凤,彭苏萍.利用地震层曲率进行煤层小断层预测[J].岩石力学与工程学报,2008,27(S1):2901-2906.

DU Wenfeng,PENG Suping.Seismic horizon curvature for predicting small fault in coalseam[J].Chinese Journal of Rock Mechanics and Engineering,2008,27(S1):2901-2906.

[5] 杜文凤,彭苏萍,黎咸威.基于地震层曲率体属性预测煤层裂隙[J].煤炭学报,2006,31(S0):30-33.

DU Wenfeng,PENG Suping,LI Xianwei.Seismic horizon curvature attribute for predicting coalseam fracture[J].Journal of China Coal Society,2006,31(S0):30-33.

[6] 李婷婷,王钊,马世忠,等.地震属性融合方法综述[J].地球物理学进展,2015,30(1):378-385.

LI Tingting,WANG Zhao,MA Shizhong,et al.Summary of seismic attributes fusion method[J].Progress in Geophysics,2015,30(1):378-385.

[7] LIN Shihwei,LEE Znejung,CHEN Shihchieh,et al.Parameter determination of support vector machine and feature selection using simulated annealing approach[J].Applied Soft Computing,2008,8:1505-1512.

[8] 李艳芳,程建远,王成.基于支持向量机的地震属性优选及煤层气预测[J].煤田地质与勘探,2012,40(6):75-78.

LI Yanfang,CHENG Jianyuan,WANG Cheng.Seismic attribute optimization based on support vector machine and coalbed methane prediction[J].Coal Geology & Exploration,2012,40(6):75-78.

[9] 邵良杉,张宇.基于小波理论的支持向量机瓦斯涌出量的预测[J].煤炭学报,2011,36(S1):104-107.

SHAO Liangshan,ZHANG Yu.Mine gas gushing forecasting based on wavelet theory support vector machine[J].Journal of China Coal Society,2011,36(S1):104-107.

[10] 孙云普,王云飞,郑晓娟.基于遗传-支持向量机法的煤层顶板导水断裂带高度的分析[J].煤炭学报,2009,34(12):1610-1615.

SUN Yunpu,WANG Yunfei,ZHENG Xiaojuan.Analysis the height of water conducted zone of coal seam roof based on GA-SVR[J].Journal of China Coal Society,2009,34(12):1610-1615.

[11] 曹庆奎,赵斐.基于遗传-支持向量机的煤层底板突水量预测研究[J].煤炭学报,2011,36(12):2097-2101.

CAO Qingkui,ZHAO Fei.Forecast of water inrush quantity from coal floor based on genetic algorithm-support vector regression[J].Journal of China Coal Society,2011,36(12):2097-2101.

[12] 施龙青,谭希鹏,王娟,等.基于PCA_Fuzzy_PSO_SVC的底板突水危险性评价[J].煤炭学报,2015,40(1):167-171.

SHI Longqing,TAN Xipeng,WANG Juan,et al.Risk assessment of water inrush based on PCA_Fuzzy_PSO_SVC[J].Journal of China Coal Society,2015,40(1):167-171.

[13] 罗胜元,何生,王浩.断层内部结构及对封闭性的影响[J].地球科学进展,2012,27(2):151-164.

LUO Shengyuan,HE Sheng,WANG Hao.Review on fault internal structure and the influence on fault sealing ability[J].Advances in Earth Science,2012,27(2):151-164.

[14] KIM Y S,PEACOCK D C P,SANDERSON D J.Mesoscale strike-slip faults and damage zones at Marsalforn,Gozo Island,Malta[J].Journal of Structural Geology,2003,25(5):793-812.

[15] SAMMA H,LIM C P,SALEH J M,et al.A memetic-based fuzzy support vector machine model and its application to license plate recognition[J].Memetic Computing,2016,8:235-251.

[16] LIN Shihwei,LEE Znejung,CHEN Shihchieh.Particle swarm optimization for parameter determination and feature selection of support vector machines[J].Expert Systems with Applications,2008,35:1817-1824.

[17] BARATI Masoud,SHARIFIAN Saeed.A hybrid heuristic-based tuned support vector regression model for cloud load prediction[J].The Journal of Supercomputing,2015,71:4235-4259.

[18] CHENG W Y,JUANG C F.An incremental support machine-trained TS-type fuzzy system for online classification problems[J].Fuzzy Sets and Systems,2011,163:24-44.

[19] HONG W C.Chaotic particle swarm optimization algorithm in a support vector regression electric load forecasting model[J].Energy Conversion and Management,2009,50:105-117.

[20] 贾义鹏,吕庆,尚岳全.基于粒子群算法和广义回归神经网络的岩爆预测[J].岩石力学与工程学报,2013,32(2):343-348.

JIA Yipeng,LÜ Qing,SHANG Yuequan.Rockburst prediction using particle swarm optimization algorithm and general regression neural network[J].Chinese Journal of Rock Mechanics and Engineering,2013,32(2):343-348.

[21] KUO R J,WANG M J,HUANG T W.An application of particle swarm optimization algorithm to clustering analysis[J].Soft Computing,2011,15:533-542.

[22] BONYADI M R,MICHALEWICZ Z,LI Xiaodong.An analysis of the velocity updating rule of the particle swarm optimization algorithm[J].Journal of Heuristics,2014,20:417-452.

[23] 刘建华.粒子群算法的基本理论及其改进研究[D].长沙:中南大学,2009:8-9.

LIU Jianhua.The research of basic theory and improvement on particle swarm optimization[D].Changsha:Central South University,2009:8-9.

AutomaticidentificationofsmallfaultsbasedonSVMandseismicdata

SUN Zhenyu,PENG Suping,ZOU Guangui

(StateKeyLaboratoryofCoalResourcesandSafeMining,ChinaUniversityofMiningandTechnology(Beijing),Beijing100083,China)

In order to improve the seismic identification accuracy of small fault,an automatic fault recognition method based on support vector machine (SVM) is constructed.The fault identification model of SVM two classification was established by analyzing the characteristics of seismic attributes of tectonic and non-tectonic sites.Firstly,the basic principle and structure of the algorithm about SVM two classification were studied.It showed that SVM has the advantages of high accuracy in two classification problems.Then,a fault forward model was established to analyze the fault response characteristics of different seismic attributes,indicating that the fault distribution is related to the trend of the attribute value.By analyzing the SVM and forward model,it showed that it is feasible to use the seismic attribute as learning modules to predict small faults.A set of attributes related to faults,such as variance and curvature,was extracted from the post-stack seismic data.Four attributes with low correlation were determined by correlation and cluster analysis.Among total 606 data that consisted of the faults and attributes information from 14 drillings and 3 tunnels,400 data were used as training samples and constructed SVM fault identification model.The authors used 206 data as test samples to identify faults.The correct rate is 98%.The SVM fault identification established by seismic attributes can effectively identify faults,reduce the influence of human subjective factors,and shorten the time of interpretation.The more uniform the drilling distribution,the more the number,the higher the interpretation accuracy.

support vector machine;faults;automatic identification;seismic attributes

孙振宇,彭苏萍,邹冠贵.基于SVM算法的地震小断层自动识别[J].煤炭学报,2017,42(11):2945-2952.

10.13225/j.cnki.jccs.2017.0972

SUN Zhenyu,PENG Suping,ZOU Guangui.Automatic identification of small faults based on SVM and seismic data[J].Journal of China Coal Society,2017,42(11):2945-2952.doi:10.13225/j.cnki.jccs.2017.0972

P631.4

A

0253-9993(2017)11-2945-08

2017-07-14

2017-09-22责任编辑韩晋平

国家自然科学基金青年基金资助项目(41402143);国家重点研发计划资助项目(2016YFC0501102);国家科技重大专项资助项目(2016ZX05066001-001)

孙振宇(1991—),男,吉林松原人,硕士研究生。E-mail:szy93126@126.com。

彭苏萍(1959—),男,江西萍乡人,中国工程院院士。E-mail:psp@cumtb.edu.cn

猜你喜欢

采区曲率断层
大曲率沉管安装关键技术研究
一类双曲平均曲率流的对称与整体解
如何跨越假分数的思维断层
稠油热采区块冷采降粘技术应用
带平均曲率算子的离散混合边值问题凸解的存在性
嘛甸油田喇北西块一区断层修正研究
X油田断裂系统演化及低序级断层刻画研究
半正迷向曲率的四维Shrinking Gradient Ricci Solitons
11采区永久避难硐室控制瓦斯涌出、防止瓦斯积聚和煤层自燃措施
基于Delphi-TOPSIS法的露天矿采区接续方案优选