APP下载

基于改进随机森林算法的钻井工况异常自动识别研究

2022-02-17刘胜娃,苏兴华,詹胜,何以晴,胡刚,隗崇华

电脑知识与技术 2022年35期

刘胜娃,苏兴华,詹胜,何以晴,胡刚,隗崇华

摘要:当前钻井工况异常复杂,异常工况特征较多,影响了钻井工况异常识别结果的准确性与全面性,为此,本文提出基于改进随机森林算法的钻井工况异常自动识别方法。布设传感器监测钻柱振动数据,提取数据中的钻井异常参数,使用EMD提取异常工况特征。结合异常工况特征提取结果,利用改进随机森林算法构建钻井工况异常自动识别模型,得到相关的识别结果。实验结果表明,设计方法在钻井工况异常自动识别方面具有极高的可靠性,能够保证工况异常识别结果的准确性与全面性。

关键词:随机森林算法;钻井工况异常;异常识别;EMD;异常工况特征

中图分类号:TE142      文献标识码:A

文章编号:1009-3044(2022)35-0087-03

钻井工程是一个具有较强不确定性的复杂施工过程[1],在钻井施工作业的过程中,受钻井设备、井下环境等异常的影响,时常发生不同类型的钻井异常工况[2]。这些异常工况威胁着钻井施工的安全性,一旦钻井发生故障,如跳钻和黏滑情况[3]等,可能直接导致关井等后果,严重影响钻井的工作效率和质量[4]。研究钻井工况异常的识别方法,对于及时处理异常工况,提高钻井工作效率,降低维护成本具有重要意义[5]。而传统的钻井工况异常识别方法存在难以提取异常工况特征的局限性,识别结果存在偏差,存在漏识、误识等情况,为此,本文提出基于改进随机森林算法的钻井工况异常自动识别方法,并通过实验验证了本文方法在钻井工况异常识别中的应用性能。

1 设计基于改进随机森林算法的异常检测识别模型

1.1 布设传感器监测钻柱振动数据

为了实现对于钻井工况异常的自动识别,需要在获取大量钻井工作数据的基础上,对异常情况进行分析。所以,需要对钻井设备进行实时监测,以获取工况数据,为异常识别提供重要的数据基础。为此,本文使用振动传感器,对钻井的钻柱进行振动信号的测量。由于在实际的工况中,钻井钻柱的振动方向并不是单一垂直运动的,而是会受到各种反作用力,产生水平振动、垂直振动以及变向振动等。为了数据采集的全面性与完整性,本文还另外添加一台加速度传感器,以满足对于钻柱振動数据的全面测量。同时,为满足数据处理高效率的要求,本文使用云端数据库将收集信号进行实时存储,以便后期进行线上的数据处理。

1.2 提取数据中的钻井异常参数

在收集好钻井运行时相关的工况数据后,本文对数据进行初步处理,降低信号数据中的干扰因素,并提取其中的钻井异常工况的参数。在此,本文使用聚类算法提取异常参数。

假设数据集为[A],其中存在的数据对象有[N]个,那么可以将数据集[A]表示为[A=1,2,...,N]。对于任意一个数据对象[N]来说,都有各自的属性分类[B],那么可以将数据根据属性进行划分,使其成为含特定属性[B]的聚类。在此基础上,选用该聚类簇的平均值[C]为中心,重新对剩下的数据进行划分,形成新的聚类,重复循环,直到数据划分完成。依据平方误差的计算公式,异常参数的提取公式表示如下:

[Q=i=1na∈ba-Ci]                     (1)

式中,[n]表示的是聚类数量参数,[a]表示的是数据集中的某一数据对象;[b]表示的是某一聚类分簇;[Ci]表示的是该分簇的平均参数。通过上述公式,能够计算出全部数据对象的平方误差参数[Q],实现对异常参数的提取。

1.3 EMD提取异常工况特征

本文在获取钻井异常工况的数据参数后,需要对其中的异常特征进行提取,以更好地分析钻井工况异常的类型与相应特征,从而进行异常工况识别。为了保证提取效果,本文使用EMD方法,对异常工况的特征进行提取。

在钻井向下钻进的过程中,容易出现钻头脱离的跳钻情况,为此本文对钻柱垂直运动方向的数据进行特征提取,以识别钻井的异常工况。利用EMD方法对钻井异常参数进行时域特征的提取。假设异常参数[D]中,存在极大值[dmax]以及极小值[dmin],通过连接[dmax]和[dmin],使得存在两条贯穿全部异常参数的曲线[z]、[x],那么对于[z]和[x]来说,能够求出二者间的平均曲线[v],可以得出如下计算公式:

[g=D-v]                            (2)

式中,通过异常参数与平均曲线作差得到异常参数[D]的特征尺度[g]。但仅仅计算出[g]是不能满足特征提取需求的,因此,还需要验证[g]的数值能够符合特征尺度的条件要求。验证成功后,继续进行下一特征尺度的提取,直到获得[n]个[g]值。

通过上述方法,能够提取跳钻情况的异常特征,然而在实际钻井运行过程中,出现异常工况的情形是多样的,仅凭一种异常特征,难以识别全部的异常情况。对此,本文还对异常参数的频域特征进行提取,以完善异常工况的特征情况。

经过分析历史数据中的异常工况数据,并结合专家经验,本文建立了钻井工况异常特征的关系规律,部分情况如表1所示:

1.4 改进随机森林算法实现异常识别

在提取异常特征以后,本文建立了相应的异常特征对比数据库,以满足对于实时获取的钻井运行数据进行匹配,搜寻其中的异常工况信息,利用改进随机森林算法进行钻井工况异常自动识别。

我们先构建判断异常特征的决策树。假设传感器捕获的数据集为[W],其中对于异常识别的决策特征为[E],由于特征类型众多,为每个异常特征进行属性划分,划分出[q]个属性量,那么对于该数据集来说,能够求出其相关的信息熵[R],其公式表示如下:

[R=i=1ntilog3ti]                       (3)

式中,[n]表示的是数据中的特征数量参数;[ti]表示的是[W]根据[E]进行分类后的数据子集。

随机森林算法就是通过特征取值,随后对数据集进行划分,将其分为无数个小子集,形成相应的决策树模型。这种计算过程较为复杂,使得故障识别的运算效率不能满足实际的需求,为此,需要对其进行优化。对此,本文引入步长LMS算法,对随机森林模型进行优化。

首先,划分数据的特征。由于已经通过历史数据提取了异常工况的特征参数[D],那么可以以此为标准,对数据集[W]进行预划分。计算出[W]集合内的特征参数[e],将[e]与标准参数[D]进行比对,若满足[e≺D]这一条件,那么就可以将该特征归为左分支,若满足[e≥D]这一条件,则归到右侧分支。按照这一思路,能够对[e]进行排序,从而得到[E=e1,e2,...,en]。

其次,对构建好的决策树进行离散度的评价,以缩小算法的方差差异。假设标准差参数为[r],那么对于集合[E]来说,其离散程度[M]的计算公式可以表示为:

[M=r∂]                                   (4)

其中,[∂]表示的是集合[E]的平均参数,通过[r]与[∂]之间的比值,能够分析出数据集[W]的离散度。

最后,使用步长LMS对其进行优化。假设窗口的滑动步长范围为[l],且满足[l=1,5],从[l]的最小值1起始,当窗口滑动的过程中,需要确定滑动均值[la],然后通过[la]的大小确定最佳的集合划分点[a]。以此方式,不断进行划分,直至特征参数被划分完畢。这样,就能够获取优化后的随机森林决策树。

通过建立改进后的随机森林构建钻井工况异常自动识别模型,能够判断数据集中异常工况的特征数据,从而在历史数据库中寻找最优解,通过匹配,实现钻井工况异常的自动识别,以此保证识别质量与效果。

2 实验论证分析

为验证本文设计的基于改进随机森林算法的钻井工况异常自动识别方法的有效性,进行实验论证。在某地的钻井施工过程中进行实验,具体的实验准备以及实验结果如下。

2.1 实验准备

本文对该地的11号钻井进行工况异常识别的实验,该钻井机为徐工的XSL7/350型钻机,钻孔深度高达700m,并采用履带式驱动,便于进行调度,该钻机采用CUMMINS QSB5.9-C210型发动机,功率可达155kw,具有较强的地层适应性。通过安装振动传感器,以此测得了钻井运行过程中,正常工况以及发生异常工况的信号数据,经过分析后绘制了相应的分解图,具体情况如下图1与图2所示:

分析对比图1、图2可以看出,钻井工作时正常情况下振动数据波动较为平稳,上下不会超过0.5m/s2。而发生异常工况时,存在信号波动尖峰,超过正常波动阈值,如图2监测数据点在460左右,超过了0.5,并且数据点在590~690之间,存在持续波动段,可见出现跳钻类异常工况,以此能够保证实验的真实性和可靠性。

2.2 实验结果

本文分别使用传统的随机森林识别方法以及本文设计的改进随机森林的自动识别方法进行异常工况识别,记录两种方法的识别数据。得到了两种方法对于钻井异常工况识别的结果,具体情况如下图3所示:

图3中,阈值在0范围内上下波动1表示识别结果为工况正常,达到5左右表示识别结果为异常,-5左右表示为识别结果模糊。由上图3可以看出,随着采样增加,本文方法与实际监测的振动信号结果分析基本一致,较传统方法在识别结果准确性方面具有明显的优势。在前期正常工况时,传统方法与本文设计方法能够保证较平稳识别,而面对瞬时异常时,本文方法能够准确识别异常,传统方法却没有识别出异常情况。同时,在面对持续异常情况时,本文方法能够做到精准及时识别,而传统方法识别存在较大时间差,并且判断结果存在模糊情况。对比证明,本文设计方法更具可靠性,且对于钻井工况异常的识别准确率较高。

3 结束语

为了保证钻井工况异常自动识别效率与质量,通过改进随机森林算法,实现对于钻井工况异常的自动识别。对比传统识别方法,验证了本文设计方法具有极高的可靠性,能够保证工况异常识别的准确全面,可以在实际中得到广泛应用。

参考文献:

[1] 罗光强,李扬,周策,等.深孔智能化钻井参数远程监控及工况识别系统研究[J].地质与勘探,2022,58(3):696-702.

[2] 李衍志,范勇,高琳.基于形态流的石油钻井水流异常检测[J].计算机应用,2021,41(6):1842-1848.

[3] 刘胜娃,曹湘华.基于决策树的钻井工况智能识别方法[J].新型工业化,2022,12(1):28-30.

[4] 李雷,韩烈祥,姚建林.参数耦合在粒子冲击钻井智能决策系统中的应用[J].钻采工艺,2020,43(3):4-6,45,1.

[5] 李兵,韩睿,何怡刚,等.改进随机森林算法在电机轴承故障诊断中的应用[J].中国电机工程学报,2020,40(4):1310-1319,1422.

【通联编辑:张薇】