APP下载

基于SMOTE-DA-RF算法的有杆抽油系统井下工况识别*

2022-01-27罗真伟

沈阳工业大学学报 2022年1期
关键词:油井灰度矩阵

王 通, 罗真伟

(沈阳工业大学 电气工程学院, 沈阳 110870)

在油田生产过程中,技术人员通常根据井下泵的工作状态判断生产工况,进而调整采油工艺措施,提高采油效率,保障油田安全运行[1].

抽油井井下泵的工作状态可以通过泵功图直接反映[2-3],油田通过泵功图分析井下工况的方法主要有灰色关联度分析法[4]及傅里叶描述子的图形相似性分析法[5].上述方法通过图形相似性比较来判断油井工况,但在油田生产过程中,存在示功图采集不准确、生产波动等现象.李春生等[6-7]利用支持向量机对提取的泵功图特征向量建立了工况识别模型;李训铭等[8-10]利用灰度矩阵提取特征向量,并用神经网络建立工况识别模型.支持向量机、神经网络等算法在工况识别中易将不平衡数据中小类作为噪声,并且将其丢弃.针对以上工况识别过程中所面临的参考功图选取不准确,数据集不平衡等问题,本文提出了结合SMOTE算法的改进随机森林算法进行抽油井泵的工况识别,从而提高采油效率,更好推进油井工况识别的数字化、智能化.

1 工况特征提取

1.1 典型泵功图分析

油井工况识别首先需要把地面采集的悬点示功图转换为泵功图.根据Gibbs模型,将抽油杆视为一根井下传导线,建立一维带阻尼的波动方程[11]为

(1)

式中:u(t)为地面示功图悬点位移函数;a为应力波在抽油杆柱中的传播速度;c为阻尼系数.

利用边界条件,最终可得抽油杆柱任意深度的载荷和位移随时间的变化方程,即可以求出泵功图,对应此模型解的傅里叶级数形式为

(2)

式中:σ0、ν0、On、Qn均为傅里叶系数;Er为抽油杆的弹性模量;Ar为抽油杆的截面积.

转换后的泵功图包含丰富的有杆抽油系统工作状态信息.当井下设备工况变化时,泵功图会跟着发生图形变化,显示出某一工况相应的图形特征,是正确、迅速识别工况的重要基础.常见的工况有以下几种:泵工作正常、供液不足、气体影响、出砂影响、游动阀漏、固定阀漏、油井结蜡、上碰泵、下碰泵.

不同工况的对称度、波动程度、示功图的四角曲率变化等各不相同,通过网格化对泵功图灰度矩阵特征提取可以反映图形的几何特征,从而达到工况识别的效果.

1.2 灰度矩阵特征提取

泵功图特征向量的选择对井下工况识别准确性有直接的影响.泵功图特征参数提取主要有傅里叶描述子、面积法、差分曲线法、矩特征向量和灰度矩阵的泵功图特征提取算法[12].本文采用识别率高的灰度矩阵特征提取方法,其特征参数少,识别率高,主要步骤如下:

1) 将泵功图数据进行无量纲归一尺度处理,消除泵功图量纲对数据的影响.

2) 泵功图网格化.将归一化后的泵功图放到一个2∶1的矩形网格中,使泵功图的四边与网格矩形的四边相切.

3) 边缘灰度赋值.在泵功图经过轮廓曲线的网格灰度值均赋值为“1”,其余网格赋值为“0”,形成了一个以“1”和“0”组成的矩阵.

4) 灰度矩阵生成.在边界内部逐步加1,外部逐步减1,最终获得网格化的泵功图灰度矩阵.

5) 求解灰度矩阵特征值.灰度矩阵特征值的提取是在泵功图灰度矩阵上计算灰度均值、灰度方差、灰度偏度、灰度峰值、灰度能量和灰度熵,表示了泵功图灰度矩阵的数据统计特征,从而反映图形的形状特质[13].泵功图的灰度矩阵各特征值提取表达式为:

(3)

式中:b为泵功图的灰度级数;B(b)为某一灰度b的元素个数;p(b)为灰度级的概率.

② 灰度方差σ2表达式为

(4)

③ 灰度偏度D表达式为

(5)

④ 灰度峰值P表达式为

(6)

⑤ 灰度能量E表达式为

(7)

⑥ 灰度熵T表达式为

(8)

利用以上表达式计算训练样本和测试样本的灰度特征值数据,各种工况的参考灰度特征向量值如表1所示.

表1 参考工况灰度特征向量值Tab.1 Values of gray-level feature vector under reference conditions

通过灰度矩阵特征提取泵功图的六个数理统计特征值,可以有效反映各种工况泵功图的几何形状,用于随机森林的有杆抽油系统井下工况识别.

2 数据不平衡处理

在采油过程中,油井各种工况出现次数是不均衡的.对于这种现象,大多数分类算法不能对小类做出有效识别,导致分类效果很差.SMOTE是由Chawla等人提出的一种向上采样方法,目的是解决小类中样本数量过少的问题.SMOTE通过合成新的小类样本来减轻类别的不平衡,其主要思想是在相距较近的小类样本之间进行线性插值,从而生成新的小类样本,计算表达式为

Snew=S+rand(Si-S) (i=1,2,…,n)

(9)

式中:Snew为新插值的样本;S为原始样本数据;rand为0~1的随机数;Si为原始样本数据的最邻近k个样本中随机选取的n个样本.

SMOTE算法对油田示功图不平衡数据处理时,首先获取工况的测试数据集S最近的k个邻样本,再从中随机选择n个,通过与原数据集边界值对比,获取符合要求的新样本Snew,算法流程图如图1所示.

3 基于DA-RF的工况识别算法

随机森林算法[14]使用有放回的Bootstrap采样生成多个训练样本集,每个样本都训练成一个决策树,而未被采样的训练样本将用来估计分类器的泛化能力.利用随机森林来实现油井工况识别,可以提高模型泛化性.

图1 SMOTE流程图Fig.1 Flow chart of SMOTE

DA-RF工况识别步骤如下:

1) 随机选取各工况的部分灰度矩阵特征值作为训练数据集,其它数据为测试集.训练集数据与测试集数据比例控制为2∶1.

2) 初始化随机森林参数(nTree,mtry)和蜻蜓算法参数,包括:相邻半径、惯性权重、分离度、对齐度、内聚度、食物因子和避敌因子.

3) 将识别准确率作为适应度函数,通过DA算法对随机森林参数nTree和mtry寻优.

4) 利用Bootstrap方法对灰度特征值进行重采样,产生R个训练集.

5) 利用每个训练集生成对应的决策树,并且在每个非叶子节点选择属性前,以分裂属性集中的属性大小mtry对该节点进行分裂.

6) 每棵树都完整成长,不进行修枝.

7) 对于测试集样本,利用每个决策树进行测试,最终得到对应的工况类别数据集.

8) 采用投票的方法,得到投票选择众数,即将决策树中输出最多的工况作为测试集样本所属的工况.

4 基于SMOTE-DA-RF算法的实现

本文将SMOTE、DA算法结合随机森林算法用来识别井下工况.首先将采集到的地面示功图转换为泵功图,在泵功图的基础上,采用灰色矩阵特征值提取算法提取泵功图的六个灰度特征值;然后在选取的训练集数据R上用SMOTE算法计算得到新的数据集Rnew,利用得到的数据集创建随机森林,在随机森林参数优化基础上,选取蜻蜓算法得到最优参数nTree和mtry;最后将测试集代入得到最优的决策树森林,完成油井的井下泵的工况识别.具体的SMOTE-DA-RF算法流程图如图2所示.

图2 基于SMOTE-DA-RF的油井工况识别流程图Fig.2 Identification flow chart of oil well operating condition based on SMOTE-DA-RF algorithm

5 实验仿真

本文选取辽河油田某厂的376组示功图数据进行SMOTE-DA-RF算法的建模与测试实验仿真.

将每类工况的原始数据集E分为训练集R和测试集G,训练集数据与测试集数据比例大致为2∶1.通过SMOTE算法将训练集R转换为新的训练集Rnew,实验中各种工况数据组数如表2所示.

表2 实验数据集Tab.2 Experimental data sets

利用DA对随机森林的参数进行寻优,将DA的初始参数设置为在[0.4,0.9]之间的自适应线性递减参数值.随机森林(nTree,mtry)初始值设置为(100,12),nTree的范围为[1,500],mtry的范围为[1,100].

根据DA算法得到的随机森林最佳参数nTree为287,mtry为31,建立随机森林决策树,对测试集数据G进行仿真测试,得到最终的工况识别结果.为验证本文方法的有效性,采用灰色关联度方法GRA、支持向量机算法SVM、随机森林算法RF进行对比.测试集工况识别结果分别如图3所示.

图3 测试集工况识别结果Fig.3 Identification results of test set for working condition

从图3可以看出,灰色关联度工况分析法的准确性依赖于示功图的灰度特征向量,容易误判.通过与其它机器学习法比较,SMOTE-DA-RF算法的识别正确率较高,特别是在小类工况上,识别效果进一步加强.该改进算法可以提高工况识别准确率,为油田后续生产措施的指定提供了参考,具有一定的工程应用价值.

6 结 论

本文建立了基于SMOTE-DA-RF算法的有杆抽油系统井下工况识别模型,采用SMOTE算法平衡少类数据,提高了基于示功图的油井识别泛化性能;利用DA算法选择随机森林最优参数,进一步提高了工况识别性能;通过随机森林算法简化运算,提高了井下泵工况识别的准确率,避免了神经网络学习效率缓慢的问题,解决了灰色关联度分析法泵功图相似工况识别不准确和依赖参考灰度矩阵的问题.

猜你喜欢

油井灰度矩阵
采用改进导重法的拓扑结构灰度单元过滤技术
天津港智慧工作平台灰度发布系统和流程设计
捞油井捞油周期优化与捞油管理研究
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
油井遭袭
Arduino小车巡线程序的灰度阈值优化方案
多项式理论在矩阵求逆中的应用
反复见水井的治理措施
矩阵
矩阵