基于卷积神经网络模型的抽油机系统故障诊断
2021-06-06刘芑辰冯子明蒋国斌孙桐建李琦
刘芑辰 冯子明 蒋国斌 孙桐建 李琦
1. 东北石油大学机械科学与工程学院;2. 中国石油大庆油田有限责任公司采油工程研究院
采油工业中抽油井数量大、分布广,人工监测油井工况所需人力成本高,需要一种自动化诊断方法,以提高人工检修效率,避免日常维护作业的盲目性。1988 年,Derek 等[1]研制出有杆抽油井故障诊断专家系统,通过将地面实测的示功图转换成井下示功图,然后与标准示功图进行比较以判断故障类型。1990 年,Rogers 等[2]将人工神经网络理论引入示功图识别领域,应用误差反向传播学习算法训练神经网络,能够识别出所学习的15 类示功图。但神经网络结构较为简单,使用效果并不理想。2008 年,杨洋[3]应用灰色理论成功提取示功图特征,并实现示功图分类识别。但由于求取灰度矩阵所需计算量较大、花费时间较长,使得灰色理论在实际应用中受到一定限制。2016 年,文必龙等[4]使用模糊神经网络解决抽油机故障诊断问题,由于模糊理论的诊断方法需要先建立隶属函数,而隶属函数建立方法并未明确,限制了这一方法的广泛应用。近年来相关研究进一步完善,Bezerra 等[5]将前馈神经网络用于诊断示功图,准确率达98%以上,但受限于神经网络隐含层数限制,导致无法对更复杂的函数进行拟合,因此对实际工况的刻画能力有限。2017 年,段友祥[6]应用简化Alexnet 模型实现了对故障示功图的识别,但分类仅为4 类,无法满足实际使用需求。
基于卷积神经网络模型提出一种有杆抽油系统的智能故障诊断方法。根据卷积神经网络模型构建分析模型对抽油机悬点示功图进行分类,对抽油机运行工况进行自动判断。抽油设备运行工况有多种类型,不同工况具有各自的特征数据,因此设备工况可以被识别并区分。以大庆油田生产数据为例,应用卷积神经网络建立诊断模型进行工况分析。
1 生产数据预处理
收集大庆油田故障诊断数据5 053 组,数据包含正常、上碰、下碰、严重供液不足、泵漏失、抽油杆断脱、气影响等共37 种类型。根据数据类型对生产数据进行筛选,将同类型生产数据不足10 组的类型归类为其他,假设剩余数据类型为实际生产中主要故障类型,笔者主要考虑生产实际中主要工况共15 种。将存在缺陷的数据(如数据缺失、未解读、明显错误等)进行清洗后,有效数据共3 502 组分类存放。根据生产数据绘制示功图如图1 所示。
图 1 示功图示例Fig. 1 Example of indicator diagram
2 卷积神经网络
卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的经典算法之一。由于卷积神经网络仿造生物视知觉进行构建,其内含的卷积层能够以较小的计算量对图片特征进行描述,因此其具有稳定的运行效果且不需要进行额外的特征工程[7]。卷积神经网络由输入层、隐含层和输出层构成。以Le-Net 为例,数据经筛选后进入输入层,由输入层进行预处理将所有数据转化为统一格式。将预处理完成的图片输入卷积层、池化层进行特征提取,经由卷积层、池化层的计算分析将待分类图片转化为特征图,经过全连接层进行匹配,最终输出目标值[8]。卷积神经网络的输入层可以依据结构接收一维至四维数组,在学习数据输入隐含层之前需对数据进行归一化,归一化的数据可以提升算法准确率以及运行效率。
卷积神经网络算法隐含层由卷积层、池化层和全连接层3 种结构构成,在更复杂的算法中还包括Inception 模块和残差块等结构[9]。其中卷积层是对输入数据进行特征提取,以笔者使用的二维卷积为例可表示为[7]
式中,S为特征系数;矩阵X为输入矩阵;矩阵W为卷积核;(i, j)为变量在特征矩阵中的位置;(m, n)为卷积核元素的位置。
卷积层内部包含多个卷积核,类似于前馈神经网络中的神经元。卷积层参数包括卷积核大小、步长和填充,三者共同决定了卷积层输出特征图的尺寸,卷积层中包含激励函数以协助表达复杂特征。池化层是在卷积层进行特征提取后将特征图进行特征选择与过滤。通过预先设定的池化函数将特征图中单个点的结果替换为其相邻区域特征图统计量。以混合池化为例,其一般形式可表示为[10]
式中,s0为步长;A为输出值;f为池化层大小;p为可选系数,p=1时,A(i,j)的值记作L1(A)称均值池化;p=∞时,A(i,j)的 值记作L∞(A)称为极大池化;μ为运行系数,取值由模型运行情况决定;l为回层位置;k为技术通道位置;式(3)即为混合池化。
卷积神经网络的全连接层与传统神经网络中的隐含层结构相同,位于卷积神经网络的隐含层末端,将特征图展开为向量并经过激活函数传入下一层。全连接层对所提取特征进行非线性组合,利用所提取的高阶特征进行学习。
3 基于Le-Net 的诊断模型的建立过程
根据卷积神经网络方法的原理,首先进行数据预处理,再根据数据集大小、形态确定各层结构,选择激活函数,确定学习次数,进而输入数据集进行训练。实现过程如图2 所示。
图 2 诊断模型建立过程Fig. 2 Establishment process of diagnosis model
3.1 学习数据预处理
将已初步分类的示功图存于同一文件夹,并为文件夹内所有分类分配索引,如表1 所示。
表 1 标签索引分配结果Table 1 Distribution result of label index
加载图片后将图片解码为图片张量,调整大小并进行归一化处理。随机抽取20%作为测试集数据,剩余80%作为训练集。分割完成后将示功图数据与标签打包得到训练用数据集。根据数据量将数据集进行分割,确保隐含层有序读入数据避免占用内存过大,输入数据集前充分打乱数据顺序。
3.2 基于Le-Net 的卷积神经网络模型的建立
参照图2 结构,建立深度为7 层的卷积神经网络。其中5 层为提取图片特征的单层卷积神经网络,2 层全连接层将图片特征与类别标签对应。该模型的输入量格式为(192,192,3)的图片,模型的输出量为一维向量。
笔者使用TensorFlow 开源机器学习平台进行基于Le-Net 模型的示功图分类识别实验,实验中使用的模型训练数据为含有15 类共3 502 张图片的有杆泵示功图。为避免过拟合现象,采取减小训练次数的措施,训练模型100 次。卷积层激活函数选择ReLU 函数以分散神经活跃度、简化运算过程降低运算成本。全连接层激活函数使用ELU 函数,以加速学习速度,由于ELU 函数存在负值使其能够像批标准化一样使激活单元值接近于0,有利于梯度计算。函数图像如图3 所示,ReLU 函数和ELU函数表示为[11]
图 3 激活函数图像Fig. 3 Image of activation function
式中,x为神经网络输入参数; α为ELU 函数参数取值自拟,α >0。
于全连接层中添加dropout 层,以避免过拟合现象。设置初始学习率为0.001,随训练次数增加而缩小学习率,每30 次缩小为原学习的1/10,以避免陷入局部最优。确定卷积神经网络各参数后,对网络进行训练。将训练集15 类示功图随机打乱划分为100 组输入隐含层进行训练,记录每次训练过后训练集、验证集准确率。根据验证集准确率调整模型参数,最终得到收敛速度较快且准确率较好的模型。
3.3 训练结果
训练结果得到分类模型,训练集图片分类准确率最高可达93.59%,输出损失为0.219。训练过程如图4 所示,可以看出,随着模型训练次数增加,训练集与验证集准确率不断上升。准确率随训练次数增加呈稳定上升趋势并逐步趋于稳定,在第90 次训练后准确率不再明显上升进入稳定区间,此时分类模型准确率达到峰值并保持在92%以上。验证集准确率趋势基本与训练集一致,准确率稳定于90%以上。训练结束后,使用测试集进行测试准确率可达92.53%,满足油田生产的实际要求。
图 4 训练集、验证集收敛曲线Fig. 4 Convergence curve of training set and verification set
3.4 实验结论与分析
通过查阅文献,得到不同模型对示功图识别的结果。段友祥[6]应用简化Alexnet 模型实现了对故障功图分类,李钰[12]基于Alexnet 模型进行改进得到示功图识别模型。如表2 所示,其中包括收敛步数、测试集准确率和分类情况。
表 2 模型性能对比Table 2 Model performance comparison
在对于模型的测试中可知,VGGNet 识别模型的准确率较高,但计算成本相较于Alexnet 模型更高、耗时更长;Alexnet 模型能较好解决少分类数问题,但对于多分类问题准确率明显下降。由对比可知,较于先前模型,笔者所使用的基于Le-Net 识别模型收敛速度明显高于传统模型,同时使用ELU 函数作为激活函数以及dropout 层的设置,避免了过拟合现象。该模型能够较好地处理多分类问题,能够弥补数据不平衡的缺陷,基本满足实际使用要求。同时笔者的验证集准确率与测试集准确率均处于较好水平,证明笔者建立模型具有良好的泛化性,可以应对实际生产中不同工况。从收敛速度来看该模型计算成本较低,利于实际使用。
4 结论
(1)实验研究模型借鉴了Le-Net 模型思想,以简化结构完成分类任务。利用测试集数据对训练所得模型进行检验,结果基本符合预期。模型准确率随训练次数增加而稳定上升,随后维持于一定水平。从训练结果可以看出,模型具有良好的稳定性,能够针对现场多种的工况进行分类,随着数据不断收集,该模型可以进一步完善。
(2)与其他分类方法相比,笔者建立的基于Le-Net 的卷积神经网络模型能够较好地完成多种类(15 种)的示功图分类,准确率基本符合使用要求,准确率达到92%以上。简化模型训练时间缩短,并且计算成本相对较低,较实用。
(3)所建的卷积神经网络预测效果满足油田实际生产的要求,随着数据收集、完善模型准确率可进一步提升。不同研究人员收集数据途径、处理数据的方法不同,训练所得模型可能不同;卷积神经网络内部结构复杂,内部参数的选择不同可能出现差异。