基于卷积神经网络的抽油机故障诊断
2024-04-29吴昊臻许燕周建平谢欣岳彭东
吴昊臻 许燕 周建平 谢欣岳 彭东
摘要:抽油机故障诊断对于保障油气田的稳定运行至关重要。针对已有基于深度学习的故障诊断模型参数量大导致应用范围受限的问题,提出一种基于空洞卷积和惩罚机制的卷积神经网络模型。该模型在浅层神经网络部署不同空洞卷积率的空洞残差模块,高效获取示功图轮廓特征的同时降低了模型参数量。其次,将惩罚机制融入Softmax损失函数,增强模型诊断气体影响等难分样本的故障准确率。采用抽油机实况数据集进行实验验证,结果表明该模型参数量为0.94 M,浮点型计算量为165.24 M。与MobileNetV3相比,改进后的算法模型在准确率同为96.6%的前提下参数量减少了3.30 M,浮点型计算量减少了52.22 M,更易部署在资源受限的故障诊断平台。
关键词:卷积神经网络;抽油机;故障诊断;空洞卷积;损失函数
中图分类号:TP183文献标识码: ADOI:10.3969/j.issn.1007-791X.2024.01.0040
引言
随着浅层油藏的开采殆尽,现有的油田逐渐向着深层油藏发展,而地层深处环境复杂,抽油机易受气、液、砂等多种因素干扰,一旦发生故障将会造成极大的经济损失[1]。因此,对抽油机进行高效故障诊断的研究有很强的现实意义。由于井下工况难以直接监测,人们设计了间接反映井下工况的抽油机示功图,根据示功图反映的不同轮廓特征可以对抽油机的故障类型做出判断[2]。现阶段抽油机故障诊断方法主要分为传统方法和深度学习方法,传统方法首先对示功图图像分析获取各类典型特征[3](如点、面积、方差等)并建立样本库,通过机器学习的方式(如支持向量机[4]、极限学习机[5])进行故障种类识别,实现抽油机故障诊断。但传统的故障诊断模型的搭建过于依赖研究者的经验,设计分类器等各个部分的最优解容易导致整体模型的局部最优解,从而影响故障诊断的准确率。
近年来随着深度学习的出现,基于卷积神经网络的目标识别方法被广泛应用于机械故障诊断领域[6],并在抽油机故障诊断方面有一定的发展。文献[7]提出将卷积神经网络(Convolutional Neural Networks,CNN)引入抽油機故障诊断中,通过对LeNet5模型做出改进,减少了模型参数,加快了模型收敛速度,使诊断准确率达到89.3%,验证了CNN应用于抽油机故障诊断的可行性。文献[8]将深层卷积神经网络模型DenseNet应用于抽油机故障诊断,获得了93.8%的准确率,验证了加深网络模型的层数可以显著提高抽油机故障诊断的准确率。文献[9]在MobliNetV2的基础上引入注意力机制,增强模型对示功图轮廓特征的提取能力。同时其提出注意力损失函数抑制易分样本对模型训练的贡献,在轻量级模型中准确率达到95.1%,但模型参数量增加至4.6 M。
现有研究中虽然考虑到了示功图图像轮廓特征更为重要和示功图数据集存在易分样本与难分样本区别的特点,但所使用的注意力机制反而增加了模型的参数量,而且没有考虑到示功图数据集中易分样本自身准确率极高的特点。因此,为了满足更快更准确地进行抽油机故障诊断的需要和顺应油田数据处理边缘化的发展需求,在保证准确率的前提下应尽可能地减少故障诊断模型的参数量,以期未来能够在嵌入式端进行部署应用。同时考虑到示功图数据集中易分样本自身拥有极高准确率,产生的损失值较低的特点,更应对难分样本进行处理,增强难分样本对模型的贡献度,将训练集中在准确率较低的样本上。
基于上述问题与分析,本文提出基于空洞卷积和惩罚机制的卷积神经网络(Dilated Convolutional and Penalty Mechanism-CNN,DCPM-CNN)智能诊断方法。该方法使用空洞卷积快速扩大模型浅层所获得的感受野,从而减少模型达到最优效果所需要的参数量。其次,提出一种惩罚系数用于Softmax损失函数中,提高难分样本在反向传播时的贡献度。使用新疆准噶尔东部某油田作业区实况数据集对模型性能进行验证。通过对比性能指标发现,相较于现有抽油机故障诊断方法,改进后的模型拥有更小的参数量和更高的准确率。
1DCPM-CNN模型
1.1网络结构
对现有轻量级CNN进行分析,MobileNetV1[10]模型提出了深度可分离卷积使参数量大幅下降,实现了网络的轻量化,但单一通道的连续卷积往往会导致权重更新时的梯度过于极端,最终导致模型过拟合或欠拟合。ShuffleNetV1[11]模型提出了通道混洗操作实现深度可分离卷积后各通道的特征交互,有效避免了过拟合问题的出现。
本文针对示功图线条稀疏性的图像特点和轮廓特征更为重要的卷积特征要求,基于空洞卷积、深度可分离卷积和通道混洗操作的特点,设计了空洞残差(Dilated Convolution Residual,DCR)模块和深度多维混合(Depthwise Multidimensional Shuffle,DMS)模块,在保证准确率的前提下,达到了大幅减少模型参数量的研究目的。其次,提出一种惩罚损失函数(Penalized Softmax,P-Softmax),提高难分样本对模型的贡献度。模型整体结构如图1所示。
DCPM-CNN在输入特征进行普通卷积和最大池化操作之后,通过两层DCR模块叠加快速扩大感受野,且该模块仅位于模型的第3~6层,避免了深层网络在应用空洞卷积时由于输入特征尺寸过小导致的相邻信息丢失问题。得益于DCR模块在浅层获得的大感受野,将深层部分的DMS模块减少至8个,并采用[2、4、2]的纺锥形结构保证深层特征图的多层次获取,提高输出特征信息表达力的同时降低了整体模型的参数量。各部分的模型参数如表1所示。在DMS模块之后使用一个通道数为1 024的1×1卷积层和全局池化层增强网络的非线性以及将特征图大小降至1×1。最后对全连接层的输出使用惩罚损失函数P-Softmax替代Softmax损失函数。
对于给定计算预算,DCPM-CNN可以在浅层产生更广泛的轮廓特征,这对于示功图的故障诊断至关重要,意味着高层语义的快速获取和无效干扰信息的快速消除。此外,在DCPM-CNN中,深度可分离卷积仅在深层特征图上执行,因为虽然深度可分离卷积的理论浮点型运算量非常低,但它在现有TensorFlow等框架下的数据提取仍存在问题,导致深度可分离卷积虽然在深层网络的实现效果很好,但在浅层网络的运算时间与效果都差强人意,这与空洞卷积的运算特点产生了互补,使模型整体达到最优效果。
1.2空洞残差模块
现有的抽油机故障诊断模型在提取示功图轮廓特征时往往忽略了示功图线条稀疏性和存在大量空白无用信息的图像特点,针对这一示功图图像特点引入了空洞卷积(Dilated Convolution,DConv)操作。空洞卷积最初被提出用于小波分解的相关研究[12],现多用于高层图像语义特征的多维提取[13-14]。如图2所示,空洞卷积的主要思想是使用零来间隔填充卷积核,在参数量不变的前提下实现感受野的增长,更快地筛除示功图中空白无用的信息,而更大的感受野代表着空洞卷积的输出所包含的特征信息比普通卷积的映射范围更大,使神经网络更关注示功图轮廓特征变化。使用普通卷积时,第i层的感受野尺寸为
使用空洞卷积时,第i层的感受野尺寸为
式中,si为第i层的步距,kdilated为空洞卷积等效卷积核大小,k为普通卷积核大小,r为空洞卷积率。
基于上述空洞卷积的特点,构建了一种DCR模块应用于浅层卷积神经网络中,加快示功图轮廓特征的提取,从而在保证准确率的前提下减少模型的参数量和计算量。DCR模块结构如图3所示,考虑到空洞卷积层连续叠加可能会导致的网格效应和远距离信息没有相关性问题,在卷积结构设计时遵循混合空洞卷积HDC[15]准则。模块采用3×3卷积核,空洞卷积率r=[2、5]两层级联空洞卷积快速获取示功图轮廓特征,同时在输出端使用残差结构与输入特征叠加以削减空洞卷积带来的影响,随后使用BN层和Relu层增加输出特征的非線性和避免过拟合。没有采用常规的r=[1、2、5]组合,是因为在浅层神经网络增加卷积层会导致模型参数增加5 184个,但由于3×3卷积核太小导致准确率提高困难。经实验最终选择了r=[2、5]的组合。由式(1)、(2)可得,当r = [1、1]时DCR模块的感受野为5×5,当r=[2、5]时感受野为15×15,是前者的9倍。
1.3深度多维混合模块
深度可分离卷积近年来被广泛应用于新型的轻量级卷积网络结构中[16-17],通过深度卷积(Depthwise Convolution,DWConv)与逐点卷积(Pointwise Convolution,PWConv)配合,在减少参数量的同时使输出特征矩阵通道维度保持不变。普通卷积与深度可分离卷积的浮点型计算量为
式中,{DK,DK}为卷积核大小,{DF,DF,M}为输入特征图,{DF,DF,N}为输出特征图,ZDW+PW为深度可分离卷积层浮点型计算量,Zcon2d为普通卷积层浮点型计算量。
由式(6)可见若取常用DK=3,则理论上普通卷积的浮点型计算量是深度可分离卷积的9倍。根据示功图线条稀疏性和图形轮廓更为重要的特点,结合1.2中的空洞卷积特性,在如图4所示的深度可分离卷积模块基础上进行改进,改进后的DMS模块结构如图5所示。将输入通道拆分为两组后,每路的通道数为原来的1/2,主路使用卷积核大小3×3,空洞卷积率r=1的DWConv配合两个1×1的PWConv完成升降维操作,在卷积操作的同时大幅减少模块的参数量。由于DMS模块部署在深层特征图上,为了减少空洞卷积导致的信息丢失,支路部分使用了一个卷积核大小3×3,空洞卷积率r=2的DWConv和1×1的PWConv。带有空洞卷积核的DWConv能够快速筛除示功图中的无用信息,同时获得更丰富的卷积特征,1×1的PWConv配合BN层和Relu层,在增强输出卷积特征的非线性的同时增加维度至与主路相同。主路和支路的通道合并后使用通道混洗操作完成多通道特征信息的交互,进一步增强DMS模块输出特征的信息表达力。
1.4惩罚损失函数
在抽油机工况数据集中,抽油杆断脱、柱塞头出工作筒、双凡尔同时漏失等典型故障均有着与其他示功图明显的区分特征。这些易分样本在模型训练过程中较易识别正确,诊断准确率高,而气体影响、供液不足的示功图轮廓特征较为相近,诊断准确率较低。因此模型训练时更应集中训练此类难分样本。
目前卷积神经网络中常用的Softmax损失函数[18]为
式中,yi为当前样本所属故障种类的概率值,N是样本的类别数。
Softmax损失函数的函数值与样本的yi值直接相关,没有样本倾向性。而考虑到示功图数据集中易分样本自身准确率极高,因此需要增强难分样本的模型贡献度。为实现这一目的,对现有的A-Softmax[19]、AM-Softmax[20]等多种改进损失函数总结后发现,其改进反映在神经网络反向传播中是当权重与特征的夹角θ增大时,cos(mθ+m)+m会产生比cos(θ)更小的值,yi值下降,从而提高难分样本的Loss函数值。基于这种思想提出一种惩罚机制增大难分样本的损失值,提高神经网络训练时对于难分样本的关注度,最终的P-Softmax损失函数定义为
式中,值1.8是经实验选出的适合示功图数据集的超参数。本文的惩罚损失函数存在以下特性:1)对于易分样本,样本预测概率yi趋近于1,惩罚系数趋近于0.9,损失值减小,抑制易分样本的损失贡献;2)对于难分样本,样本预测概率yi趋近于0,惩罚系数趋近于1.8,损失值增大,增强难分样本的损失贡献。这种惩罚机制不但增强了难分样本对模型参数训练的贡献度,而且损失值的增大加快了模型初期的收敛速度。
2抽油机故障诊断实验
2.1数据集及参数设置
实验数据来自新疆准噶尔东部某油田作业区,通过无线示功仪采集获得示功图图像,图片重构至224×224尺寸,再经归一化、二值化完成图片的预处理工作,数据集总量为15 229张,经专家标定分类为正常示功图、供液不足、气体影响、双凡尔同时漏失、游动凡尔漏失、出砂、活塞碰泵、抽油杆断脱、柱塞头出工作筒等9种抽油机典型故障。每种故障的典型示功图如图6所示,其中S为抽油机驴头悬点位移,P为抽油机泵载荷。为保持样本平衡,对抽油杆断脱等样本进行数据增强。最终各典型故障示功图训练集每类1 000张,测试集每类250张,标签索引分配结果如表2所示。
实验运行环境为Windows 7(64位)操作系统,搭载NVIDIA GeForce GTX 960M,Intel Core i7-4710MQ CPU @ 2.50 GHz,计算机内存为16 GB,Anaconda 4.13.0,CUDA 10.1编程平台,cuDNN 7.6,基于开源深度学习框架TensorFlow 2.8开发环境,使用Python 3.7编程语言,模型训练中随机梯度下降法,动量设为0.9。根据GPU的内存和数据集实际情况,批处理设置为16,初始学习率为0.001。
2.2实验结果及分析
为了验证DCPM-CNN模型的有效性,对ResNet50[21]、VGG16等多个经典卷积神经网络进行对比实验,选取参数量、浮点型运算量,准确率对模型的性能进行评估。同时与文献[9]、文献[22]提出的抽油机故障诊断模型做对比。表3为示功图数据集在不同神经网络的训练情况对比。
实验结果表明:1)ResNet50、VGG16模型参数量,浮点型计算量均过大,并不适用于硬件环境受限的抽油机故障诊断设备中。2)DCPM-CNN在同等量级的网络模型中达到了最高的96.6%,与MobileNetV3持平,超过AlexNet、ShuffleNetV2和现有的抽油机故障诊断模型。3)在模型参数量和计算量方面,轻量级神经网络方面DCPM-CNN模型仅为0.94 M和165.24 M,相比MobileNetV3减少了3.30 M(77.8%)和52.22 M(24.0%),比ShuffleNetV2减少0.34 M(26.5%)而浮点型运算仅增加了20.98 M。经以上对比分析,DCPM-CNN在保证了准确率的前提下参数量和浮点型运算量都达到了较低的量级,充分降低抽油机故障诊断模型运行所占用的系统资源。
表4展示了DCPM-CNN模型对示功图各类典型故障的诊断效果。对训练好的DCPM-CNN模型进行典型故障样本的正确率验证,每类随机抽取样本图片300张(不属于训练集样本)做验证。表中数据为5次实验取平均值。采用精确率(Precision)作为性能指标,其代表模型预测的某类故障中预测正确所占的比例,计算公式为
式中,NTP为真实值为1,预测值也为1的所有样本数量,NFP为真实值为0,预测值为1的所有样本数量。
由表中数据可得:1)作为抽油机一级故障的抽油杆断脱,柱塞头出工作筒验证精确率达到99%以上,保证了严重突发情况时诊断系统的可靠性;2)难分样本中供液不足、气体影响的精确率均达到了94%以上。能够满足故障诊断系统对难分故障诊断精度的要求。图7为验证集测试所得的混淆矩阵图,其中坐标轴0~8依次代表正常、供液不足、气体影响、双凡尔同时漏失、游动凡尔漏失、出砂、活塞碰泵、抽油杆断脱、柱塞头出工作筒,纵轴表示样本的实际工况标签,水平轴表示样本的预测工况标签。所有正确的预测均位于表格的对角线上,以便直观地检查识别结果中的错误。由图可得本研究提出的DCPM-CNN的实际诊断效果良好。
DCPM-CNN模型的核心特点在于浅层DCR模块对于模型整体性能的影响,为了探究不同空洞卷积率对示功图故障诊断的影响,选择常用的几组空洞卷积率组合进行对比实验,实验中所有的卷积核尺寸为k=3。结果如表5所示,可以看出随着空洞卷积率的增大,准确率和训练时间不断增加,但r=[6、12]时的准确率有所下降。这是由于空洞卷积实际计算时卷积核不连续,需要多次访存才能获取目标数据导致。因此并不是空洞卷积率越大越好。经实验效果最好的组合为r=[2、5],相比于普通卷积操作,正确率提高了1.0%。
为了进一步验证本文的DMS模块和P-Softmax损失函数的有效性,通过融合实验进行性能对比分析,设计三种不同的模型方案,对比指标是模型训练时间和准确率。
方案一:模型3~6层为DCR模块,7~30层为深度可分离卷积模块,损失函数为Softmax。
方案二:模型3~6层为DCR模块,7~30层为DMS模块,损失函数为Softmax。
方案三:模块3~6层为DCR模块,7~30层为DMS模块,损失函数为P-Softmax。
表6为DCPM-CNN的融合实验性能对比,实验结果表明:1)在使用DMS模块替换深度可分离卷积模块后,凭借多个维度的卷积特征叠加和通道混洗操作,准确率增加了1.4%,证明DMS模块有效性的同时也侧面印证了空洞卷积对于示功图特征提取的有效性;2)引入惩罚机制,通过改变不同样本的贡献度,使模型训练过程中较多地关注难分样本,在训练时间少量增加的情况下准确率又增加了0.9%。
将带有惩罚机制的P-Softmax损失函数应用于3种不同的轻量级CNN模型,并与Softmax损失函数进行准确率对比。图8为MobileNetV3、ShuffleNetV2和DCPM-CNN模型在示功图数据集上的训练结果。在应用了P-Softmax损失函数后,3种轻量级CNN模型的准确率分别提高了0.6%、0.9%和0.9%,进一步证明了惩罚损失函数的普適性。
最后,设计对比实验验证DCPM-CNN模型的普适性和鲁棒性,将MobileNetV3、ShuffleNetV2和DCPM-CNN模型应用于有代表性的MINIST和Flower测试数据集,实验结果如表7所示。结果表明DCPM-CNN在典型自然图像的Flower数据集上,由于浅层使用空洞卷积导致图像细粒度信息少量丢失,准确率略差于MobileNetV3,而在充分体现轮廓特征重要性的MNIST数据集上准确率明显高于现有模型,进一步证明了DCPM-CNN更适用于如抽油机故障诊断、工业草图识别、路面裂痕监测等需要充分获取全局特征信息的情况。
3结论
针对抽油机故障诊断模型参数量大、应用受限的问题,本文提出了一种基于空洞和惩罚机制的卷积神经网络模型DCPM-CNN,相较于经典网络模型主要有以下三点改进:
1) 针对示功图图像无用信息过多的特点,构建DCR模块应用于浅层神经网络,利用空洞卷积的大感受野快速过滤无用信息,获取轮廓语义特征,进而减少模型效果达到最优所需要的参数量。
2) 构建DMS模块,使用通道混洗操作避免深度可分离模块可能导致的过拟合问题,通过空洞卷积与普通卷积的特征重用输出多种分辨率特征,提高模型的故障诊断精度。
3) 针对气体影响等典型故障易构成难分样本且示功图数据集中易分样本高准确率的特点,提出一种惩罚机制增强难分样本对模型的贡献度。
通过与现有经典网络模型以及其他文献提出的模型对比,DCPM-CNN模型在同等量级下拥有最高的准确率(96.6%)和最小的参数量(0.94 M),可以满足实际抽油机故障诊断任务的需求。
参考文献
[1] 张乃禄,孙换春,郭永宏,等.基于示功图的油井工况智能分析 [J].油气田地面工程,2011,30(4):7-9.
ZHANG N L,SUN H C,GUO Y H,et al.Intelligent analysis of oil well working conditions based on display power diagram [J].Oil-gas Field Surface Engineering,2011,30(4):7-9.
[2] 杨永江.浅谈抽油机异常示功图的解释分析 [J].化学工程与装备,2018(9):44-46.
YANG Y J.Interpretation and analysis of abnormal power diagram of pumping machine [J].Chemical Engineering and Equipment,2018(9):44-46.
[3] ZHANG R,WANG Z,WANG X,et al.Integrated diagnostics method and application of ground and down hole working condition in rod pumping well [J].Journal of Applied Science and Engineering,2018,21(4):615-624.
[4] LV X,WANG H,ZHANG X,et al.An evolutional SVM method based on incremental algorithm and simulated indicator diagrams for fault diagnosis in sucker rod pumping systems [J].Journal of Petroleum Science and Engineering,2021,203:1-17.
[5] LI K,HAN Y,WANG T.A novel prediction method for down-hole working conditions of the beam pumping unit based on 8-directions chain codes and online sequential extreme learning machine [J].Journal of Petroleum Science and Engineering,2018,160:285-301.
[6] 姜萬录,李振宝,雷亚飞,等.基于深度学习的滚动轴承故障诊断与性能退化程度识别方法 [J].燕山大学学报,2020,44(6):526-536.
JIANG W L,LI Z B,LEI Y F.et al.Deep learning based rolling bearing fault diagnosis and performance degradation degree recognition method [J].Journal of Yanshan University,2020,44(6):526-536.
[7] 刘宝军.基于CNN卷积神经网络的示功图诊断技术 [J].西安石油大学学报(自然科学版),2018,33(5):70-75.
LIU B J.Research on diagnostic technique of indicator diagram based on CNN convolution neural network [J].Journal of Xi′an Shiyou University (Natural Science Edition),2018,33(5):70-75.
[8] 段志刚,李汉周,司志梅,等.基于迁移学习的示功图诊断方法 [J].石油化工自动化,2022,58(1):72-76.
DUAN Z G,LI H Z,SI Z M,et al.Diagnosis method of indicator diagram based on transferring learning [J].Automation in Petro-chemical Industry,2022,58(1):72-76.
[9] 杜娟,刘志刚,宋考平,等.基于卷积神经网络的抽油机故障诊断 [J].电子科技大学学报,2020,49(5):751-757.
DU J,LIU Z G,SONG K P,et al.Fault diagnosis of pumping unit based on convolutional neural network [J].Journal of University of Electronic Science and Technology of China,2020,49(5):751-757.
[10] ANDREW G H,ZHU M L,CHEN B,et al.Mobilenets:efficient convolutional neural networks for mobile vision applications [J].Applied Intelligence,2019,50(1):107-118.
[11] ZHANG X,ZHOU X,LIN M,et al.ShuffleNet:an extremely efficient convolutional neural network for mobile devices [C]// 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition,Salt Lake City,USA,2018:6848-6856.
[12] HOLSCHNEIDER M,KRONLAND-MARTINET R,MORLET J,et al.A real-time algorithm for signal analysis with the help of the wavelet transform [C]// Wavelets:Inverse Problems and Theoretical Imaging.Berlin/Heidelberg:1990:286-297.
[13] 王丹,李琦,梁栋,等.基于多尺度全卷积与CRF的路面裂缝检测算法 [J].燕山大学学报,2021,45(4):367-376.
WANG D,LI Q,LIANG D,et al.Road crack detection algorithms based on multi-scale fully convolution and CRF [J].Journal of Yanshan University,2021,45(4):367-376.
[14] 杨云航,闵连权.采用空洞卷积的多尺度融合草图识别模型 [J].西安电子科技大学学报,2021,48(5):92-99.
YANG Y H,MIN L Q.Multi-scalefusion sketch recognition model by dilated convolution [J].Journal of Xidian University,2021,48(5):92-99.
[15] WANG P,CHEN P,YUAN Y,et al.Understanding convolution for semantic segmentation [C]// 2018 IEEE Winter Conference on Applications of Computer Vision,Lake Tahoe,USA,2018:1451-1460.
[16] HOWARD A,SANDLER M,CHU G,et al.Searching for mobilenetv3 [C]// Proceedings of the IEEE/CVF International Conference on Computer Vision,Seoul,Korea,2019:1314-1324.
[17] TAN M,LE Q.Efficientnetv2:smaller models and faster training [C]// International Conference on Machine Learning,2021:10096-10106.
[18] 任進军,王宁.人工神经网络中损失函数的研究 [J].甘肃高师学报,2018,23(2):61-63.
REN J J,WANG N.Research on cost function in artificial neural network [J].Journal of Gansu Normal University,2018,23(2):61-63.
[19] LIU W,WEN Y,YU Z,et al.Large-margin softmax loss for convolutional neural networks [C]// International Conference on Machine Learning,New York,USA,2016:507-516.
[20] WANG F,CHENG J,LIU W,et al.Additive margin softmax for face verification[J].IEEE Signal Processing Letters,2018,25(7):926-930.
[21] HE K,ZHANG X,REN S,et al.Deep residual learning for image recognition [C]// Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,Las Vegas,USA,2016:770-778.
[22] 段友祥,李鈺,孙歧峰,等.改进的Alexnet模型及在油井示功图分类中的应用 [J].计算机应用与软件,2018,35(7):226-230.
DUAN Y X,LI Y,SUN Q F,et al.Improved alexnet model and using in dynamometer card classification [J].Computer Applications and Software,2018,35(7):226-230.
Fault diagnosis of pumping unit based on convolutional neural network
WU Haozhen1,XU Yan1,ZHOU Jianping1,XIE Xinyue1,2,PENG Dong1
(1. College of Mechanical Engineering,Xinjiang University,Urumqi,Xinjiang 830039,China;
2. Xinjiang Golden Calf Energy IOT Technology Co. Ltd.,Karamay,Xinjiang 834008,China)
Abstract:Pumping unit fault diagnosis is crucial to ensure the stable operation of oil and gas fields.The current fault diagnosis of pumping unit based on deep learning model has the problem that the number of parameters is too large,and it is difficult to be widely used in actual production.Considering the real demand for reducing system resource usage of the fault diagnosis model,a novel convolutional neural network is established based on dilated convolution and penalty mechanism in this study.In this model,dilated convolution residual blocks of different dilated convolution rates are deployed in the shallow neural network to efficiently acquire the contour features of the dynamometer card and reduce the number of model parameters.Moreover,the penalty mechanism is integrated into the Softmax loss function to enhance the influence of indistinguishable samples (such as gas influence) on the fault diagnosis model.Experimental validation is conducted with the data set made from actual working conditions of the pumping unit.When the accuracy rate is 96.6%,the number of parameters acquired by this model is 0.94 M,which is decreased by 3.30 M in MobileNetV3 model.Similarly,the floating-point operations calculated by this model is 165.24 M,which are also decreased by 52.22 M in MobileNetV3 model.In conclusion,the convolutional neural network holds potentially promising in the resource-constrained platform of actual production.
Keywords: convolutional neural network;pumping unit;fault diagnosis;dilated convolution;loss function