基于RSGWPT-MSE和PNN的潜油电泵故障诊断方法
2018-12-29王亚昆
王亚昆
(大庆油田力神泵业公司,黑龙江 大庆 163311)
基于RSGWPT-MSE和PNN的潜油电泵故障诊断方法
王亚昆
(大庆油田力神泵业公司,黑龙江 大庆 163311)
针对潜油电泵特征提取及状态判别问题,提出一种基于冗余第二代小波包变换、多尺度熵和概率神经网络的诊断方法。首先,利用冗余第二代小波包对拾取的信号样本进行处理,得到相应的子带信号分量,继而计算所得子带信号分量的多尺度熵值,并构造能够表征电泵状态的特征向量,最终将特征向量输入到概率神经网络中实现潜油电泵故障的自动识别。实测数据分析结果表明,所述方法能够有效对潜油电泵的工作状态进行识别,具有一定工程应用价值。
冗余第二代小波包变换;多尺度熵;概率神经网络;潜油电泵;故障诊断
0 引 言
潜油电泵采油技术,因其排量大、功率高、能量传递方式简单以及管理方便等优点得到了现场的广泛应用。但由于潜油电泵结构较为复杂,井下工作条件恶劣,在油田开采过程中综合故障率较高,因此对潜油电泵的状态进行监测、辨识是确保安全生产的关键,具有重要而实际的意义[1]。
近些年,随着非线性理论的发展,许多非线性算法如关联维数、近似熵、样本熵等被陆续应用于机械设备诊断领域,但这些参数只能反映信号序列单一尺度的特征信息,分析效果具有一定局限性[2]。由Costa等[3]提出的多尺度熵(Multiscale entropy,MSE)方法不仅能够在整体上刻画信号序列的动力学特征,而且可以根据尺度的变化反映时间序列不同尺度上的规律特性[3]。相关领域学者已将其用于处理机械故障信号,并且得到了比单一尺度样本熵更为理想的分析效果[4-5]。由于设备运行过程中存在强烈的背景噪声干扰,因此对于潜油电泵诊断而言,直接利用多尺度熵来描述振动信号的特征,效果欠佳,存在较大的改进空间。作为一种强有力的非平稳信号处理工具,冗余第二代小波包变换(redundant second generation wavelet package transformation,RSGWPT)因其变换可完全重构、不依赖傅里叶变换来构造非线性小波基等特点,已被成功应用于机械故障诊断领域。该算法可对信号频域进行精细剖分,将原始信号分解为相应的子带信号分量,从而有效减少信号中复杂成分间的交互干扰[6],因此将其作为一种预处理手段,对潜油电泵原始信号进行处理,对于后续准确刻画信号的特征将更为有利。
作为一种智能化数据处理算法,概率神经网络(Probabilistic neural network,PNN)能够以高精度逼近任何连续非线性函数,具有良好的自学习、自适应特性以及强大的并行处理能力和联合记忆功能,并且与经典的BP神经网络相比,PNN网络的训练过程耗时更短,训练结果更稳定[7],已作为分类器被成功应用于机械故障诊断领域。
鉴于潜油电泵振动信号非平稳、非线性特点以及电泵状态自动判定的现实需求,本文利用MSE来提取信号的动力学突变特征,以PNN作为分类器进行状态甄别,提出一种基于MSE和PNN的潜油电泵故障诊断方法,并通过实测数据对该方法进行验证。
1 冗余第二代包变换
第二代小波变换对频带划分是不均匀的,在高频部分分辨率较差,降低了检测精度,而小波包能将小波分析没有细分的高频部分作进一步的分解,使尺度的增大而变宽的频谱窗口进一步分割变细,具有更好的时频分析能力,可以提高信号分析精度。但是第二代小波包变换分裂与合成操作过程中重采样造成处理结果出现频率混叠现象,采用非降采样的冗余方案可在一定程度上抑制频率混叠,因此在第二代小波变换基础上构造了冗余第二代小波包变换[8]。
在2l尺度上冗余第二代小波包分解表达式为:
式中:Xl,k代表2l尺度上第k个节点系数分别为2l尺度上的冗余预测器和冗余更新器。
在2l尺度上冗余第二代小波包重构表达式为:
在2l尺度上的冗余预测器Pl和冗余更新器Ul的表达式分别为:
其中:P={pm},m=1,2,…,N和U={un},n=1,2,…分别为提升小波变换的初始预测器和初始更新器,N和分别为它们的长度。
图1 冗余第二代小波包分解
图2 冗余第二代小波包重构
以两层处理过程为例,冗余第二代小波包分解、重构过程分别如图1、图2所示。
2 多尺度熵
MSE是在样本熵算法基础上发展而来的一种能够在不同尺度上衡量信号复杂度的方法,给定一个长度为L的序列{x1,x2,…,xL},其多尺度熵的具体计算过程[3]如下:
1)对时间序列进行粗粒化处理
6)对m+1重复步骤(2)至步骤(5),得到Cτ,m+(1r)。
7)当长度L为有限值时,序列的样本熵值为
8)多尺度熵定义为不同尺度因子τ下样本熵值的集合,则原始序列的多尺度熵为
3 概率神经网络
PNN是由径向基神经网络发展而来的一种前馈神经网络,并且在径向基神经网络基础上,融合了概率密度函数估计和贝叶斯理论,以指数函数替代传统神经网络中常用的S型函数作为激活函数,具有训练简便、分类性能强等诸多优势。PNN一般由输入层、模式层、求和层和决策层构成,其结构如图3所示[7]。
输入层将输入样本传递给模式层各节点,模式层与输入层通过权值ωij相连,进行加权求和,并通过非线性算子
运算后,传递给求和层。该层各个模式单元的输出为
式中:X为输入样本,Wi为输入层与模式层间权值矩阵,σ为平滑系数。
求和层则将对应样本中同一类别的模式层传递输出进行累加,即
其中,m为样本个数。
决策层接收求和层输出的各类别的概率密度函数,概率密度函数最大的神经元输出为1,其对应的类别即为样本的识别结果,其它神经元输出则为0。
图3 概率神经网络结构
4 诊断流程
本文融合冗余第二代小波包变换、多尺度熵在信号特征提取上的优势以及概率神经网络强大的模式辨别能力,提出一种基于RSGWPT-MSE和PNN的潜油电泵故障诊断方法,有望取得满意的分析效果,诊断流程如图4所示,具体步骤如下:
1)设置RSGWPT的处理层数,对采集到的每个信号样本进行分解重构,得到相应的子带信号分量。对于RSGWPT处理层数的选取,如果设置的层数过小,则信号剖分不够精细,反之处理层数设置过大,则所得的子带信号分量带宽过窄,包含的特征信息过少,不利于特征信息的获取,考虑上述因由,本文设定RSGWPT的处理层数为2层。
2)计算每个信号样本分解所得子带信号分量的多尺度熵,并构造相应的特征向量。MSE的计算结果主要受嵌入维数m和相似容限r这两个参数的影响。m越大,在动态重构序列的联合概率时,蕴含的细节信息越丰富,但m取值过大,会造成计算负担过重,综合考虑,本文设定m=2。r取值过大,会丢掉许多统计信息,反之,则容易受噪声的干扰,得到的统计特性效果不理想,因此r一般取0.1SD~0.5SD(SD为原始数据的标准差),本文取r=0.15SD。至于对MSE计算影响较小的样本长度L和尺度因子τ这两个参数的选取,本文分别取L=2048、τ=10。
3)通过RSGWTPT和MSE提取到各样本的特征向量后,将训练样本的特征向量输入到PNN中,对神经网络进行训练。
4)将测试样本的特征向量输入到训练好的PNN中,通过网络的输出结果来判别电泵的状态。
图4 诊断流程图
5 诊断实例
图5 测试现场
表1 样本的具体描述
为了验证所述方法的有效性,对实际采集的潜油电泵振动数据进行分析,测试现场如图5所示。采样频率为5120 Hz,每种电泵状态采集了50个信号样本,样本长度为1024点,从每种状态的样本集中随机选取10个样本用于训练,另外40个作为测试样本进行测试,信号样本的具体描述如表1所示,电泵的10种工作状态分别用序号C1~C10表示。
电潜泵井故障诊断的基础和关键核心问题是一个模式识别问题,它的研究内容是对模式(识别对象)的特征的描述。模式识别的主要依据是特征量,因此首先对各个信号样本进行RSGWPT处理,本文设定的处理层数为2层,因此每个样本经分解重构后得到4个子带信号分量。利用RSGWPT对各个样本处理后,计算样本分解重构所得子带分量的MSE,并构造相应的特征向量。由于本文选取的MSE尺度因子τ为10,因此每个信号样本经过RSGWPT、MSE提取特征后,得到一个由4×10=40个元素组成的特征向量。
特征向量某些尺度对应的样本熵值可以很好地将电泵不同状态区分开来,但是某些尺度上对应的样本熵值存在彼此接近的情况,由此表明信号样本在不同尺度上样本熵值的可区分性强弱不同,存在一定差异。潜油电泵10种不同状态共有50×10=500个样本,如表1所示,每种状态随机选取10个样本用于训练PNN网络,构成一个包含10×10=100个样本的训练集,剩余的40×10=400个样本则组成测试集。为了验证本文所述特征提取方法的可行性及优势,利用3种方法分别提取信号样本的特征。其中:方法一是本文提出的RSGWPT结合MSE的方法;方法二直接计算样本的MSE作为特征参量;方法三采用EMD结合MSE的方法。
利用3种方法分别提取样本特征并构造相应的特征向量后,将训练集的特征向量输入到PNN中进行网络训练,利用测试集的特征向量对训练好的网络进行检验,表2给出了3种特征提取方法的识别结果。其中,本文所述特征提取方法识别精度最高,整体识别精度为96.25%,除了C4状态(泵抽空)和C7状态(电泵延时太短)外,其它状态类别均无错分情况,由此表明本文所述方法能够得到一个较为满意的识别结果。方法二的整体识别准确率最低,为88.5%,且C7状态(电泵延时太短)的识别精度极低,仅为42.5%,大部分C7状态样本被误判为C6状态频繁运行,说明直接以MSE为特征难以区分电泵的不同状态,而将RSGWPT与MSE相结合则可以更好地刻画信号样本的本质特征,这也验证了RSGWPT预处理的必要性。方法三的整体识别精度为91.79%,除了C1状态(正常泵况)外,其它状态类别均存在错分情况,与本文所述特征提取方法相比,识别精度存在很大差距。究其原因,主要由于EMD属于一种自适应信号处理手段,作为预处理方法在分解原始信号样本时表现得不够稳定,从而对后续分类效果造成不利影响。上述对比结果表明,RSGWPT结合MSE的方法能更好地实现信号样本特征信息的提取,并且本文提出的诊断新方法能够实现潜油电泵运行状态的准确判定。
为进一步验证PNN作为分类器的优越性,在训练样本集和测试样本集完全相同的情况下,利用MSE提取样本特征并构造特征向量后,训练传统的反向传播神经网络(BPNN)分类器并进行测试,识别结果如表3所示。与PNN训练过程相比,BPNN的耗时更长,除此以外,样本整体识别准确率也低于PNN分类器,由此表明无论在网络训练速度还是分类准确率方面,PNN分类器均比传统BPNN分类器更具优势。
表2 不同特征提取方法识别结果对比
6 结 论
表3 PNN和BPNN分类器识别结果对比
本文提出了一种基于RSGWPT-MSE和PNN的潜油电泵故障诊断方法,通过RSGWPT对信号样本进行分解重构处理,得到若干子带信号分量,利用MSE来刻画各子带信号分量的状态特征,并构造相应的特征向量,通过PNN来识别电泵的不同工作状态。实际数据对比分析结果表明,与直接MSE方法以及EMD结合MSE的方法相比,RSGWPT结合MSE的方法能更好地实现信号样本特征信息的提取,与传统BPNN分类器相比,PNN分类器在训练速度及分类精度上优势明显,本文提出的诊断方法能够有效区分潜油电泵的状态类型,得到可靠、准确的故障识别结果,从而能够为实际工程应用提供一定的参考,减少电潜泵在不正常工况下的工作时间,有效提高电潜泵井的经济效益。
[1] 冯定.朱宏武.薛敦松.基于系统分析的潜油电泵机组综合诊断模型厂[J].石油学报,2007,28(1):127-130.
[2] 李莉,朱永利,宋亚奇.多尺度熵在变压器振动信号特征提取中的应用[J].振动.测试与诊断,2015,35(4):757-762.
[3] COSTA M,GOLDBERGER A L,PENG C K.Multiscale entropy analysis of biological signals.[J].Physical Review E Statistical Nonlinear&Soft Matter Physics,2005,71(1):021906.
[4] 张龙,张磊,熊国良,等.基于多尺度熵的滚动轴承Elman神经网络故障诊断方法[J].机械科学与技术,2014,33(12):1854-1858.
[5] 秦喜文,高中华,董小刚,等.利用经验模态分解和多尺度熵的滚动轴承故障诊断研究[J].制造业自动化,2015,37(11):67-70.
[6] 罗荣,田福庆,冯昌林,等.改进的冗余第二代小波包及其故障诊断应用[J].华中科技大学学报,2014,42(5):40-46.
[7] 杨凌霄,朱亚丽.基于概率神经网络的高压断路器故障诊断[J].电力系统保护与控制,2015,43(10):62-67.
[8] ANTONI J,BONNARDOT F,RAAD A,et al.Cyclostationary modelling of rotating machine vibration signals[J].Mechanical Systems&Signal Processing,2004,18(6):1285-1314.
(编辑昊 天)
A Diagnosis Method for Electrical Submersible Pump Based on RSGWPT-MSE and PNN
WANG Yakun
(DaqingOilfield Powerlift Pump IndustryCompany,Daqing163311,China)
Aiming at solving the problems of feature extraction and condition judgment for electrical submersible pumps,this paper proposes a diagnosis method based on redundant second generation wavelet package transformation(RSGWPT),multiscale entropy and probabilistic neural network (PNN).Firstly,the acquired signal samples are processed using redundant second generation wavelet package,and the corresponding subband signal components can be obtained.Then,the multiscale entropy of each obtained subband signal components is calculated,and the feature vectors which could characterize the conditions of the electrical submersible pumps are constructed.Finally,the feature vectors are input into the probabilistic neural network,and the different fault types of the electrical submersible pumps can be identified automatically.The analysis results of the measured data show that the proposed method could effectively identify the work condition of the electrical submersible pumps,and has a certain value for engineering application.
RSGWPT;multiscale entropy;PNN;electrical submersible pump;fault diagnosis
TE 933.307
A
1002-2333(2018)01-0167-05
王亚昆(1983—),男,工程师,从事潜油电泵油田现场的应用以及维护管理工作。
2017-04-01