APP下载

基于随机森林的离心泵滚动轴承故障诊断

2020-06-29周海军王超伟周国敬周博

中国舰船研究 2020年3期
关键词:离心泵决策树分类器

周海军,王超伟,周国敬,周博

1 海军装备部装备技术合作中心,北京100841

2 中国舰船研究设计中心,湖北武汉430064

3 郑州航空工业管理学院,河南郑州450046

0 引 言

离心泵在船舶、核电、水利机械中有着广泛的应用,其作用是将流体抽出或压入容器,或将液体送到高处,它是现代工程领域广泛使用的一类机电产品,表征了大部分机械电气产品的主要特征,具有广泛的代表性。作为疏排水和供油的重要设备,离心泵一旦发生故障,对设备整体会造成严重影响,而轴承作为离心泵中的重要部件,离心泵故障的30%以上往往是由轴承故障所产生的,因此对离心泵滚动轴承进行故障诊断具有重要意义[1-2]。

由于轴承振动信号相对于电流、流量等信号会表现出非线性、非稳态的特点,并且振动信号中包含大量复杂、难以提取的信息,因而利用振动信号进行诊断也是故障诊断研究中的难点。以往的信号处理方法更适用于平稳信号或是线性信号,而滚动轴承信号非平稳、非线性的特点使得傅里叶变换存在一定的局限性[3]。针对上述问题,多种时频联合分析方法相继产生,如短时傅里叶变换、Wigner-Ville 分布、小波变换、希尔伯特-黄变换(Hilbert-Huang transform,HHT)等,并且需要提前获取分析信号的先验知识。其中HHT 作为一种新的自适应时频分析方法,虽然实现了信号的自适应分解,但在分解过程中会产生拟合误差、模态混叠及端点效应等[4];经验模态分解(empirical mode decomposition,EMD)和局部均值分解(local mean decomposition,LMD)也有计算量大、频率混淆和平滑次数的选择等问题[5]。而局部特征尺度分 解(local characteristic-scale decomposition,LCD)则可以将复杂的信号分解为若干个内禀尺度分量(intrinsic scale component,ISC),并且可避免过包络、欠包络、端点效应、频率混淆等情况的发生。因此,本文选用LCD 进行信号的时频分析[6]。

熵是一种不确定性的度量,能有效处理随机性和偶然性的问题。近似熵由于是通过比较自身数据段来修正系数为零的情况,导致其对复杂、微小的波动不敏感。样本熵在近似熵的基础上得到了发展,计算时不需要自身模板匹配[7],故本文将样本熵用于刻画轴承时间序列复杂度,以弥补近似熵存在偏差的不足,从而更好地提取故障轴承信号中的特征,这对诊断准确度的提取具有积极作用。

针对模式识别时,基分类器在训练过程中容易出现过度训练或者学习误差较大的缺点,可以在集成学习中通过建立多棵决策树,利用随机选择的训练数据对多棵决策树进行训练,生成多个可以进行决策的基分类器,然后对基分类器进行权值分配来达到提高诊断结果的目的[8]。因此,为了提高对滚动轴承故障诊断的准确度,本文将在提取故障特征的基础上,利用随机森林(random forest)作为分类器进行故障诊断,从而完成泵组设备中滚动轴承的故障诊断研究。

1 基于LCD-样本熵与随机森林分类的滚动轴承故障诊断原理

本文所采用的离心泵滚动轴承故障诊断方法包括小波降噪、时域分析及随机森林等,其故障诊断流程如图1 所示。图中:ca 为高频分量;cd 为低频分量;X(i)和X(j)为小波降噪后的振动信号。

由于在振动信号采集过程中环境因素会对信号采集产生很大干扰,因此,首先采用小波降噪的方法对振动信号进行降噪处理,然后采用LCD 对降噪后的振动信号进行时频分析,获取各故障模式信号的ISC 分量,之后,提取各ISC 分量的样本熵作为振动信号的故障特征。进行故障诊断时,利用提取的各故障模式ISC 分量的样本熵对随机森林进行训练。随机森林由若干棵分类回归决策树(classification and regression tree,CART)组合而成,并由决策树进行投票决策,如图2 所示[9]。随机森林是一种以决策树为基础学习器的集成学习算法,而决策树是随机森林的基础分类器,其是一种由节点和有向边构成的树状结构。训练时,在每一个非叶子节点针对某一属性进行分裂,迭代这一过程,直到每个叶子节点上的样本均处于单一的类别或者每个属性都被选择过为止。叶子节点代表分类的结果,从根节点到叶子节点的完整路径代表一种决策过程。决策树的算法本质上是节点如何进行分裂的方法,常见的有ID3,C4.5P,CART 等。决策树算法得到的结果一般是二叉树,少数情况下也存在非二叉树情况。决策树构造完成以后,因为样本集中噪声和离群点的存在,得到的决策树往往庞大而复杂,为了克服这一缺点,通常还要再对其进行剪枝处理,以限制其规模,提高分类的准确率。大而复杂的决策树得到的分类结果是不准确的,因为许多树分枝反映的是样本集中的异常数据。对模型中的各个子树进行评估,若满足条件,则将该子树转化为一个叶子节点,再对整个分类器的性能进行评估,看其是否提高了分类的准确度。若得到了提高,则进行此种转化,若没有提高,则进行下一棵子树的检测。循环此过程,直到分类器得到比较满意的分类效果。本文在此基础上采用Bagging 的方式随机抽取训练样本对决策树进行训练,建立多棵决策树,然后利用训练好的随机森林对测试数据进行诊断测试,从而获得故障诊断结果。

图1 离心泵滚动轴承故障诊断流程图Fig.1 Fault diagnose flow chart of centrifugal pump antifriction bearing

图2 随机森林结构图Fig.2 Structure of random forest

2 轴承故障试验研究

本文采用50CL-30A 立式离心泵作为试验对象进行故障诊断试验验证,试验平台如图3 所示。该离心泵使用6306 型滚动轴承,待测轴承为驱动端轴承。试验通过电火花加工技术对滚动轴承的内环、外环进行单点故障注入,注入故障切槽的宽度为1 mm,利用砂轮对滚动体打磨进行单点故障注入,打磨深度为0.5 mm。试验过程中,控制离心泵组电机的转速为2 950 r/min,试验数据通过构建的16 通道的硬件采集系统采集,采样频率为20 000 Hz,采样时间为每隔2.5 h 采集1 s 振动数据,每种故障模式的振动数据共采集7 次,形成7 组故障数据。

图3 离心泵滚动轴承故障诊断试验系统Fig.3 Fault diagnose experiment system of centrifugal pump antifriction bearing

离心泵组试验系统原理如图3 所示。试验场地提供380 V 的交流电源,然后控制交流电机运转,电源与电机通过电缆连接,交流电机带动离心泵实现吸/排水过程;离心泵进口通过DN50×1.096法兰与DN40 过渡管路连接,出口通过DN40×1.096 法兰与DN40 过渡管路连接,进、出口处的DN40 过渡管路分别通过φ64.2SP 液压软管与DN80 管路相连并接入水箱。流量传感器用于检测离心泵组出口的流量。其中,离心泵组通过螺栓固定在T 型钢结构挂架上,挂架与基座通过螺栓固定。

根据图3 所示位置关系,通过螺栓将挂架、电机、离心泵连接起来,然后将挂架侧面与基座用螺栓固定。将各传感器与诊断系统相连,完成试验系统的安装,如图4 所示。离心泵故障诊断系统现场测试设备如图5 所示,主要包括传感器系统、数据采集及预处理模块、诊断主机系统。其中离心泵分别连接进水管和出水管,流量计通过法兰连接在出水管路上,其他传感器(振动传感器、电流传感器和轴心轨迹检测传感器)均直接安装在离心泵设备(包括电机、离心泵外壳,主轴等)上。基于LabVIEW 开发的离心泵综合故障诊断系统软件以可执行程序(.exe)的方式安装在诊断主机系统中;数据采集及预处理模块(包括电源模块、电荷放大器模块、输入输出端子等)起着数据预处理及转接的作用,用于数据融合、信号输入输出等,采集的4 种传感器信号通过4 个输入端子输入转接模块仪表箱,再通过相应的4 个输出端子将信号输出并接入到诊断主机系统(包括电源、信号前置放大、滤波、数据采集及A/D 转换等模块)的输入端子,最终实现信号的全方位分析及诊断。

3 诊断方法验证

首先,将采集到的每种故障模式的7 组数据进行整合,按时间顺序将其组合成一个数据列,通过降采样处理后,数据采样频率改为10 000 Hz。之后,利用小波降噪方法降低试验过程中由振动传感器所采集故障信号中的噪声,提高所采集数据的信噪比。在本方法中,选取db1 小波函数强制降噪,每种故障模式的时域数据降噪后的对比如图6 所示。

图4 离心泵滚动轴承故障诊断试验系统安装图Fig.4 The installation diagram of fault diagnose experiment system of centrifugal pump antifriction bearing

图5 离心泵滚动轴承故障诊断设备Fig.5 Fault diagnose equipment of centrifugal pump antifriction bearing

将每种故障模式数据进行分段处理,每段数据长度选取为10 000 个点,通过滑移取值获得100 组数据;然后,利用LCD 对每段数据进行分解,分解层数设定为5 层,每种故障模式任意一段数据的LCD 分解结果如图7 所示。从图中可以看出,信号经LCD 分解5 层之后,每种故障模式振动型号的时域特征值已比较明显。因此,对于开展后续的信号处理分析来说,采用5 层分解进行故障诊断完全足够。

图6 离心泵滚动轴承故障振动信号降噪Fig.6 Signal noise reduction of centrifugal pump antifriction bearing for fault vibration

图7 故障数据LCD 分解结果Fig.7 LCD decompose results of fault data

所有故障模式数据分解结束之后,提取LCD分解的每组信号的样本熵作为故障特征,生成每种故障模式的5 维特征,正常状态、内环故障、滚动体故障、外环故障的故障特征分别为100 组,如表1 所示。表1 中,各故障模式为5 维特征,为了更加直观地对所提取的特征进行表示,取4 种故障模式的三维特征绘制成三维散点图,如图8 所示。从图8 中可以看出,滚动轴承不同故障模式的特征具有很好的可分性。

提取了滚动轴承的故障特征之后,选取随机森林作为分类器进行故障诊断。赋予轴承正常状态、内环故障、外环故障、滚动体故障数据的特征标签分别为1,2,3,4,并随机抽取每种故障模式数据的30%作为训练数据,训练随机森林,随机森林中树的数量设定为100 棵。将随机森林训练完成之后,对所有故障数据的所有特征进行故障诊断,随机森林诊断结果与测试数据标签的对比如图9 所示。经计算,在滚动轴承的故障诊断方面,采用本文方法准确率高达99.75%。同时,本文还利用BP 神经网络分别对离心泵组轴承3 种构件(内环、外环、滚动体)试验采集的7 组数据进行了训练测试,显示故障诊断准确率为95%。对比结果表明,本文所研究的基于LCD-样本熵与随机森林的诊断方法与传统的诊断方法相比诊断的准确度更高。

表1 各故障模式的样本熵特征Table 1 Sample entropy characteristics of each failure mode

图8 各故障模式的特征图Fig.8 Characteristic diagram of each fault mode

图9 故障诊断结果Fig.9 Results of fault diagnose

对于泵组的其他组成部分,需开展面向测试性的故障模式影响及危害性分析(T-FMECA),分析其故障特征信号并根据特征信号的特点选择相应的诊断方法。若振动信号也为其主要特征信号,可采用本文方法;若为其他信号,例如主轴典型故障模式(主轴弯曲和主轴不对中),可采用位移传感器拟合轴心轨迹的方法进行故障检测及诊断。

4 结 语

本文对离心泵组中重要组件——滚动轴承典型故障模式的故障表征信号(振动)进行了信号处理分析,依此开展了基于LCD-样本熵与随机森林的故障诊断方法,并建立了相应的综合故障诊断系统,然后在此基础上运用试验方法对上述技术方法进行了试验验证,结果显示可以有效解决机电设备的综合故障诊断问题,为实现装备基于状态的维修及提高设备的测试性、安全性、可靠性等通用质量特性奠定了基础,切实提升了装备的整体可用度水平,能保证平台执行任务的成功性和

安全性。后续,可在机电设备综合故障诊断数据采集及监测技术的基础上进一步建立并完善相应的专家系统,为未来进一步实现泵组监测及诊断的集成化、智能化和网络化提供技术支撑。

猜你喜欢

离心泵决策树分类器
中低比转速带导叶离心泵出水边倾斜角对无叶区压力脉动的影响研究
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
基于贝叶斯网络的舰船离心泵类系统声学故障诊断方法
基于机器学习的离心泵气液两相压升预测
学贯中西(6):阐述ML分类器的工作流程
离心泵后泵腔内液体压力数值分析与验证研究
基于朴素Bayes组合的简易集成分类器①
简述一种基于C4.5的随机决策树集成分类算法设计
基于AdaBoost算法的在线连续极限学习机集成算法
决策树学习的剪枝方法