APP下载

基于随机森林的屏蔽泵故障诊断方法研究

2020-10-13段智勇刘才学

核科学与工程 2020年4期
关键词:屏蔽泵诊断模型决策树

段智勇,刘才学,艾 琼,何 攀

(中国核动力研究设计院,四川 成都 610213)

屏蔽泵是核动力装置一回路中的重要设备,是反应堆一回路压力边界的重要组成部分,其安全可靠运行是确保核动力系统正常运行的基础[1]。从屏蔽泵设计、制造和运行经验反馈来看,屏蔽泵零部件的摩擦和磨损是易发生的故障,如屏蔽泵出现过轴承磨损、叶轮口环刮磨、转子不平衡和屏蔽套鼓包刮磨等故障类型[2]。因此及时尽早地发现屏蔽泵运行异常状态,准确高效地诊断出屏蔽泵出现的故障类型,能够为其维修时间和维修措施提供可靠的指导,从而有效避免故障运行恶化而可能导致更严重的后果,确保设备运行的安全性和可靠性。

屏蔽泵又称为无密封离心泵,泵和电机被封闭在一个被泵送介质充满的压力壳体内,此壳体内只有静密封。电机的转子和泵的叶轮固定在同一根轴上,用隔离套将电机的转子和定子隔开,转子在被输送的介质中转动,其动力通过定子磁场传递给转子。这种结构取消了传统离心泵具有的旋转轴密封装置,故能做到完全无泄漏[3]。

由于屏蔽泵的特殊结构无法直接测量转子的振动位移,其故障振动信号探测只能在泵外实施[2]。目前,针对屏蔽泵出现的异常状态,一般利用已积累的经验知识进行故障原因分析[4,5],上述方法能够较有效地识别屏蔽泵的部分故障源,但较依赖于人员经验且诊断效率相对较低。本文针对屏蔽泵典型故障识别问题,研究了基于随机森林的故障诊断方法,利用屏蔽泵故障模拟试验研究获得了故障状态下的振动信号数据,在故障信号分析的基础上提取了诊断特征量,然后以其作为输入量训练随机森林算法模型,以实现屏蔽泵典型故障的准确诊断。

1 随机森林诊断算法原理

随机森林(Random Forests,RF)算法[6]结合了Breimans的“Boot Strap Aggregating”思想和H.O.的“random subspace”方法[7]。它是一个由多个决策树(Decision Tree,DT)组成的分类器群,所有的决策树随机生成,从而形成RF,森林中的树之间没有关联。诊断时,将测试数据输入RF,然后让每一颗决策树独自进行诊断分类,即“投票”,最后综合投票结果,将所有决策树中分类结果最多的那类为最终结果。RF算法的优点为[8]:(1)它能够处理高维度数据且不需要进行特征选择,而且在训练完之后可以得出“哪些维度比较重要”的结论;(2)创建随机森林,使用无偏估计;(3)能检测到维度间的影响;(4)实现过程简单,且易于使用并行化方法处理。

构建RF分类诊断模型的步骤如下[9](设样本的特征量个数为M,且0

(1)自助重采样。从训练样本数据集中采用有回放采样的方法,随机抽取k个样本(k为决策树的数量),形成新的训练样本集,具体方法见参考文献[10]。

(2)决策树生成。利用自助重采样得到的k个训练样本集创建对应的单颗决策树。单颗决策树的生成方法:从M个特征量中随机选取m个特征量作为当前节点的分裂特征集,然后根据节点不纯度最小的原则对节点进行分裂。

(3)为使每个节点不纯度最小,单颗决策树不进行剪枝,保证其完整生长。

(4)投票。对于测试数据集,利用单颗决策树进行测试,得到对应的类别,从而RF得到多个结果。然后采用“投票”的方法,将单个决策树中输出类别最多的结果作为待测试数据集的最终所属类别。

本文利用随机森林方法进行屏蔽泵故障诊断的实施方案流程如图1所示。

图1 屏蔽泵故障诊断实施方案流程Fig.1 The process of faults diagnosis program for canned motor pump

2 屏蔽泵典型故障特征量提取与分析

2.1 故障样本数据的获取

梳理屏蔽泵在长时间运行过程中出现的机械类故障主要包括轴承磨损、转子不平衡、叶轮口环刮磨、转子与定子屏蔽套刮磨等,通过搭建屏蔽泵运行试验回路,设计加工相应故障类型及不同故障程度的模拟试验件,在高速稳态工况下开展屏蔽泵正常运行状态和上述各种故障状态下的运行试验,利用压电式加速度传感器配套相应的采集系统测量屏蔽泵在各种运行状态下的振动信号数据,传感器测点布置参考文献[2]中的方法,即在屏蔽泵靠近上、下导轴承位置指向轴心方向相隔90°分别布置2个传感器(X方向、Y方向),在顶盖垂直下止推轴承方向布置1个传感器(Z方向),测点布置位置示意图如图2所示。

图2 屏蔽泵振动信号测点布置位置示意图Fig.2 The placements position of vibration signal measurement points of canned motor pump

屏蔽泵上述各种故障状态模拟试验与正常状态运行试验采用交叉方式进行,即将故障模拟试验件安装到屏蔽泵上模拟某一种故障状态运行后,更换上屏蔽泵正常完好的零部件确认其状态恢复正常后,再进行下一类故障状态的模拟试验,这样可以确保获取到真实可靠的反应每一类故障状态信息的振动信号数据,通过故障模拟试验,经筛选共获得了屏蔽泵不同状态下的振动信号数据样本信息如表1所示,每条振动数据中包括了5个测点的振动信号原始序列。

表1 屏蔽泵故障模拟试验获取的样本数据信息Table 1 The sample data information obtained by faults simulation test of canned motor pump

2.2 振动信号特征量提取

屏蔽泵是典型的旋转机械,运转过程中其整机、零部件都会有不同程度的振动,部分故障状态下如转子不平衡等会引起屏蔽泵的异常振动。振动烈度是评价旋转设备振动大小的一个重要指标,通常定义在10~1 000 Hz范围内取振动速度的有效值,提取屏蔽泵运行振动烈度特征量,其计算公式为[11]:

(1)

vi为振动速度信号,是对振动加速度信号去直流之后利用Simpson数值积分法计算,其结果为:

(2)

式中:i=0,1,…,N-1,N为单次采样的点数;

Δt——采样时间间隔;

aj——采集的振动加速度信号。

对于屏蔽泵摩擦或磨损类故障如叶轮口环刮磨、屏蔽套刮磨等会引起屏蔽泵高频摩擦噪声异常,一般分布在1~10 kHz范围内,可提取摩擦噪声特征量,它是由振动加速度信号在某一频段内的幅值谱的有效值转化而来,其计算方法如下:

(3)

式中:a0=1 μm/s2,是基准值;

ai——某一频段内振动加速度信号采样序列。

同时,提取屏蔽泵运行时振动加速度时域信号的有效值(RMS)、方差、峭度等统计特征量,一般在正常运行状态下统计特征量的波动相对较小;由于屏蔽泵具备旋转机械的特点,部分故障状态下会引起转动基频或倍频处幅值的明显变化,因此提取屏蔽泵运行时振动加速度信号在1/3f、1/2f、f、2f、3f、4f、6f、8f、12f等各阶倍频的幅值,上述特征量的计算方法可参考文献[12]。

2.3 故障与正常状态特征量对比分析

通过对振动加速度信号进行特征量提取,获得了屏蔽泵在各种运行状态下的特征量样本数据,对故障和正常运行状态下的特征量数据进行对比分析,发现故障状态下的部分特征量较正常出现明显的增长,且随着故障程度的恶化而上升。由于不同故障类型的特征量存在相似的变化且特征量较多,无法归纳出规则知识进行诊断,因而采用基于随机森林的方法进行屏蔽泵故障诊断是一种有效途径。图3是轴承磨损故障下X方向(上部)测点归一化的1/2f幅值特征量数据与正常运行状态下的对比,图4是转子不平衡故障下X方向(上部)测点归一化的1f幅值特征量数据与正常运行状态下的对比。

图3 轴承磨损故障与正常状态下归一化的特征量对比Fig.3 Comparison of normalized features data between bearing wear fault and normal state of canned motor pump

图4 转子不平衡故障与正常状态下归一化的特征量对比Fig.4 Comparison of normalized features data betweenrotor unbalance fault and normal state of canned motor pump

图5是叶轮口环刮磨故障状态下X方向(下部)测点归一化的有效值特征量数据与正常运行状态下的对比,图6是转子与定子屏蔽套刮磨故障状态下X方向(下部)测点归一化的摩擦噪声特征量数据与正常运行状态下的对比。

图5 叶轮口环刮磨故障与正常状态下归一化的特征量对比Fig.5 Comparison of normalized features data between impeller ring scraping fault and normal state of canned motor pump

图6 屏蔽套刮磨故障与正常状态下归一化的特征量对比Fig.6 Comparison of normalized features data betweenshielding sleeve scraping fault and normal state of canned motor pump

3 屏蔽泵诊断模型训练及验证

对屏蔽泵振动信号进行特征量提取与分析之后,利用得到的表2中的特征量构建了随机森林算法训练的输入样本空间,输出则对应屏蔽泵上述的5种状态(包括正常状态和4类故障状态),将由故障模拟试验获得的屏蔽泵特征量样本数据随机均分成三份,以其中的一份数据作为诊断建模的训练数据,剩余的两份数据作为诊断模型测试和验证的样例数据,用于模型训练和验证的样例数据信息如表3所示。

表2 随机森林算法建模用特征量信息Table 2 The features information for model establishment by random forests algorithm

表3 屏蔽泵故障诊断模型训练与验证用样本数据信息Table 3 The sample data information for training and verification of faults diagnostic model

将屏蔽泵故障训练样例数据作为随机森林算法输入量,算法中树的棵树设置为100,对随机森林诊断模型参数进行训练,从而建立了基于随机森林的屏蔽泵典型故障诊断模型,同时采用了贝叶斯(Bayes)算法模型和支持向量机(SVM)算法模型对样例数据进行了学习,分别得到各训练模型的分类准确率对比如表4所示,可以看到随机森林分类模型训练的准确率要好于贝叶斯模型和支持向量机模型。

表4 基于不同算法训练的屏蔽泵故障分类模型准确率对比Table 4 Accuracy Comparison of Faults Diagnosis Models Based on Different Algorithms

评判诊断模型的好坏还需要分析模型对训练样例之外的新数据的泛化能力,因此利用剩余的数据对所建立的屏蔽泵诊断模型进行测试和验证,得到各模型的测试结果如表5所示。从中可以看出随机森林诊断模型对新数据的预测准确率要高于其他两种模型,且与模型训练时的准确率基本一致,诊断模型具备了良好的泛化诊断能力,实现了屏蔽泵典型故障的有效识别和诊断。

表5 测试数据对屏蔽泵诊断模型的测试结果Table 5 The Test Results of Diagnostic Models for Canned Motor Pump Based on Test Data

4 结论

本文提出的屏蔽泵典型故障诊断方法以随机森林算法为基础,利用屏蔽泵故障模拟和正常状态运行试验获取的振动信号数据,从中提取了用于训练建模的特征量样本数据,并据此建立了屏蔽泵典型故障诊断模型,通过对诊断模型进行测试和验证,表明了所建立的随机森林诊断模型能够有效地对屏蔽泵典型故障进行识别与诊断,诊断准确率达97%以上,相对比优于贝叶斯和支持向量机诊断模型。该方法对核动力屏蔽泵运行中的故障识别与诊断具有一定的应用价值,为相应监测与诊断系统的开发和工程应用奠定了基础。

猜你喜欢

屏蔽泵诊断模型决策树
立式屏蔽泵振动超标分析及解决措施
屏蔽泵应用与维护浅析
屏蔽泵用屏蔽套稳定性分析
CD4细胞计数联合IGRA预测AIDS/Ⅲ型TB影像诊断模型分析
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
一种电网通信网络的故障检测方法及系统
基于决策树的出租车乘客出行目的识别
基于肺癌CT的决策树模型在肺癌诊断中的应用
对于电站锅炉燃烧经济性诊断模型的研究