基于数据挖掘的转子系统故障诊断方法研究★
2022-05-11侯国安田舟祺
侯国安,田舟祺
(银川能源学院,宁夏 银川 750015)
引言
压缩机是化工生产中的重要设备,随着科学技术的飞速发展,压缩机结构日益复杂化,在工作中经常会发生一些故障,导致生产停顿,甚至机毁人亡,造成重大经济损失和社会影响。如何及时发现和预测故障就显得十分重要,于是出现了数据挖掘技术。数据挖掘技术就是应用设备产生的振动数据,进行分析处理,找到分类规则,从而进行设备故障的诊断[1]。
1 转子振动故障的频率分析
压缩机属于旋转机械的一类,转子运作过程中将会产生振动,依据振动的频域和时域特征进行分析,对故障的诊断具有重要意义[2]。压缩机转子故障的主要类型有以下几种:
1.1 转子不对中
故障特征从频率角度分析,主要出现一倍频和二倍频;如果故障比较微小,轴心轨迹会出现椭圆形;严重时会呈现“8”字形[3]。
1.2 转子不平衡
故障特征主要是一倍频,轴心轨迹会出现椭圆形或圆形[4]。
1.3 转子碰摩
故障特征1 倍频、2 倍频、3 倍频与4 倍频都存在,轴心轨迹会出现椭圆形或圆形[5]。
1.4 油膜涡动
故障特征主要为二倍频以上,轴心轨迹是发散的曲线,有时会出现花瓣状[6]。
2 数据挖掘在故障诊断中的应用
2.1 决策树
决策树是一种归纳学习算法,它可以从大量无序、无规则的数据中找出分类规则。
决策树是一种树状的流程图模型,模型树的顶层是其根节点,是不同的信息集合,各个树枝是属性的测试,树叶表示分析结果。
针对类型判别的过程,决策树是人们普遍采用的经典归类方式。分析时,决策树的树根结点首先选取恰当的属性,将全部初始数据离散规划为一些子集,接着在各个子集中设立低层次的结点和分枝,这样便能够将繁乱的分类任务简单化。在模式识别中,决策树作为模式识别中一种行而有效的分类方法,通过从根节点开始选择合适的属性,将样本数据集分割为若干子集,在子集中重复建立下层节点和分支,可以将繁杂的多类别分类问题转变为一种简单的分类问题。主要的决策树方法有:ID3 算法、SPRIND 算法、CLS 算法和C4.5 算法等。
2.2 频域下样本生成决策树
本文中的数据是关于30 个压缩机的振动样本监控数据,其中,训练集选用了16 组数据,另14 组将作为决策树的测试数据,第213 页表1 为频域下的故障下的样本,在故障状态中选定1 为转子不平衡,2 为转子不对中,3 为转子的碰磨,读取数据库中BLOL 型的时域信号进行FFT 变化,提取出能反映设备故障特征的1 个~6 个倍频值对应的幅值[7]。在决策表中这个故障特征作为条件属性e=(F1,F2,F3,F4,F5,F6),C 为决策属性,这里由于原始样本数据是连续性的因此首选要对样本进行离散化处理,数据测试样本见第213 页表2,离散化后的样本见第213 页表3。数据的离散化方法常用的有3 种,即,基于最大熵法、等宽间距法及等频率区间法,综合考虑本文将选用等宽间距法来进行数据的离散化处理,它主要是把数据平均分为相等的区间,具体如下:
表1 频域下的故障下的样本
表2 数据测试样本
表3 离散化后的样本
2.3 决策树构造
根据算法所介绍的方法对样本进行计算。在决策表中这个故障特征F 作为条件属性,C 为决策属性样本共有6 个条件属性值,其中,每个描述属性都对应3 个类1 不平衡、2 不对中、3 碰磨[7]。
其中,P(C1)=9/16,P(C2)=3/16,P(C3)=4/16。
对训练集分类所需期望为:
描述属性F1有5 个属性值分别为1,2,3,4,5,它们的信息量分别为:
同理,可得训练集F2所得信息量为:
F3的信息量:
F4的信息量:
F5的信息量:
F6的信息量:各属性划分训练集所得熵为:
各属性划分训练集的信息增益为:
计算各信息熵如下:
各描述属性的信息增益比:
比较各个描述属性的信息增益比,选择信息增益比最大的属性F6作为该决策树的根节点。当F65个不同的取值时将产生相应的样本子集,样本子集如表4、表5。
表4 F6 取1 的样本集
表5 F6 取2 的样本子集
由表4、表5 可知当F6取值为2 时样本均对应同一类别3,则作为叶子节点故障类别为转子碰磨,取1 时样本子集并不“纯”以此要在该属性下继续选择信息增益比最大的,如此下来将构造出一棵决策树如第215 页图1。
图1 C4.5 生成的的故障诊断决策树
决策树生成根据以下规则:
每一条规则都为转子故障诊断的分类。如第一条“if A=3 then ②”,可解释为如果旋转机械转子特征频率F6的频率大于0.08 小于1.6,则可能发生转子碰磨了。同理,第二条可解释为如果转子特征频率F6的频率大于0 小于0.8 且特征频率F5的频率大于0 小于0.8,且特征频率F3 的频率大于0.8 小于1.6,则可能发生转子不平衡了[8]。这样,通过基于粗糙集的数据挖掘技术,将6 个属性约简变为4 个,使旋转机械转子故障诊断分类维度降低,挖掘出更方便的分类规则。我们可以按照这些规则,代入新的样本进行分类,也可以在数据库建立过程中形成检索和匹配的规则。
3 结语
本文分析了压缩机转子系统常见振动故障与频域的关系,利用粗糙集理论中可辨识矩阵方法进行属性约简,删除了冗余属性,克服了在决策树生成过程中产生子树重复的缺点,用C4.5 方法进行分类,得到故障诊断规则,通过诊断规则可以预测压缩机故障的发生。