APP下载

基于数据挖掘技术的齿轮箱故障诊断研究与应用*

2020-08-26李国庆侯国安

广州化工 2020年16期
关键词:决策表断点约简

李国庆,侯国安,张 浩

(银川能源学院,宁夏 银川 750015)

随着现代工业的发展,工业由原来的简单控制系统发展为复杂的智能化控制系统,齿轮箱是现代化机械设备中最常用到的动力部件,主要起传递运动和调配速度的作用。齿轮箱一旦发生故障,整个机械设备就会因此而无法正常运行或无法保证运行精度,从而造成巨大经济损失[1]。

现今,数据挖掘[1]已成为一种新的知识发现方法,在工程诊断领域的发展日益重要,在监测诊断项目方面,许多国家和研究机构都已开始了对数据挖掘的研究和应用[2]。

1 齿轮箱故障的振动特征[3]

1.1 轴承的故障特征

轴承的故障一般表现为轴承疲劳剥落和点蚀,外圈故障和内圈故障[4]。

(1)轴承疲劳剥落和点蚀的主要特征:在其频谱中高频区外环,固有频率附近出现明显的调制峰群,产生以外环固有频率为载波频率,以轴承通过频率为调制频率的固有频率调制现象;由于滚动轴承在变速箱中产生的振动与齿轮振动相比能量较小,解调谱中调制频率幅值较小,一般只出现一阶[5]。

(2)外圈故障特征:在转频、外滚道特征频率及其高倍频处有明显的谱线。

(3)内圈故障特征:在转频、内滚道特征频率及其高倍频处有明显的幅值下降的谱线。

1.2 轴的故障特征

轴的主要故障有轴向窜动、轴不平衡和轴严重弯曲。

(1)轴向窜动故障的主要特征:故障轴上齿数多的齿轮啮合频率的幅值大幅度增加;振动能量(包括有效值和峭度指标)有较大程度的增加[6]。

(2)轴不平衡故障的主要特征:以齿轮啮合频率、谐波为载波频率,齿轮所在轴转频、倍频为调制频率的啮合频率调制,调制边频带数量少而稀,解调谱上一般只出现所在轴的转频;故障轴的转频成分有较大程度的增加;振动能量(包括有效值和峭度指标)有一定程度的增加,包络能量有一定程度的增加。

(3)轴严重弯曲故障的主要特征:以齿轮啮合频率、谐波、齿轮固有频率、箱体固有频率为载波频率,以齿轮所在轴转频为调制频率的啮合频率调制,如果弯曲轴上有多对齿轮啮合,则会出现多对啮合频率调制,谱图上边带数量较宽,解调谱上出现所在轴的转频和多阶高次谐波;振动能量(包括有效值和峭度指标)有较大程度的增加,包络能量有大幅度的增加。

2 全局寻优的离散化算法

粒子群优化是1995年提出的,Kennedy博士是首位研究者,他是源于对迁徙类觅食过程,通过观察鸟类的迁移和群居的拟态[7]。其数学表达方式描述为:Pd=(Pd1Pd2…Pdn),V=(Vi1Vi2…Vin),Pi=(Pi1Pi2…Pin),X=(Xi1Xi2…Xin)。

设目标为d维,种群由m构成,每个粒子按照此式:

vid(t+1)=vid(t)+c1r1(pid-xid(t))+c2r2(pgd-xid(t))

(1)

所有的值都要大于零,其中i取值[1,M],r1,r2是在[0,1]范围,d的取值[1,D],c1,c2为加速因子,c1=c2=2ptd,表示最优的位置;在实际的工程应用速度之前要乘以系数ω,通常粒子的速度迭代公式(1),pxtd(t)表示现在的方位;ω取值范围为0.1~0.9之间。

条件属性的个数为T,根据粗糙集理论[8]中粒子群优化算法,基于决策表的成型的构成特点,实际应用中将连续属性离散化,并且是每一个属性都要一一的进行离散化[9]。

定义:设断点个数h,则起初位置是h×t的矩阵向量。

粗糙集理论粒子群优化算法中的速度公式表示如下:

v(t+1)=wv(t)+c1r1(pbest-p(t))+c2r2(Gbest-p(t))

(2)

p(t+1)=p(t)+v(t)

(3)

粒子群优化的基础理论是粗糙集理论的核心基础,对于这点不足,导致属性归类效果难以分辨[10]。

粗糙集理论的基础是它的决策能力,通过对Naïve Scaler算法的灵活应用也可以发现基本与粒子优化没有关系,依据决策属性值选取断点值。

但是,有可能两个决策值不同,随着信息的组合不同会被除去。为了处理类似情况,其中改进的 Naive Scaler算法[11]可以在原来的NS算法中加入一个步骤,具体如下:

(1)每一个a的大小组合,a∈C,根据(xi)的值,仍记xi,…x,不失一般性,并将样本保留1个以方便决策;

(2)如果D(xi)D(xi+1)≠a(xi)a(xi+1),得到一个断点c,取c=(a(xi)+a(xi+1))/2。

如果a(xi)≠a(xi+1)且D(xi)=D(xi+1),a(xi+1)=a(xi+2)且D(xi+1)D(xi+2),则得到一个断点,取c=(a(xi)+a(xi+2))/2。

如果a(xi)=a(xi+1)且D(xi)=D(xi+1)且属性值与决策值都相同的样本只保留一个,D(xi)≠D(xi+1),a(xi+1)≠a(xi+2),则得到一个断点,取,c=(a(xi)+a(xi+2))/2,加入两条计算断点的规则。

分析上述过程,在所得不相同理论值之间的理论算法和属性相结合的离散化算法中都找到了数量不等的断点,在进行属性约简[12]后改进的NS算法中,离散化的断点个数数量就会大大的减少,这样就有利于计算生成规则[13]。

表1的数据是利用敏感元件进行对齿轮箱故障详细诊断所得到的基本数据情况,决策属性D分别用1、2、3、4、5、6表示齿轮箱故障的六种情况:良好、内圈划伤、外圈剥落、保持架坏、齿面磨损、崩齿;C={a,b,c,d,e}为条件属性,U代表论域,通过HS算法分解后,得到能够代表不同情况的数值,总共二十个样本,每种情况取三到四个样本。下面分别采用基于改进NS的全局寻优的离散化算法对该决策表进行离散化。

表1 连续属性决策

表2 改进NS的断点集

计算离散化前条件:

X1={x1},X2={x2},X3={x3},X4={x4},X5={x5},X6={x6},X7={x7},X8={x8},X9={x9},…X20={x20}。

计算离散化前决策的属性:

D1={x1,x2,x3,x5},D2={x6,x7,x8,x9,x10},D3={x11,x12,x13,x14,x15,x16},D4={x17,x18,x19,x20}。

则POSc(D)={x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13,x14,x15,x16,x17,x18,x19,x20}。

各个条件属性的断点集用改进的NS算法计算,0.5528,0.3979,0.5712,0.3618,0.16322通过选取原则各取一个断点,NS算法得出的决策表见表3。

表3 离散化后的决策表

3 基于Pawlak属性重要度的约简算法和应用过程[14]

Pawlak属性约简算法的公式如下:

sig(a;B;D)=γ(B)-γb-(a)(D)

sig(a;B;D)={card(posIND(B)(D))-card(posIND(B-(a))(D))}/card(posIND(B)(D))

可根据公式直接证明定理[15],具体从略。

D核B=core(D)={a,b};

U/IND(c)={{1},{2}…{20}};

U/IND(D)={{1,2,3,4};{5,6,7};{8,9,10,11};{12,13,14};{15,16,17};{18,19,20}};

U/IND(B)={{1,2,3,12,13,14,17};{5,6,8,10,11,15,18,19};{4,7,9,16,20};{12,13,14};{15,16,17};{18,19,20}};

U/IND(B∪{c})={{1,2,3,12,13,14,17};{5,6,8,10,11,15,18,19};{4,7,9,16,20}};

U/IND(B∪{d})={{1,2,3,12,13,14,17};{5,6,8,10,11,15,18,19};{4,7,9,16,20}};

U/IND(B∪{e})={{14};{6,8,10};{1,2,3,4,5,7,9,12,17,16,20,11,15,18,19}}。

根据上述可得:

posB(D)=B{x}={1,2,3,12,14,17};

posB∪(c)={1,2,3,12,14,17};

posB∪(d)={1,2,13,14,17};

posB∪(e)={14}。

由此可以消除d、e,得到化简后的决策表4。

表4 化简后的决策表

计算条件属性等价类:

X1={x1},X2={x1,x5},X3={x3},X4={x4},X5={x6,x7,x8,x9,x10},X6={x11,x12},X8={x14},X9={x16,x17,x18,x19,x20}。

最终的离散化决策表就是表4。

4 基于决策间不可分辨关系的值约简算法[16]

当且φ≠∩[t]∈B,集合T是B的最小决策值,即最小值约简。

该表存在5个决策值:(D,1),(D,2),(D,3),(D,5),(D,6),D1=(D,1)={1,2},D2={5},D3={9},D5={16},D6={20}。

该表的每个属性有两个属性值对,共有八个:(a,0),(a,1),(b,0)(b,1),(c,0),(c,1),(d,o),(d,1)。

为便于表示,用A0,A1,B0,B1,C0,C1,D0,D1表示。

A0=(a,0)={1,4,20};A1={5,9,11};B0={1,9,16};B1={4,5,20};C0={1,4,16};C1={5,9,20};D0={1,16};D1={1,4,16}。

可以根据定义逐个看条件属性的不可分辨关系以及组合求解。

A0≠D1,A0≠D2,A0≠D3,A0≠D,A0≠D6,同理A1,B0,B1,C1,C0,D0,D1均无法推导出规则。

变换组合求解得以下规则:

表5 规则表

由此推断出新的诊断规则,也可知道粗糙集理论的诊断优势。本文只针对齿轮箱内部主要事故进行分析,此规则也只是适用于集中且大量出现的故障。

5 规则准确率验证

经过数据挖掘算法的粗糙集理论得出了一种诊断规则,我们需要对其进行验证。把训练样本数据处理后代入得出的规则中,进行准确率验证。

表6 待验证离散化表

采用10组验证数据,由表7验证表得出,诊断规则准确率为90%。

表7 验证表

通过差别矩阵和决策树得出的诊断规则准确率为80%。

由此得出粗糙集理论中改进的Naïve Scaler属性约简算法和基于决策间不可分辨关系的值约简算法得出的诊断规则优于决策树和差别矩阵所得出的规则。所以,此次改进的算法具有一定的可行性和实用性。

6 结 语

在全局动态寻优离散化算法中,改进Naïve Scaler算法能够得到所有保证不可分辨关系的断点,通过断点均分样本集、逐渐增加断点,动态地选择断点集,在信息系统分类能力不改变的情况下,使断点个数最少,最终得出诊断规则;和决策树的数据挖掘算法进行比较,表明改进Naïve Scaler算法的全局动态寻优离散化算法准确率较高,说明该算法有一定的优越性和有效性。

猜你喜欢

决策表断点约简
基于决策表相容度和属性重要度的连续属性离散化算法*
基于粗糙集不确定度的特定类属性约简
带权决策表的属性约简
砂泥互层断点组合类型及其合理性分析
——以大庆长垣萨尔图油田为例
用Eclipse调试Python
基于二进制链表的粗糙集属性约简
一类无限可能问题的解法
实值多变量维数约简:综述
广义分布保持属性约简研究
基于决策等价性的决策表属性集分解研究*