APP下载

基于DPMM-CHMM的机械设备性能退化评估研究

2017-12-27朱龙彪

振动与冲击 2017年23期
关键词:轴承聚类观测

季 云, 王 恒, 朱龙彪, 刘 肖

(南通大学 机械工程学院, 江苏 南通 226019)

基于DPMM-CHMM的机械设备性能退化评估研究

季 云, 王 恒, 朱龙彪, 刘 肖

(南通大学 机械工程学院, 江苏 南通 226019)

针对传统的HMM模型状态数必须预先设定的不足,提出了一种基于DPMM-CHMM的机械设备性能退化评估方法。该方法利用DPMM模型的自动聚类功能,实现了模型结构根据观测数据的自适应变化和动态调整,获得设备运行过程中的最优退化状态数,并结合CHMM良好的分析和建模能力,得到设备退化状态转移路径,实现机械设备运行过程中的退化状态识别和性能评估,并利用滚动轴承全寿命数据进行了应用研究。结果表明,该方法可以有效地识别轴承运行中的不同退化状态,为基于状态的设备维修提供了理论指导。

狄利克雷混合模型; 连续隐马尔可夫模型; 性能退化评估; 滚动轴承

随着科学技术的迅速发展,机械设备越来越朝着大型化、高速化和高度自动化方向发展,机器故障对生产造成的影响和危害也越来越严重。为了保证设备长期安全运行,越来越需要对机械设备的运行状态进行监测,并且基于运行状态对设备进行预知维护和管理,以便做到防患于未然。隐马尔可夫模型(Hidden Markov Model,HMM)具有很好的状态监测和早期微弱故障诊断识别能力,而且还具有状态隐含、观测序列可见的双重随机属性。HMM的双重随机属性,很好地描述了机械设备运行过程中的衰退隐状态与观测到的征兆信号(如振动、转速和位移等)之间的随机关系,在机械设备性能退化评估与预测中得到广泛应用[1-2]。

在HMM的定义和学习过程中,状态数的划分是进行运行状态识别的关键,传统的根据专家经验划分状态的方法需要对模型先验知识比较了解,缺乏科学性、通用性;通过实验方法将多数部件能够遍历的状态数设为最佳状态数需要进行大量实验,对于长寿命、价格昂贵的设备不适用。柳新民等[3]建立了基于SVM(Support Vector Machine,SVM)与HMM串联结构的故障诊断模型,实现了对直升机减速箱的状态识别和诊断;张金春等[4]利用HMM自身的状态识别和转移回溯能力,结合多智能体遗传算法(Multi-Agent genetic algorithm,MAGA)实现了温控放大器的状态分类;但是上述文献中HMM模型的初始状态数都是依据传统经验设定的,缺乏科学性、通用性。曾庆虎[5]提出了基于最小描述长度准则(MDL)的学习算法,通过MDL准则优化调整状态数,但模型状态数还是需要预先确定,计算过程较为复杂。腾红智等[6]基于连续隐马尔可夫模型(Continuous Hidden Markov Model,CHMM)对齿轮箱全寿命过程的退化状态识别进行了研究,提出了基于K均值算法和交叉验证相结合的状态数优化方法,但K均值聚类算法仍需要预先确定状态数,且交叉验证对不同的退化状态数都要进行训练并检验分类错误率,计算时间长,效率低。张星辉等[7]建立了一组聚类方法评价指标,利用K均值聚类算法对状态特征进行聚类,通过指标评定结果从中选取模型的最优状态数。但是在设备运行过程中,随着监测数据的更新,退化状态数也需要随之不断更新,关于如何有效地确定最优退化状态数还需要进一步深入进行研究。

针对HMM模型状态参数的优化问题,本文提出了一种基于狄利克雷混合模型(Dirichlet Process Mixture Model,DPMM)和HMM相结合的机械零件性能退化评估方法,将DPMM引入到HMM模型中,利用其自动聚类功能,确定退化状态数,并结合HMM良好的分析和建模能力,实现运行过程中的退化状态识别。轴承退化性能评估结果表明了本文所提方法的有效性和适用性。

1 DPMM模型的概念

1.1 DP定义

狄利克雷过程(Dirichlet Process)定义为关于一组分布或者随机测度的分布,假设参数服从一类样本空间上的宽先验分布,参数的后验分布通过采样推断,该狄利克雷模型及其扩展模型则具有良好的聚类特性。近几年,狄利克雷模型已经在机器学习、生物信息学、文本聚类、图像分割等方面有较好的应用[8]。

Ferguson首次提出狄利克雷过程的定义,G0是测度空间Θ上的随机概率测度,参数α为正实数。对于测度空间Θ的任意有限划分A1,L,…,Ar,如果存在如下关系:

(G(A1),L,G(Ar))~Dirichlet(αG0(A1),

αG0(A2),L,αG0(Ar))

(1)

则G服从由基分布G0和参数α组成的Dirichlet过程,即

G~DP(α,G0)

(2)

1.2 DP构造

DP过程定义无法实现对DP过程的采样,在实际应用中往往采用不同形式的构造实现DP过程的应用。截棍构造(Stick-breaking Construction)可以用于独立构造服从狄利克雷过程的随机样本,截棍构造设有两个参数:聚集参数α、基础分布G0,则G可以通过如下方式构造:

(3)

图1 CRP 构造Fig.1 CRP Construction

1.3 DPMM模型

Dirichlet过程表现了良好的聚类性质,但是Dirichlet过程只能将具有相同值的数据聚为一类,如果两组数据不相等,不管它们是多么具有相似性,利用Dirichlet过程均无法实现聚类,这大大限制了其应用,针对这个问题,引入Dirichlet过程混合模型[9-11](Dirichlet Process Mixture Model, DPMM)。

在Dirichlet过程混合模型中,Dirichlet过程作为参数的先验分布存在,假设观测数据是xi,其分布服从

xi丨θi~F(θi)θi丨G~G

θi丨G~GG丨α,G0~DP(α,G0)

(4)

DPMM模型参数的物理意义如下:xi为观测数据(本文中为轴承全寿命数据);θi为数据服从某一分布,该分布的参数为θi;F(θi)为数据xi服从的以参数为θi的分布函数。

利用截棍过程构造DP,可得到DPMM模型的截棍构造表示:

π丨α~GEM(α)

(5)

Zi丨π~Mult(π)

式中,GEM表示截棍构造过程,Zi为类别标签,用来显示表示聚类中的各分量分布,Mult(·)表示多项式分布。

2 DPMM-CHMM退化评估算法

2.1 基于DPMM的轴承退化状态数确定

隐状态数N的确定是HMM模型训练和测试的关键,目前隐状态数大多根据经验人为设定,很难将各种类别都考虑到,而且新的数据中也可能有未知类型出现,依靠训练样本得到的固定模型结构对新的观测数据的适用性、涵盖性不强。DPMM算法不依赖于训练样本,而且随着数据的变化,模型结构能够实现自适应调整,实现动态聚类,图2为基于DPMM模型的隐状态数确定算法流程图,其步骤如下:

(1) 对轴承原始数据进行特征值提取;

(2) 初始化DPMM模型的参数(隐状态数N、迭代次数M、聚集参数α,假设观测数据服从高斯分布,其分布参数θi服从高斯维希特分布,将高斯分布边缘函数作为聚类类别标签);

(3) 其参数θi分别通过Stick-breaking和CRP构造获得狄利克雷过程先验分布;

(4) 通过Gibbs采样更新参数后验分布,当某个类簇中元素个数为0时,N减1,否则保存当前值。继续迭代步骤(1)~(4),待聚类数目稳定时,停止迭代,获得最终的状态数目N。

图2 基于DPMM模型的隐状态数确定Fig.2 The number of hidden states based on DPMM

2.2 基于CHMM的轴承退化状态识别

图3为基于CHMM的轴承退化状态识别算法流程图,步骤如下:

图3 基于CHMM的轴承退化状态识别Fig.3 Identification of bearing degradation status based on CHMM

(1) 根据步骤(1)~(4)确定的状态数N,作为CHMM模型的输入参数,在一定的约束条件上,随机初始化模型的其他参数(初始状态π,转移矩阵A,观测值矩阵B,混合高斯数M);

(2) 观察值概率矩阵B={bj(Ot)}描述了在t时刻隐含状态是Sj条件下,观测状态为Ot的概率。在实际应用中,观测值一般为连续信号,因此使用连续HMM模型更有优势,由于高斯混合模型(Gaussian Mixture Model, GMM)可以逼近任意分布,因此,通常使用GMM来描述连续HMM模型各状态下的观测值概率密度函数,即

(7)

式中,bj,m(Ot)是状态Sj的第m个高斯分布:

(8)

式中:Mj为状态Sj的高斯分量数目;wj,m为状态Sj的第m个高斯分布的权值;μj,m和ξj,m分别为状态Sj的第m个高斯分布的均值向量和协方差矩阵;d为观测数据维数。

(3) 根据上一步训练所得到的CHMM模型,利用Viterbi算法计算已知模型参数λ下,最可能的隐藏状态序列,即P(O|λ)的最大值,运用CHMM模型进行建模,已知观测序列O=(O1,O2,…Ot,…OT),通过Baum-Welch算法对观察数据进行训练,利用EM算法求概率参数模型的最大似然估计,重估权值w、均值μ和方差ξ,通过不断迭代估计模型参数λ=(π,A,B)。定义变量γt(j,m)为t时刻模型处于状态Sj且处于第m个高斯分布的联合概率,参数重估公式可写为

(9)

通过路径回溯求得每个观察序列最可能的状态,即得到退化状态转移曲线。

3 应用研究

应用研究采用美国USFI/UCR的智能维护中心提供的轴承全寿命数据[12],图4为实验装置。四个ZA-2115双列轴承并列安装在同一轴上,由恒定转速2 000 r/min的直流电机驱动,在轴承和轴上加载约26 671 N的弹性径向载荷,采用加速度传感器采集振动信号,采样频率为20 kHz。轴承1在连续运转约163 h外圈出现严重损伤,共采集982组数据,本文采用轴承1的全寿命数据进行建模与分析。

图4 轴承加速寿命实验装置示意图Fig.4 Schematic diagram of the bearing life device

目前在轴承性能退化评估中普遍采用均方根值和峭度指标来监测运行状态。峭度指标是概率密度分布尖峭程度的度量,对早期故障有较高的敏感性,其早期故障点相比于均方根值要早一些;而均方根值(Xrms)是对时间平均的,用来反映信号的能量大小,对早期故障不敏感,但稳定性比峭度指标要好。基于DPMM分别对均方根值(Xrms)和峭度指标(Kurtosis)进行训练以获取轴承CHMM模型的最佳退化状态数。以峭度指标为研究对象,分析DPMM模型中不同α值对聚类结果的影响分析,由图5可知,当α分别取2、20、2 000时,该模型聚类结果均能收敛到相同的值,可见,DPMM模型中参数α的初值选择对最终聚类结果没有太大影响。本文取初始聚类数目N=50,聚集参数α=20,迭代次数M=200,设观测数据服从Gaussian分布、观测数据分布的参数服从其共轭分布Gaussian-Wishart分布,分别通过Stick-breaking和CRP构造DP过程,并利用Gibbs采样获得参数后验分布参数,实现基于DP过程的自动聚类,结果如图6所示,均方根值和峭度指标的聚类曲线大致相同,且两种构造算法聚类结果均趋近于5。因此,将N=5作为CHMM模型隐状态数进行模型的训练和测试。

利用混合高斯模型来拟合各状态下的观测值概率密度函数,在构造连续隐马尔科夫模型时,高斯分量数目M取3,基于Baum-Welch算法重估参数(π,A,B),获得经过多次迭代的重估模型。利用Viterbi算法计算P(O丨λ)的最大值,即得到退化状态转移曲线。

图5 不同α值影响分析

Fig.5 Effect analysis of different valuesα

图6 CHMM模型隐状态数确定Fig.6 Determination of the number of hidden states of CHMM

图7 基于DPMM-CHMM的轴承退化状态识别Fig.7 Identification of bearing degradation status based on DPMM-CHMM

基于DPMM-CHMM获得的轴承退化状态转移曲线如图7所示,由图可知轴承从正常状态到失效状态的全寿命历程中,一共出现了5次不同状态,分别为正常状态、早期退化状态1、中度退化状态2、严重退化状态3和失效状态。通过该模型可以有效地找出轴承运行时的早期故障点,并识别轴承在运行过程中的一系列退化状态,为轴承的早期维护保养和寿命预测提供了理论指导。

为验证DPMM算法聚类的有效性,对CHMM的退化状态数N分别取4、6、7,与N=5的轴承退化状态转移曲线进行对比,如图8所示,结果表明,状态数N的取值对退化状态识别影响很大,当N=5时,轴承退化状态转移曲线更能反映轴承的实际退化过程,因此,运用该算法获得的最佳退化状态数为CHMM初始参数的设定提供了理论指导。

图8 不同隐状态数的CHMM退化状态转移曲线比较Fig.8 Comparison of state transition diagram based on different hidden states number

4 结 论

(1) 提出了一种基于DPMM-CHMM模型的机械设备性能退化评估方法,利用DPMM的自动聚类特性,解决了传统的CHMM模型状态数必须预先设定的不足,实现了模型结构的自适应调整和变化。

(2) 滚动轴承全寿命数据建模结果表明,DPMM-CHMM模型可以有效地反映轴承运行时的早期故障,为轴承早期的主动维护提供理论依据;并能识别轴承在运行过程中的一系列退化状态,反映轴承运行时的退化程度,为基于HMM的设备退化评估提供了一种新的方法。

[1] PENG Y, DONG M. A prognosis method using age-dependent hidden semi-Markov model for equipment health prediction [J]. Mechanical System and Signal Processing, 2011, 25 (1):237-252.

[2] LIU Qinming, DONG Ming, PENG Ying. A novel method for online health prognosis of equipment based on hidden semi-Markov model using sequential Monte Carlo methods [J]. Mechanical Systems and Signal Processing, 2012, 32: 331-348.

[3] 刘新民,刘冠军,邱静.基于HMM-SVM的故障诊断模型及应用[J].仪器仪表学报,2006,27(1):20-26.

LIU Xinmin, LIU Guanjun, QIU Jin. The fault diagnosis model and application based on HMM-SVM [J]. Chinese Journal of Scientific Instrument, 2006, 27(1):20-26.

[4] 张继军,马登武,张金春. 基于HMM的电子设备状态监测与健康评估[J]. 系统工程与电子技术,2013,35(8):1692-1696.

ZHANG Jijun, MA Dengwu, ZHANG Jinchun. State of electronic equipment inspection and health assessment based on HMM [J]. Journal of Systems Engineering and Electronics, 2013, 35(8):1692-1696.

[5] 曾庆虎.机械动力传动系统关键部件故障预测技术研究[D]. 长沙:国防科学技术大学,2010:65-72.

[6] 滕红智,赵建民,贾希胜,等. 基于CHMM的齿轮箱状态识别研究[J]. 振动与冲击,2012,31 (5):92-96.

TENG Hongzhi, ZHAO Jianmin, JIA Xisheng, et al. Research on the state identification of gear box based on CHMM [J]. Journal of Vibration and Shock, 2012, 31(5):92-96.

[7] 张星辉,康建设,高存明,等.基于MoG-HMM 的齿轮箱状态识别与剩余使用寿命预测研究[J].振动与冲击, 2013, 32(15):20-25.

ZHANG Xinghui, KANG Jianshe, GAO Cunming,et al. Research of gear box state identification and residual service life prediction based on MoG-HMM [J]. Journal of Vibration and Shock, 2013, 32(15):20-25.

[8] 周建英,王飞跃,曾大军. 分层Dirichlet过程及其应用综述[J]. 自动化学报,2011,37(4):389-407.

ZHOU Jianying, WANG Feiyue, ZENG Dajun. Review on hierarchical dirichlet processes and application [J].Acta Automatica Sinica, 2011, 37(4):389-407.

[9] TEH Y W, JORDAN M I, BEAL M J,et al. Hierarchical dirichlet processes[J]. Journal of the American Statistical Association, 2006, 101(476): 1566-1581.

[10] XU T B, ZHANG Z F, YU P S, et al. Dirichlet process based evolutionary clustering[C]∥In: Proceedings of the 8thIEEE International Conference on Data Mining. Pisa, Italy: IEEE, 2008: 648-657.

[11] 梅素玉,王飞,周水庚. 狄利克雷过程混合模型、扩展模型及应用[J].科学通报,2012,57(34):3243-3257.

MEI Suyu, WANG Fei, ZHOU Shuigeng. Dirichlet processes mixture model、extended model and application[J].Chinese Science Bulletin, 2012, 57(34):3243-3257.

[12] LEE J, QIU H, Yu G, et al. ‘aring Data Set’, IMS, University of Cincinnati. NASA Ames Prognostics Data Repository[DB/OL].http://ti.arc.nasa.gov/project/prognostic-data-repository

PerformancedegradationassessmentformechanicalequipmentbasedonDPMM-CHMM

JI Yun, WANG Heng, ZHU Longbiao, LIU Xiao

(College of Mechanical Engineering, Nantong University, Nantong 226019, China)

Aiming at the deficiency of the traditional HMM model, the performance degradation evaluation method for mechanical equipment based on DPMM-CHMM was proposed. With this new method, the automatic clustering function of DPMM model was adopted to realize adaptive changes and dynamic adjustment of a structure model according to the observed data to get the optimal degradation state number in the operation process of mechanical equipment. With good analysis and modeling capabilities of CHMM, the equipment degradation state transition path was obtained to realize the degradation state recognition and performance assessment of mechanical equipment in its operation process. Rolling bearing whole life data were studied, the results showed that the proposed method is feasible, it provides a theoretical guidance for the maintenance of mechanical equipment based on its state.

Dirichlet process mixture model (DPMM); continuous Hidden Markov model (CHMM); Hidden Markov model (HMM); performance degradation assessment; rolling bearing

国家自然科学基金(51405246);江苏省自然科学基金面上项目(BK20151271);江苏省“六大人才高峰”高层次人才资助项目(2017-GDZB-048);南通市应用基础研究项目(GY12016010)

2016-07-07 修改稿收到日期:2016-09-18

季 云 女,硕士生,1992年生

王 恒 男,博士,副教授,硕士生导师,1981年生。E-mail:wangheng@ntu.edu.cn.

TH165.3

A

10.13465/j.cnki.jvs.2017.23.025

猜你喜欢

轴承聚类观测
轴承知识
轴承知识
轴承知识
轴承知识
基于K-means聚类的车-地无线通信场强研究
天文动手做——观测活动(21) 软件模拟观测星空
2018年18个值得观测的营销趋势
基于高斯混合聚类的阵列干涉SAR三维成像
可观测宇宙
基于Spark平台的K-means聚类算法改进及并行化实现