APP下载

基于生存分析的设备剩余寿命预测技术研究

2018-05-05韦朝奥陈绍辉张爱辉

机电工程技术 2018年4期
关键词:马尔可夫建模状态

姜 勇,韦朝奥,陈绍辉,陈 亮,张爱辉,陈 余

0 引言

设备的剩余使用寿命(RUL)被定义为从当前时间到使用寿命结束时其设备可以有效使用的时间长度。目前,RUL的概念已经被广泛运用到运筹学、统计学中,其他如材料科学、生物统计学和计量经济学等领域也有涉及。其中一部分的运用是合理的,例如在“Businessdictionary.com”中,“使用寿命”被定义为资产或财产在使用过程中从开始到最后的目的达成所进行的期限。然而,在会计学中,它被定义为“贬值的资产实现生产力再生及可用的预期期限”。由此可见,使用寿命的具体定义取决于其所在的环境和所需的操作特性。在本文中,假定设备的持有者了解使用寿命的定义,且在此前提下对近年来RUL预测的建模发展进行回顾,并在基于条件维护和状态预测的生存分析下审查集中统计数据驱动的方法,最后对设备剩余寿命预测技术的合理性进行介绍。

RUL预测主要是基于条件维护(CBM)[1]和状态预测管理[2]的条件下而进行的,其在设备资产使用过程中具有至关重要的作用,因为它将会影响设备使用维护的规划、备件的供应、运行性能以及设备资产持有者的盈利程度[3]。不止如此,RUL预测在产品重复使用和回收管理方面以及设备使用过程中的能源消耗、原材料使用、污染程度和垃圾填埋场的使用同样具有重要的战略影响[4]。因为产品要想具备重复使用的能力,就必须有足够长的使用寿命。

由于设备的RUL具有随机性,所以预测过程主要取决于设备当前已使用时间、操作环境和可以观察到的状态监测(CM)或健康信息。在本文中,首先关注了RUL预测下的统计数据驱动方法,由于它只依赖可用的以往观测数据和统计模型,所以在不依赖任何物理条件或工程原理的情况下可以利用统计数据驱动的方法构建RUL预测模型,继而将模型拟合到一个概率模型上。可以发现与其他方法相比,统计数据驱动具有一定的优势,因为它可以对一些良好的数学特性进行分析。一般来说,用于RUL预测的数据可以划分为两种主要类型:事件数据和CM数据。所谓事件数据,就是指记录着的以往的故障数据。正如文献[5]中所分析的那样,为了利用统计数据来实现一个合理有效的RUL预测,可以从目标设备中收集和存储有用的数据(信息)。然而,对于一些关键设备则必须保证预测结果的准确性以及有效性,因为这类数据是稀缺且重要的,在此情况下,CM数据便成为了重要的数据信息来源,因为CM数据是在大范围数据中被定义,而这些数据却很可能与RUL的预测技术有关,例如CM信息、操作、性能、环境信息和退化信号。同时这些CM数据是通用的,例如振动数据、石油分析数据、温度、压力、湿度、加载速度和环境数据等。也就是说,数据可以是客观的,也可以是主观的,这主要取决于数据的性质和收集方法。

由以上分析可以了解到,统计数据驱动的方法依赖于数据的可用性和数据的性质。在这一点上,可以将可用的CM数据划分为不同的类别,以便能够以相同的方式进行审查。根据对现有文献的回顾,将观测到的CM数据分为直接CM和间接CM[6]。直接的CM数据可以直接描述系统的底层状态,因此可以说RUL预测实际上是对CM数据的预测。如果可以观察到,那么设备上诸如磨损和裂缝便是此类数据的典型范例。而间接的CM数据只能间接地描述系统的底层状态,因为其对于RUL预测的进行需要在CM数据中添加故障事件数据(从振动和油基监测中便可以得到)。据此,可以将对于统计数据驱动的审查分为两大类,即基于直接观察状态的模型和基于间接观察状态的模型。后者也被称为部分观测状态模型,因为观察到的CM状态与不可观测的状态之间存在随机关系。

其次,由于已经有部分分散在运筹学、可靠性建模、优化维护、故障诊断和生存分析的论文对这个话题进行了讨论,所以首先对此类论文进行简要但完整的回顾介绍,从而说明本文覆盖了一个以前没有被全面审查过的领域。

论文的其他组织架构为:第1节对与RUL有关的文件进行简要的调查分析;第2节对基于直接观察状态的RUL预测模型进行介绍;第3节回顾了基于间接观察状态的RUL预测模型;第4节通过建立退化模型来对该预测技术进行评估;第5节则对全文的分析进行总结。

1 对与RUL有关的文件进行调查分析

在过去的几十年里,出现了一些关于设备维护、升级优化、建模技术以及故障诊断等方面的优秀评论性文章,这些评论性文章涵盖了设备维护和可靠性问题等诸多方面。然而,这些文章有一个共同点,那就是很少讨论RUL以及与此相关的建模技术,尽管其所审查的一些建模技术已经可以用于RUL预测。

目前可进行RUL预测的设备主要是旋转机械设备,但是众所周知,RUL预测技术并不仅仅局限于旋转机械设备,因为许多工业设备项目(如电子和民用设备)并没有旋转部件,但是其在使用过程中仍会出现磨损消耗,所以仍然需要RUL预测。在文献[7]中,文章将RUL预测技术置于设备故障和数据驱动的物理类别之下,同时依靠底层降解过程的物理特性来预测设备故障的发生。由此可知数据驱动的方法主要是通过收集CM数据和事件数据来直接派生概率模型,这种模型将机器学习和基于统计的方法进行融合,而所用的融合方法则是设备故障研究和数据驱动模型的结合[8]。当然,在统计数据驱动过程中需要对CM数据进行观察研究,但是研究发现所观察到的CM数据并不是退化信号,而仅仅是其中的一部分,同时也可以观察到这部分退化信号的产生实际上是偏向于Gamma过程的。而其他诸如此类的文章也大多强调人工智能技术,对基于生存分析统计的预测技术讨论较少。

通过以上论述可以知道,以往用于RUL预测的统计数据驱动方法并没有得到全面审查,而本文则填补了该项空白,其主要工作是试图对广义的基于统计方法的RUL预测方法提出一个全面的论述。在此过程中,不涉及特定类型的机器设备,而是从数据和模型的性质以及统计的角度来进行观察,这将为基于生存分析的RUL预测技术提供一个连贯统一的参考点。如前所述,将CM数据分为直接CM数据和间接CM数据,且在基于直接CM数据的条件下回顾了基于回归的的模型,同时在此模型中包含了文献中所报告的统计数据驱动模型。

研究发现,间接CM数据如果想要与直接CM数据进行联接,则需要利用一些信号处理技术(例如傅立叶和小波变换等)直接从间接CM数据中提取并计算出能够代表设备健康状态的指标。在这种情况下,可以首先使用基于直接观察状态的RUL预测模型。

2 基于直接观察状态的RUL预测模型

目前,基于设备故障时间分析的传统方法仅仅依靠故障事件数据[9]来进行判断,因为除故障事件数据以外的一些数据常被认为是无效数据进而被舍弃。但是有人指出在设备实际使用过程中或许根本不存在无效数据,每一组数据皆有其存在价值,而且基于直接观测状态的RUL预测模型作为一种可供选择的研究模型已经可以对RUL进行有效预测。正如前面所提到的,CM数据可以直接在这些模型中对设备的底层状态进行描述,也就是说如果CM数据可以进行正确的建模,那么便可以直接预测设备的RUL,且在这个过程中并不需要损耗数据,这显然是这类预测技术的一个优点。

目前,有两种常用的基于直接观察状态的RUL预测建模的方法。第一种方法是将状态模型转化为一个连续性过程,而第二种方法则是使状态过程满足离散空间。在这两种方法的理论基础上,主要对回归模型和马尔可夫模型进行介绍。

首先对回归模型进行简要介绍。目前在用于CM路径研究的所有模型[10]中回归模型可能是最简单的,而且研究发现此模型进行过程中最受欢迎的方法是其包含着的机器学习和随机回归系数。其中机器学习方法仅利用观察到的数据和一些统计技术,比如最小二乘法。随机回归系数方法则是利用CM数据来对CM路径进行描述,然后推断出设备的寿命分布情况。可以对随机回归系数模型做以下基本假设[11]:(1)设备的工作状态随着操作时间的变化而恶化,并且在任何时候都可以观察到恶化程度;(2)被监控的设备数量固定,且每一个设备都有相同的退化形式;(3)设备总体的随机项是已知的。此前也有一些随机回归系数模型被提出,而且被用于RUL预测,但是这类模型侧重于使用基于传感器的监测信号来对单个操作设备的RUL分布进行预测分析。分析结果表明,在贝叶斯框架下,建立单个设备的历史数据与实时CM信息之间的联系需要不断提供更新后的模型参数。

与机器学习方法相比,随机回归系数模型可以提供RUL预测结果的PDF格式,当然这种PDF的封闭形式只有在特殊情况下才可用。而在大多数情况下,必须使用逐步近似或模拟的办法来寻找近似的RUL预测数据。但是随机回归系数模型也有一个问题,就是它不能对RUL预测的时间变化进行建模分析。这主要是因为随机回归系数模型没有FPT动机,而且由于高斯噪声的普遍使用,使得它在一定程度上限制了模型的非单调性。

其次对马尔可夫模型的特点进行简单介绍。基于马尔可夫的模型有两个基本假设。一是设备未来的退化状态只取决于当前的退化状态;另一个是设备系统的运行状态可以直接由所观察到的CM信息显示出来。目前马尔可夫模型已经被广泛应用于RUL预测和设备维护决策中,其主要原因是马尔可夫模型可以使状态定义更接近于工业中使用的其他随机模型,且容易被理解使用,而且马尔可夫理论在可靠性分析和RUL预测上具有很强的数学基础。但值得注意的是,马尔可夫模型的RUL预测过程存在一定的局限性,这一局限性有可能对有效结果的得出产生影响。而且在马尔可夫模型中,系统状态间的转移概率通常由经验知识或大量的样本决定,而这些样本并不总是可靠的。换言之,如果想要RUL预测的结果合理,马尔可夫模型仍有需要改进的地方。

3 基于间接观察状态的RUL预测模型

用于RUL预测的所有模型中有三种类型是基于间接观察状态的。第一种是基于随机过滤的模型[12];第二种是基于协变量的风险模型(PHM)及其变种[13];第三种是基于隐马尔可夫模型(HMM),在这三类模型中基于隐马尔可夫模型(HMM)由于其概念清晰而被应用于设备RUL预测技术中[14]。下面将具体对基于协变量的风险模型在RUL预测过程中在的应用进行考察。

在设备实际使用过程中,机械部件的磨损以及电子设备的损坏、退化过程是由一个或多个称为协变量的因素引起的。例如,设备运行过程中会因受到温度、材料性能和运行速度的影响而产生磨损。可以说这些随机变化的协变量影响着设备的使用寿命周期。因此,在RUL预测技术中引入这些协变量是很重要的。

作为一种最常见的基于协变量的模型,比例风险模型由于其通用性、灵活性和简单性而一直备受欢迎。而且由于PHM在统计科学中具有通用性,所以PHMs一直被广泛用于将系统CM变量、外部因素与系统的故障联系起来这一过程中。在其他统计方法中,PHM最重要的优点是协变量信息可以很容易地与基线危险函数相结合。据此,可以很容易地评估不同协变量对设备使用寿命预测的影响,对于此过程,可以用公式来表述:

在此公式中,Z(t)表示整个协变量信息的历史时间,t表示设备的使用周期。从上面的公式可以看出,PHM的运行需要依靠事件数据,如故障、审查数据以及CM数据信息。

基于这种情况,在设备RUL预测过程中可以参考结合工厂的运行状况。因为这样可以从RUL预测过程中得到有效的CM数据,从而克服传统预测方法所具有的缺点。同时在基于协变量的模型框架中,可以利用一些基于基本PHM的变体来构建危险建模,如比例强度模型。但是,值得注意的是,这些变体的应用程序比PHM更少。也就是说即使其他变体在理论基础、概念上以及可行性方面确实有对RUL预测的潜力,但是在他们被操作者接受之前仍然还有一些方法要去做。

最后需要知道用基于协变量的风险模型来对RUL进行预测所存在的主要问题是:(1)模型混合了不同的协变量,而在这些协变量中有部分变量会对预测的结果产生影响。例如,在发动机的机油分析方案中,油液浓度是评估发动机磨损的良好指标。然而,发动机机油中的污染物同样会对发动机磨损;(2)PHM与任意给定时刻的协变量之差具有正比关系,而这一关系给工程设备的有效使用和可靠性评估带来了严重的限制,其对于具有不同协变量但基线风险相同的工程设备来说也存在干扰;(3)基线危险函数的参数采用过程中需要足够的故障事件数据和相关的CM数据,但是这些数据有时并不能完全得到或者保证正确。

4 退化模型

通过对近年来RUL的建模发展进行回顾,以及在基于条件维护和状态预测的生存分析下对集中统计数据驱动的方法进行审查,发现基于生存分析的RUL预测技术较以往的预测技术有着预测结果有效合理的特点。为了对其进行验证,本节建立了一类退化模型,通过建立这类退化模型来对功能设备的随机参数进行重新估计,进而使用这些更新的参数来预测被监控设备的剩余寿命分布。

本文中提出的退化模型适用于具有指数递增或递减形式的具体退化现象,所进行验证的预测技术满足于这类退化模型的运行特点。Gebraeel等人[15]提出了多种退化模型的剩余寿命分布,这些模型包含了线性、多项式以及其他的指数类型。此外,Gebraeel也提出了依赖于随机参数的模型,以及其他用于推导剩余寿命分布的计算方法。

首先用一个指数模型来模拟一个具有指数模型分量的退化信号,并且让此模型对随机误差过程中的误差项进行假设,同时对单个构件模型的未知随机参数进行估计。一旦确定了这些未知参数的具体分布情况,便可以得到单个设备的剩余寿命分布。

让S(tn)表示连续随机过程中的退化信号,t为连续时间t1、t2、…(tn≥0),在此条件下对时间t内的退化信号进行建模,且对分布在离散点上的退化信号进行观察。

在此式中,n=1、2、…,φ是一个已知的常数,θ是对数正态随机变量,β是一个正常的随机变量,ε(tn)则是一个遵循正态分布的随机误差项,其方差为σ2。在观察过程中假设θ、β相互独立,而且其他与此模型有关的数据信息,都将被用于模型退化分析。

对于这个指数模型,发现在时间tn内使用被记录的退化信号将是很方便的,基于此,用L(tn)来定义被记录的退化信号:

在以上公式中,L1、L2.…所表示的数值即是在n=1、2…条件下所得出的模型数据,但是考虑到所得数据符合二元正态分布的特点,所以对其进行命题假设,从而使其满足剩余寿命分布的推导过程。

在模型建立完成后,需要对剩余寿命分布进行分析确定,从而保证对基于生存分析的设备剩余寿命预测技术的验证是科学的,而要做到这一点,首先计算后验分布,进而观察被记录的退化信号值。

现在,对T时刻下设备的剩余寿命进行表示:

如上述分析,已经展示了如何确定设备上的剩余寿命分布,而且注意到,T不是一个正常的随机变量,因为T的分布与伯恩斯坦分布[16]类似。但是可以确定的是只要得到一个新的退化信号,就可以对设备的剩余使用寿命进行重新估计,而且这个过程可以很容易地在电子表格上得到体现,换句话说就是基于生存分析的设备剩余寿命预测技术对于设备的使用寿命预测是可行合理的。

5 结论

在本文中,回顾和总结了基于条件维护和状态预测的生存分析下的RUL预测技术的建模发展,且审查了集中统计数据驱动的方法。本文也将研究建立的RUL预测模型分为了两大类讨论,即基于直接观察状态和间接观察状态的RUL预测模型。同时本文通过建立退化模型来对基于生存分析的RUL预测技术进行了检验,且通过对于退化模型的分析,证明此RUL预测技术在合理操作下是可行且准确的。

参考文献:

[1] Wang,W.,Zhang,W.An asset residual life prediction model based on expert judgments[J] .European Journal of Operational Research,2008,188:496-505.

[2] Pecht,M.Prognosticsand Health Management of Elec⁃tronics[M].John Wiley,New Jersey,2008.

[3] Altay,N.,GreenIII,W.G.OR/MS research in disaster operations management[J] .European Journal of Opera⁃tional Research,2006,175:475-493.

[4] Mazhar,M.I.,Kara,S.,Kaebernick,H.Remaining life estimation of used components in consumer prod⁃ucts:Life cycle data analysis by Weibull and artificial neural networks [J].Journal of Operations Manage⁃ment,2007,25:1184-1193.

[5] Jardine,A.K.S.,Lin,D.,Banjevic,D.A review on machinery diagnostics and prognostics implementing con⁃dition-based maintenance[J].Mechanical Systems and Signal Processing,2006,20:1483-1510.

[6] Wang,W.,Christer,A.H.Towardsa general condition based maintenance model for a stochastic dynamic system[J].Journal of the Operational Research Society,2000,51:145-155.

[7] Pecht,M.Prognostics and Health Management of Elec⁃tronics[M].John Wiley,New Jersey,2008.

[8] Pecht,M.,Jaai,R.A prognostics and health manage⁃ment roadmap for information and electronics-rich system[J].Microelectronics Reliability,2010,50:17-323.

[9] Kalbfleisch,J.D.,Prentice,R.L.The Statistical Analy⁃sis of Failure Time Data [M].Wiley, New Jersey,2002.

[10] Heng,A.,Zhang,S.,Tan,C.C.,Mathew,J.Ro⁃tating machinery prognostics: State of the art, chal⁃lenges and opportunities[J].Mechanical Systems and Signal Processing,2009,23:724-739.

[11]Wang,W.A model to determine the optimal critical lev⁃el and the monitoring intervals in condition-based main⁃tenance [J].International Journal of Production Re⁃search,2000,38(6):1425-1436.

[12]Wang,W.A model to predict the residual life of rolling element bearings given monitored condition information to date [J] .IMA Journal of Management Mathemat⁃ics,2002,13:3-16.

[13] Jardine,A.K.S.,Banjevic, D., Makis,V.Optimal replacement policy and the structure of software for con⁃dition-based maintenance [J].Journal of Quality Maintenance Engineering,1997,3(2):109-119.

[14] Bunks, C., McCarthy, D.Condition-based mainte⁃nance of machines using hidden markov models[J].Mechanical Systems and Signal Processing, 2000,14 (4):597-612.

[15]Gebraeel,N.,Lawley,M.,Li,R.et al.Life distribu⁃tions from polynomial and exponential component degra⁃dation signals: Bayesian approach [D].Purdue Re⁃search Memorandum,Purdue University,West Lafay⁃ette,IN 47907,USA.2001.

[16] Ahmad,M.and Sheikh,A.Bernstein reliability mod⁃el: derivation and estimation of parameters[J] .Reli⁃ability Engineering,1984,8:131-148.

猜你喜欢

马尔可夫建模状态
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
状态联想
基于马尔可夫链共享单车高校投放研究
基于马尔可夫链共享单车高校投放研究
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
生命的另一种状态
坚持是成功前的状态
基于马尔可夫链的光伏发电系统输出功率短期预测方法
基于灰色马尔可夫模型的公务航空市场需求预测