精密机电设备寿命评估方法
2018-02-28胡昌华甄桂清
胡昌华,马 芳,张 峰,甄桂清,谭 巧
(1.火箭军工程大学302教研室,西安710025;2.北京航天控制仪器研究所,北京100039)
0 引言
随着高新技术的发展和社会的进步,高精尖复杂机电设备大量涌现,复杂精密机电设备的性能评估与健康管理难度越来越大。近年来,在世界范围内,在部分高科技产品(如武器装备、航空航天设备)采购价格大幅度增长的同时,维护使用费用上升至设备投资费用的1/4甚至1/3。由于可靠性、维修性不佳,设备发生故障,成为维护使用费用剧增的重要因素。复杂精密机电设备发生故障的机理是随着机电设备储存或运转时间的推移,机件表面或内部将会产生诸如磨损、腐蚀、疲劳、蠕变、脆化等损伤,上述损伤累积的过程,也就是设备寿命不断减少的过程,直到该设备完全报废,即寿命终结为止。如果能在机电设备性能退化的初期,尤其在还没有造成重大危害时,就对设备的寿命进行评估和预测,并在此基础上确定对设备进行维护的最佳时机,将具有重要意义[1-2]。
在工程实际中,寿命评估是指在已知设备当前状态信息或历史信息的条件下,去评估或预测设备失效前还剩下多少时间,或设备在未来一段时间内发生失效的概率。在观测到失效之前剩余的时间通常称为剩余寿命(Remaining Life,RL),也称为残余寿命(Residual Life,RL),定义为条件随机变量:, (Zj(v),Ej)。 其中,T表示失效时间的随机变量,t为当前时刻,Z(u),u∈[0,t]为设备在t时刻之前的状态监测数据(或称退化数据),Zj(v)为同类设备j在运行时刻v的状态监测数据,Ej为同类设备j的事件数据(主要包括失效时间、预防维护时间等数据)。由于 RL是随机变量,其分布对于全面理解 RL很有意义。在相关文献中,剩余寿命估计(Remaining Life Estimate,RLE)通常有两种意思,一种情况是求RL的分布(如概率密度函数、累积分布函数等),然而在某些情况中只是求RL的期望,即E[T-t|T>t,Z(u), (Zj(v),Ej)]。 值得一提的是, 设备失效时间T通常定义为设备退化首次达到某一故障阈值的时间, 即首达时间(First Hitting Time,FHT)。
设备寿命评估近年来已经成为可靠性工程领域的一个前沿和热点研究问题,根据研究对象采用方法的不同,不同学者提出了许多不同的分类方法。文献[3]将现有的寿命预测方法分为基于机理模型的方法和数据驱动的方法两类。文献[4]对数据驱动的剩余寿命预测方法进行了系统且完整的综述,将数据驱动的方法分为基于直接监测数据的方法和基于间接监测数据的方法两类。文献[5]将剩余寿命预测的方法分为基于统计的方法、基于人工智能的方法和基于模型的方法3类。现有的寿命预测方法综述文章均是从寿命预测方法的角度综合评述了现有研究成果的研究进展情况,事实上,从工程的角度看,寿命评估面临的实际工程问题涉及3个方面:一是如何对一个新研制设备进行定寿,二是如何对运行状态的工作设备进行剩余寿命预测,三是如何对处于贮存或备份状态下的备件产品进行寿命预测。如图1所示,本文试图从上述3个工程问题出发,探讨寿命预测技术的进展情况。
1 新研制设备定寿方法
新研制设备有两种情况:一是已有设备改进形成的,二是全新设计研制的新设备。对于前者,通常采用相似产品类推的方法确定设备的寿命;对于后者,定寿方法包括机理分析法、基于构成元件可靠性综合的寿命预测方法、基于加速寿命试验的寿命预测方法和基于环境因子折合的寿命分析方法等4种定寿方法。
1.1 相似产品类推法
选取与新研制设备相似的已有设备,根据已有设备的额定寿命,通过类比分析法来确定新研制设备的寿命。目前,这种方法已广泛应用于部件寿命预测。张金怀等[6]利用继承因子描述新设备和旧设备间的相似程度,提出了综合旧设备信息和产品个体特性的混合先验,然后得到新设备的寿命。北京航空航天大学杨军[7]等进一步针对Zhang和Wang方法中计算复杂、难以推广到其他常见分布的缺点,提出了一种基于融合后验的Bayes方法。在Zhang和Wang的基础上,首先根据历史样本和前样本数据,得到设备历史后验,反映产品对原型产品的继承性;再采用Bayes假设作为先验,结合样本数据,得到设备可靠性的更新后验,反映产品的独有特性;然后通过继承因子,综合历史后验和更新后验,得到产品可靠性的融合后验,并以此进行可靠性推断和寿命预测。这种方法的优点是理论简单、运用方便,但是在实际工程中,对于较复杂的设备,难以获得与新研制设备相似程度很高并有完整故障记录的现有设备。
1.2 机理分析法
通过研究设备物理化学变化机理、原因、过程及规律,得到设备寿命演变规律,据此进行寿命预测。例如,在晶粒尺寸范围内,疲劳裂纹的起裂与扩展主要取决于结构微观特征,比如晶粒尺寸、晶格取向、沉淀夹杂等。Tanaka等首次提出疲劳微裂纹沿晶粒内某一滑移带萌生的理论模型[8]。在此基础上,Angelika应用此理论模型对微观裂纹在马氏体钢各晶粒内的萌生进行了初步模拟[9]。牟园伟等进一步利用泰森多边形生成法,模拟微观多晶结构,建立宏-细观模型相结合的三维仿真模型,得到了基于结构微观特性模拟的疲劳寿命预测方法[10]。沈自才等用渐变折射率的概念对复折射率材料热控涂层的光学性能进行了分析,建立光学性能退化模型[11]。针对机电设备,Glodež等提出了一个齿轮寿命的确定性计算模型,该模型以应变-寿命方法计算裂纹萌生所需的应力循环数,以Paris方程模拟裂纹扩展过程,以位移相关法计算应力强度因子与裂纹长度的函数关系,最后估计齿轮的寿命[12]。基于振动响应分析和损伤力学,Qiu等提出了一个基于刚度的轴承系统预测模型[13]。在该文献中,轴承系统作为单自由度振动系统,因此其固有频率和加速度幅值可与系统刚度相关联。另一方面,通过损伤力学,可将失效时间、服役时间和刚度变化联系起来。这样,一个轴承系统的固有频率和加速度幅值便可与失效时间和服役时间联系起来。Orsagh等以轴承为例讨论了轴承接触失效情况下的寿命预测方法,提出在碎裂(spall)萌生前使用Yu-Harris模型,在碎裂萌生后则使用碎裂扩展模型[14]。Li等提出了一个直齿轮寿命预测方法[15],该方法包括一个基于有限元法的齿轮裂纹长度估计模型、一个齿轮动力学仿真器(以估计齿轮载荷)、一个计算应力强度因子的仿真器和一个基于Paris公式的寿命预测模型。该方法考虑了在裂纹扩展过程中,齿轮刚度变化造成的动态载荷。试验证明,该方法具有较高的预测精度。若事先将齿轮载荷与应力强度因子在各种情况下的值制成查询表,该方法适用于现场应用。Ramakrishana等根据线性损伤(Palmgren-Miner)理论估计印刷电路板上焊点在振动和温度载荷下的损伤累计[16],并以同样的方法估计焊点仅在热循环(thermal cycling)下的剩余寿命。该方法的优点是能够较为准确地预测设备的真实寿命,且预测精度较高。但是,对于一些复杂精密机电设备(陀螺)而言,设备性能退化或失效往往是温度场、电磁场、力学等多物理场综合耦合作用的结果,很难清楚地确定其内在机理变化,难以建立精确的机理模型,限制了这类方法的使用。
1.3 基于构成元件可靠性综合的寿命预测方法
建立构成设备的元器件可靠性模型、构成设备的元器件与设备的可靠性关系模型,通过可靠性综合的方法,由元器件的可靠性指标预测设备的可靠寿命,元器件的可靠性指标可通过查表、相似产品类推的方法获得。美国马里兰大学的CACLE中心的专利提出了一种基于 “竞争”模型的可靠性评估和寿命预测方法,并应用于电路可靠性估计和寿命预测[17]。陈云霞等在此基础上加以改进[18],通过灵敏度仿真和主成分分析两种方法,确定对电路性能起主要影响的关键单元,再通过失效物理分析或统计规律明确单元的失效概率分布,通过综合考虑电路功能组成关系,提出了一种基于功能组成关系的可靠性评估和寿命预测方法,并应用在某航空机电产品的电源电路中。使用该方法的前提是能够获得元器件的可靠性参数,并能建立设备的元器件与设备的可靠性关系模型。
1.4 基于加速寿命试验的方法
加速寿命试验是一种在不改变设备失效机理的基础上,通过提高试验中的应力水平,加速设备的退化,从而在较短时间内获得设备失效数据的试验方法。基于加速寿命试验的寿命预测方法根据加速寿命试验获得的失效数据,将加速环境下确定的寿命信息进行转换,得到设备在正常应力条件下寿命信息。加速寿命试验作为一种快速预测高可靠设备寿命的方法,在航空航天、武器装备及机械电子等领域得到广泛应用[19]。根据加速应力的不同,可将加速寿命试验分为以下3类:
(1)恒定应力加速寿命试验
恒定应力加速寿命试验的基本思想是:设备在高于正常工作应力水平的恒定应力下进行寿命试验,直到规定的停止条件为止,再根据得到的失效数据进行统计分析。恒定应力是目前工程中应用最广泛的方法,试验技术比较成熟,1981年我国颁布了恒定应力试验的4个国家标准(GB2689.1~4—1981)。 但是, 这种方法耗费的时间仍然相对较长。
(2)步进应力加速寿命试验
步进应力加速寿命试验的基本思想是:在加速试验中,逐级提高应力水平,直到规定的停止条件为止,这种方法能够较快获得试验数据并且降低了对试样数量的要求。1961年,贝尔实验室的Dodson和Howard提出了步进温度应力试验法,并用于半导体器件的可靠性分析和寿命预测中。1980年,Nelson总结了关于步进应力试验的统计模型和分析方法,并提出了基于极大似然估计的模型参数估计方法[20]。2005年,Zhao等提出了一般性的步进应力试验加速寿命模型,并提出了其一般性的似然函数方法,其模型也可适用于任何应力水平仅改变尺度参数的寿命分布,并且还可以延伸到多个应力以及异形测试模式[21]。但是对于步进应力试验的统计分析,算法复杂性和非流程化是目前存在的主要问题。这两方面的问题使得步进应力试验的工程应用难度增大,并难于实现软件编程,降低了工程应用价值。
(3)序进应力加速寿命试验
序进应力加速寿命试验的基本思想是:将所有的试验样品分成几组,每组样品在随时间增加的加速应力下进行寿命试验,直到规定的停止条件为止。1958年,Kimmel在电子设备的可靠性研究中首先尝试了序进应力试验方法。1987年,殷向康等运用一些基本的假设,推导序进应力加速寿命试验下产品寿命分布,并对加速度方程为逆幂律模型以及序进应力正比于时间这类特殊情况进行了讨论[22]。徐晓岭等进一步研究了对数正态分布步进应力加速寿命试验和变序进应力加速寿命试验的统计分析方法[23]。虽然,序进应力加速寿命试验相比前两种方法效率最高,能最快地激发试验样品失效,但是其统计分析最为复杂,导致工程应用难以实现。另外,序进应力加速寿命试验对试验设备和试验环境的要求颇高,需要专门的设备来产生规定的序进应力,因此其应用范围受到很大的限制。
1.5 基于环境因子折合的寿命分析方法
将设备在多种工作环境下的试验数据折合为在某一特定工作环境下的等效数据,进而预测设备在该工作环境下的寿命。1965年,钱学森最先提出了 “天地折合”问题,即地面试验数据与飞行试验数据的折算与综合问题。对于基于环境因子的寿命折算问题,其关键在于如何求取不同环境下的环境因子的值。李凤等提出了一种考虑天地试验环境下Weibull分布形状参数不变的条件下,基于Bayes理论的两参数Weibull分布环境因子估计方法,其仿真实验说明Bayes估计优于极大似然估计[24]。洪东跑等利用比例风险模型来描述可靠性和环境因子的关系,提出了一种综合变环境试验数据的环境因子估计方法,并基于该模型给出了常用寿命分布下环境因子的统计推断方法[25]。
基于环境因子折合的寿命分析方法能够将不同环境下的数据折合到同一环境下,这样便克服了单一环境下数据不足或缺失等问题,扩大了样本。应用该方法的前提是不同环境下的失效机理保持不变,并且需要事先根据经验假设寿命分布类型。
2 工作状态下设备剩余寿命预测方法
工作状态下设备寿命评估是指设备已经工作一段时间,根据此前所获得的设备工作信息,评估设备剩余寿命,通常称为设备剩余寿命预测。对于工作状态下的设备,可获取3类信息:一是设备的历史运行信息,二是相似产品的寿命信息,三是研制阶段试验、加速试验等方式获得的信息。这3类信息中包括两类数据:失效数据与性能退化数据。对应的寿命预测方法包括3类:基于失效数据的剩余寿命预测方法、基于退化数据的剩余寿命预测方法、多源信息融合剩余寿命预测法,如图2所示。
2.1 基于失效数据的剩余寿命预测方法
以失效数据为基础,通过统计分析得到设备寿命分布,基于设备的寿命分布和寿命之间的关系,得到统计意义上对应某个可靠度下设备的寿命。该方法的关键在于选择合理的寿命分布函数,常用的寿命分布函数包括指数分布、对数分布、正态分布、Weibull分布、均匀分布等。电子设备通常采用指数分布,机械设备通常采用Weibull分布。这类剩余寿命预测方法通常包括4个步骤:1)收集失效数据,并对数据进行预处理;2)选择寿命分布模型;3)估计寿命分布模型参数;4)预测剩余寿命。
2.2 基于退化数据的剩余寿命预测方法
利用设备的历史运行信息,建立设备的性能退化轨迹模型,根据性能退化轨迹模型预测设备性能指标超过失效阈值的时刻,设备从当前时刻到该时刻的时间即为设备的剩余寿命。基于退化数据的剩余寿命预测方法包括基于直接监测数据的方法和基于间接监测数据的方法,这类方法既能研究个体的退化趋势,也能研究设备总体的退化趋势。
2.2.1 基于直接监测数据的设备剩余寿命预测方法
直接监测数据指的是能够直接反映设备性能或健康状态的监测数据,例如磨损、疲劳裂纹数据等。基于直接监测数据的剩余寿命预测方法包括基于时间序列建模的剩余寿命预测方法与基于随机过程的设备剩余寿命预测方法。
(1)基于机器学习的设备剩余寿命预测方法
方法原理:将退化数据看作时间序列,用机器学习或人工智能的建模方法建立设备性能退化轨迹模型,根据性能退化首次达到故障阈值的时刻预测设备的剩余寿命。常用的时间序列建模方法包括灰色模型、人工神经网络模型、支持向量机模型和组合预测模型等,这类方法在设备剩余寿命预测领域也得到了广泛的应用[26-27]。但是,该方法得到的预测结果是一个固定值,难以反映剩余寿命预测的不确定性。
(2)基于随机过程的设备剩余寿命预测方法
方法原理:假设退化过程服从某种随机过程分布,根据设备退化数据建立设备性能退化轨迹模型和寿命分布模型,根据性能退化首次达到故障门限的时刻预测设备的剩余寿命及其概率。这类方法是在概率框架下提出的,得到的剩余寿命结果是一个概率分布。如前所述,剩余寿命应带有一定的不确定性,因此该方法更符合工程实际。目前研究较多的方法包括:基于随机系数回归的方法、基于 Gamma过程的方法、基于逆高斯(Inverse Gaussian,IG)过程的方法、 基于 Wiener过程的方法和基于Markov链的方法等。
①基于随机系数回归模型的方法
随机系数回归模型将设备的退化状态直接由监测变量表征,通过监测,跟踪并估计这些变量达到或超过预先设定的阈值时间,实现剩余寿命的估计。20世纪90年代以前,这种方法局限于较为简单的线性回归模型。1993年,Lu等[28]首次提出一种一般的随机系数回归模型,描述一类设备的退化数据,剩余寿命可以定义为当前时刻开始,退化过程达到或超过阈值的时间。这类方法通过对一批设备的监测数据进行建模,并采用两步法估计模型参数,进而估计设备剩余寿命。该文献在退化建模领域具有重要的影响,基于该文献已经出现了许多扩展和变形,这类模型的一个共同假设是模型的噪声项与随机系数是相互独立的。
需要注意的是,此类模型基于如下假设:监测设备同属一类,它们具有相同的退化形式。因此,该类方法描述的是一类设备的退化过程及其总体的寿命特征,对于单个设备来讲,采用该模型意味着确定的退化路径,即所有的模型系数是确定的,不能反映设备退化的动态变化,又称随机变量模型。再者,以上的研究中,对于设备寿命的估计都是利用多个同类设备离线的历史监测数据进行估计的,没有利用到设备实时监测的数据,因此得到的寿命估计适合于描述同类设备的共性属性,这样的寿命估计在设备设计阶段是有用的。但是,对于具体设备的使用者而言,更关心的是具体服役设备的剩余寿命。为了解决对具体服役设备的剩余寿命估计,Gebraeel等考虑单个运行设备的剩余寿命估计问题,提出了一种指数型随机系数回归模型。具体地,该模型假设随机系数服从一定的先验分布,且可以获取同类设备的历史退化数据,基于这些历史数据依据经验确定先验分布中的参数,并通过Bayesian更新机制建立了历史数据与单个运行设备实时监测数据的关系,最后实现了对单个设备的剩余寿命估计。近几年,在以上工作的基础上又进行了广泛的拓展。基于随机系数回归模型的寿命研究存在的问题是:寿命估计大多是单调性假设下的近似解,由于没有考虑时间相关的动态,不能刻画寿命估计的瞬时不确定性。
②基于Gamma过程的方法
Gamma过程适用于设备退化过程严格单调的情况。例如,磨损过程、疲劳扩展过程等一般随着时间会逐渐累积,退化的增量是非负的,对于这样的过程,采用Gamma过程进行描述是自然的选择。由于退化轨迹的单调特征,利用Gamma过程对退化状态进行建模时,求解首达时间分布非常直接。因此,基于Gamma过程的剩余寿命估计方法,数学计算相对简单直接,并且物理意义比较容易理解。Singpurwalla[29]研究了在动态环境下如何利用Gamma过程描述退化状态,并融入动态环境对退化过程的影响,进而估计剩余寿命。Wang[30]以某大型饮料厂的水泵为研究对象,将设备的失效率建模为Gamma过程,即失效率函数为随机过程的情况,进而提高数值的方法来估计水泵的剩余寿命,通过饮料厂的历史数据验证了所提出的方法能够取得满意的结果。近年来,一些学者考虑运行设备的负载变化情况对退化过程的影响,提出将Gamma过程与Poisson过程结合建模运行设备的退化过程和负载变化过程。2009年,Van Noortwijk[31]对Gamma过程在寿命估计以及维护决策中的研究进行了系统全面的总结和分析。基于Gamma过程的寿命预测研究存在的问题是:由于其单调的特性,只适合于监测数据具有严格单调性特征设备的剩余寿命估计;Gamma过程的增量为Gamma分布,但Gamma分布比较复杂,难以利用设备运行过程中的实时监测数据对模型的参数进行估计或Bayesian更新。
③基于IG过程的方法
Wasan[32]首次提出 IG 过程。 Wang 等[33]首次将其应用于退化建模领域(激光数据),通过EM算法对基于IG过程的退化模型中参数估计问题进行了研究。Ye等[34]从数学上分析了IG过程用于退化建模的物理意义,从理论上分析了IG过程作为退化模型的可行性,并通过与Gamma过程进行对比,说明了IG过程更具有灵活性也更具有吸引力。目前,基于IG过程的退化建模与寿命预测相关的研究还比较少,但是与Gamma过程类似,IG过程仅能刻画单调形式的退化,这限制了其使用范围。
④基于Wiener过程的方法
Wiener过程是由Brownian运动驱动的具有线性漂移系数的一类扩散过程,也被称为漂移Brownian运动。Brownian运动最初用于描述微小粒子的随机游动,适合描述具有增加或减小趋势的非单调退化过程。而工程实际中,由于设备负载情况、系统内部状态的动态变化、外部环境的改变都有可能使得测量得到的性能退化变量具有非单调的特性。因此,Wiener过程已被广泛用于退化建模和剩余寿命估计。20世纪90年代以来,Wiener过程被广泛用于设备可靠性与寿命分析。例如,Doksum等[35]利用 Wiener过程对加速退化测试数据建模,并通过时间尺度变换将非平稳的Wiener过程转换为平稳Wiener过程,进而推断正常应力水平下的设备寿命。Joseph等[36]假设存在一定的变换方法可以将非线性退化特征转换为线性的特征,然后再用Wiener过程进行退化建模。
为了解决对具体服役设备的剩余寿命估计,Gebraeel等提出一类几何Brownian运动模型,实际上就是假设退化轨迹可以通过对数变换转化为线性轨迹,然后采用Wiener过程进行建模,实现剩余寿命估计。这类方法虽然融入了运行设备的实时监测数据,但仍需要多个同类设备的历史运行数据来确定模型参数的先验分布,而且先验分布中的超参数和模型的扩散参数一旦离线估计后,在实时数据获取后不再更新,因此剩余寿命估计的结果较大地依赖先验参数估计的准确性。此外,基于Wiener过程的剩余寿命估计方法大都假设退化过程的期望是时间的线性函数,即设备的退化率为常数。这类研究中,都采用了类似随机系数回归模型中的近似方法来求取剩余寿命的分布,得到的结果并不是首达时间意义下的解,由此造成估计的剩余寿命的矩估计不存在,难以在后期的决策优化中使用。为解决这一系列问题,Si等[37]解决了剩余寿命估计的精确封闭解的求解问题,而且结果能够保证剩余寿命矩估计的存在性,是目前文献中唯一的具有这些优良性质的研究成果。另外,Si等[38]又开展了基于非线性随机退化过程的退化建模和剩余寿命估计,提出了一类新的、一般性的非线性随机退化模型,首次得到了这类非线性退化过程首达时间分布的解析渐近解和封闭的剩余寿命概率分布,并能将线性的结果包含为特例。基于Wiener过程的寿命预测研究存在的问题是:假定其误差项的方差与时间长度成正比,Wiener过程为时齐的随机过程,但实际中并不是所有的退化过程具有这种性质,尤其当运行环境或者工况发生变化时。
⑤基于Markov过程的方法
基于Markov链的方法适用于对具有离散退化状态的设备进行剩余寿命估计,其两个主要的潜在假设为:设备将来的退化状态仅依赖于当前状态,即无记忆性;设备的状态能够通过状态监测直接反映。Kharoufeh等[39]考虑单个部件设备的剩余寿命估计问题,将设备的退化描述为连续时间的磨损过程,并依赖于外部的环境变化过程,而将这种环境变化过程描述为连续时间的时齐Markov链,实现剩余寿命估计的关键是计算PH分布(对应着剩余寿命分布)。 Kharoufeh等[40]进一步研究了这类方法用来寿命估计时的一些极限性质,但都是在Markov链状态逗留时间为指数分布的前提下得出的,难以解释状态逗留时间不满足指数分布的情形,即不能保证Markov性。这类方法实现剩余寿命估计,直观上容易理解,但Markov链的方法用来描述这种连续过程时,首先面临的难题是如何将连续过程离散划分为有限的状态,实质是一种近似。再者,对于状态的划分一般需要大量的监测数据,而且通过聚类等方法确定状态数目时难以保证状态数目的唯一性。基于Markov过程的寿命预测研究存在的问题是:对连续退化系统,需采用近似的方法将连续退化过程离散划分为离散状态,状态转移概率矩阵的确定通常由经验知识或需要大量数据来确定,数据量不充分时难以得到准确结果。
2.2.2 基于间接监测数据的设备剩余寿命预测方法
间接监测数据主要是指只能间接或部分地反映设备性能或健康状态的监测数据,如振动分析数据和油液分析数据等。这类监测数据与设备失效或寿命之间存在着间接的关系,间接监测数据通过一定的信号处理方法可以转化为直接监测数据。基于间接状态监测数据的剩余寿命预测方法主要包括基于随机滤波的方法、基于比例风险模型的方法、基于隐 Markov模型(Hidden Markov Model,HMM)的方法和基于隐半 Markov模型(Hidden semi-Markov Model, HSMM)的方法 4 种。
(1)基于随机滤波的方法
该方法主要基于以下两个假设:一是设备没有受到诸如维修和更换等因素的干扰,设备在监测间隔期结束时刻的剩余寿命比开始时刻短;二是在设备退化过程中,其间接状态监测数据会出现趋势性的变化。北京科技大学王文彬教授等对这类方法进行了详细研究,提出一种基于半随机滤波的剩余寿命估计模型,并进一步研究了在模型中引入延迟时间和专家知识等主观信息的问题,其研究结果应用于轴承的剩余寿命预测和维修管理。该方法是目前剩余寿命预测领域的研究热点。
(2)基于比例风险模型的方法
利用不同设备间失效函数成比例的性质,通过建立设备运行状态监测数据与设备的失效率之间的关系,进行设备的故障率预测,进而预测设备的剩余寿命。1972年,Cox首次将该模型应用于寿命分析中,之后Jardine基于该模型研究了退化设备的替换问题,并开发了维修决策优化软件,已经在工程中得到应用。Ghasemi等[41]进一步考虑了缺失条件下结合历史数据的剩余寿命预测问题,通过将设备的退化过程看作协变量,并用隐含Markov过程来描述,推导出了平均剩余寿命的计算表达式。
(3)基于 HMM 的方法
该方法是在Markov链方法基础上发展起来的,不同之处在于,它主要用于具有连续退化状态的剩余寿命预测问题。Bunks等[42]于2000年首次将HMM用于设备的剩余寿命预测,根据寿命预测结果进行视情维护决策。 之后 Baruah 等[43]、 Camci等[44]分别将HMM 和EM(Expectation Maximization)、 动态Bayesian网络相融合,分析设备的剩余寿命预测。
(4)基于隐半Markov模型HSMM的方法
HSMM是HMM的改进模型,与传统HMM的主要区别在于,放宽了状态服从Markov性的要求,并定义状态驻留时间为显式的函数分布,一般设为Gauss分布。近几年,Dong等对HSMM应用设备剩余寿命预测展开了一系列研究[45]。2012年,Liu等通过HSMM来描述健康状态之间的转移概率和状态的持续时间,序贯蒙特卡洛方法(SMC)来描述健康状态和监测的观测设备的概率关系,提出了一种新的在线剩余寿命预测方法[46]。
2.3 多源信息融合剩余寿命预测法
方法原理:融合多源信息(如失效数据和退化数据、加速试验数据与正常退化数据、专家知识与退化数据等)建立退化模型,进而预测设备的剩余寿命。Petti等[47]研究了在Wiener过程中将性能退化数据和失效数据融合的联合建模方法,提出了基于Bayes理论的参数估计方法,研究结果表明,融合的方法能够更加准确地估计参数。Lee等在此基础上提出了一种基于EM思想的参数估计算法,并应用于发光二极管的寿命预测中[48]。Gebraeel等结合寿命数据研究了基于线性随机系数模型的轴承寿命预测问题。司小胜等结合先验分布研究了基于Bayes理论和EM算法的寿命预测方法,并应用于导航系统中的陀螺仪。虽然基于信息融合的方法能够更加精确地预测设备的剩余寿命,但是会增大建模和参数估计的复杂度,难以得到剩余寿命预测的解析表达式,可能导致算法的实时性不高。
3 设备贮存寿命预测
早在20世纪50年代,美国就开始进行设备的现场贮存试验,对其部署和研制的导弹及所属的各种装置实施了一系列的现场贮存试验,得到了大量的数据,并用于改进导弹的贮存可靠性。俄罗斯从20世纪80年代开始进行加速贮存试验,研究成果保证了导弹能在10年贮存期内,无需检查和维修即满足相应的战术要求。迄今为止,国内外对元器件、原材料的加速贮存试验已经开展多年,获取了许多元部件、原材料的贮存寿命数据信息,并且形成了一套较为成熟的相关加速贮存试验技术和方法,但是,对于系统级或分系统级的加速贮存试验研究相对较少且进展较为缓慢[49]。
设备处于贮存状态时,可以获取的与寿命相关的信息主要包括两种:一是贮存期间设备的寿命数据,二是通过定期检测获得的性能监测数据。由于设备在贮存期间退化较为缓慢,因此通常采用加速试验的方法来缩短试验时间。目前,设备贮存寿命预测方法可分为基于失效数据的方法和基于加速退化试验的方法两类。
3.1 基于失效数据的设备贮存寿命预测方法
通过对失效数据进行统计分析,确定设备的寿命分布,据此进行设备的寿命预测,这类方法可分为基于现场贮存试验的方法和基于加速贮存试验的方法两类。
(1)基于现场贮存试验的方法
将设备置于与工作环境条件相当的条件下进行贮存,贮存过程中通过定期检测获得设备性能退化数据或失效数据,并对这些数据进行退化分析或寿命分布统计分析,预测设备的剩余贮存寿命。这类方法的预测结果与实际比较贴近,预测准确度较高,在20世纪被广泛应用于军事设备的贮存寿命预测中。Wise等研究了微电路板在储存、不工作状态下的寿命预测问题[50]。Feng等提出了一种多阶段Wiener过程的模型预测高电压脉冲电容器的储存寿命[51]。王兆强等在随机滤波的框架下,考虑了测试活动对储存状态下陀螺仪的寿命的影响,研究了陀螺仪的剩余储存寿命预测问题,并用于指导陀螺仪的维修活动安排[52]。但这类方法需要的时间周期长,在较短的时间内获得较高置信度的预测结果,对使用来说更有意义,加速贮存试验在这种背景下应运而生。
(2)基于加速贮存试验的设备寿命预测方法
加大贮存应力载荷,加速设备退化或失效进程,在较短的时间内获得设备失效或性能退化结果,得到设备寿命分布或性能退化模型。这类方法试验耗时短、费用相对较少,得到了广泛研究与应用,并在诸如火工品等元器件级设备的加速贮存寿命试验方面形成了相应的规范和标准。在整机加速寿命试验方面,Van Dorp等研究了设备服从指数分布和Weibull分布的统计特性[53],周秀峰等在此基础上进行了模型修正,并应用于某型通信设备电子整机的贮存寿命预测中[54]。
3.2 基于加速退化试验的贮存寿命预测方法
在性能退化试验的基础上,通过提高应力水平以加快退化速率。Nelson最早对加速退化试验进行了研究[55]。 Padgett等[56]和 Park 等[57]进一步研究了加速退化试验在发光二极管、逻辑集成电路、电源、碳膜电阻等设备中的应用。加速退化试验作为解决高可靠性、长寿命设备贮存寿命预测的一种重要方法得到了迅速发展。
关于加速寿命试验与加速退化试验的选择,目前国内外尚未有明确的标准。相比于加速寿命试验,加速退化试验需要的试验样本较少。此外,加速退化试验不需要设备运行至失效,只需获取试验中的监测数据便可预测设备的寿命,因此对于长寿命、高可靠性设备的贮存寿命预测可缩短试验时间。而基于加速寿命试验的方法,需要的样本数量多,但也更能反映设备整体样本的寿命情况,因此对于造价较为低廉、可进行大批量试验的设备,使用加速寿命试验更加合理。
4 精密机电设备寿命评估发展趋势与展望
4.1 精密机电设备寿命规律的特点
对航天惯导系统等精密机电设备,一套设备的价值动辄上百万甚至上千万,这就决定对这类设备进行寿命预测,不可能通过大量的加速实验或平储实验来获取寿命数据,所获得的寿命数据或退化数据的子样数偏少、寿命典型的小子样条件下寿命评估问题。航天惯导系统等精密机电设备属于典型的光机电综合设备,其性能或寿命演变受电学应力、电磁应力、力学应力、光学效应多场综合交叉耦合作用影响。生产工艺的一致性、稳定性等对航天惯导系统等精密机电设备的性能退化或寿命演变也有较大影响,手工制作的这类设备,个性化特点非常明显,每一个设备都表现出不同的性能退化获寿命演变特性。如对某平台惯导系统72套陀螺的分析表明,其性能退化有趋好、趋坏、几乎不变、快变、慢变等多种退化模式,随着数控加工技术的发展,设备的一致性应该有更好的表现。航天惯导系统等精密机电设备的使用场景不同,其寿命演变规律也出现不同的特点。如卫星等应用,设备一直处于工作状态;而对武器系统应用而言,设备处于长期储存、短时测试、一次使用多态交互状态。对航天惯导系统等精密机电设备进行寿命预测,需要考虑这些独特的特点,设计数据获取和寿命评估方法。
4.2 多场耦合作用下精密机电设备退化敏感应力识别与寿命预测
对惯性仪表等复杂精密机电设备而言,设备的性能退化或失效常常是温度、电磁场、材料的残余应力、工作力载荷等多物理场应力综合耦合作用引起的,设备在何种条件下对哪种应力最为敏感,设备性能变化与该应力作用时间、强度呈现何种关联关系,从机理上探索清楚并揭示出相关规律,是进行设备寿命预测首先需要回答的问题,而国内外关于这方面的基础研究还相对薄弱,亟待加强。
4.3 多源小子样条件下精密机电设备寿命预测
对于惯性仪表等复杂精密机电,由于设备价格昂贵,可获得的现场监测数据或加速试验数据常常呈现多源小子样的特点,即对每个个体或每类个体,通常只能得到少量的现场监测数据、加速试验数据,而且这些数据常常还是在不同的储存、使用、加速试验条件下得到的,如何综合利用这些不同来源的少量数据,得到我们感兴趣的某种使用条件下的设备寿命,是一个极富挑战性的问题。
(1)状态切换条件下设备寿命预测
在工程实际中,设备不可能始终处于同一工作状态中,会存在状态的切换,例如设备可能从工作状态转换为停机状态,设备从贮存状态转化为工作状态。在已有寿命预测方法中,为了减小建模的难度,仅考虑在上述某一主要状态下设备的退化,常常忽略设备在其他状态下的退化情况,其假设的研究前提与实际情况不符,导致寿命预测结果存在偏差。目前对于该问题鲜有研究,文献[58]研究了设备在贮存和测试间相互转换下寿命预测的问题,首先将贮存和测试看作两个不同的状态,然后通过隐Markov链来描述这两个状态间的转换,最后采用多阶段的Wiener过程分别对两个状态进行建模。文献[59]在Wiener过程的框架下利用Monte-Carlo仿真的方法,研究了工作-维修状态切换下设备的剩余寿命预测问题,仿真实验结果表明,状态切换对设备寿命预测结果有较大影响,但该方法只能得到剩余寿命的经验分布。因此,考虑不同状态切换条件下设备的退化建模和寿命预测问题是寿命评估领域的前沿和难点问题,相关研究具有重要的理论意义和工程应用价值。
(2)不同环境下设备寿命的折算
如前所述,设备在实际运行或贮存中,可能存在多个状态,例如设备定寿时往往在不同环境对其性能进行测试,从而获得不同环境下的寿命数据,前面已经对这种情况下寿命的折算问题进行了介绍。实际上,设备处于贮存、正常工作、加速寿命试验等状态中皆可看作是处于不同应力环境。因此,若能够构建设备处于不同应力环境下寿命间的函数关系,实现设备的贮存寿命、工作寿命和加速条件下寿命间的折合,这样便可减小试验成本、缩短试验时间。例如,对于贮存寿命预测问题,可将设备的正常工作状态看作是设备贮存的加速形式,那么贮存寿命便可看作关于正常工作寿命以及应力之间的函数。若能确定函数的形式和应力的种类,就实现设备正常工作寿命到贮存寿命的折合。目前,很少见到采用这种思路进行寿命预测的相关研究。
(3)融合定性知识和定量信息的设备寿命预测
现有设备寿命预测方法主要使用了定量信息(监测数据和失效数据),但是在工程实际中,对于某些造价昂贵的设备(航空航天和导弹武器系统中的某些关键设备),无法进行大量试验,难以获取足够丰富的定量信息。针对这一问题,有必要在建立寿命模型时,进一步结合定性知识(专家知识等)。对于融合定量信息和定性知识的预测问题,基于置信规则库和证据理论,周志杰等[60]已经开展了相关研究并应用于故障预测中,但是还未进一步考虑设备寿命预测问题。
(4)融合加速试验数据与设备现场退化数据的寿命预测
在实际中,对某些特定设备如新研制设备或武器装备等,在役设备的现场退化数据往往呈现小样本特征。为准确确定设备的剩余寿命,常需借助加速试验的方法获取部分退化数据或失效时间数据,以此作为先验信息,结合设备的现场退化数据预测在役设备的剩余寿命。这里,类似于加速试验的寿命预测方法,核心是如何将加速应力条件下的数据转化为正常应力条件下的数据,即加速因子的确定。进一步,可借助Bayesian推理的思想,融合加速条件下得到的先验分布和在役设备的现场退化数据,实现设备的剩余寿命预测。
5 结论
随着无线传感网络(UWS)、 物联网(CPS)、 大数据、健康管理技术的发展,基于嵌入式传感、无线传感网络技术,研制精密机电设备健康状态周期性、实时性感知、监测设备,结合物联网技术,可实时、远程获取精密机电设备健康状态信息。基于大数据、数据挖掘、机器学习等智能特征提取技术,从机电设备的健康状态监测信息中自动提取设备的性能退化、寿命演变规律模型,实现机电设备实时健康管理、动态可靠性预测与寿命预测、预测维护,是机电设备下一步研制使用的一种必然模式。
[1]Zhou D H, Wei M H, Si X S.A survey on anomaly detection,life prediction and maintenance decision for industrial processes [J].Acta Automatica Sinica, 2013, 39 (6):711-722.
[2]Hu C H, Shi Q, Si X S, et al.Data-driven life prediction and health management: state of the art[J].Information and Control, 2017, 46(1): 72-82.
[3]Pecht M G.Prognostics and health management of electronics[M].John Wiley & Sons, Ltd, 2008.
[4]Si X S, Wang W B, Hu C H, et al.Remaining useful life estimation-a review on the statistical data driven approaches[J].European Journal of Operational Research, 2011,213(1): 1-14.
[5]Jardine A K S, Lin D, Banjevic D.A review on machinery diagnostics and prognostics implementing condition-based maintenance [J].Mechanical Systems and Signal Processing, 2006, 20(7): 1483-1510.
[6]Zhang S F, Fan S J, Zhang J H.Bayesian assessment for product reliability using pass-fail data [J].Acta Armamentarii, 2001, 22(2): 238-240.
[7]Yang J, Huang J, Sheng L J, et al.Bayes comprehensive assessment of reliability for binomial products by using test information of similar product[J].Journal of Beijing University of Aeronautics and Astronautics, 2009, 35 (7):786-788+847.
[8]Tanaka K, Mura T.A dislocation model for fatigue crack initiation [J].Journal of Applied Mechanics, 1981, 48(1): 97-103.
[9]Brückner-Foit A, Huang X. Numerical simulation of micro-crack initiation of martensitic steel under fatigue loading [J].International Journal of Fatigue, 2006, 28(9): 963-971.
[10]Mu Y, Lu S.Numerical simulation of fatigue-crack-initiation life for turbine disk based on material microcosmic characteristics [J].Acta Aeronautica Et Astronautica Sinica, 2013, 34(2): 282-290.
[11]Shen Z C, Kong W J, Feng W Q, et al.Degradation model of the optical properties of the thermal control coatings[J].Acta Physica Sinica, 2009, 58(2): 860-864.
[12]Glodež S, Šraml M, Kramberger J.A computational model for determination of service life of gears[J].International Journal of Fatigue, 2002, 24(10): 1013-1020.
[13]Qiu J, Seth B B, Liang S Y. Damage mechanics approach for bearing lifetime prognostics[J].Mechanical Systems and Signal Processing, 2002, 16(5): 817-829.
[14]Orsagh R F, Sheldon J, Klenke C J.Prognostics/diagnostics for gas turbine engine bearings[C].ASME Turbo Expo 2003,Collocated with the 2003 International Joint Power Generation Conference, 2003: 159-167.
[15]Li C J, Lee H.Gear fatigue crack prognosis using embedded model,gear dynamic model and facture mechanics[J].Mechanical Systems and Signal Processing, 2005,19(4): 836-846.
[16]Ramakrishnan A, Pecht M G.A life consumption monitoring methodology for electronic systems [J].IEEE Transactions on Components and Packaging Technologies,2003, 26(3): 625-634.
[17]Reliability prediction of electronic parts and products[R].University of Maryland, 2006.
[18]Chen Y X, Xie W S, Zeng S K.Functional analysis and physics of failure associated reliability prediction [J].Acta Aeronautica Et Astronautica Sinica, 2008, 29(5):1133-1138.
[19]Dodson G A, Howard B T.High stress aging to failure of semiconductor devices [C].Proceedings of the 7thSymposium on Reliability and Quality Control in Electronics,1961:262-272.
[20]Nelson W.Accelerated life testing-step-stress models and data analyses[J].IEEE Transactions on Reliability,1980, 29(2): 103-108.
[21]Zhao W B, Elsayed E A.A general accelerated life modelfor step-stress testing [J].IIE Transactions, 2005, 37(11): 1059-1069.
[22]Yin X K, Sheng B Z.Some aspects of accelerated life testing by progressive stress [J].IEEE Transactions on Reliability, 1987, 36(1): 150-155.
[23]Xu X L.Parameter estimation from multiplicate progressive stresses accelerated life testing under Weibull distribution [J].Journal of Shanghai Normal University, 1997,26(1): 36-41.
[24]Li F, Shi M Y, Jing Y.Bayesian estimation for environmental factor of two parameter of Weibull distribution[J].Systems Engineering and Electronics, 2008, 30(1):186-189.
[25]Hong D P, Ma X Z, Zhao Y, et al.Environment referring factor based on proportional hazards model [J].Journal of Beijing University of Aeronautics and Astronau-tics, 2010, 36(4): 443-446.
[26]Gebraeel N Z, Lawley M A.A neural network degradationmodel for computing and updating residual life distributions [J].IEEE Transactions on Automation Science and Engineering, 2008, 5(1): 154-163.
[27]Lei Y G,Chen W,Li N P,et al.A relevance vector machine prediction method based on adaptive multi-kernel combination and its application to remaining useful life prediction of machinery [J].Journal of Mechanical Engineering, 2016, 52(1): 87-93.
[28]Lu C J, Meeker W Q.Using degradation measures to estimate a time-to-failure distribution [J].Technometrics,1993, 35(2): 161-174.
[29]Singpurwalla N D.Survival in dynamic environments[J].Statistical Science, 1995, 10(1): 86-103.
[30]Wang W B.A prognosis model for wear prediction based on oil-based monitoring [J].Journal of the Operational Research Society, 2007, 58(7): 887-893.
[31]Van Noortwijk J M. A survey ofthe application of gamma processes in maintenance [J].Reliability Engineering and System Safety, 2009, 94(1): 2-21.
[32]Wasan M T.On an inverse Gaussian process [J].Scandinavian Actuarial Journal, 1968(1-2): 69-96.
[33]Wang X, Xu D H.An inverse Gaussian process model for degradation data [J].Technometrics, 2010, 52(2):188-197.
[34]Ye Z S, Chen N.The inverse Gaussian process as a degradation model [J].Technometrics, 2014, 56 (3 ):302-311.
[35]Doksum K A, Hóyland A.Models for variable-stress accelerated life testing experiments based on Wiener processesand the inverse Gaussian distribution [J].Technometrics, 1992, 34(1): 74-82.
[36]Joseph V R, Yu I T.Reliability improvement experimentswith degradation data [J].IEEE Transactions on Reliability, 2006, 55(1): 149-157.
[37]Si X S, Wang W, Chen M Y, et al.A degradation pathdependent approach for remaining useful life estimation with an exact and closed-form solution [J].European Journal of Operational Research, 2013, 226(1): 53-66.
[38]Si X S, Wang W, Hu C H, et al.Remaining useful life estimation based on a nonlinear diffusion degradation process[J].IEEE Transactions on Reliability, 2012, 61(1): 50-67.
[39]Kharoufeh J P, Cox S M.Stochastic models for degradation-based reliability [J].IIE Transactions, 2005, 37(6): 533-542.
[40]Kharoufeh J P, Mixon D G.On a Markov-modulated shock and wear process [J].Naval Research Logistics,2009, 56(6): 563-576.
[41]Ghasemi A, Yacout S, Ouali M S.Evaluating the reliability function and the mean residual life for equipment with unobservable states[J].IEEE Transactions on Reliability, 2010, 59(1): 45-54.
[42]Bunks C, McCarthy D, Al-Ani T.Condition-based maintenance of machines using hidden Markov models [J].Mechanical Systems and Signal Processing, 2000, 14(4): 597-612.
[43]Baruah P, Chinnam R B.HMMs for diagnostics and prognosticsin machining processes [J].International Journal of Production Research, 2005, 43(6): 1275-1293.
[44]Camci F, Chinnam R B.Health-state estimation and prognostics in machining processes [J].IEEE Transactionson Automation Science and Engineering, 2010, 7 (3):581-597.
[45]Dong M, He D.Hidden semi-Markov model-based methodology for multi-sensor equipment health diagnosis and prognosis[J].European Journal of Operational Research,2007, 178(3): 858-878.
[46]Liu Q, Dong M, Peng Y.A novel method for online health prognosis of equipment based on hidden semi-Markov model using sequential Monte Carlo methods[J].Mechanical Systems and Signal Processing, 2012, 32(4): 331-348.
[47]Pettit L I, Young K D S.Bayesian analysis for inverse Gaussian lifetime data with measures of degradation [J].Journal of Statistical Computation& Simulation,1999,63(3): 217-234.
[48]Lee M Y, Tang J.A modified EM-algorithm for estimating the parameters of inverse Gaussian distribution based on time-censored wiener degradation data [J].Statistica Sinica, 2007, 17(3): 873-893.
[49]QJ 2328-1992, Degradation storage test for composite solid propellant [S].Beijing: Ministry of Aeronautics and Astronautics of People's Republic of China,1992.
[50]Wise L J, Schrimpf R D, Parks H G, et al.A generalized model for the lifetime of microelectronic components,applied to storage conditions[J].Microelectronics Relia-bility 2001, 41(2): 317-322.
[51]Feng J, Sun Q, Jin T D.Storage life prediction for a high-performance capacitor using multi-phase Wiener degradation model[J].Communications in Statistics-simulation and Computation, 2012, 41(8): 1317-1335.
[52]Wang Z Q, Hu C H, Wang W B, et al.A case study of remaining storage life prediction using stochastic filtering with the influence of condition monitoring [J].Reliability Engineering& System Safety,2014,132: 186-195.
[53]Van Dorp J R, Mazzuchi T A,Fornell G E, et al.A Bayes approach to step-stress accelerated life testing [J].IEEE Transactions on Reliability, 1996, 45(3): 491-498.
[54]Zhou X F, Yao J, Zhang J.Dirichlet analysis method for the accelerated storage test of electronic machine [J].Acta Aeronautica Et Astronautica Sinica, 2012, 33(7):1305-1311.
[55]Nelson W.Analysis of performance degradation data from accelerated tests [J].IEEE Transactions on Reliability,1981, 30(2): 149-154.
[56]Padgett W J, Tomlinson M A.Inference from accelerateddegradation and failure data based on Gaussian process models [J].Lifetime Data Analysis, 2004, 10(2): 191-206.
[57]Park C, Padgett W J.Accelerated degradation models for failure based on geometric Brownian motion and Gamma processes[J].Lifetime Data Analysis, 2005, 11(4):511-527.
[58]Si X S, Hu C H, Kong X Y, et al.A residual storage life prediction approach for systems with operation state switches [J].IEEE Transactions on Industrial Electionics,2014, 61(11): 6304-6315.
[59]Wang Z Q, Hu C H, Wang W B, et al.A simulationbased remaining useful life prediction method considering the influence of maintenance activities [C].Prognostics and System Health Management(PHM) Conference,2014:284-289.
[60]Zhou Z J, Hu C H, Xu D L, et al.A model for realtime failure prognosis based on hidden Markov model and belief rule base [J].European Journal of Operational Research.2010, 207(1): 269-283.