复杂电子装备故障预测技术研究
2017-03-16杜光远
杜光远
(北京机电工程研究所,北京 100074)
复杂电子装备故障预测技术研究
杜光远
(北京机电工程研究所,北京 100074)
首先,强调了对复杂电子装备进行故障预测和健康管理的必要性;其次,简要地介绍了故障预测单元法、故障预兆参数法和基于失效物理分析的环境监测法3种故障预测方法;然后,总结了利用基于以上方法得到的故障相关数据来进行复杂电子装备的故障评价的主要原则和方法;最后,分析了复杂电子装备相关故障预测数据的特点和应重点关注的问题。
复杂电子装备;健康管理;故障预测;测试;评价
0 引言
目前,故障预测和健康管理 (PHM:Prognostics and Health Management)技术已经得到了美英等军事强国的高度重视和推广应用,并正在成为新一代飞机、舰船和车辆等系统设计和使用中的一项重要的测试技术。国外以F-35飞机的PHM系统[1]、直升机健康与使用监控系统 (HUMS)、波音公司的飞机状态管理系统 (AHM)和NASA飞行器综合健康管理 (IvHM)等为代表的PHM相关技术,已被广泛地应用于欧美等国的先进战机、直升机和大型客机上,包括美国海军的先进舰船也均采用了类似PHM技术的综合状态评估系统,以增强故障预测与诊断能力。
据来自美军的综合数据可知,在武器装备的全寿命周期费用中,使用与保障费用占到了总费用的72%,并且1/3的维修费用是由于不必要和不准确的维修工作引起的。与使用保障费用相比,维修保障费用在技术上更具有可压缩性。PHM是压缩维修保障费用的重要手段,其通过减少备件、保障设备和维修人力等保障资源需求来降低维修保障费用;通过减少维修次数,特别是计划外的维修次数来缩短维修时间,提高战备完好率;通过健康感知来减少任务过程中故障引起的风险,提高任务成功率[2]。
我国的武器装备中有大量的复杂电子装备,目前针对这些装备的测试主要是功能测试,由于很多技术参数均无法测量,因此,功能测试只能评价武器系统合格与否,而无法对其质量和品质进行评估。如果在设计这些复杂的电子装备时,进行PHM设计并配置相应的测试手段和测试数据评估方法,则不仅能够判断装备是否合格,而且还能对其健康状况进行评估,同时还可以对一些近期可能出现的故障进行预测。
PHM技术通过最大程度地利用传统的故障特征检测技术,采用先进的传感器,借助各种算法和智能模型来预测、监控和管理武器装备的运行状态,进而获得虚警率极低的故障检测和故障隔离的结果,并最终实现基于状态 (历史、当前及未来状态)的维修,以主动性的3Rs(即在准确的时间对准确的部位采取准确的维修活动)取代传统的、基于事件的事后维修或基于时间的定期维修。该项技术在国外先进国家已经成为了新一代航空航天装备实现自主式保障和降低寿命周期费用的核心技术。
故障预测技术是采用故障预测单元、故障预兆参数监测和基于失效物理分析的环境监测等方法来获得产品失效相关信息的,在此基础上利用数据分析技术得到产品临近失效的特征并以此给出产品即将失效的预警[3]。故障预测与产品失效关系示意图如图1所示。
图1 故障预测与产品失效关系示意图
1 基于PHM的装备设计和测试
目前,国际上常用的电子产品的故障预测方法主要有3种,即:基于保险和预警装置的方法 (故障预测单元法)[4]、基于故障预兆和推理的方法(故障预兆参数法)和基于失效物理分析的环境监测的方法。关于PHM方法的分类有很多,但均与上述3种分类大致相同。实际使用中可以把以上2种或2种以上方法混合使用。
1.1 内置故障预测单元的电子产品设计
故障预测单元法是指在产品上预置一个预警单元,以模拟被监测产品的电特性和环境适应特性。产品工作时对该单元施加大于被监测产品的电应力或环境应力,使该单元在被监测产品失效前失效。通过设定监测单元的应力级别,可以控制监测单元失效到被监测产品失效之间的距离;通过测试故障预警单元的状态,可以判定其是否失效,也可以由故障预警单元直接给出失效预报信号。该方法的另一种实现形式是保持故障预警单元的电应力和环境应力与被监测产品的一致,而将预警单元承受电应力和环境应力的能力降低,这样也能达到同样的预警效果。
故障预测单元可以是设备功率参数的预测单元,也可以是环境参数的预测单元。对于功率器件,可以在相同的工作条件下配置一个耗散功率低于正常器件的预警芯片,该芯片在与工作芯片相同的功率条件下会早于工作芯片而失效,当该芯片失效时说明工作应力已经达到了工作芯片即将失效的条件,因而可以据此给出提前维修的提示。例如:在额定电流为10 A的功率驱动器附近,安装一只额定电流为0.98 A的芯片,并在该预测芯片后端设置一个1 A的负载。这样,当额定电流为10 A的工作芯片通过10 A电流时,额定电流为0.98 A的预测芯片通过了1 A的电流。此时,预测芯片相当于通过了略高于其额定电流的电流,将早于工作芯片失效。当预测芯片失效时,工作芯片也接近于失效的阶段。这样便可以在预测芯片失效时,提前更换工作芯片或进行设备的其他维修,从而避免设备在执行正式任务时因失效而影响武器系统的作战性能。本例中,故障预兆芯片的额定电流设置成0.98 A还是0.95 A,决定了图1中预兆点与工作芯片真正失效的距离。在实际使用的过程中,器件要降额使用,预测芯片的降额要与工作芯片的降额等比例。
当环境是引起武器系统失效的主要因素时,可以设计一个耐环境应力能力略低于工作器件的芯片,当环境应力积累到一定的量值时,预测芯片先于工作器件失效,此时可以预测,工作芯片也即将失效。
故障预测芯片的失效可以作为工作芯片的故障预测指标,也可以将故障预测芯片设计成其特征参数与工作芯片有某种对应关系,以这个特征参数达到某一门限值作为工作芯片即将失效的判据。这样,通过测量故障预测芯片的某种特征参数,便可以达到预测工作芯片是否即将失效的目的。
1.2 基于装备故障预兆参数的电子产品的设计和测试
故障预兆参数法是指如果产品的被测参数中的某个参数发生变化即预示着该产品即将失效,则可以根据该参数的变化情况推断出产品将要失效的结论,该参数就是该产品的故障预兆参数。
故障预兆参数法是故障预测最直观、最有效的方法。该方法特别适用于电子产品的某个或多个参数的变化能够准确地反映产品的失效趋势的情况。但是,不是每个产品都有能够反映产品故障或寿命的参数。很多器件没有表示功能退化失效的参数,或者有能够预兆元器件即将失效的参数,但是该参数无法测量或测量将影响元器件的正常功能,从而使该方法的应用受到了一定的限制。
有些芯片在同样的负载和环境条件下,随着功能的退化,器件的温度较刚使用时升高较多,因此,器件的温升就可以作为器件失效的预兆参数。具体的方法是:首先,测量器件在出厂初期额定工作条件下的环境温度和器件的表面温度作为基础数据;然后,在器件使用过程中测量环境温度和器件温度,并用这组数据与基础数据作比较。在相同的环境温度和相同的负载条件下,器件的温升与基础数据偏离一定程度时,即可给出器件即将失效的预警。到底应该将使用中的温升数值与基础数值相差多少时作为预警的门限,则需要在产品交付前进行大量的试验验证,根据试验数据来确定。预警门限的宽容度,可以根据器件温升变化与失效对应关系的离散性和器件在系统中的关键性等因素来决定。
再比如,充电电池类产品随着使用的增多次数或时间的延长,其容量会逐渐地降低、等效内阻会逐渐地加大,电池在充电过程中的温升也较初期高。因此,容量、等效内阻和温升等都可作为电池寿命预测的参数。
继电器触点的电压降会随着使用次数的增加而增加,因而这个电压降可以作为继电器失效的预兆参数。在继电器的使用过程中,测量继电器触点的压降,在继电器的负载和环境温度不变的情况下,触点压降达到一定的数值时,可以触发继电器故障预警。电连接器的孔接触体和针接触体之间的电阻也会因为触点的老化和电应力的作用而增大,因而这个接触电阻也可以作为电连接器失效的故障预兆参数。
要想预测一个设备的故障,则首先需要分析设备内各种器件的失效模式和失效概率,并分析器件在设备中的关键性,选择设备内的关键器件和故障概率大的器件的故障预兆参数作为设备的故障预兆参数。如果一个器件有多个故障预兆参数,则选择最可能先失效的参数和发生概率高的参数作为器件的故障预兆参数。也可以根据这些参数的组合变化作为故障预兆参数。这需要对器件各种预兆参数进行大量的测量、分析,并找出这些参数变化与器件失效的数学规律,依此设定一个数学模型,当这些参数的变化达到按数学模型计算的数值时,就会触发故障预警。
1.3 基于装备失效物理分析和环境监测的电子产品的设计和测试
基于失效物理分析和环境监测的故障预测方法是先通过分析产品的失效模式,再监测环境应力和使用应力,然后通过一系列的算法和评定规则来推断该产品所经受的环境应力和使用应力是否达到了使该产品失效的条件,以此来预测产品的剩余寿命的方法。物理模型提供了一种将关键件损伤表征为运行状态函数的方法,并以损伤累积效应来评估部件的剩余寿命[5]。将该方法用于复杂电子产品的PHM研究的难度很大,因为复杂产品的失效模式有很多、不同的失效模式的触发条件也不同,必须在诸多的故障模式和触发条件中寻找最先满足条件的那一个,还要确定该故障模式对产品整体功能的影响。
在进行复杂电子装备失效分析时,首先,应对装备进行故障模式及影响分析,在此基础上根据故障发生的概率和故障的危害性来确定关键件、重要件;然后,对关键件和重要件进行故障诱发因素分析,找出容易诱发故障的工作应力和环境引力;最后,在此基础上针对所确定的诱发因素设计工作应力和环境应力测量方案。必要时,针对某重点设备需进行环境应力和工作应力对寿命影响的理论分析和试验验证。根据试验结果,确定不同的应力诱发故障的门限值。
功率器件在额定功率下工作到一定的时间后会逐渐地老化,直至失效。如果掌握了某种功率器件在额定功率下的寿命参数,即可以监测器件的实际功率和工作时间的话,则当该器件在额定功率下运行到接近器件失效高发期时,即可给出器件即将失效的预警。对于降额使用的器件,其实际可使用的时间比在额定功率下的要长一些,具体延长多久需要利用统计方法来确定。
海防导弹长期存放于海边湿热和高盐雾环境下,湿热和盐雾就是影响导弹的重要环境因素。在某些器件附近进行湿热监测或者对能够引起电化学腐蚀的参数进行监测,就可以根据这些参数的变化给出器件可能到达即将失效条件的预警。
一些器件长期工作在低温或高温环境中,还有些器件长期工作在振动等力学环境下,对这些器件进行环境因素测量,可以根据环境应力的累计值给出器件是否即将失效的预警。
2 复杂电子装备的健康评价和故障预测方法
复杂电子装备的故障预测比一般产品的故障预测要复杂一些,其中,基于故障预测芯片的方法、基于故障预兆参数的方法和基于失效物理分析的环境监测法是预测各种电子装备的故障时都需要用到的方法。至于具体是3种方法都用还是只用其中1种方法则需要根据设备的功能和工作环境等因素来确定。复杂装备与一般装备最明显的不同是如何利用以上3种方法收集的数据来对复杂装备寿命的进行评价。目前,国内外一些组织和个人通过研究给出了一些寿命预测的方法或工具软件。
若想进行装备的PHM,改变目前只进行装备主要功能测试的现状,则需要进行一些内部在线测试和专项测试。例如:如果装备内部某个设备内置了故障预警芯片,则需要为预警芯片配置相应的测试方案。测试电路是配置在电路板上、设备内部还是装备外部的地面专用设备内,则需要根据具体的情况来进行综合的考虑。当确定了装备某些器件或部件的故障预兆参数后,还需要制定故障预兆参数测量方案,这些参数的检测不能影响器件和设备的正常工作。
环境监测法需要根据系统的特点,在系统正常功能所需配置的基础上增加一些测量用的传感器、测量电路或测量设备。如果测量方案太复杂则必然会带来成本的增加,因而需要在综合分析器件和系统的实际情况的基础上来设计测量方案。环境监测方案需要兼顾能够进行故障预测、不影响器件的正常功能和尽量地降低成本的原则。
内置故障芯片法、故障预兆参数法和环境监测法可以同时使用,用这些方法得到的数据可以综合地评价复杂电子装备的预期寿命。各种数据对装备寿命预期的权重是不一样的,需要根据具体的器件进行分析和试验验证,并用统计规律进行综合的权衡,得到某型装备的具体预测规则和方法。
目前,国内外进行了大量的PHM研究,取得了一些成果,充分利用这些成果,可以对复杂电子装备进行PHM,提高装备的工作可靠性,做到科学评价、精准维修,提高装备的有效利用率,减少使用维护成本。
3 结束语
对复杂电子装备进行故障预测时,可以把装备简化成一般的电子装备或功能模块,再对这些具体的功能模块进行故障预测设计。在此基础上,把从每个部分收集到的与故障预测相关的数据进行整理,根据每个功能模块在系统整机中的作用和特点,给出这些故障相关数据与设备整机寿命的函数关系。利用这些数学模型处理相关数据,就能找到复杂装备的故障有关参数与装备整机寿命的变化规律,进而预测装备的预期寿命。
[1]韩国泰.航空电子的故障预测与健康管理技术 [J].航空电子技术,2009,40(1):30-38.
[2]何厚伯,赵建民,郝茂森,等.PHM系统中的费效模型[J].火力与指控控制,2013,38(1):129-133.
[3]张婧婧,杜磊,包军林.电子元器件与系统可靠性保障的 PHM新方法 [J].电子产品可靠性与环境试验,2009,27(2):17-23.
[4]王浩,罗宏伟,陈媛.半导体级别故障预测与健康管理[J].电子产品可靠性与环境试验,2011,29(5):58-62.
[5]邵新杰,曹立军,田广,等.复杂装备故障预测与健康管理 [M].北京:国防工业出版社,2013.
[6]徐风建,车建国,许荣.基于知识推理的雷达装备故障预测专家系统 [J].电子产品可靠性与环境试验,2010,28(5):29-32.
Research on Fault Prediction Technology of Complex Electronic Equipment
DU Guangyuan
(Beijing Electro-mechanical Engineering Institute,Beijing 100074,China)
Firstly,the necessity of conducting the prognostics and health management for complex electronic equipments is emphasized.Next,the fault prediction unit method,the fault omen parameter method and the environmental monitoring method based on the failure physical analysis are introduced briefly.And then,the main principles and methods of fault evaluation of complex electronic equipment with the failure related data obtained through the above methods are summarized.Finally, the characteristics of the related fault prediction data and the issues that need special attention are analyzed.
complex electronic equipment;health management;fault prediction;test;evaluation
TP 206+.3
:A
:1672-5468(2017)01-0045-05
10.3969/j.issn.1672-5468.2017.01.010
2016-07-06
杜光远 (1961-),男,满族,辽宁抚顺人,北京机电工程研究所研究员,主要从事电源及供电控制技术、电子设备和电子元器件可靠性技术的研究工作。