APP下载

基于可用度的电子设备告警系统检查策略研究*

2016-10-18姜新亮赵建民苏波

火力与指挥控制 2016年9期
关键词:间隔期延迟时间电子设备

姜新亮,赵建民,苏波

(1.军械工程学院,石家庄050003;2.解放军73158部队,福建厦门361100)

基于可用度的电子设备告警系统检查策略研究*

姜新亮1,赵建民1,苏波2

(1.军械工程学院,石家庄050003;2.解放军73158部队,福建厦门361100)

针对电子设备告警系统故障具有隐蔽性的特点,考虑检查不完善的因素,运用延迟时间概念,以系统期望可用度最大为优化目标,建立了电子设备隐蔽功能故障检查优化模型。提出了优化检查间隔期的算法,并通过实际案例验证了模型的有效性。

电子设备,告警系统,延迟时间,隐蔽功能故障,检查间隔

0 引言

近年来,电子产品在人们的生产生活中扮演着越来越重要的角色,对其可靠性与安全性要求也越来越高,特别是在航天航空、军事、交通运输领域等,一旦设备停机,所带来的损失可能无法度量。为了提高电子产品的可靠性,人们在电子产品研制时通常会对重要部位安装告警装置或预警系统,通过对设备运行中的技术指标进行实时监控,提供异常情况告警,使操作人员能提前预判设备可能出现的不良状况,从而采取相应的措施,以避免或减小因系统功能故障所造成的损失。由于这些告警系统通常处于非工作状态,所以设备正常工作时操作人员无法感知这些告警系统是否存在故障,只有通过特定的检查手段或方法才能发现,因此,这些告警系统的故障就具有隐蔽性。

国内外学者从不同角度对隐蔽故障、检测间隔、维修模型、维修评估以及维修优化等维修关键问题进行了研究,取得了大量的研究成果。文献[1-5]运用延迟时间概念,从经济性或使用性等不同角度建立了潜在故障检查与维修模型,并应用于工业设备维修管理实践中。文献[7-11]对设备隐蔽功能故障进行了研究,其中文献[6]提出“隐蔽故障(hidden failure)”概念,在此基础上对保护装置的检查间隔期决策问题做了研究;文献[7]研究了基于日历时间和基于工作时间的隐蔽故障检查决策问题,建立了以可用度为决策目标的检查模型;文献[8-9]研究了系统内部零部件失效的共因性,运用神经网络技术建立了新的隐蔽性故障率模型,实现了动态描述隐蔽性故障率,克服了原模型精度不足的问题;文献[10-11]对隐蔽故障维修与检查间隔期的决策问题进行了研究探索。然而上述研究大都假设检查是完备的,即所有已形成的故障都能通过一次检查被发现,但是由于检测手段或设备的缺乏,以及人为差错等情况的存在,使得检测本身不可能绝对完善,因此,故障检出率是检查决策中不可忽视的因素。

许多情况下,对于电子设备来说可用度远比维修费用更重要,那么这时候在维修决策中强调可用性比强调经济性更符合实际[12]。因此,研究如何合理安排检查间隔时间使得期望可用度最大,是电子设备维修决策的核心问题。本文针对电子设备功能故障发展的特点,研究运用延迟时间的概念,以单位时间的平均可用度最大为目标,考虑检查不完善等实际情况,建立电子设备告警系统检查策略模型。给出确定告警系统检查间隔期的优化算法,并举例加以验证。

1 检查策略

众所周知,电子部件系统有其自身特殊的性质:首先,电子部件的偶然失效期较长,在这个时期内可以认为是效率近似恒定的;其次,电子部件的故障产生主要是由外部冲击造成的,表现出较强的突发性、随机性和隐蔽性特点,很难通过传统的监控手段对其状态进行监测,从而发现其临近发生故障的状态或征兆。因此,对于电子设备告警系统故障预防的最有效办法,就是有计划地对告警系统进行检查、维修、更新,从而减少或避免多重故障的发生。

本文中所述电子设备的状态涵盖3种情况:正常状态、隐蔽故障状态、功能故障状态,其中,“正常工作状态”是指设备交付使用时的状态,此时设备状况良好;“隐蔽功能故障状态”是指告警系统出现故障,但是设备并未发生功能故障,设备依然能够正常工作,只不过此时设备发生功能故障的概率增加了;“功能故障阶段”是指设备不能够完成规定功能的状态,这种状态可能是因为告警系统故障而引发的多重故障造成的,也可能是设备自身固有缺陷造成的。将设备首先发生隐蔽功能故障,而后再经过一段时间发生功能故障的具有延迟特点的特性叫作延迟性,将设备从发生隐蔽功能故障到发生功能故障的这一段时间称为延迟时间,这与用以描述系统潜在故障的发展过程P-F曲线[13]有许多相同点。因此,延迟时间模型可以为产品隐蔽功能故障检查问题提供一个可行的基础。

基于以上分析,电子设备告警系统的具体检查策略可以描述如下:

①讨论电子设备在一个更新周期内发现隐蔽功能故障(备用系统故障)和发生功能故障的有关事件及其概率,将该更新周期看作是k+1个检查周期,每个检查周期是相等的;

②如果电子设备在检查间隔期内发生功能故障,则立即进行修复;

③如在检查间隔期内未发生功能故障,在检查中发现隐蔽功能故障,则立即进行修复,以避免产生多重故障;

④如在一个检查间隔期内既无功能故障发生,也未在检查点发现隐蔽功能故障,则进入下一个检查间隔期,并按上述检查策略重复进行。

2 模型假设

2.1基本假设

为了便于模型的建立,做假设如下:

①告警系统的故障与否必须经过检查才能发现;

②若经过检查发现告警系统已经故障,则立即进行修理;

③经过修理后可将设备完全恢复到正常工作状态,即修复如新;④检查和维修工作所占用的时间小于检查周期;⑤检查是不完善的,告警系统故障在一次检查中被发现的概率为α;

⑥固有缺陷导致的功能故障和告警系统故障引发的多重故障相互独立。

2.2可用度分析

系统可用度是指在某时刻具有或维持其规定功能的概率,长时期使用的系统的期望可用度可以表示为[14]:

式(1)中ED表示一个周期内的期望停机时间;EL表示期望更新周期的长度。

在任意时刻造成设备不可用的主要原因有以下几种情况:一是告警装置检查维护所造成的停机,这种情况通常花费的时间较少;二是当检查出告警系统后对其进行维修所造成的停机;三是修复设备功能故障所造成的停机,由于造成设备功能故障的情况通常比较复杂,因此,修复设备功能故障所学要的时间通常较长。设f(u)、F(u)分别为告警系统故障的概率密度函数和分布函数;g(h)、G(h)为延迟时间的概率密度函数和分布函数;电子设备的固有可靠度为R0(t);进行一次检查所需要的时间为Ti;设备功能故障所导致的停机时间为Ta;修复一次告警系统所需时间为Tb。

根据上文的分析,讨论电子设备在k+1个周期内发现预警系统故障(为了便于理解,以下将之称为“隐蔽功能故障”)和电子设备发生功能故障的有关事件及其概率。

电子设备在(k+1)T第一次检出隐蔽功能故障和首次发生功能故障的事件有:

事件1:设备在kT以前即已出现隐蔽功能故障,且kT前的各次检查中未被检出,同时设备也未发生功能故障,但在(k+1)T被检出隐蔽功能故障。

在kT以前即已出现隐蔽功能故障的事件有多种可能。即包括在[0,T]、[T,2T]…[(k-1)T,kT]都可能出现隐蔽功能故障,而延迟时间h的终点应该超过区间(k+1)T点,如图1所示。

其中,对于第i个检查间隔期[(i-1)T,iT]出现隐蔽功能故障,在(k+1)T首次被检出的概率为:

因此,事件1发生的概率:

事件2:电子设备在kT以后才出现隐蔽功能故障,但未发展为功能故障,在(k+1)T被检出隐蔽功能故障,此时延迟时间h的终点应该超过区间(k+1)T点,如图2所示:

图2 事件2示意图

事件2发生的概率为:

事件3:电子设备在kT以前已经出现隐蔽功能故障,且kT前的各次检查中未被检出,在[kT,(k+1)T]中发展为功能故障。

与事件1类似,电子设备在kT以前即已出现隐蔽功能故障的可能事件包括:分别在[0,T]、[T, 2T]…[(k-1)T,kT]出现隐蔽功能故障,而延迟时间应该延续到区间[kT,(k+1)T]内,如图3所示:

图3 事件3示意图

其中,对于第i个检查间隔期[(i-1)T,iT]出现隐蔽功能故障,在[kT,(k+1)T]中发展为功能故障的概率为:

所以事件3发生的概率为:

事件4:电子设备在kT以后才出现隐蔽功能故障,在[kT,(k+1)T]中发展为功能故障。此时,延迟时间h应该延续到区间内,如图4所示:

图4 事件4示意图

其概率为:

事件5:设备在[kT,(k+1)T]中未出现隐蔽功能故障,但发生了功能故障。

造成该事件发生的主要原因是设备自身的缺陷。由固有可靠性决定的故障密度函数为:,而未发生隐蔽功能故障的概率为:1-F(t)。因此,事件5发生的概率为:

根据更新周期定义,将电子设备从开始投入使用到发生功能故障或检查出隐蔽功能故障的累计工作时间间隔记为一个更新周期。那么对应于事件1和事件2的情形,其更新间隔时间就可以看作是(k+1)T。而对于事件3~事件5的情形,其更新周期可以看作是u+h。

综上所述,可以得到电子设备更新周期的期望为:

在一个更新周期内,恰好进行了n次检查的概率为:

所以,一个更新周期内的平均检查次数为:

一个更新周期内的隐蔽功能故障检查所需要的时间为:

一个更新周期内功能故障发生的概率为:

一个更新周期内因功能故障所导致的停机时间为:

一个更新周期内通过检查发现隐蔽功能故障的概率为:

所以,一个更新周期内因隐蔽功能故障修复所需要的时间为:

综上所述,一个更新周期内因检查和修复所需要花费的总时间为:

分别将式(9)和式(17)代入式(1)就可以得到一个更新周期内设备期望可用度Aav(T)。

2.3优化算法

本文研究的最优检查策略是,在一个更新周期内,以系统可用度最大为目标,确定最优检查间隔时间T*。可以采取数值迭代的方法来求解T*,设T*为非负整数,求解步骤如图5所示。

3 算例分析

以某型通信设备远程告警系统为例,该告警装置通过对通信设备输出参数指标进行实时监控,及时发现设备存在的异常状况,并第一时间通过拨打电话的方式通知设备维修人员进行维修,以减小或避免设备故障造成的损失。正常情况下,操作人员无法感知告警系统是否存在故障,只有通过相应的检查才能知道其状态。因此,该告警系统的故障就属本文所述“隐蔽故障”范畴。假设通信设备的固有可靠度服从λ=0.000 5/h的指数分布,假设告警系统发生隐蔽故障时间u和延迟时间h的分布函数分别为:

图5 最优检查间隔期的求解步骤

假设每进行一次告警系统检查所需要的时间为2 h,进行一次告警系统故障修复所用的时间为6 h,修复通信设备功能故障所需要的时间为12 h。下面,根据上文所提供的求解方法进行优化,优化过程如下:

假设故障检出率α的取值为0.9,根据2.3节所提出的优化算法,可以得到检查间隔期与系统期望可用度的关系,如下页图6所示。

由图中可以看出,当检查间隔时间T=96(h)时,设备的期望可用度最大为0.962 7。所以,当备用系统故障检出率α=0.9时,对于通信设备来说最优的检查间隔期为T*=96 h。

下面,讨论告警系统故障检出率α的取值对系统可用度的影响。

假设其他参数不变,分别取α的值为0.6,0.7,0.8,0.9,可以得到不同α值下期望可用度与检查间隔期的关系,如图7所示:

图6 检查间隔期与可用度的关系

图7 检查间隔期与期望可用度的关系

从图7中可以看出,其他条件不变,当检查间隔期相同时,故障检出率越高设备可用度就越高,这与实际维修情况是相符合的。因此,改进故障检查手段,提高故障检出率是提高系统可用度的有效手段。此外,从图中还可以看出系统可用度随检查间隔期的增长有一个从增大到减小的过程,这是因为如果检查间隔期越短,单位时间内的检查次数就越多,因检查而造成的停机时间也越长,相应的期望可用度也就越小。检查间隔期过长,单位时间内的检查次数过少,不能及时发现告警装置故障,造成设备功能故障,导致较长的停机维修时间,从而造成系统期望可用度的下降。

4 结论

本文在前人研究的基础上,针对电子设备告警系统故障具有隐蔽性的特点,利用延迟时间模型,考虑故障检查不完善的因素,研究分析了检查间隔时间与系统可用度的关系,建立了基于可用度最大的电子设备隐蔽功能故障检查模型,提出了最佳检查间隔期的优化算法。最后以某型通信设备远程告警装置为例,进行了验证分析,表明该检查模型具有合理性而且有较大的实际应用价值。

[1]赵建民,王云峰.两阶段功能检查模型研究[J].系统工程与电子技术,2000,12(12):49-51.

[2]赵建民,张森林,田燕.潜在故障检查策略及案例研究[J].中国机械工程,2009,20(23):2832-2836.

[3]赵建民,白进达.考虑修理延误情况下的最优维修测[J].系统工程与电子技术,2009,31(5):1288-1258.

[4]CHRISTER A H,WANG W,CHOI JM,et al.The delay-timemodeling of preventivemaintenance of plant given limited PM Data and Selective repair at PM[J].IMA JMathsApplBus Ind 1998,9:355-79.

[5]WANGW.An inspectionmodel for a processwith two types of inspections and repairs[J].ReliabEngSystSaf,2009,94:526-33.

[6]CHAY SC,MAZUMDAR M.Determination of test intervals in certain repairable standby protective systems[J].IEEE Transactionson Reliability,1975:201-205.

[7]TANGTQ,LINDM,ANDREW K S.Jardine availability of asystem subject to hidden failure inspected atconstant intervals with non-negligible downtime due to inspection and downtime due to repair/replacement[J].JournalofStatistical Planningand Inference,2013,143:176-185.

[8]倪爱伟,谢里阳,翁刚,等.基于RCMII和CCF理论的隐蔽性故障的新评价模型[J].东北大学学报(自然科学版),2008,29(1):105-108.

[9]倪爱伟,谢里阳,翁刚,等.神经网络求解隐蔽性故障率[J].机械制造,2007,45(514):4-6.

[10]苏义.记载设备隐蔽性故障及维修策略[J].航空制造技术,2010,12:86-88.

[11]刁海飞,蔡景,林海彬,等.基于多目标的隐蔽功能故障检测间隔优化方法研究[J].飞机设计,2014,34(3):33-36.

[12]ELSAYED A.ELSAYED.可靠性工程[M].杨舟,译.北京:电子工业出版社,2013.

[13]CHRISTER A H,WALLER W M.Reducing production downtimeusing delay time analysis[J].Journalof the OperationalResearch Society,1984,35(6):499-512.

[14]贾希胜.以可靠性为中心的维修模型[M].北京:国防工业出版社,2007.

An Inspection Policy for Alarm System of Electronic Equipment Based on Availability

JIANGXin-liang1,ZHAO Jian-min1,SU Bo2
(1.Ordnance Engineering College,Shijiazhuang 050003,China;2.Unit73158 of PLA,Xiamen 361100,China)

The failure of alarm system of electronic equipment has the properties of hidden,based on the properties,a model is developed to optimize the inspection schedule by using the concept of delay time.The model is provided to maximizes expected availability,and the situation of imperfect inspection is considered.Finally,an example proves that themodel is effective and economical.

electronic equipment,alarm system;delay time,hidden function failure,inspection interval

E92

A

1002-0640(2016)09-0161-05

2015-03-05

2015-05-07

国家自然科学基金资助项目(71401173)

姜新亮(1982-),男,河南扶沟人,硕士。研究方向:可靠性工程。

猜你喜欢

间隔期延迟时间电子设备
关于储粮防护剂安全间隔期的问题
江苏泰斯特电子设备制造有限公司
献血几百次是真的吗
某型机载敏感电子设备电磁干扰抑制技术研究
献血间隔期,您了解清楚了吗?
二氧化碳对乙烷燃烧着火延迟时间的影响
等离子体对CH4-空气着火特性的影响因素分析
电子设备电路的调试方法研究
NOx对甲烷点火延迟时间影响的数值研究
DRAM中一种延迟时间稳定的时钟树驱动电路