智能BIT降虚警技术
2015-01-17孙金明潘红兵周晶晶
孙金明,潘红兵,周晶晶
(海军工程大学 湖北 武汉 430033)
机内测试(Built-in Test,简称BIT)是系统或设备自身为故障检测、隔离或诊断提供的自动测试能力。它是一种能显著改善装备或系统测试性能与诊断能力的重要技术手段,在航空电子设备可靠性与维护性设计中日益受到重视。但虚警率较高始终是困扰BIT技术研究和应用的主要问题之一。BIT虚警问题是导致武器系统战备完好性差、使用保障费用高的重要因素。虚警率高不但直接影响BIT的有效性,而且对武器系统的战备状态产生种种不利影响。
1 BIT虚警原因分析
产生BIT虚警的原因大致可归纳为以下9种:设计者的假设不当[1];BIT设计不适合系统的实际情况;测试门限值/容差不合理;BIT或其他监测电路失效;错误的故障隔离;正常系统的偶然故障或偶然的性能变化;不适当激励或干扰;时间环境应力;间歇故障的影响等[2]。其中最主要的是:
1)时间环境应力:根据美军ROME空军实验室的研究报告,时间环境应力是造成现役电子设备BIT虚警的重要原因。由美军机载电子设备环境应力故障原因比率图 (如图1所示)可知:50%以上的电子设备故障是由各种环境因素引起的,其中温度、湿度、振动三项就造成大约44%的故障。恶劣的环境因素使电子系统在实际工作条件下所承受的环境应力与原来预计的不同,使得系统工作特性与原计划相比发生了变化,这样就直接影响到BIT模块本身,造成原设计的BIT特性出现虚警区和未检测区,使BIT有效性下降,而产生虚警。
2)间歇故障:根据美军装备和电子工业的数据表明:间歇故障是产生BIT虚警的一个主要原因,占电子系统BIT虚警的30%~40%。间歇故障的特点是随机出现和消失,其发生时间很随机,在有限的、不能预料的时间内对系统产生影响,且没有明显的模式或频率。
图1 机载电子设备环境应力故障原因比较Fig.1 Comparison of airborne electronic equipment malfunction causes of environmental stress
间歇故障的这种不确定性引起了BIT诊断的不确定,表现出如图2所示的各种现象。图中,INTERMITTENT是间歇故障,而 CND (不能复现)、NPF(没找到问题)、NFF(没找到故障)、RTOK (重检合格)、NEOF (失效无法验证)和ER(错误拆卸)是由间歇故障引发的不确定性问题,这些问题都因为报告了异常而事后却找不到故障,于是导致虚警。
图2 间歇故障导致的现象Fig.2 Phenomenon caused by intermittent faults
2 BIT的虚警控制
为解决以上问题达到提高BIT故障诊断能力、降低BIT虚警率的目的,分别从时间环境应力和间歇故障的角度出发,降低 BIT虚警[3]。
2.1 时间环境应力与BIT虚警分析
基于多元Logistic[4]回归的关联分析:
基于logistic分布的logistic回归模型是对二分类因变量进行定量分析的有力工具,该方法在医药卫生社会科学领域广泛应用于变量对结果的影响因素及重要程度计算。通过采用多元logistic回归对时间应力和BIT虚警关联分析进行定量分析,得到相应影响程度。
定义时间环境应力表达式如下:
x1(t)为时间应力向量;xn(t)为某种应力参数,如振动,温度等,xn(t)是一个随机变量。
定义函数 y(t)为系统 BIT输出,其中,0为正常状态,1为虚警状态,定义环境时间应力作用下系统发生虚警概率为:P(y(t)=1|X)=π(x)=π[x1(t),x2(t),…,xn(t)]
由logistic回归模型理论,可以建立时间应力与BIT虚警关联的多元logistic回归模型为
式中,β0表示与各种应力因素无关的常数项,在数学模型中表现为回归截距;βi为该回归模型的回归系数,具体表示各种应力因素,xn(t)导致BIT虚警的贡献量,即各种应力因素对该虚警的影响程度。
通过环境时间应力与BIT性能影响分析,可知关联阈值是影响时间应力与虚警关联后BIT检测率和虚警率的最要影响参数,这两个阈值如果选择不当,会导致降低BIT虚警识别效果,降低BIT检测率。目前解决这类问题主要有Bayes理论,神经网络、k近邻方法、SVM等。SVM具有以下优点:1)结构简单,各种技术性能泛化能力明显提高。2)样本较小情况下有很好的分类效果。3)算法确定的网络结构是自动生成的,对模型选择依赖度低。
2.2 间歇故障与BIT虚警分析
来自美军装备和电子工业的数据表明:间歇故障是导致系统暂时失效的一个主要原因,它占了整个系统故障的70%~90%,间歇故障[6]也是产生BIT虚警的一个主要原因,电子系统的虚警中有30%~40%是由间歇故障引起的。对此,美国相关研究机构开展了诊断间歇故障抑制BIT虚警的技术研究,通过诊断间歇故障,达到抑制虚警的目的。间歇故障和故障一样是很多系统难以避免的问题,由于间歇故障情况复杂、时隐时现、难以诊断,因此基于两状态分类的传统BIT一般是忽略或干脆避开间歇故障。由此产生的结果是:在间歇故障活跃时,BIT报警有永久故障,可事后又找不到故障,造成虚警率升高;在间歇故障不活跃时,BIT判断系统为正常,造成间歇故障的漏诊,使得故障检测率降低。因此两状态分类就成为传统BIT的一个最大的不足。
间歇故障时有时无,是一种变化剧烈的动态时间序列。传统BIT的诊断方法多从单一时刻的状态来判别 (如神经网络虚警过滤器等),遗漏了系统的动态信息,易引起诊断决策的错误,从而导致BIT虚警。实际上,间歇故障前后时刻的态存在着一定的转移关系,这种状态转移关系给诊断决策提供了重要的信息,如果有效地利用这些信息,则可以更准确地识别间歇故障。
HMM[6]是在Markov链的基础上发展而来的一种统计模型,是一个双重随机过程。模型中真实的状态不能直接看到,只能是通过一个观测值去感知状态的存在及特征。HMM具体可表示为 λ=(π,A,B), 其中:π 为初始概率分布矢量;A为状态转移概率矩阵;B为观测值概率矩阵。π,A描述的是一个Markov链,产生的输出是状态序列;B描述是一个随机过程,产生的输出为观察值序列。模型采用左右型三状态转移的Markov链,每个状态的观测概率由2个高斯概率密度函数联合决定。系统开始时总是处于正常状态,因此取初始状态概率矢量为π=[1,0,0],A的初值均匀选取。为增加HMM诊断模型的稳健性,训练时利用多个观测值序列的重估算法,由初始模型对训练样本进行Baum-Welch算法:
其中:α为前向变量;β为后向变量;L为观测值序列的数量。由初始模型对训练样本进行匹配计算和状态标注后,估计出一组新的模型,再对训练样本重新进行匹配计算和状态标注,估计出更新的模型参数λ,如此反复直至收敛,得到优化模型,使P(O,λ)最大。诊断分为两个阶段:1)分别对正常、间歇和故障3种状态的训练样本提取特征向量,利用Baum-Welch算法进行模型训练,获得各类典型故障的HMM模型;2)在实际状态监测时,将测得的信号经EMD分解处理提取特征向量后作为观测值序列,将其送入已经训练好的HMM模型,通过前向-后向算法计算观测向量在不同模型下的概率P(O,λ),由概率值最大的HMM模型决定被测系统的状态。
3 结束语
虚警率较高始终是制约BIT技术研究和应用的瓶颈问题之一。本文从降低智能BIT虚警率入手,从时间环境应力和间歇故障角度,利用支持向量机(SVM)解决时间环境应力问题,利用隐马尔科夫模型(HMM)解决间歇故障问题,有效的降低BIT虚警率。
[1]杨钰.机内测试虚警分析和控制[J].新工艺新技术新设备,2007, 34(10):93-96.YANG Yu.The analysis of false alarm in test and control[J].New Technology New Technology and New Equipment,2007,34(10):93-96.
[2]徐永成,温熙森,易晓山.机内测试虚警原因的分析及其解决方案[J].振动、测试与诊断,2002,22(1):38-42.XU Yong-cheng,WEN Xi-sen,YI Xiao-shan.The analysis and solutions of the reason of BIT false alarm[J].Vibration Testing and Diagnosis,2002,22(1):38-42.
[3]郑文荣,夏清涛.武器系统BIT的设计与应用[J].舰船电子工程,2012,32(12):131-133.ZHEN Wen-rong,XIA Qing-tao.The design and application of BITweapon system[J].Ship Electronic Engineering,2012,32(12):131-133.
[4]Gao R X,Suryavanshi A.BIT for intelligent system design and condition monitoring[J].IEEE Transactions on Instrumentation and Measurement,2002,51(5):221-225.
[5]柳新民,邱静,刘冠军,等.诊断间歇故障降低BIT虚警[J].测试技术学报,2004,18(4):53-55.LIU Xin-min,QIU Jing,LIU Guan-jun,et al.Intermittent fault diagnosis BIT reduce false alarms[J].Test and Measurement Technology,2004,18(4):53-55.
[6]张超,马存宝,宋东,等.隐马尔科夫模型[J].计算机测量与控制,2007,24(5):58-61.ZHANG Chao,MA Cun-bao,SONG Dong,et al.Hidden markov models[J].Computer Measurement&Control,2007,24(5):58-61.