APP下载

机载高度表故障诊断的KPCA-BN方法

2020-05-18吴忠德吴阳勇吴昱舟

兵器装备工程学报 2020年4期
关键词:贝叶斯故障诊断概率

孙 扩,吴忠德,吴阳勇,吴昱舟

(海军航空大学, 山东 烟台 264001)

机载电子设备故障诊断往往会遇到很多未知性的问题。原因就在于测试对象的故障机理较为复杂、测试项目有限,以及提供的知识经验不够准确。针对历史数据不完备、不确定性的问题,Pearl于1988年在概率推理和贝叶斯理论的基础上提出了贝叶斯网络,它适用于具有关联测试属性的故障诊断,是当前不确定性知识表达和推理方面最常见的诊断方法之一[1]。针对电网中故障不确定性和模糊性的特点,文献[2]提出了基于故障区域识别和贝叶斯网络的新型故障诊断方法。文献[3]针对故障诊断领域中先验信息缺乏的特点,提出了一种基于模糊贝叶斯网络的故障诊断方法。文献[4]针对故障诊断中的不确定或不完备信息,提出利用故障树和键合图结合共同构建贝叶斯网络的故障诊断方法。

1 核主元分析及其特征降维

1.1 基于核函数的空间变换

基于核的方法在去除冗余信息、调整非线性数据结构所表现出的优良特性已被广范应用并结合故障特征提取的其他方法中。最基本的原理就是通过引入核函数完成数据样本特征空间的变化使原始数据线性可分,将特征空间的内积运算转化为核函数的运算,减少了运算量[5-6]。空间的变换过程如图1所示。

图1 核空间变换过程

图1中的xi,xj代表数据空间中的样本点,以核函数为桥梁进行空间变换:

(xi,xj)→K(xi,xj)=〈φ(xi),φ(xj)〉

(1)

xi∈Rd(i=1,2,…,N),Rd为数据样本空间,该空间的维数是d,由Hilbert空间变换可知存在一个非线性映射φ把数据空间转换为Hilbert空间,即φ∶Rd→H。选取核函数时应满足Mercer条件,得到任意连续正定的核函数:

(2)

由式(1)、式(2)可以看出:在数据空间变换过程中核函数与特征空间的内积是等价的,因而只需要知道核函数的特征空间点内积,非线性映射φ的具体形式并不重要,只要根据故障特征的特点选择合适的核函数即可。

1.2 核主元分析的基本原理

核函数主元分析法(KPCA)的基本原理是利用核函数的内积运算将非线性的数据样本空间映射为线性的高维特征空间[7],然后再用主元分析法(PCA)的算法进行故障特征分析并提取主元成分,将高维的特征空间投影为低维的数据样本空间,以便对数据的聚类分析。

(3)

设协方差矩阵C的特征值为λ,特征向量为α,将协方差矩阵C特征值分解得到:

λα=Cα

(4)

定义一个核函数矩阵K满足Mercer条件[8]:

K=φ(x)Tφ(x)

(5)

对核函数矩阵K进行特征值分解

λkαk=Kαk=φ(x)Tφ(x)αk

(6)

(7)

将特征向量ν单位化得

(8)

进而求得特征空间样本φ(x)在特征向量ν上的投影,则样本x的第k个非线性主元为

(9)

1.3 核主元分析算法的实现

KPCA算法的实现步骤如下:

步骤1 假定从数据空间中选取m组数据集,每组数据中包含n个特征属性。构造出一个m×n维的数据样本矩阵。

步骤2 选取合适的核函数。为了故障诊断和分类效果,此处选择简单可行的径向基高斯核函数

步骤3 对核函数矩阵中心化,防止经过非线性映射后无法均值化;

步骤4 采用Jacobi矩阵计算式(6)中K的特征值和特征向量。

步骤6 计算协方差矩阵的主元贡献率Bi并按由大到小顺序排列有B1≥B2≥…≥Bt≥…Bn,i∈(1,2,…,n),令Bt≥P,通常取P=85%,所以前t个特征值所对应的变量就是所需要提取的主元变量。

步骤7 计算数据在提取主元特征向量上的投影βi,i∈(1,2,…,t)。所得投影即为特征空间经KPCA降维处理后的数据。

2 贝叶斯网络模型的故障定位

建立好网络模型后,通过贝叶斯公式计算出故障模块的最大后验概率,实现故障的隔离定位。只讨论单故障情况,即与每项测试相关联的至多只有一个模块发生故障。假定一个测试tj与m个模块相关联,则该测试的条件概率的个数就是对应相关模块的个数m,记为Pdij。已知故障模块si的先验概率P(si),所以测试项的故障全概率为

(10)

(11)

采用贝叶斯公式计算测试检测故障情况下模块的故障后验概率为

(12)

具体计算见第3节,通过计算可以得到测试tj所对应的m个模块的故障后验概率,并通过比较得出单个测试特征的故障模块最大后验概率最优估计值为

(13)

假设贝叶斯网络模型内共有n个测试状态,计算后会产生n个有关故障模块的最大后验概率,而这n个值并不完全是同一测试故障状态下得到的,所以在单故障条件下无法定位故障模块的位置,引起“匹配冲突”的问题。

为解决“匹配冲突”引入属性加权规则。属性加权的基本原理,是在各个测试属性的基础上,乘上一个权值,来对不同属性特征带来的影响加以区分。由于各模块的最大后验概率是针对不同测试属性条件而言的,我们定义一个可靠性因子α作为加权项,即α=P(tj)。则有关联属性加权后的公式为

(14)

3 基于KPCA-BN的故障诊断模型

KPCA-BN诊断模型首先采用KPCA对故障数据进行特征降维处理,然后再将所得数据输入贝叶斯网络中进行故障诊断。将KPCA在处理冗余及非相关特征量的优点与贝叶斯网络对不确定信息的故障分类优良特性相结合应用在故障诊断方面会有较好的效果[10]。该方法的故障诊断流过程如图2所示。

图2 故障诊断流程

对诊断对象—某型高度表作为一个外场可更换单元(LRU,Line ),通过自动测试系统平台及数据库,应用KPCA-BN故障诊断方法,选取合适的故障模式和故障测试特征属性,其故障—测试关联表见表1。本文研究的某型机载高度表测量范围为0~1 500 m,发射机发出的射频信号载波频率为4 300 MHz、脉冲重复频率为10 kHz、功率为100 W的射频信号,剩余的一部分进入距离计算器模块作为时间基准信号使用。发射信号经过地面或水面的反射作为回波信号被接收机成功接收,经过一系列变换、放大、检波等操作变为视频回波脉冲信号进入距离计算器。将时间基准时间信号与视频回波脉冲信号之间的时间间隔转换为与真实高度成正比的直流电压。

表1 高度表故障—测试关联表

故障模式共有4种,分别为S1(稳压电源模块故障)、S2(发射机模块故障)、S3(接收机模块故障)和S4(距离计算器模块故障)。故障测试特征属性有6种,分别为t1(+5 V电压测试)、t2(脉冲重复频率测试)、t3(内部隔离度测试)、t4(外部距离电压测试)、t5(模拟距离精度测试)和t6(零高度灵敏度测试)。表中主体部分数字“1”代表模块与测试间有关联,“0”则代表无关联。

4 应用实例分析

在数据库和知识库中选取稳压电源模块、发射机模块、接收机模块、距离计算器模块等4个模块所对应的故障训练数据集是4×48=192组。测试数据集样本也是192组,见表2。

表2 高度表样本数据集

在192组数据集中对应4个模块,包含6个测试特征属性。采用训练样本对贝叶斯网络进行推理训练,然后将通过核主元分析法降维的测试样本的特征向量输入训练好的贝叶斯网络中实现故障诊断与分类。核函数与核参数的选择对数据的特征选取非常重要。经过试验比对,选择径向基高斯函数作为核函数,取核参数σ=0.8。

在6维的测试特征空间中,前3个测试特征向量的累积贡献率>85%,故通过PCA和KPCA对数据特征降维处理后得到三维特征空间投影效果,见图3和图4。

图3 PCA处理数据三维特征投影

图4 KPCA处理数据三维特征投影

通过图3和图4的比较可以看出:PCA和KPCA两种特征选取方法都压缩了试验数据量,对数据都有一定的聚类效果。但是对比可以发现,PCA处理过的故障模式下的数据样本中,如s1和s4、s2和s3样本数据之间有些许的重叠,而KPCA处理的数据样本基本没有重叠,可分性好。结果表明:KPCA采用核函数特征空间变换由非线性数据空间映射为低维空间相比PCA有更好的效果。

根据表1可以建立相应的基于测试特征的贝叶斯网络模型,见图5。根据机载高度表的有关专家先验知识及数据库历史测试数据统计计算,可以得到故障模块的先验故障概率及故障的条件概率。这里取模块的先验故障概率P(s1)=0.23,P(s2)=0.27,P(s3)=0.19,P(s4)=0.31,其故障的条件概率为:P(tj|si)(i=1,2,3,4,j=1,2,…,6),见表3。

图5 基于测试特征的贝叶斯网络模型

故障模式测试t1t2t3t4t5t6S10.530.410.000.000.000.00S20.250.390.340.310.230.00S30.330.000.370.000.250.53S40.210.000.320.240.200.49

以图5中的贝叶斯网络模型图5(a)为例,已知模块s1的故障先验概率及测试t1的条件概率Pd11、Pd21、Pd31、Pd41,由式(10)可得测试t1故障的全概率为

p(t1)=(t1|s1)·P(s1)·(1-P(s2))·

(1-P(s3))·(1-P(s4))+(t1|s2)·

P(s2)·(1-P(s1))·(1-P(s3))·

(1-P(s4))+(t1|s3)·P(s3)·

(1-P(s1))·(1-P(s2))·(1-P(s4))+

(t1|s4)·P(s4)·(1-P(s1))·

(1-P(s2))·(1-P(s3))

其他的测试的故障全概率及测试下各模块的故障概率也同理可得。诊断测试故障全概率分别为0.133、0.150、0.145、0.112、0.095、0.193。测试下的最大后验概率包括s1、s2、s4三个模块,由于并不是同一测试状态下的最大后验概率,需要利用可靠性因子加权来判断(表4)。代入式(14)中可得模块s1、s2、s4对应的加权最大后验概率分别是0.121 9、0.105 3、0.151 9。

所以可以得出结论是距离计算器模块发生故障。上述基于测试的贝叶斯网络故障诊断方法,可以通过运算得到最大后验概率来判断故障模块及故障模式。贝叶斯网络是针对不确定性故障诊断的主流方法之一,所以本文以贝叶斯网络作为故障诊断的核心方法,将PCA和KPCA分别与贝叶斯网络方法结合,并与基于测试的贝叶斯网络方法[11]进行试验对比。以特征维数、各模块故障诊断准确率为评价指标对BN、PCA-BN和KPCA-BN三种推理机算法结果进行比较,见表4。KPCA-BN与PCA-BN相比较而言,加入核的方法增强了故障特征提取的特性,使得最终的故障诊断准确率提升了1.5%。

表4 三种方法故障诊断结果比较

通过主成分分析处理后,特征维数由6维降到3维,再将经KPCA处理的数据输入基于测试的贝叶斯网络中推理得到与单独采用贝叶斯网络方法相同的故障隔离结果,即距离计算器模块故障,并且与实际故障模块相一致。说明本文采用的改进方法确实有效。而且经过PCA和KPCA数据处理后,各个模块的故障诊断准确率得到了大幅度提高。

5 结论

提出了通过核函数主元分析进行特征选取的贝叶斯网络故障诊断研究模型。利用基于核函数的主元分析法对数据进行降维处理,实现了非线性高维数据样本空间到低维的特征向量空间转换。以某型机载高度表为研究对象进行基于测试的贝叶斯网络模型构建,采用贝叶斯公式计算模块的最大后验故障概率,提出可靠性因子的概念,对后验概率进一步修正,得出最终的故障诊断结果。以故障识别率、特征提取时间等指标作为评价标准,将本文中提出的KPCA-BN方法与PCA-BN和BN两种方法对比,证明所提方法在故障诊断中的有效性。

猜你喜欢

贝叶斯故障诊断概率
比亚迪秦EV充电系统故障诊断与排除
基于神经网络的船舶电力系统故障诊断方法
迈腾B81.8T起动机无法启动故障诊断分析
概率统计中的决策问题
概率统计解答题易错点透视
概率与统计(1)
概率与统计(2)
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
贝叶斯网络概述