APP下载

概率分布表插值的离散贝叶斯网络故障诊断算法*

2022-07-27宋仁旺董增寿

组合机床与自动化加工技术 2022年7期
关键词:概率分布插值贝叶斯

宋仁旺,杨 磊,石 慧,董增寿

(太原科技大学电子信息工程学院,太原 030024)

0 引言

近年来,故障监测和诊断技术不断发展,已广泛应用于工业生产领域。对工业设备进行故障诊断,可以快速发现和定位故障,制定合理有效的维修方案,进而缩短设备故障时间,对工业生产系统地稳定运行具有重要的意义[1-2]。

贝叶斯方法具有处理故障过程中的不确定性和多源信息融合的能力,是一种合理有效的故障诊断方法。CHEN等[3]应用贝叶斯理论,建立了风力发电机加速齿轮箱的故障诊断模型。路敦利等[4]提出一种使用K近邻-朴素贝叶斯决策组合算法对滚动轴承进行故障诊断。朴素贝叶斯(naive bayes,NB)网络结构简单,不能充分利用属性变量之间的依赖关系,当属性变量之间具有较强的依赖性时,网络的分类效果会下降。ZHANG等[5]提出了一种基于增强数据独立性的朴素贝叶斯轴承故障诊断方法,从轴承数据的属性特征和样本维数两个方面去除冗余,减少了数据特征之间的相关性,增强了朴素贝叶斯方法在轴承故障诊断中的性能。为了提高滚动轴承故障识别的正确率,ASR等[6]在不使用组合故障特征作为训练数据集的情况下,使用非朴素贝叶斯方法进行组合故障诊断。

贝叶斯网络(Bayesian network,BN)是不确定性知识表达和推理领域的有力工具,可以充分利用变量之间的依赖关系,具有更高的分类能力[7]。针对齿轮箱故障信息耦合性、模糊性的不确定性特点,周真等[8]构建了一种基于事故树分析方法的三层贝叶斯网络模型并解析了贝叶斯网络的故障推理过程,通过风电机组齿轮箱的故障诊断实例验证了模型的可行性和贝叶斯网络推理的有效性。为了减少建立模型所需要的定性和定量知识,WANG等[9]特别考虑了粗糙集和noisy-OR/MAX模型对贝叶斯网络结构和条件概率表达式的简化,显著降低了基于贝叶斯网络的诊断模型所需的先验知识,降低了诊断模型建立和应用的复杂性。

连续变量的贝叶斯网络故障诊断一般假设变量服从高斯分布,然而机械故障信号是时变非平稳的,高斯分布假设与实际情况并不相符。针对故障诊断涉及到不容易处理的连续变量,WANG等[10]提出了一种基于离散贝叶斯网络的冷水机组故障诊断方法,该方法能在无专家参与的情况下快速确定贝叶斯网络的参数。当故障样本数量较少或者故障样本不完备时,使用离散贝叶斯网络方法进行故障诊断时存在概率统计因子不充分的问题,针对上述问题提出了对离散贝叶斯网络概率分布表进行二维插值的算法。

1 贝叶斯网络的定义

贝叶斯网络B=分别表示网络拓扑结构和网络参数[11],G=表示一个有向无环图,V表示一组随机变量;D表示有向边集,其中每条边都表示从一个节点(即父节点)到另一个节点(即子节点)的概率依赖关系。条件概率分布(CPD)量化节点的依赖关系的大小。假设贝叶斯网络有n个节点X1,X2,…,Xn,∏i是节点Xi的父节点集合,贝叶斯网络的联合概率分布P(X1,X2,…,Xn)可以表示如下[12]:

(1)

(2)

2 贝叶斯网络拓扑结构的建立

基于依赖分析的贝叶斯网络结构学习方法首先对训练数据集进行条件独立性测试,确定变量之间的条件独立性;然后利用变量之间的条件独立性构造一个有向无环图,以尽可能多地涵盖这些条件独立性。在拓扑结构学习中,常采用互信息和条件互信息进行变量之间条件独立性测试。随机变量Xi和Xj的互信息量I(Xi;Xj),以变量XN1,XN2,…,XNs(Nh≠i,j,h=1,2,3,…,s)为条件的随机变量Xi和变量Xj的互信息I(Xi;Xj|XN1,XN2,…,XNs)为[13]:

(3)

(4)

互信息具有非负性,当且仅当变量Xi和Xj相互独立时等号成立;两节点间的互信息值越高,则依赖越强,可根据互信息值的大小判断节点间是否存在连接。

本文建立贝叶斯网络拓扑结构的具体步骤如下:

步骤1:计算每一类故障特征之间的条件互信息I(Xi,Xj|C),把I(Xi,Xj|C)作为节点Xi和Xj的连接权重,建立故障特征节点完全无向图。

步骤2:构建最大权生成树(MSWT),过程如下:

(1)初始状态:n个变量(结点),0条边;

(2)插入最大权重的边;

(3)找到下一个权重最大的边,并且加入到树中;要求新边加入后,树没有环生成,否则查找次大的边;

(4)重复上述过程(3),直到插入了n-1条边。

步骤3:根据特征节点的相对预测能力确定属性节点的顺序,过程如下:

(1)计算每一类故障下故障特征的信息量I(Xi|C);

(2)对于故障特征Xi和Xj,如果|I(Xi|C)-I(Xj|C)|>ε,I(Xi|C)>I(Xj|C),则有向边为Xi→Xj;

(3)把上述故障特征之间的无向边别变成有向边。

步骤4:增加类节点C,并使C指向所有没有父节点的节点。

步骤5:根据网络结构,使用统计的方法计算故障症状与故障类型的条件概率分布表。

步骤6:利用贝叶斯网络的性质计算故障的后验概率,最大后验概率为诊断的结果。

3 贝叶斯网络参数的学习

数据预处理是参数学习的关键步骤,离散化是最重要的数据预处理技术之一[14]。本文故障数据特征离散化具体步骤如下:

步骤1:由已知故障数据获取故障特征Xi的上限max(xi)和下限min(xi);

步骤2:定义离散间隔数量m;

步骤3:根据m的值计算离散间隔长度为:

(5)

步骤4:计算故障特征离散区间:

(6)

式中,s=1,2,…,m,网络参数的学习采用样本统计学习法,用样本数的比值近似概率值。

(7)

式中,Num(X)表示X=x落在区间Xs中的个数。贝叶斯网络拓扑结构建立以后,使用标记数据计算故障症状与故障类型的条件概率分布表。初始概率分布表中的概率分布存在如下问题:①概率统计因子不充分,概率值分布不连续,存在大量概率值为0的统计因子,影响后验概率的计算与比较;②由于数据不完备等因素导致的待确诊的故障数据范围溢出,需要适当扩大数据的范围。

针对上述问题,对一系列二维概率分布表进行插值处理。二维插值法有Shepard方法、反距离平均法、线性插值三角网格法、Kriging方法等。本文插值方法是使用径向基函数(radial basis function,RBF)对初始概率分布表进行二维插值。常用的径向基函数为二维零均值离散高斯函数,其表达式为:

(8)

式中,c是规范化系数;σ是离散高斯函数的标准差。归一化的插值权值矩阵M为:

(9)

权值矩阵Mn×n的维数n=3,5,…,矩阵M的中心M0权重值较大,M0周围的权重值较小,且距离M0的距离越远权重值越小,所有权重的总和等于1.0。参数σ定义了当前概率值对周围概率值的影响大小,较大的σ会使周围的概率值受当前概率值的影响;参数n定义了权值矩阵的作用范围,较大的n值会使当前概率值影响到更远范围内的概率值。

采用JS散度衡量每个概率分布表插值前后的概率分布差异:

(10)

式中,P1和P2分别表示第k个概率分布表插值前后的概率分布。JS散度的值越大,表示插值前后的概率分布概率值差异越大。由于每一个概率分布表的概率分布是不同的,自适应选取参数σ={σi,i=1,2,…,k}对一系列概率分布表进行插值,使得插值前后有较大的JS散度。概率分布表插值后不能降低网络的诊断准确率η,因此选取参数σ,使得网络的准确率最高。

综上所述,需要选取参数σ,使得函数L和η的值最大。

(11)

使用图1算法寻找最优的σ,然后依次计算相对应的插值函数矩阵M,对初始概率分布表进行插值,得到故障类型和故障特征之间的概率分布表。给定未知的故障数据,由贝叶斯网络可以计算得出故障的后验概率(故障类型)。

图1 算法流程图

4 实验方案及分析

4.1 实验方案

仿真实验平台为Windows10系统,处理器为i5 2.4 GHz,平台软件为MATLAB R2016a,实验数据使用某大学电气工程实验室轴承中心实验台所采集的振动信号数据[15]。所选取的原始实验数据包含滚动轴承的3种故障类型,分别是内圈故障、滚动体故障和3种不同位置的外圈故障,其中外圈故障信号取采集点为3点钟、6点钟和12点钟方向作为实验数据,上述故障分别定义为故障类型1、类型2、类型3、类型4、类型5。选取滚动轴承3种故障状态下5×120组数据,每种故障各取60组数据作为训练数据集,其余60组作为测试数据集。

文献[5]计算故障样本的17维故障特征,然后通过属性约简的方式去除冗余的特征,选择最能区分故障的故障特征进行网络拓扑结构的确立,降低模型的复杂程度。通过属性约简后保留的特征属性有:特征属性1,2,6,10,11,12,15,16,17。

图2表示贝叶斯网络的部分拓扑结构,类型表示故障类型,数字表示多维特征经过属性约简后保留的特征属性。

图2 贝叶斯网络结构图

贝叶斯网络是以先验概率和节点条件概率为基础,通过贝叶斯定理计算得到后验概率的过程[16],从而得到在某种故障特征发生的情况下,引起该特征的各种故障原因的概率。网络根节点先验概率是根据历史资料或专家经验判断所确定的各故障发生的先验概率。网络根节点先验概率的准确程度直接决定其能否快速定位故障,解决这一问题的一般做法是引入专家意见,但机械系统越来越复杂,专家意见有时会存在差错,影响网络的诊断性能。然而当统计先验概率的样本充足时,以统计概率替代先验概率的方法是行之有效的。

本文实验没有统计5种类型故障的先验发生概率,由此没有考虑先验概率对模型的影响,选取5种故障类型样本的数量均为60,因此每种类型故障的先验概率均为0.2。

实验中使用如下评判标准对故障诊断性能进行综合评判。

故障识别率:

故障诊断准确率:

表1列出了直接使用初始概率分布表进行故障诊断时测试样本的故障诊断准确率。使用初始的概率分布表进行故障诊断时的平均诊断准确率为88.33%,诊断的准确率较低,诊断效果需要进一步提升。

表1 故障样本诊断准确率 (%)

图3是直接使用初始概率分布表进行故障诊断时测试样本的分类情况,每种故障类型在诊断时都存在样本未识别的情况,未识别率为10%~13%,诊断性能较低的原因是故障样本未识别。进一步分析是由于样本属性特征在概率分布表中统计因子为0,计算的后验概率值为0,进而没有对样本进行进一步的分类判断。

图3 直接使用初始概率分布表进行 故障诊断时测试样本的分类情况

4.2 插值处理与参数选择

下面考虑对初始概率分布表进行插值解决统计因子不充分的问题。表2列出了本文方法插值参数σ对概率分布JS散度值的影响。

表2 插值参数对散度值的影响

由表2可知,随着插值参数σ的增大,JS散度值逐渐增大,表明插值前后概率分布差异逐渐增大。同时仿真结果表明,随着权值矩阵M的维数n逐渐增加,概率分布表中的插值个数增加,可以实现对概率分布表插值和填充的目的。

以下进行插值函数参数的选择。根据插值函数参数σ对JS散度值和测试数据诊断性能的影响,选择相应的参数值。插值参数σ的取值为0.1~2.0,取值的步长为0.1。为了方便比较,每个概率分布表选择相同的插值参数。表3列出了插值参数值对故障分类结果的影响。实验结果表明当插值参数的值较小时,插值数量较少,不能充分满足插值的要求;当标准差值较大时,故障分类效果逐渐变差。

表3 插值参数对故障分类结果的影响

根据前面讨论,在满足诊断准确率需求时,应该选择较大的插值参数,从而使概率分布表中的统计因子更加充分。

4.3 实验分析

图4是插值参数对测试数据分类结果的影响。插值后测试数据的识别率可以达到99%,识别率比没有插值时提升明显,并且在插值参数为0.2~1.5的范围内保持稳定。故障诊断准确率随着插值参数的增大,先缓慢提升后分阶段逐渐下降,σ值在[0.1,0.6]、[0.6,1.1]、[1.1,1.5]三个范围内每增加0.1,诊断准确率分别下降0.056%、0.056%、0.067%。

图4 插值参数对模型的影响

插值参数σ值为0.5左右时,每种类型故障诊断的识别准确率和平均故障诊断准确率最高,能够有效的识别滚动轴承的故障状态,从而判断滚动轴承的故障类型。表4是选取σ为0.5的5维离散高斯核函数对概率分布表插值处理后测试数据各种故障类型的混淆矩阵。插值处理后,每种类型未识别个数减少,未识别率为0~3.3%,所有类型样本未识别率下降了90.9%。

表4 测试数据混淆矩阵

由表4可知,本文所提的方法故障诊断准确率为99.33%,没有插值的贝叶斯网络故障诊断方法准确率为88.93%,该方法比没有插值的贝叶斯网络故障诊断方法准确率提高了10.40%,准确率提高了11.68%。

表5列出了使用不同的方法对概率分布表进行插值后对JS散度值和故障诊断准确率的影响。

表5 插值方法对JS散度和诊断准确率的影响

由上表使用不同方法插值后故障诊断的准确率都有所提升,但平均值法和线性插值法插值后JS散度值较大,对初始概率分布的影响较大;而反距离加权法插值后虽然保持原有的概率分布,但诊断准确率较低。本文方法插值后不仅可以充分增加概率统计因子,同时保持较高的诊断准确率。图5是本文方法与部分参考文献方法的比较。

图5 本文方法和参考文献中的方法的比较

参考文献中JSSVM+NB方法的平均诊断准确率为99.02%,KNN+NB方法的平均诊断准确率为93.00%,本文方法比JSSVM+NB以及KNN+NB方法有更高的诊断准确率。对于内圈故障、滚动体故障和外圈故障3种故障状态来说,3种方法对于内圈故障有相同的诊断准确率,而本文方法对外圈故障有更高的故障诊断能力。

5 结束语

贝叶斯网络对于解决不确定性和关联性引起的故障具有很大优势,已经被广泛应用于故障诊断领域。本文用标记的故障数据进行网络参数的学习,得到初始的贝叶斯网络的概率分布表;在此基础上对概率分布表进行插值处理,提高模型的适用性和诊断准确率;最后通过实验仿真验证了该方法的有效性。本文使用单个时间片段内的数据进行诊断识别,没有充分考虑故障过程前后时间片段之间状态的相互影响。动态贝叶斯网络(dynamic bayesian networks,DBN)是贝叶斯网络与马尔科夫链(Markov chain,MC)的结合,在概率框架下能够实现动态(时序)和静态(非时序)信息的融合,把不同时间片的信息进行综合评估,将会进一步提高模型的诊断性能。

猜你喜欢

概率分布插值贝叶斯
滑动式Lagrange与Chebyshev插值方法对BDS精密星历内插及其精度分析
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
一类摸球问题及其解法
基于pade逼近的重心有理混合插值新方法
弹性水击情况下随机非线性水轮机的概率分布控制
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
混合重叠网格插值方法的改进及应用
关于概率分布函数定义的辨析