基于模糊贝叶斯网络的汽轮机组故障诊断研究
2022-08-22张栋良汪刘峰洪勤勤张凯文
张栋良,汪刘峰,洪勤勤,张凯文
(上海电力大学自动化工程学院,上海 200090)
1 引言
汽轮发电机组是电力生产的重要设备,其故障类型多,引发的原因较为复杂,这都为机组故障诊断的准确性增加了难度[1]。近年来,基于数据驱动的智能算法的应用与改进发展较快,如利用独立分量分析法等[2]对故障源信号进行分离,通过改进小波[3]、变分模态分解(VMD)等[4]进行数据挖掘,提取分离后振动信号的特征,并输入支持向量机(SVM)[5]、神经网络[6]等分类器进行故障模式识别。这些方法虽然经试验验证了对特定故障诊断的有效性,但大多忽略了实际机组诊断中缺乏样本、存在大量不确定性信息的问题,所以难以进行推广。
BN是一种可以有效处理不确定性问题的推理方法,能够有效地进行信息融合与表达,并且在旋转机械故障诊断中有了一定的研究[7-8]。然而,在实际的应用中,BN模型构建有如下困难:①节点变量及其关系的确定困难。设备中与故障有关的因素众多,尤其是复杂设备中这些因素的关系错综复杂,故障模式模糊,故障征兆与故障模式往往是多对多的复杂映射关系,一个特征往往对应着多个故障,一个故障对应着多种特征,难以完全它们之间的相互关系,②条件概率获取困难。由于设备故障样本缺乏,无法获得完整的故障样本,导致条件概率估计困难。鉴于此,本文提出一种基于本体和模糊的贝叶斯网络故障诊断方法。该方法首先结合专家经验、工作机理,融合振动频谱、趋势、运行工况、相关参数等信息,建立汽轮机发电机组故障诊断领域本体模型,通过建立规则将本体转化为BN结构,解决了BN结构确定困难的问题;再结合模糊综合评价法和Leaky Noisy-Or模型获取条件概率表,解决了BN概率参数难以获得的问题,融合BN结构与参数建立了完整的BN诊断模型。最后,通过实例验证了本文方法的有效性。
2 研究思路
根据汽轮发电机组故障诊断的特点,本文提出一种基于贝叶斯网络的汽轮发电机组故障诊断方法,方法体系如图1所示。该方法可以分为以下5个步骤:
a)故障诊断知识集成。从机组结构特点、故障机理出发,结合对专家知识和历史数据的分析,利用本体建模技术实现故障知识的集成,建立本体模型。
b)贝叶斯网络的转化。设计相应规则,抽取领域本体类的实例及关系属性,实现领域本体到贝叶斯网络结构的转化。
c)条件概率表的获取。通过邀请专家评分,利用模糊理论和Leaky Noisy-Or模型将专家评分转化为条件概率表。
d)模型融合。将BN结构与参数结合形成完整的BN诊断模型。
e)诊断推理。利用BN诊断模型对故障案例进行推理。
图1 汽轮发电机组BN模型构建流程
3 基于本体和模糊理论的BN模型构建
BN是一种基于概率知识表示的图形化模型,可以表示为N=
3.1 BN结构学习
3.1.1 本体建模
本体作为一种知识表示方法,可以采用多种形式进行表达,能够对特定领域的概念、术语及关系进行明确化、形式化的描述,其优点是互操作性,重用性和共享性[9]。基本本体模型可以描述为[10]
O={C,OP,DP,I}
(1)
其中C为本体类集合,OP为对象属性集合,DP为数据类型属性集合,I为实例集合。领域本体的构建主要包括三个方面,一要厘清领域之间的关键概念,确定本体的类,二要定义本体中的属性关系,三要添加本体实例。
首先,根据旋转机械故障诊断专家经验,将汽轮机发电机组故障知识主要分为故障模式和故障征兆两大类,图2描述了汽轮发电机组故障诊断知识的关键概念。其中,故障模式的子类有1倍频故障、低频故障、高频故障、广谱频故障,故障征兆的子类有频率特征、趋势特征、运行工况和相关参数。
图2 汽轮发电机组故障本体类及其层次关系
然后,确定概念之间的属性关系,本文主要的对象属性关系为hasSymptom(逆关系是isSymptomOf),表示故障模式具有某种故障征兆,这种关系具有可逆性。关系的可逆性可以应用于BN的双向推理中。数据属性关系为hasState,用来描述类的个体所具有的状态,对应于BN中的节点状态。
最后,添加本体实例,如图3所示。故障模式和故障征兆的每个子类下面分别增加故障实例和征兆实例,在1倍频故障类中,添加了质量不平衡、转动部件脱落、转子绕组膨胀受阻、转子绕组匝间短路、转子不均匀冷却、支承松动等实例,在相关参数类中添加了振幅随转速变化、振幅随负荷变化、振幅随励磁变化等实例,类似的,在低频故障、高频故障、广谱频故障、频率特征、趋势特征和运行工况子类中都添加了相应的实例。
图3 汽轮发电机组故障本体
3.1.2 转换规则的定义
BN的结构学习就是要确定BN的结构,本文通过本体结构转换得到BN结构。可通过以下几个规则完成转换:
规则1 确定节点变量。BN节点的确定主要依赖于本体中类的实例[12],本体中的类的实例Ii对应转换为BN中的节点Vi,本体中类的实例与BN结构模型中的节点变量是一对一的映射关系。
规则2 确定有向边。BN节点之间的有向边由相对应的对象属性转换而来。若实例Ii和与实例Ii+1之间存在关系Pj,则联系节点Vi和Vi+1的有向边就是关系Pj相应转换项。
规则3 确定节点变量的状态。实例Ii转换为BN节点后,其相对应的数据属性Dk也相应转换为节点Vi的取值。
3.2 BN参数学习
3.2.1 Leaky-Noisy-Or模型简化条件概率表
BN结构越复杂,节点越多,所需要确定的条件概率就越多。若一个BN由二值离散型变量节点构成,某个节点具有n个父节点,在理论上该节点要获得的独立条件概率参数为2n个,n越大,确定概率就越困难,在实际情况下难以获得完整信息。因此,这种情况下通常假设每个父节点都可以单独对子节点产生概率影响,即将BN节点看作Noisy-Or节点,原来的2n个条件概率值现在只需要确定2n个条件概率。但是还要考虑到知识建模方法可能存在未知因素的干扰,即实际过程中建立BN模型时不一定能考虑到所有故障,当所列出的故障原因均未发生时,设备也可能出现故障,从而使Noisy-Or模型进行概率评估时出现置信偏差[13]。因此,引入遗漏概率的概念,将BN中的节点扩展为Leaky Noisy-Or节点。即使所有的父节点都为假,由于遗漏概率的存在,子节点也可能为真,这就使BN模型更接近实际情况。Leaky Noisy-Or模型子节点Y的条件概率为如式(2)所示。
(2)
其中,Pl为遗漏概率,Xp为节点Y的父节点,n为父节点的个数,Pi是父节点Xi单独作用时Y为真的概率。
3.2.2 专家经验获取条件概率参数
在缺乏实际故障数据时,无法进行参数学习,需要让专家来对故障的发生概率做出语义评判。为了将专家的评判语言转换成定量的条件概率,本文提出一种基于模糊理论的条件概率参数获取方法。
第一步:为了便于专家给出客观的评判结果,引入{非常低(VL),低(L),偏低(RL),中等(M),偏高(RH),高(H),非常高(VH)}七个评判等级,并通过三角(梯形)模糊数对专家评判结果进行模糊化处理。每个评判等级与隶属度函数的对应关系如图4所示,其中,三角(梯形)模糊数表示为F=(a,b,c,d),其隶属度函数如式(3)所示。
图4 模糊隶属度函数
(3)
式中,a和d分别表示估计域的下限和上限,区间[b,c]表示隶属度为1的区域,当b=c时,f(x)就是三角模糊数。
第二步:为了使建立的模糊隶属函数更加准确,有必要引入权重对多位专家评判结果进行合成。本文通过加权求和的方式进行模糊数的合成,令ωj表示第位专家的权重值j=(1,2,…,n),Fji表示第j位专家对第i个节点给定的语义评判模糊数i=(1,2,…,m),则节点i的加权综合评判合成方式可以表示为
Mi=ω1F1i⊕ω2F2i⊕L⊕ωnFmi
(4)
其中,Mi为节点i的加权综合评判值。两个模糊数的求和运算表示为
F1⊕F2=(a1,b1,c1,d1)⊕(a2,b2,c2,d2)
=(a1+a2,b1+b2,c1+c2,d1+d2)
(5)
第三步:利用BN计算时需要将模糊数转换成一个精确的值,本文利用左右模糊排序法[14]来对模糊数进行转换。在转化过程中,需要对模糊最大化集合和最小化集合定义分别如式(6)(7)所示。
(6)
(7)
再由式(8)(9)能够得到模糊数M的极左值FL(M)和极右值FR(M)
FL(M)=sup[fM(x)∧fmin(x)]
(8)
FR(M)=sup[fM(x)∧fmax(x)]
(9)
其中,fM(x)为模糊数M的隶属度函数。再通过式(10)解模糊可以获得具体模糊概率值。
(10)
4 实例分析
4.1 建立BN结构
由于篇幅有限,本文仅以1倍频故障诊断为例建立BN模型,根据本体-BN转换规则得到如图5所示的BN结构。由转换结果可知,贝叶斯诊断网络分为两层结构,第一层为故障模式,第二层为故障征兆。一共列举了6种故障模式和10种故障征兆。各个节点的代号、名称如表1所示。
图5 贝叶斯诊断网络结构模型
表1 BN节点列表
4.2 获取条件概率参数
确定BN结构后,还需确定节点条件概率参数。其中,包括根节点的先验概率,中间节点及叶节点的条件概率。根据第二节提出的方法,邀请4位专家对BN结构中的因果关系进行评判。以节点F1(质量不平衡)先验概率获取为例,四位专家的评语分别为L、L、RL、L,通过图4的三角(梯形)模糊隶属度函数得到各个评判语义对应的模糊数;然后,通过式(4)进行模糊数合成,合成时采用层次分析法[15]获得专家权重因子分布为(0. 196、0. 146、0. 501、0. 157)得到的加权综合模糊数为MF1=(0.1501,0.2501,0.3002,0.4002)。根据已经获得的加权模糊数,通过式(8)(9)获得极左值和极右值分别为0.2274、0.3638,根据式(10)解模糊得到节点F1的先验概率值为P(F1)=0.2854。类似的,可以获得所有的根节点的先验概率以及中间节点、叶节点的条件概率,先验概率表和条件概率表分别如表2和表3所示。
表2 先验概率表
表3 因果关系概率表
图6 1倍频故障BN诊断模型
4.3 BN诊断模型
通过前两小节的获得的BN结构和参数,利用BN可视化软件Netica即可建立完整的BN诊断模型。其中,模型中故障层的先验概率直接将表2中的概率输入即可,征兆层的条件概率需要根据表3及Leaky Noisy-Or模型进行计算。以节点S2的条件概率获取为例,S2节点的条件概率如式(11)所示。
P(S2|F1,F2,F6)=NoisyOrDist(S2,0.05,
F1,0.8852,F2,0.7639,F6,0.7686)
(11)
式中,0.05为遗漏概率,表示即使节点S2的所有父节点都为假,由于遗漏概率的存在,S2的取值也可能为真,这使得BN模型更接近实际情况,本文的遗漏概率一律设为0.05。征兆层节点的条件概率都可以根据表3和式(11)得到。完整的汽轮发电机组1倍频BN诊断模型如图6所示。
4.4 案例验证
某660MW机组[16]在调试启动阶段中,在升负荷过程中,运行中发电机转子振动逐步增大,最终达到跳机值,且跳机惰走过程中过临界转速时的振动显著增大。在冷却氢温实验中,将氢冷气冷风温度从38℃提高到48℃,7、8号轴承轴振变化不大。变密封油温试验中振动基本保持稳定。根据实验结果及数据,发电机振动主要有如下特征:
1)空载时振动不大,升负荷过程中,发电机振动尤其是7号轴承轴振随负荷增加稳步增长;
2)振幅增大与励磁电流有关,随着励磁电流增加,振幅也稳步增加,振动增大后,降低电流及负荷,振动很难恢复到原始值;
3)振动成分主要以1倍频分量为主,其余杂波成分很少;
4)振幅随冷氢压力变化不明显,密封油温对振幅基本没影响。
根据以上发电机振动基本情况可归纳证据集如下:
频率分量主要为1X,振幅随励磁电流变化明显,振幅随负荷变化明显,振幅与冷却介质无关。
将以上归纳的证据输入诊断模型,得到最终诊断结果如图7所示。推理结果匝间短路故障发生的概率为95.4%。现场经电气专业动态匝间短路实验验证,实验表明发电机转子发生了绕组匝间短路故障。
5 结论
本文将BN、本体、模糊集理论相结合,提出了基于BN的汽轮发电机组故障诊断方法。利用本体知识库的语义性和知识表达能力,多角度分析汽轮发电机组故障知识,丰富了故障特征,厘清故障特征与故障的相互关系,有效地发掘隐含信息和推理知识,并将建立本体-BN转换规则,由本体模型得到BN结构,解决了BN建模困难的问题。将模糊综合评价法和Leaky Noisy-Or模型相结合,用模糊集理论对专家语义进行模糊化处理,解模糊获得确定的概率值,解决了由于故障数据不足导致的条件概率表获取困难的问题,大大简化了BN模型的建立过程。以汽轮发电机组1倍频故障为例建立了BN诊断模型并进行案例验证,分析结果表明,该方法能够有效地进行汽轮发电机组故障诊断。
图7 故障诊断结果