多因素集对分析的系统故障模式识别方法

2022-04-21崔铁军李莎莎

智能系统学报 2022年2期

崔铁军，李莎莎

（1.辽宁工程技术大学安全科学与工程学院，辽宁葫芦岛 125105;2.辽宁工程技术大学工商管理学院，辽宁葫芦岛 125105）

故障模式识别是安全科学领域，特别是安全系统工程领域研究的重点内容之一。目前各行各业的安全都以预防为主，而预防的前提是了解系统、影响系统安全的因素、以及系统本身的结构等[1]。这些研究的结果是为预防故障而提供的系统基本情况，因此预防才是所有前期工作的核心。对各种系统制定的安全检查制度和应急预案都是保障系统安全的具体形式。显然在人力、财力和物力有限的情况下这些预案不可能是无限的。因此实际情况必将是针对重点系统故障采取对应的措施，但同时也面临另一问题，即系统在故障状态下表现出来的特征具有多样性。即使两个故障原因大体相同，也有可能由于自然因素或是人关心的方面不同导致表现出的现象不同。那么如何将具有多样性的系统故障样本模式归类为已知的有限的已具有预防治理措施的系统故障标准模式，成为在多因素情况下系统故障识别的关键。

系统故障模式识别是智能科学和安全科学的重点研究领域之一。这些研究包括：中压直流系统故障识别方法研究[2]，机器学习的风电机组变桨系统故障分析[3]，船舶动力装置智能故障诊断技术[4]，频图纹理特征的供输弹系统故障诊断[5]，混合多端直流输电系统故障识别[6]，分布式光纤扰动传感系统故障模式识别[7]，电力系统故障全信息诊断模型研究[8]，光纤通信系统故障诊断[9]，参数缺失时的核动力系统故障诊断[10]，齿轮传动系统故障诊断技术[11]，复杂网络聚类的提升机主轴系统故障诊断[12]等。这些研究在各自领域具有良好的效果，但这些前人的工作也存在一些不足。这些不足可总结为三点：1)系统故障可能受到很多因素影响，而且各故障的影响因素可能是相关甚至相同的。所以这些故障具有内在的相关性，传统方法难以区分。2)影响因素的分析同样难以得到单因素与系统故障的影响关系。相对的，一般可得到几个重点因素联合对故障的影响关系。因此这些数据的有效利用成为关键，而不纠结于必须获得单因素影响关系。3)系统故障本身是难以确定的，影响因素和系统故障的对应关系具有确定性和不确定性共存的特点，该特点通过已有方法仍难以表示。

为解决上述问题，基于集对分析的联系数和空间故障树的故障分布建立系统故障模式识别方法。方法将导致系统故障的直接原因和基本背景因素分开，利用故障分布表示多因素联合影响的系统故障特征，利用集对分析联系数表示故障发生的确定性和不确定性叠加。最后通过一实例说明了分析过程，并给出了方法的优点。

1 集对分析基本原理

集对分析理论是赵克勤教授在1989 年提出的研究系统确定性和不确定性的数学理论，其基础是联系数学的联系数[13]。目前该理论已经用于多个领域，但仍在发展之中[14-17]。

集对分析的核心是联系数，联系数包括二元联系数直到多元联系数。二元联系数可表示为

式中：a为确定性分量；b为不确定性分量；i为不确定性系数。其表达了任何系统故障都可表示为确定与不确定的叠加。三元联系数μ=a+bi+cj，这时a仍然是确定性分量，表示同类的概念；b是不确定性分量，表示异类的概念；c是确定性分量，表示反类的概念。即根据定义可将集合中的对象分为同类、异类和反类3 种情况。对多元联系数，确定性分量是恒定存在的，而不确定分量“异”可进一步划分。例如在系统安全分析中，“同”代表系统安全，“反”代表系统不安全，而“异”代表良、中、差等级别。因此联系数代表在已有定义下系统安全状态的同异反特征，同和反为确定，异为不确定。

2 集对分析与空间故障树的耦合

系统故障包括很多，一般是直接的，例如实例中给出的电气系统漏电和短路故障。实例中漏电与温度和湿度有关，而短路与温度、湿度和气压等有关。这说明系统的直接故障与更为基础的背景因素相关。因此至少要对影响系统故障的因素进行两层次划分。一是直接故障，定义为直接因素；二是基础的环境背景因素，定义为背景因素。

确定单一背景因素与直接因素的关系显然是困难的。一般在实际或是实验中取得的数据都是多因素耦合作用的结果。所以使用该结果的分析更为合理，可通过空间故障树理论实现。该理论包括4 部分，空间故障树理论基础[1]、智能化空间故障树[18-20]、空间故障网络[21-25]、系统运动空间与系统映射论[26]。主要研究的问题是系统可靠性与影响因素关系，及系统故障演化过程的内在机制。理论中多个影响因素与系统故障概率组成了多维空间，具体的数据组成了空间曲面，即故障概率分布。为解决多因素耦合作用的表示问题，可同样利用该思路将各因素条件影响下的系统故障数量组成故障空间分布，简称故障分布。但在此之前得到的不同因素时的系统故障数量可能是不完整的，存在冗余或遗漏。因此可对这些数据在故障空间内进行拟合得到故障分布曲面，以方便故障识别方法使用。

综上，将集对分析的联系数和空间故障树的故障分布结合使用可有效地对系统故障样本模式进行识别。

3 故障模式识别方法构建

故障模式识别系统的建立是基于集对分析的联系数和空间故障树的故障分布。设故障模式识别系统如式(1)所示。

式中：RS为故障标准模式集合；M为标准模式数；R为故障样本模式集合；N为样本模式数；F为直接因素(可理解为指标)；Q为直接因素数量；X为背景因素集合；L为背景因素数量；X′,X′′,···,X(Q)为某直接因素相关的背景因素集合，X′,X′′,···,X(Q)⊆X，当其作为参数时表示因素集合的各因素具体数值；W为直接因素的权重集合。

图1 给出了依据故障标准模式识别故障样本模式的方法，具体给出识别的过程。

图1 故障模式识别过程Fig.1 Fault pattern recognition process

首先分析单一故障样本模式rn与某故障标准模式rSm的关系。过程中，只考虑单一直接因素fq，与其相关的背景因素集合为X(q)。那么rn与rSm的联系度表示为

式(2) 展示了使用联系数(a+bi+cj) 计算联系度的方法。联系数是集对分析中的重要概念，是联系度概念具体化的方式，这里使用三元联系数表达rn与rSm的同异反关系[13]。联系度越大，说明rn与rSm越一致。采用相似比法确定i和j的具体数值[13]。研究的联系度使用联系数表示。

其次确定式(2)中的Na、Nb和Nc，它们是统计得到的数量，是在背景因素构建的故障空间中，rn与rSm对应X(q)状态下取值的距离统计。由于假设rn与rSm关于fq(X(q)的故障空间)是变化的，所以当考虑rn与rSm的同异反状态时，通过rn与rSm在故障空间不同位置的对应值的距离进行同异反分析。根据不同位置得到的rn与rSm相对距离划分同异反状态，进而统计每种状态的不同位置数量来确定Na、Nb和Nc。这里设距离在[0,30%]为同状态，(30%,70%]为异状态。(70%,+∞)为反状态。因此Na、Nb和Nc的确定如式(3)所示。

进一步确定在X内，rn与rSm的识别度，则需要判断F内各直接因素的权重。因素F={f1,f2,···,fQ} 的权重确定不是重点，可采用专家法或熵权法等确定，这里不做详述，进而确定权重W={w1,w2,···,wQ}。那么X内rn与rSm的识别度为

通过式(4)即可得到在背景因素X(直接因素F)组成的故障空间中，各故障标准模式rS1～M和各故障样本模式r1～N的分别识别度。识别度越大，证明该识别的对应关系越正确。最终对某一故障样本模式rn属于哪种故障标准模式rS1～M可由式(5)确定：

由式(5)可得到r1～N隶属于哪种故障标准模式，从而达到多因素影响下不同故障样本模式的识别。

4 实例分析

举一个简单例子说明方法的计算过程，以免复杂例子的结构对方法理解造成影响。设一电气系统，主要关注的直接因素为F={f1=漏电，f2=断路}；其背景因素为X={x1=温度，x2=湿度，x3=气压}；X′(f1)={x1,x2}，X′′(f2)={x1,x2,x3}；x1∈[0,30]℃，取样间隔为1 ℃；x2∈[80,95]%，取样间隔为1%；x3∈[1.05,1.35]MPa，取样间隔为0.05 MPa；RS={rS1,rS2}，M=2，故障标准模式为2个；R={r1,r2,r3}，N=3，故障样本模式为3个。由于这里主要论述联系度及识别度的确定方法，而直接因素F导致系统故障的权重W不是重点，因此只通过专家确定简单的权重，W={w1=0.63,w2=0.37}。最终建立故障模式识别系统T，如下进行故障模式识别。目的是得到R中样本模式与RS中标准模式的归属关系。由于过程复杂，这里只详细给出r1与RS的识别度确定过程。

首先计算r1与rS1的识别度。由系统介绍可知，r1的F={f1=漏电,f2=断路}，X′(f1)={x1,x2}，X′′(f2)={x1,x2,x3}。根据式(4)计算 µXf1′(r1→rS1)中的Na、Nb和Nc。使用图进行表示，如图2 所示。

图2 故障空间与故障分布Fig.2 Fault space and fault distribution

图2 显示了X′条件下r1与rS1的故障数据统计情况。“+”为r1的故障分布特征；“O”为rS1的故障分布特征。(X′)表示所有“O”点的集合，表示所有“+”点的集合，。当然实际的数据统计图并不是这样的，因为实际过程中的数据有冗余和遗漏，造成两个分布的对应位置没有对应的可分析数据。所以这里将各自数据进行曲面拟合，再进行网格化的曲面绘制，从而满足分析要求。这两种分布的曲面方程为

根据式(3)统计得Na=338、Nb=142、Nc=16，代入式(2) 得到a=0.68、b=0.28、c=0.03、j=−1、i=0.6 8 −0.0 3=0.6 5，那么=0.6 8+0.28×0.65−0.03=0.832。

根据式(3) 进行统计Na=1 953、Nb=609、Nc=910，代入式(2)得到a=0.56、b=0.18、c=0.26、j=−1、i=0.56−0.26=0.3，那么=0.56+0.18×0.3−0.26=0.354。

根据式(4)，(r1→rS1)=[0.63 0.37]T×[0.832 0.354]=0.655。同理可以得到(r1→rS2)=0.549。那么继续根据式(5) 可得，[1,m]={(1,m)|MAX{(r1→rS1)=0.655,(r1→rS2)=0.549}}，这是n=1，m=1。最终故障样本模式r1属于故障标准模式rS1。同理可判断r2和r3与RS中各标准模式的归属，从而对样本模式进行识别。

总结上述过程的计算步骤如图3 所示。

图3 算法实现的步骤Fig.3 Steps of algorithm

上述方法的特点：1)将因素分为直接因素和背景因素，直接因素是引起系统故障的直接原因，但这些直接原因可能受到多种更为基本的因素影响，因此将因素分层更为合理。2)模式识别是通过联系度确定的，而联系度的系数则是通过故障数据在故障空间中的分布统计确定的。因为无论是实际数据还是实验数据都难以完全独立地得到单因素对故障发生的影响。多因素的联合分布更为准确。3)利用三元联系数表示了故障发生的确定性和不确定性。

上述研究是集对分析理论与空间故障树理论的结合，应用于系统故障模式识别。根据故障标准模式识别故障样本模式，从而分析故障原因，采取对应的故障标准模式预防和治理措施对故障样本模式进行处理。