APP下载

线性熵的系统故障熵模型及其时变研究

2021-11-27崔铁军李莎莎

智能系统学报 2021年6期
关键词:系统故障概率分布均匀度

崔铁军,李莎莎

(1.辽宁工程技术大学 安全科学与工程学院,辽宁 阜新 123000;2.辽宁工程技术大学 工商管理学院,辽宁 葫芦岛 125105)

系统故障及其过程受到很多因素影响。这些因素的变化情况,决定了系统故障的发生特征。那么针对在不同因素或多个因素联合变化过程中,系统故障变化衡量是关键问题[1]。总体上衡量方式要考虑全过程、全因素情况下的系统故障变化。局部也应考虑某些因素对系统故障影响作用的差异。可解释为单个因素或因素联合变化中系统故障的稳定性或变化程度。研究系统变化的方法很多,其中熵定义就可用来描述系统故障变化情况。

目前使用熵来描述系统故障和可靠性的研究不多。国内主要有:使用能量熵辨识直流短路故障[2];基于样本熵的轴承故障诊断[3];小波相对熵的系统接地故障定位[4];对于改进多尺度排列熵的轴承诊断[5];基于多尺度熵的轴承故障可拓智能识别[6];基于信息熵与PNN 的轴承故障诊断[7];基于电−振信号熵权特征的故障诊断[8];基于故障特征信息量的诊断[9];使用平滑先验分析和模糊熵的故障诊断[10];基于EMD 模糊熵与会诊决策融合的故障诊断[11];基于交叉熵改进NPE 间歇过程的故障检测[12]。国外研究主要包括:基于集对称交叉熵的故障诊断[13];改进多尺度模糊熵的故障分类方法[14];基于Otsu 方法和熵权法的缺陷分析[15];自回归近似熵方法识别多故障机械劣化[16];改进多点最优最小熵反褶积方法的故障检测[17];基于改进ADMM 和最小熵反褶积的故障诊断[18]及机械故障诊断推理研究[19]等。这些研究实际上集中在一些非关键问题上,例如熵权。但系统故障直接导致系统功能性下降,也使系统混乱程度增加;或是通过维修系统故障减少,混乱程度下降。因此描述系统故障应基于熵增减的方式进行。且在了解系统总体故障情况下,不同因素对系统故障的影响也应通过熵来衡量。这些方面上述文献未见提及。

因此本文提出了用系统故障熵来衡量上述情况,并基于线性熵具体实现系统故障熵模型。最后通过实例研究了系统故障熵的时变特征,得到了一些有益结论。

1 系统故障熵

熵(entropy) 是系统的混乱程度,其在控制论、概率论、天体物理、医学科学等领域都有重要地位,在这些领域中也有各自具体定义[13]。

当系统发生故障时,在某诊断精度条件下故障熵描述了故障的不确定性。故障熵越大表示故障不可诊断性越高,对系统状态信息需求越高;而故障熵越小则表示故障确定性越高,实现诊断的可能性越大[12]。这是已有文献给出的故障熵描述。

这里的系统故障熵是基于空间故障树[1]理论提出的,以适合因素空间中线性熵的定义。空间故障树理论目前分为4 部分,即空间故障树基础理论[20-23]、智能化空间故障树[24-27]、空间故障网络[28-29]、系统运动空间与系统映射论[30-31]。其基本思想认为,在系统元件和结构确定后,系统故障变化由因素决定,可以是内在的也可以是外在的。所谓空间就是以这些影响因素作为坐标轴建立的多维空间,再增加一维表示系统故障概率或可靠性。那么系统故障概率就是在该多维空间中存在的超曲面。从另一角度就是在该空间中的系统故障分布,即系统故障概率分布[1]。空间故障树基础理论部分已经给出该超曲面的构造方法[1]。各因素的变化都将影响系统故障在该超曲面上以不同概率变化。将这些故障概率变化作为信息研究对应系统的故障变化特征是有用的工作。因此提出系统故障熵的概念。

定义1系统故障熵:在空间故障树理论构造的系统故障概率分布中,将系统故障概率随着影响因素变化而变化的信息作为研究对象,研究系统故障变化的混乱程度和信息量,其衡量指标即为系统故障熵。

作为熵定义的衍生,系统故障熵在总体上可使用现有如信息熵的基本计算方式,但其也有自身特点。系统故障按工作时间增长是逐渐增加的,这是普遍规律。原有熵概念难以分析时变特征。更重要的是,系统在不同因素变化过程中故障变化也是不同的。那么单一因素或多因素联合变化时,使用传统熵概念计算无法区分熵变与因素变化关系,因为熵具有置换不变性[32]。同理,不同因素具有不同状态,可通过对因素变化范围划分得到这些状态。那么系统从一个因素的一个状态转移到另一个状态后系统故障熵的变化用传统熵计算也是无法得到的,更何况系统在多因素状态间运动。由于置换不变性的存在难以确定熵变与哪一部分的因素变化相关,这对系统故障分析是不利的。熵值相同的两个系统故障发生的条件可能相差很远,但熵值无法表示。那么系统故障熵如何表征和计算成为关键问题。

2 线性熵

系统故障熵难以用传统熵的计算方法,原因在于传统熵的4 个性质:1)均匀分布达到最高均匀度,即概率分布划分(自变量间隔相同)后,所有这些划分对应的概率相等,则该概率分布的熵为1;2)确定性蜕化为最低均匀度,即上述划分的概率只有1 个为1,其余均为0,则熵为0;3)迭代性,即两个分布拼接在一起所得分布熵可通过这两个分布的熵计算确定[33];4)置换不变性,即概率分布划分后,在划分概率不等时,置换这些划分的概率后总概率分布熵不变。

正如上节所述,置换不变性阻碍了熵在系统故障分析中的应用。但线性熵可以解决该问题,因素空间理论的建立者汪培庄教授在文献[33]中给出了线性熵定义。

定义2线性熵[33]:对二相分布P={p,q},记J(P)=2min{p,q},多相分布按熵的迭代公式计算,这样得到的量J(P)称为P的线性熵。

线性熵线性地表现了分布的均匀度。它不满足熵所满足的置换不变性公理,是一个能反映系统形态变化的整体性度量。因素状态是根据设定值对因素相值域进行划分形成的因素相状态,简称因素状态,如因素身高,其相划分为高和矮状态。下文若无特殊说明因素相划分简称为因素划分。定义2 中二相指一个因素的两种因素状态,而多个因素的两状态叠加为2k种状态,k为因素数量。线性熵是熵的衍生定义,因此它满足熵的前3 个性质。二相分布P={p,q},p+q=1,p和q的变化是对应的。当p=0 时,q=1;当q=0 时,p=1;当q=0.5 且p=0.5 时,p=q,符合第一条均匀分布达到最高均匀度,显然也符合第二条蜕化为最低均匀度。根据熵迭代性公式,当分布为二相分布时满足熵叠加性,具体见实例。

熵并非线性均匀度而是对数均匀度,线性熵才是线性均匀度。这对描述系统故障变化与因素变化很重要。设熵的迭代性如式(1)所示:

式中:R=(p1,p2,···,pn;q1,q2,···,qn);P=(p1/p,p2/p,···,pn/p);p=p1+p2+···+pn;Q=(q1/q,q2/q,···,qn/q);q=q1+q2+···+qn。

对任意两概率值,设pˆq=min{p,q},则式(1)转化为线性熵,如式(2):

式中k为因素个数。

容易证得当k=2 时,线性熵如式(3)所示:

式中:X为1 和0 两种状态的并;P1/0XX中的1/0 表示可计算前一因素状态为1 或0 时的线性熵。

当k=3 时,线性熵如式(4)所示:

当k=4 时,线性熵如式(5)所示:

当k=n时,线性熵如式(6)所示:

式中xn表示n个连续的X。

因此基于线性熵,系统故障熵计算模型为式(3)(k=2)和式(5)(k>2)的组合。当然空间故障树得到的系统故障概率分布是更为精细的分布,因素可划分为多个状态。这里只对一个因素划分两种状态进行讨论,多状态划分情况有待研究。

3 系统故障熵时变分析

当系统被制造之后,系统的元件和系统组成结构都是固定的;另一方面,系统故障与元件故障及系统组成有关。但系统故障熵在系统制造后与系统本身及元件关系不大,即与系统的内因关系不大。相反,系统故障与系统运行时的环境有明显关系[1]。这种影响来源于意外,不是在系统设计范围内的因素变化。最终,系统故障熵与系统运行环境因素直接相关;也与使用时间有明显关系。更为重要的是,环境因素变化是限定的、有规律的,但是时间则是单向的。

问题是在以时间衡量系统故障熵时,系统必将在环境因素变化过程中运行。在一个规定时间段内系统必将经历不同运行环境,则系统表现出来的故障发生情况也不同。如果在连续多个时间段内,按照相同环境因素划分,记录故障与环境因素关系,则可得到每个时间段内系统故障熵。基于线性熵也可得到各因素状态叠加下的系统故障熵。进一步可得到在规定间隔时序下的系统故障熵变化情况。如果系统故障熵稳定,则系统故障及其可靠性稳定;否则不稳定,该过程称为系统故障熵的时变分析。稳定的系统故障或可靠性对系统正常使用极其重要。甚至即便是低可靠性但故障稳定的系统,也比较高可靠性但故障不稳定的系统更容易应用于实际。低可靠性系统可通过系统结构设计提高可靠性降低故障;而不稳定的系统可靠性则无法及时采取措施保证系统可靠,特别是变化速度大于措施速度时。

4 实例分析

这里给出实例说明上述系统故障熵的计算及其时变分析。一个简单的电气元件系统,其故障发生对于温度、湿度、电压和磁场最为敏感。设温度范围为10~30 ℃、湿度为70%~90%、电压为5~10 V、磁场为30~300 mG。考虑因素划分为两种状态,分别取上述范围的平均值作为划分状态数值。因素划分从小到大依次为:温度因素状态a0=[10,20],a1=(20,30];湿度b0=[70,80],b1=(80,90];电压c0=[5,7.5],c1=(7.5,10];磁场d0=[30,165],d1=(165,300]。4 种因素,每个因素划分为2 种状态,则该系统运行环境可形成16 种叠加状态。时间划分单位为1 个月,共10 个月。记录该系统故障发生时4 个因素的状态,针对16 种状态组合分别统计,归一化形成概率分布。组合状态标记XXXX分别对应于a、b、c、d。10 个月的16 种状态中发生故障的概率分布如表1 所示。

表1 故障概率分布及其系统故障熵Table 1 Fault probability distribution and system fault entropy

表1 中计算举例:如式(3)所示,第1 月的线性熵值:

如式(5)所示,第1 月:

经过上述类似计算后得到表1 结果。表1 中前16 行是对16 种不同状态下系统故障统计得到的,后7 行是通过计算得到的系统故障熵。后7 行中,前4 行考虑了2 种因素状态变化叠加形成的4 种状态的系统故障熵;第5、6 行考虑了第3 个因素;第7 行考虑了全部因素。将这7 个不同状态下系统故障熵根据时间间隔绘制变化如图1 所示。

图1 不同状态系统故障熵的时变规律Fig.1 Time-varying law of the system fault entropy in different states

图1 中,00XX曲线代表了温度a0和湿度b0状态下电压和磁场状态叠加形成的系统故障熵随时间的变化情况,其余3 种解释相同。0XXX曲线代表了温度a0状态下湿度、电压和磁场状态叠加形成的系统故障熵随时间的变化情况,1XXX解释相同。XXXX曲线代表了温度、湿度、电压和磁场状态叠加形成的系统故障熵随时间的变化情况。用图1 能说明如下问题:

1)不同因素影响下系统故障熵的变化不同。图1 中曲线可成对分析,00XX与01XX、10XX与11XX、0XXX与1XXX。00XX与01XX在图中距离较大,说明湿度变化对温度不变的电压磁场状态叠加时系统故障熵影响较大。10XX与11XX在图中距离很小,说明湿度变化对温度不变的电压磁场状态叠加时系统故障熵影响较小。0XXX与1XXX表明温度变化对其余3 个因素状态叠加时系统故障熵影响较大。同理,可横向对比,00XX与10XX表明温度变化对湿度不变电压磁场状态叠加时系统故障熵影响较大。通过计算两条曲线的距离平均值获得影响因素的影响程度排序。该计算较为简单,这里不再详述。进一步可通过这些影响的对比和排序有的放矢地采取措施方式故障发生。

2)系统故障熵的总体变化规律。图1 中7 条曲线给出了所有情况下系统故障熵随时间的变化规律。可见,无论何种情况,虽然局部可能递减,但系统故障熵总体上都是递增的。根据熵的基本含义,熵值增加说明系统变得更加混乱。考虑哲学意义,该电气系统是人造系统,以完成预定功能。对该系统而言,在系统制造完成时系统故障熵为0(如果可靠性是100%)。自然对系统(人造)的影响是使系统失去功能,变得杂乱。不加维护的长时间使用,系统可靠性逐渐降低为0,这时系统故障熵为1。因此在不维护时使用系统必将导致系统故障熵的持续升高。

3)判断系统可靠性的稳定性。系统可靠性与故障发生是互补关系。可靠性稳定证明在运行过程中故障发生也是稳定的,反之亦然。图1 表明在这7 种4 个因素状态叠加时系统故障熵曲线都是近似连续的,具有较小且稳定的斜率。这说明,系统故障熵是稳定的,系统可靠性是稳定的,没有跳跃式变化。如果在连续时间间隔上,系统故障熵在某种条件下出现大幅变化,可能是由于系统修缮,或系统失效将要出现重大故障。

综上,系统故障熵的理论和实践都基于线性熵。系统故障熵和线性熵可应用于类似情况下的众多领域故障及数据分析,也为系统故障智能预测提供了一种方法。

5 结束语

1)定义了系统故障熵。系统故障熵是基于系统故障概率分布曲面得到的。可研究系统故障变化的混乱程度和信息量。其变化可衡量不同因素状态下的系统故障变化情况,得到系统故障变化总体规律及系统可靠性的稳定性。

2)定义了线性熵。与传统熵相比,线性熵满足它的前3 个条件。熵并非线性均匀度而是对数均匀度,线性熵才是线性均匀度,即线性熵具有的第4 条件。给出了线性熵在不同因素数量时的模型。认为线性熵可表征和计算系统故障熵。

3)对系统故障熵进行了时变分析。通过实例研究得到了不同时间和不同因素状态叠加时系统故障熵及其变化规律。得到了考虑不同因素状态叠加时系统故障熵的变化不同;系统故障熵总体随时间增长而增长;可应用于判断系统故障稳定性。

猜你喜欢

系统故障概率分布均匀度
某型水泵旋转系统故障分析
离散型概率分布的ORB图像特征点误匹配剔除算法
均匀度控制不佳可致肉种鸡晚产
洛伦兹力磁轴承磁密均匀度设计与分析
关于概率分布函数定义的辨析
基于概率分布的PPP项目风险承担支出测算
2015款奔驰R400车预防性安全系统故障
雷克萨斯ES350车空调系统故障2例
汉兰达车空调系统故障排除4例
依赖于时滞概率分布的不确定细胞神经网络的鲁棒稳定性