APP下载

KooN表决结构多阶段马尔可夫模型简化算法

2018-01-06王海清乔丹菊刘祥妹许小林

关键词:失效率马尔可夫离线

王海清, 乔丹菊, 刘祥妹, 许小林

(1.中国石油大学机电工程学院,山东青岛 266580; 2.中国石油独山子石化公司,新疆独山子 833699)

KooN表决结构多阶段马尔可夫模型简化算法

王海清1, 乔丹菊1, 刘祥妹1, 许小林2

(1.中国石油大学机电工程学院,山东青岛 266580; 2.中国石油独山子石化公司,新疆独山子 833699)

针对传统多阶段马尔可夫模型CMM(conventional multi-phase Markov)在建模过程中存在分析过程复杂、维数爆炸等问题,提出一种多阶段马尔可夫模型简化算法SMM(simplified muti-phase Markov)。对该方法与CMM方法、IEC61508解析式方法中的计算负荷与精度进行数值分析。结果表明:采用SMM方法的计算结果与CMM方法的基本一致,在维持计算精度的同时避免了CMM方法中复杂的多阶段马尔可夫建模过程,极大地降低了计算量,使得安全仪表系统中失效概率计算更加快速且准确。

多阶段马尔可夫模型; 异型冗余设备; SMM方法; 失效顺序

安全联锁系统是降低石化装置风险的关键技术措施,其中异型设备构成的KooN表决结构的需求失效概率计算一直是难点问题。安全仪表系统(safety instrumented system, SIS)是在发生危险事件时通过执行特定安全仪表功能避免或降低因事故造成的人员、设备、环境等损失的安全控制系统。马尔可夫模型是安全仪表功能回路(safety instrumented function,SIF)可靠性建模的主流方法之一。工程实际中,由于子系统状态结构会随着阶段测试发生改变,故对执行多次测试的SIS系统行为进行建模时,传统的马尔可夫模型具有一定的局限性,通常需采用多阶段马尔可夫建模方法。目前,Markov建模方法研究大都不考虑异型冗余、在线局部测试、失效顺序的影响,当分析较复杂的冗余结构时,建模过程易出错、计算也更为复杂而不可行。郭海涛等[1]提出用马尔可夫模型计算安全仪表系统可靠性指标,通过对状态转移矩阵预先迭代相乘降低计算量;Mechri等[2]通过使用转换马尔可夫链并考虑共因失效,非完全测试等因素建立更为全面的安全仪表系统不可用性模型;Innal等[3]提出受部分测试和全周期测试影响的多阶段马尔可夫模型。Brissaud等[4]基于简化公式,考虑部分测试和全周期测试的影响,提出同型KooN结构的失效概率计算公式;Jin等[5]对文献中的公式做了扩展,融入了共因失效的影响;Zhang等[6]建立了异型设备构成的2oo3结构的马尔可夫模型,但未推导出KooN结构的Markov模型。鉴于此,笔者提出一种全新的简化算法SMM,以连续多阶段马尔可夫模型[7]为框架,综合考虑在线局部测试、异型冗余和失效顺序等多个影响因素,创新推导出KooN异型冗余表决结构的多阶段马尔可夫模型简化算法,在避免复杂建模过程的同时维持计算精度。

1 异型冗余结构的多阶段马尔可夫模型简化算法

目前,SIS的现场检验测试一般分为在线局部测试和离线周期测试[3]。系统的未检测危险失效由两部分构成,其中由在线局部测试检测出的未检测失效简称PT失效,另一部分由离线周期测试检测出的未检测失效简称FT失效。危险未检测失效率为

λDU=λPT+λFT=θλDU+(1-θ)λDU.

(1)

式中,λPT为在线局部测试检测出的未检测危险失效率;λFT为离线周期测试检测出的未检测危险失效率;θ为λPT占λDU的比率。

由于PT失效和FT失效的检测周期不同,故系统失效顺序会影响平均停止工作时间。在简化多阶段马尔可夫模型时,应先确定不同失效顺序对应的不同平均停止工作时间,然后计算每种失效顺序的平均需求失效概率,并对所有失效顺序的失效概率求和得到KooN结构的失效概率,其算法流程见图1。为了简化计算,除最后一个失效元件考虑危险检测失效外,其他之前已发生失效的元件的危险检测失效均被忽略。KooN结构的失效顺序可以归结为3类:

(1)首个元件发生PT失效。当第一个元件发生PT失效时,接下来无论失效序列为何种类型,失效一定发生在在线局部测试间隔TPT内,考虑维修的影响,则第i个发生未检测失效(PT失效或 FT失效)元件的平均停止工作时间为

(2)

式中,MRTPT为PT失效的平均维修时间。

当首个元件发生PT失效时,异型设备构成的KooN表决结构的失效概率[8-10]为

(λDU,an-k+1tPT,n-k+1+λDD,an-k+1MTTR),n>k,

(3)

λDU,ax=λPT,ax+λFT,ax,

(4)

(5)

式中,在ax中x表示第x个失效元件,其中对任意x有ax∈[1,n],即第x个失效元件可以是元件1到n中任意一个;λDU,a1为第1个失效元件的在线局部测试检测出的未检测危险失效率;λDU,ax为第x个失效元件的未检测危险失效率;λPT,ax为第x个失效元件的在线局部测试检测出的未检测危险失效率;λFT,ax为第x个失效元件的离线周期测试检测出的未检测危险失效率;λDD,an-k+1为第n-k+1个失效元件的已检测危险失效率。

(2)所有元件均发生FT失效。所有失效均发生在离线周期测试间隔T1内,考虑维修的影响,则第i个FT失效元件的平均停止工作时间为

(6)

式中,MRTFT为FT失效的平均维修时间。

则当所有元件均发生FT失效时,异型设备构成的KooN表决结构的失效概率为

其中

(7)

式中,λPT,al为第l个失效元件的离线周期测试检测出的未检测危险失效率;tFT,l为第l个失效元件的离线周期测试检测出的未检测危险失效的平均停止工作时间;λFT,an-k+1为第n-k+1个失效元件的离线周期测试检测出的未检测危险失效率;λPT,an-k+1为第n-k+1个失效元件的在线局部测试检测出的未检测危险失效率。

(3)从首个失效元件开始连续发生s个FT失效,随后发生1个PT失效。由于该PT失效元件与之前发生的s个FT失效的失效区间不一致,较前两种情况分析复杂,假设离线周期测试时间间隔比在线局部测试时间间隔大很多,因此在计算该PT失效的平均停止工作时间时,忽略FT失效数量,均近似看作发生s=1个FT失效后发生PT失效的平均停止工作时间[9]。

假设在一个离线周期测试间隔内执行m次在线局部测试(T1=mTPT)且每个在线局部测试阶段的开始时刻均初始化为0,故无论PT失效发生在任何阶段,积分区间均为[0,TPT],而FT失效的失效时间则须累积增加t+jTPT(其中j=1,2,3,…,m-1),因此失效顺序为FT-PT的平均失效概率为

(8)

概率密度函数为

(9)

发生1个FT失效,随后发生一个PT失效,则此PT失效的平均停止工作时间为

(10)

该PT失效发生后,接下来元件的失效顺序无论为何种类型,失效一定发生在部分测试间隔TPT内;与式(1)不同的是在计算第i个失效元件的平均停止工作时间时,其失效数应以发生第一个PT失效算起,即i-s,因此,第i个失效元件的平均停止工作时间为

(11)

则从首个失效元件开始连续发生s个FT失效,随后发生1个PT失效时,异型设备构成的KooN表决结构的失效概率为

(12)

综上所述,基于多阶段马尔可夫模型的异型冗余结构PFD简化计算公式[8-10]为

(13)

图1 SMM算法流程Fig.1 Flow chart of SMM approach

整个导出的SMM的计算流程如图1所示。首先计算出失效元件均为PT失效时的需求失效概率PFD3,然后依据n-k的值判断计算首个元件发生PT失效时的计算式PFD1、PFD2,若n-k>1,则须进一步计算首个元件开始连续发生s个FT失效,随后发生1个PT失效的失效概率PFD4,按照此流程最后得出异型冗余结构的失效概率。

2 在线局部测试与元件失效顺序的影响对比

以IEC61508为指导,考虑在线局部测试对PFD计算的影响,推导出异型冗余系统PFD计算模型为

(14)

由式(14)可知,当TPT=T1时,无在线局部测试,系统仅执行离线周期测试;当T1=mTPT(m>1)时,即一次离线周期测试间隔内执行m次在线局部测试。可见,m越大(在线局部测试间隔越小),系统的失效概率也逐渐减小。目前,由于很多企业也通过采用在线局部测试策略以延长离线周期测试周期,为了准确评估系统的失效概率有必要在推导简化算法时考虑在线局部测试的影响。

此外,IEC61508标准中给出的简化公式忽略了失效顺序对每个失效元件的平均停止工作时间的影响,则其第i个发生失效的通道ai的平均停止工作时间[11]为

(15)

实际应用中,系统每个失效元件的平均停止工作时间会受到元件失效顺序的影响。为方便说明,以同型1oo2结构为例,采用IEC61508方法,求得的1oo2结构系统失效的平均停止工作时间为

(16)

假设所有元件失效率均相同,采用SMM方法,求得1oo2结构系统的平均停止工作时间为

(17)

根据以上分析可知,在线局部测试和元件失效顺序均是失效概率计算不可忽略的重要影响因素。

3 SMM模型计算负荷与精度的数值分析

为了研究CMM、SMM、IEC61508三种方法的计算负荷,推导出3种方法计算KooN结构系统所需浮点次数(floating-point operations per second,FLOPS)公式[12]。

IEC61508计算KooN结构系统时所需浮点次数SIEC为

(18)

由于一个N×N的矩阵相乘一次需要2N3次浮点运算,而且采用CMM方法时,计算t小时的失效概率时矩阵需相乘t次,因此,计算KooN结构系统时所需浮点次数SCMM为

(19)

SMM模型中计算KooN结构系统时所需浮点次数SSMM为

(20)

几种常见结构在不同方法下计算失效概率时所需浮点次数见表1。如表1所示IEC61508和SMM方法的计算效率远高于CMM方法的。

表1 浮点次数计算结果对比

除了要保证计算负荷外,计算精度也是工程实际应用中备受关注的问题。假设所有元件失效率均相同,λDU=2×10-6,λDD=3×10-6,θ=0.6,MTTR=MRTPT=MRTFT=8 h,TPT=2 190 h,T1=17 520 h,利用SMM、CMM、IEC61508计算几种不同结构的失效概率,并求出不同方法之间的相对误差,对比结果见图2。由图2可知,采用SMM的相对误差明显小于IEC61508,计算结果更加准确。

图2 几种KooN结构不同方法之间的相对误差Fig.2 Relative error of different approaches for several KooN architectures

4 实例分析

某化学反应器的高温/高压保护系统如图3所示。该系统由1oo2表决结构的压力传感器、2oo3表决结构的温度传感器、1oo2表决结构的逻辑运算器和1oo3表决结构的阀门子系统构成,相应的设备可靠性数据见表2,其中θ=0.6,MTTR=MRTPT=MRTFT=8 h,离线周期测试T1=17 520 h(该SIF结构也可以理解为两个独立SIF结构的串级触发,后续将另文分析其量化差别)。当反应储罐中的压力或温度超过限值时,传感器组(压力和温度传感器)将通过逻辑运算器发送关断信号给阀门子系统,避免造成反应失控。图4为该保护系统的可靠性框图。

图3 化学反应高温高压保护系统Fig.3 HT/HP protection system of chemical reactor(CRPS)

为了分析计算效率的影响,根据式(18)~(20),以1oo3结构为例求取不同方法计算失效概率时所需的浮点运算次数,如图5所示。用IEC61508方法计算所需浮点运算次数为179次,用SMM方法计算为254次,且两种方法浮点运算次数不受时间变化的影响。而CMM方法计算系统运行1 a时的失效概率运算次数已达到1.914×1010次,且随着时间增加呈线性增长。此外,在多阶段马尔可夫模型中,当系统单元数量较多时,其转移矩阵维数会成指数性增长,如图6所示。当单元数量为7时,转移矩阵的维数为1.386×106达到了百万级。采用本文中提出的SMM方法可以显著地提高计算效率,减小计算负荷。

表2 HT/HP保护系统设备可靠性数据Table 2 Data on HT/HP protection system equipment reliability

图4 HT/HP保护系统的可靠性框图Fig.4 Reliability block diagram of HT/HP protection system

图5 不同方法计算所需浮点次数的变化趋势Fig.5 Different trends of FLOPS using different approaches

图6 系统转移矩阵维数随系统单元数的变化Fig.6 System transfer matrix dimension with number of system units

分别利用CMM方法、SMM方法和IEC61508方法计算出传感器组、执行机构的需求失效概率,计算结果见表3。对于1oo2结构,当TPT=8 760 h时,SMM与CMM的相对误差为2.1%,IEC61508与CMM的相对误差为11.38%,后者约为前者的5倍;当TPT=730 h时,二者的相对误差最小,SMM与CMM的相对误差为1.4%,IEC61508与CMM的相对误差为4.87%,后者仍为前者的3倍多。IEC 61508与CMM方法之间的相对误差明显高于SMM与CMM之间的相对误差,尽管随着测试间隔的减小,二者相对误差均有减小的趋势,但差异仍然很大。综合计算负荷和计算精度两方面考虑,采用SMM方法可以在保证计算负荷最小的前提下得到较高的计算精度,而且采用SMM方法求得的需求失效概率比CMM方法的略大,非常适合实际工程应用中兼顾计算负荷和风险保守的需求。

表3 三种不同模型的需求失效概率计算结果对比

5 结 论

(1)综合考虑在线局部测试间隔、异型冗余等影响可靠性的诸多因素,构建的SMM计算模型在不损失计算精度的前提下,大大减少了计算量,提高了计算速度。而且SMM方法比CMM方法结果略大,从风险控制的角度更趋保守和安全。

(2)系统的在线局部测试间隔与SMM和CMM方法之间的相对误差成正比,缩短在线局部测试间隔,不仅可以提高SMM方法的精确度,且可以在不改变硬件的条件下提高系统的可靠性,延长功能测试周期,提高经济效益。

[1] 郭海涛,阳宪惠.安全系统定量可靠性评估的Markov模型[J].清华大学学报(自然科学版),2008,48(1):149-152.

GUO Haitao, YANG Xianhui. Markov model for quantitative reliability assessment of safety systems [J].Journal of Tsinghua University(Science and Technology),2008,48(1):149-152.

[2] MECHRI W, SIMON C, BENOTHMAN K. Switching Markov chains for a holistic modeling of SIS unavailability [J]. Reliability Engineering & System Safety, 2015,133:212-222.

[3] INNAL F, LUNDTEIGEN M A, LIU Y, et al.PFDavg, generalized formulas for SIS subject to partial and full periodic tests based on multi-phase Markov models[J]. Reliability Engineering & System Safety, 2016,150:160-170.

[4] BRISSAUD F, BARROS A, B○CRENGUER C. Probability of failure on demand of safety systems: impact of partial test distribution[J]. Journal of Risk & Reliability, 2012,226(4):426-436.

[5] JIN H, RAUSAND M. Reliability of safety-instrumented systems subject to partial testing and common-cause failures[J]. Reliability Engineering & System Safety, 2014,121(1):146-151.

[6] ZHANG Y, DAI J, ZHU D. Calculation of the probability of failure on demand of redundant systems using Markov model[J]. Information Technology Journal, 2013,12(20):5477-5481.

[7] MECHRI W, SIMON C, BICKING F, et al. Probability of failure on demand of safety systems by multiphase Markov chains: Control and Fault-Tolerant Systems[C].Nice: IEEE Press,2013:98-103.

[8] JAHANIAN H. Generalizing PFD formulas of IEC 61508 for KooN configurations[J]. ISA Transactions, 2015,55:168-174.

[9] LU L, LEWIS G. Configuration determination fork-out-of-n, partially redundant systems[J]. Reliability Engineering & System Safety, 2008,93(11):1594-1604.

[10] MECHRI W, SIMON C, OTHMAN K B, et al. Uncertainty evaluation of safety instrumented systems by using Markov chains[J]. World Congress, 2011,44(1):7719-7724.

[11] 王海清,乔丹菊,刘祥妹,等.异型冗余设备KooN结构通用PFD计算模型[J].中国安全科学学报,2016(8):90-94.

WANG Haiqing, QIAO Danju, LIU Xiangmei, et al. Model for calculating generalizing PFD of non-identical redundant KooN configurations[J].China Safety Science Journal, 2016(8):90-94.

[12] 马奔,孙自强.基于MBF参数模型的安全完整性等级定量评估[J].华东理工大学学报(自然科学版),2016,42(1):97-103.

MA Ben, SUN Ziqiang. Quantitative assessment of safety integrity levels based on MBF model[J]. Journal of East China University of Science and Technology(Natural Science Edition), 2016,42(1):97-103.

Asimplifiedmulti-phaseMarkovmodelwithKooNstructure

WANG Haiqing1, QIAO Danju1, LIU Xiangmei1, XU Xiaolin2

(1.CollegeofMechanicalandElectronicEngineeringinChinaUniversityofPetroleum,Qingdao266580,China;2.PetroChinaDushanziPetrochemicalCompany,Dushanzi833699,China)

As the analysis process for the conventional multi-phase Markov (CMM) model is complicated and the dimension explosion may occur, a simplified multi-phase Markov(SMM) approach is proposed in the present study. The numerical analysis is performed to analyze the computational efficiency and accuracy based on this new method, CMM method and IEC61508 analytical formula. The results show that the calculation results by SMM are in good agreement with those of CMM, the former method maintains the calculation accuracy without complicated multi-phase Markov modeling procedure, making the failure probability calculation more quick and accurate.

multi-phase Markov model; non-identical redundant components; SMM approach; failure sequence

2017-01-28

山东省自然科学基金项目(ZR201702160283);国家重大科技专项(D719-ZGSY-555)

王海清(1974-),男,教授,博士,研究方向为安全仪表系统、工艺灾害分析、报警管理和可靠性RAM分析等。E-mail:wanghaiqing@upc.edu.cn。

1673-5005(2017)06-0147-07

10.3969/j.issn.1673-5005.2017.06.018

X 924.4

A

王海清,乔丹菊,刘祥妹,等. KooN表决结构多阶段马尔可夫模型简化算法[J]. 中国石油大学学报(自然科学版), 2017,41(6):147-153.

WANG Haiqing, QIAO Danju, LIU Xiangmei, et al.A simplified multi-phase Markov model with KooN structure[J]. Journal of China University of Petroleum (Edition of Natural Science), 2017,41(6):147-153.

(编辑 沈玉英)

猜你喜欢

失效率马尔可夫离线
基于通信定位系统用模块的可靠性预计计算研究
异步电机离线参数辨识方法
浅谈ATC离线基础数据的准备
互联互通车载控制器离线数据自动生成方法研究
面向电力系统的继电保护故障建模研究
深入理解失效率和返修率∗
基于马尔可夫链共享单车高校投放研究
基于马尔可夫链共享单车高校投放研究
基于改进龙格-库塔法反舰导弹贮存寿命研究
基于马尔科夫算法对预测窗户状态模型的研究