RMS军用标准亟待革新和提升
2015-12-10丁定浩
丁定浩
0 引言
可靠性、维修性和保障性 (RMS)是影响装备的作战效能、作战适用性和寿命周期费用的关键特性,是提高装备战备完好性和出动强度的基础,也是改善装备快速出动能力和机动性的有力保证。随着世界新军事变革的深入发展,RMS军用标准将扮演着越来越重要的角色。然而,我国的RMS军用标准绝大多数不是直接引用美国军标的内容,就是在理论和技术层面上完全参照美国军标,有别于美国军标中的不同见解的极少。但是,自从20世纪80年代以来,美国的RMS理论基本上已经停滞不前, RMS军用标准已经大大地落后于军用装备对其的实际需求,因而,对RMS军用标准进行革新和改善就显得十分必要。
1 RMS军用标准中存在的问题
在此前的RMS理论模型中,还有不少不完备、不确切的模型,甚至存在不少错误的模型。这种现象在可靠性、维修性和保障性各个领域中均可见到。下面,我们将分别对可靠性、维修性和保障性各个领域中存在的一些问题进行简单的阐述。
a)可靠性领域中存在的问题
在可靠性领域中,对于冗余结构的检修,只区分联机检修和停机检修两类模型。联机检修是指当工作中的冗余单元发生失效时容许在不停机的条件下立即对其进行检修,修复后随即接入工作;停机检修是指当工作中的冗余单元发生失效时,不能立即对其进行检修,必须等待任务结束,下次执行任务之前才能对其进行检修。但是,对于存在多个冗余单元的结构,不容许也不可能每次结束任务后都对其已经发生失效的冗余单元进行检测和检修,因而规定,需要在经过若干次任务后才能对结构中已经发生失效的冗余单元进行检测。我们将这样的结构称之为定期检修结构[1],对于定期检修结构的检修,上述两种检修模型均无法适用。
又如,对于使用速调管和磁控管为发射单元的相控阵雷达,雷达的天线阵的可靠度模型通常采用表决结构。但是,对于以固态射频功率放大器件为发射单元的雷达,其天线阵为树状形态,因此其可靠度模型根本不适合使用表决结构模型,而必须使用树联结构模型[2],否则将会大大地低估雷达实际的可靠性,并为此支付不必要的过高费用。
b)维修性领域中存在的问题
在维修性领域,由于维修设施的数量有限,因而前期的维修性工程的设计和分析必须充分,也就是说,不应出现等待维修现象。此处的等待维修,是指有限数量的失效部件等待检修复原。由于检修设施的数量有限,当需要检修的失效部件的数量超过检修设施的数量时,就会出现等待检修现象。经典的解决等待检修问题的方法是排队论,但它只适用于检修对象以一定的频率源源不断地送修故障单元的情况,而在工程中,无论任务剖面是连续工作状态还是间断工作状态,等待检修的故障单元都是固定的,因此,此前还没有解决等待维修这一问题的设计模型。
不仅如此,维修性领域还存在错误的模型,最典型的例子是:对于相同多个故障单元同时检修的平均修复时间的模型,具有权威性的美国MILHDBK-338手册中给出的模型竟然与单个故障单元检修的平均修复时间的模型相同。通过定性分析就可以判明,这是一个明显的错误,因为修复单个故障单元的平均修复时间是多次随机修复时间的算术平均值,而多机同时维修的平均修复时间是每次维修中随机修复时间的最大值的算术平均值。而且每次多机同时修复时,不取随机维修时间的最大值,则多机无法同时修复[3]。
c)保障性领域中存在的问题
在资源消耗的保障领域中,我们讨论的重点实际上是现场更换功能模块的备件保障,但是,这并不是说,其他的资源保障就不重要,任何必须的资源保障都是不可或缺的,缺少了装备就无法运转。但是,其他的资源保障所涉及的是计划是否精密,以及管理是否严格的问题,不存在理论和技术方面的问题;而现场更换功能模块数量的配置却涉及理论和技术方面的问题。备件配多,会造成积压浪费;备件短缺,又会延误战机。
对于现场更换功能模块备件的优化配置,迄今未见国外系列的设计模型,虽然市场上有不少公司经销国外的相关的设计软件,但均不具体地说明或提供理论依据。根据笔者的使用体验,利用这些设计软件得到的配置结果根本就不合理,更谈不上是优化了的配置。在已经发表了的、有关备件保障概率的理论模型的文献中,也存在模型不适用或理论错误的情况。例如:国家军用标准GJB 4355-2002引用了美国海军备件保障的设计模型,但实际上,这一模型既不正确,也不具有实际的可操作性。这一标准中还提供了少见的、与国外系统备件保障不同的概率模型,即:
式 (1)中:Pi——组成系统中第i序号模块的备件保障概率。
公式 (1)表示:系统的备件保障概率等于模块中备件保障最低的备件保障概率。这一军标是经过仿真得到的,实际上这一模型是不正确的。[4]
经典的可修备件保障概率模型是基于马尔可夫随机过程建立的,但它只适合用于现场维修的场合,而当前故障部件的修复均在外地进行,连同运输时间在内的平均修复时间很长,而且无法通过使用多套维修设备同时进行检修来提升修复率,因为在外地检修的等效修复率是包含运输时间在内的,而运输时间是无法通过增加维修设备的数量来减少的。因而,即使将备件的数量增加到无穷大也不能达到要求的保障概率,所以这一模型对外地检修的场合是不适用的[5]。
由此可见,修正、革新当前的RMS军标已是刻不容缓。
2 首先确立RMS一体化设计的顶层参数模型
革新RMS军用标准,首先必须建立一体化设计的顶层参数模型。因为RMS设计的目的是使用其各自的不同功能来使军用装备在整个寿命周期内以定量概率表达的战术性能可以得到持续的保持。可靠性、维修性和保障性任一单项参数的优化设计都不能实现上述目的。这是因为,可靠性只保障在一个任务持续工作时间内装备成功完成任务的概率;维修性只能保障在预定的条件下修复故障的概率;备件保障性只能保障在规定的条件下现场不缺备件的概率,所以,必须将RMS各单项参数综合起来进行考虑。
但是,这3项概率与上述顶层参数之间到底存在何种定量的关系,我国军用标准中并没有明确的说明。
美国MIL-HDBK-338手册给出2个顶层指标:1)效能;2)使用可用度。前者适用于任务剖面为间断工作状态的情况,后者适用于任务部面为连续工作状态的情况。效能指标由能力、战备完好率和任务可靠度3个参数相乘组成。能力实际上是用概率表达的性能参数,取决于性能设计,与RMS无直接关联。战备完好率是可靠性能得到持续保持的关键参数,这一参数模型在MIL-HDBK-338手册改版中继续保持不变,但20世纪80年代后不再被使用。人们猜测这一参数模型之所以不再被使用,是因为在这一模型中没有备件保障因子,在现场更换单元早已不是元器件,而是由众多的元器件制成的复杂的功能模块的今天,没有备件因子的战备完好是不可想象的。因此,国内不少自然基金课题都会设法在这一模型中加进备件因子。但是,笔者已经指出,即使不计备件因子,这一模型也是不正确的 [6]。
使用可靠度是工作时间与日历时间的比值。笔者也已指出,它只适合用于纯串联结构的系统,不适合用于存在冗余结构的系统[7]。几年前国内外还曾一度把使用可用度作为战备完好率使用,这也是不对的,因为战备完好率是任务剖面为间断工作状态时装备成功出动的概率,而使用可用度是任务剖面为连续工作状态的全程日历工作时间的利用率。
除此之外,美国空军提出的另一个顶层参数是能执行任务率,它与使用可用度都是指对全程工作时间的利用率,差别在于前者的任务时间是规定的有限时间,而后者的任务时间是全寿命周期的日历时间;前者适用于有间隔停机时间的间断工作任务剖面,而后者适用于不停机的连续工作剖面。
空中预警机正是适应能执行任务率顶层参数的一个示例。但是,对于这一顶层参数,美军标中并没有给出数学模型,只是使用仿真方法对其进行设计。20世纪80年代后,随着装备的复杂程度的加深,RMS结构模型也变得越来越复杂了,但是美军标中几乎没有给出新的解析模型,而只是使用计算机数字仿真方法来替代。必须指出的是,数字仿真不同于实物仿真,它的正确性完全取决于仿真数学模型能否真实地反映客观事物的实际的变化过程。通常在给出仿真的结果时并不公布仿真模型,因此无法证实这种结果的正确性。当前行销的相关的设计软件并没有给出设计的理论根据,只是在实行暗箱操作,因此,利用此类设计软件得到的设计结果并不合理,更谈不上是优化的设计。
笔者已经在理论上导出了上述3个顶层参数模型,在以下第5章中将对这3个顶层参数模型进行详细的介绍。
当前国内的RMS设计都是各自进行单项参数的设计,对RMS设计需要达到的总体目标并没有清晰的认识。用户在确定指标时,并没有明确的依据,除了任务可靠度指标外,维修性指标和备件保障指标的设计要求值基本上都是通过参考或抄袭的方式来确定的,根本就说不清确定这2项指标的依据,更谈不上对这些单项参数进行优化设计。
RMS军标改革的首要任务是在确定顶层参数模型的基础上定量地确定顶层参数的要求值,选定适用的顶层参数类型 (从任务成功率 (即效能参数中删去能力因子)、能执行任务率和使用可用度中选定),对各个单项参数的指标进行优化设计,从而使得各单项参数的指标既能满足顶层指标的要求,又能降低寿命周期内的费用。
3 RMS的设计评审的重点在于核查现场更换功能模块的设计
RMS的设计必须在现场更换功能模块的设计上落实,才能防止和杜绝纸上谈兵、数字游戏。
承制方提供的评审材料,必须包括全机现场更换功能模块的类别及其数量,每类模型的预计失效率和修复率及其依据。并将模块的失效率、修复率和备件数代入相应的顶层参数模型中,得出相应的顶层设计指标的要求值。
设计评审的重点在于抽查现场更换功能模块的失效率和修复率等数据的可信性和系统各种模型的正确性。
4 顶层指标的试验考核
RMS的试验考核,对于实际保障军用装备的RMS是不可或缺的。当前军用标准的试验方案及其数据处理,除了系统可靠性结构纯属串联结构时可以考核任务可靠度以外,其他情况下均只能考核装备发生故障的频率,对系统的可靠性、维修性和备件保障性问题没有提供任何信息。
实际上,试验中出现的任务可靠性、维修性和备件保障性等宝贵的信息并没有被利用起来。当前已经呈现出装备的维修性名不符实的情况。例如:厂商标称的装备的平均维修时间为1 h,但实际的修复时间往往会长达几小时乃至一个星期。原因之一,就是厂商在设计装备时并未对装备的维修性设计加以考核;至于装备的备件保障性,除了少数的单位使用国外的软件得出了不合理的备件配置外,军标中并没有给出实际的可以操作的设计模型,均按照原来的传统或经验对其进行处置。
笔者主张废弃当前的基本可靠性考核法,代之以对顶层参数进行试验考核。其中,对任务成功率的考核,可以直接使用两项分布模型来实现[8]。试验方案中的用户方和承制方的风险、接收与拒收限、试验总次数和容许失败次数可由下列议程组来确定:
式 (2)中:α——承制方风险概率,即合格产品被拒收的概率;
β——用户方风险概率,即不合格产品被接收的概率;
P0——验证参数的上界值;
P1——验证参数的下界值;
n——试验总次数;
r——容许的失败次数。
而且,对顶层参数进行试验考核时,试验的次数与基本可靠性试验的次数相差无几。与基本可靠性试验相比,此方法仅仅增加了对数据进行记录和处理这两项工作内容,但取得的成效却显著得多。
5 RMS主要的新模型
以下,我们将围绕3个RMS的顶层参数模型来展开讨论。
a)任务成功率Pms模型
式 (3)中:Rs——系统任务可靠度;
POR——系统的战备完好率。
任务成功率实际上是全寿命周期内任务可靠度能够持续得到保持的概率。它的任务剖面是间断工作状态。
b)能执行任务率MCR模型[9]
能执行任务率是全寿命周期中每次执行任务的规定工作时间的利用率。它同样用于任务剖面是间断工作状态的情况。
下面将给出上述2个顶层参数均涉及的系统任务可靠度和战备完好率的模型。
系统任务可靠度的通用模型可以表达为由不同可靠性结构串联组成的模型,其中,对于串联结构和需要采用停机检修的方式进行检修的并联、表决和非并联、表决,以及常规复杂结构的任务可靠度模型,笔者并没有进行过更改;但是,对于需要采用联机检修的方式来检修的冗余结构的可靠度模型,笔者修正了原有模型中的修复率μ。这一传统模型不计及备件,在更换单元为元器件的年代,通常现场备有大量的元器件,因而不计备件因子是合理的,但是这完全与当前的实际情况脱节。因此,传统模型中的μ应该被下式取代:
式 (5)中:μ——更换模块的修复率;
tpa——更换模块备件的周转时间;
PB——备件的保障概率;
因此,公式 (5)的物理概念是:当现场存有备件时,计及备件的修复率是实际的修复率;当现场短缺备件时,计及备件的修复率就是计及取得备件的周转时间后的等效修复率。
新开发的模型中有定期检修的冗余结构模型,适合用于对定期检修结构进行检测和检修。
定期检测和检修的可靠度模型[1]为:
式 (6)中:ts——任务持续时间;
T0——定期检测检修周期。
此外,新开发的模型中还有适应固态相控阵雷达射频收发天线阵的树联结构模型[2]和适应性能改变致可靠性改变的权联结构模型[10],由于这两个模型占用的篇幅较多,此处从略。
下面对新的战备完好率模型展开进一步的讨论。
战备完好率是每次执行任务的成功出动率,也是上述任务可靠度和能执行任务率在全寿命周期内得到保障的前提条件。新的战备完好率模型为:
式 (7)中:tsm——系统平均维修延误时间;
tsp——系统平均备件延误时间。
tsm和tsp的模型是:
式中:h(i)——系统中第i序号现场更换模块的独立失效概率;
Rsb——系统的基本可靠度;
λ(i)——第i序号单个现场更换模块的失效率;
tm(i)——第i序号单个现场更换模块的平均维修延误时间因子;
tp(i)——第i序号现场更换模块的平均备件延误时间因子。
其中,第i序号现场更换模块的平均维修延误时间因子tm(i)的模型是:
式中:n(i)——第i序号现场更换模块在线数量;
k(i)——保持系统正常工作时必要的工作模块数;
exp(-λ(i)ts)——单个第i序号现场更换模块不发生故障的概率;
μ(i)——单个第i序号现场更换模块的修复率;
td——再次出动前的准备时间;
ts——任务持续工作时间。
其中,存在等待维修条件下的平均维修延误时间因子的模型为:
式中:j——等待检修的模块单元数;
l——在线维修设施数;
μ——单个故障单元的修复率;
A(j)——等待维修转移矩阵中的系数。
下面是备件供应体制为现场和备件供应站两站点体制的6种备件补充方式的第i序号现场更换模块的平均备件延误时间因子tp(i)的模型。第1种备件补充方式是定期补充,即当备件的累计工作时间达到预先规定的T0周期时,就一次性将备件的数量补足到原定的配置数;第2种备件补充方式是实时补充,即当备件因更换故障部件而减少时,就随之加以补充,实际上,补充的备件不能即刻到位,存在备件周转期;第3种备件补充方式是定数补充,就是要等备件缺少到规定的数量时才一次性地对其进行补充。
第4-6种备件补充方式,与1-3种备件补充方式是完全一致的,差别在于适用的对象有所不同,前者适用于对消耗性部件进行补充,而后者适用于对可修部件进行补充。
式中:tpa(i)——第i序号现场更换模块备件的周转时间;
PB1——消耗性部件按定期补充方式进行补充时的备件保障概率;
PB2——消耗性部件按实时补充方式进行补充时的备件保障概率;
PB3——消耗性部件按定数补充方式进行补充时的备件保障概率;
PC1、PC2和PC3——可修性部件相应的备件保障概率;
λ(i)——第i序号现场更换模块的失效率;
m(i)——第i序号现场更换模块的备件数;
t0——定期补充方式的补充周期;
k——定数补充方式中的规定的累计备件的缺额数。
限于篇幅,上述两站制、近距离备件库房与备件供应站两站制和现场、备件库房与备件供应站三站制,以及现场、中继站和备件供应站三站制等4种备件体制仅列出上述两站制一种,其他参见文献 [11]
c)使用可用度的新模型
式 (8)中:MUT——平均工作时间;
MTTR——平均修复时间;
MLDT——平均备件延误时间;
MTTPM——平均预防维修时间。
这一模型也与当前流行的模型不一致,式中的平均工作时间MUT分为MUT1和MUT2(PB)两部分。MUT1表示串联结构的平均工作时间;MUT2(PB)是冗余结构的平均工作时间,而且它是备件保障概率PB的函数。
可以证明,对于任务剖面为连续工作状态的使用可用度参数,检修失效单元时如果不采用联机检修,而采用停机检修的方式,则冗余设计反而会导致可用度下降。因此,在使用可用度的设计中,对冗余结构进行检修时必须采用联机检修的方式。而且,采用联机检修的方式对冗余结构进行检修时,必须要有备件保障,缺少备件,不仅会增加备件延误的停机时间MLDT,而且联机检修也会蜕化为停机检修。因此必须把平均工作时间分为两个部分,重新建造涉及冗余部分的平均工作时间的新模型[7]。
式 (9)中:MUTd——联机检修的平均工作时间;
MUTZ——停机检修的平均工作时间;
PB——备件保障概率。
例如:对于两单元的并联系统,有:
因此,对比下列2个联机检修的两单元的并联结构的平均工作时间的模型 (前面是新模型,后面是现行模型)可以发现,两者之间存在显著的差异。
下面再比较使用可用度模型中的平均修复时间MTTR的模型,对于多单元同时进行检修的MTTRn,现行的模型是:
我们的新模型[3]是
对于维修设施成套数小于等待检修的故障单元数的等待检修的平均修复时间,当前没有给出相应的模型,笔者给出的新模型[3]是:
式 (11)中:n——待修单元的数量;
l——维修设施的成套数;
μ——单个单元的修复率;
A(i)——维修转移矩阵的系数。
平均延误时间MLDT模型中的时间因子,与上述战备完好率中的平均延误时间模型中的时间因子是相同的,但两者的备件延误时间有所不同。在战备完好率的备件延误时间因子前有一个在任务持续工作中发生失效概率的因子,这说明只有在发生失效情况下才存在备件延误事件,而在国外的文献中,有关模型都缺少一个失效概率因子,这是一个重大的失误,而且这些模型还存在其他的缺陷。但在使用可用度模型中,对于这一失效概率因子是无需加以考虑的,实际上,这一因子是存在的;但是,由于使用可用度处在连续工作的任务剖面中,它的任务持续工作时间为无穷大,因此,它在任务时间内的失效概率必然等于1,这一因子就消失了。
对于使用可用度的预防维修模型,在接触过的文献中没有见到,我们给出的模型如下所示。
式 (12)中:k——预防维修的项目数量;
Tfi——第i序号的预防维修项目的预防维修周期;
tfi——第i序号预防维修项目的平均修复时间;
MUTs——全系统的平均工作时间。
对于由系统中的更换功能模块的失效率、修复率来表达系统的使用可用度的模型,现行的模型与我们的模型不同。
现行的使用可用度模型为:
式 (13)中:Ai——第i序号更换模块的使用可用度。
新的使用可用度模型是:
式 (14)中:n——不同更换模块的数量;
Ai——第i序号的使用可用度;
MDTi——第i序号的平均停机时间,是MTTRi与MLDTi之和,其他的参数所代表意义与上文中提到的相同。
下面举一个简单的示例来说明两者之间的明显差别。假设系统由1个串联结构、1个由两单元组成的并联结构和1个由4中取2的表决结构串联组成。串联结构的失效率和修复率分别为λ1和μ1;并联结构的单个单元的失效率和修复率分别为λ2和μ2;表决结构的失效率和修复率分别为λ3和μ3。全机配置两套维修设施,以加速失效状态的修复速度。现行的系统的使用可用度模型为:
新的系统的使用可用度模型为:
假设 lx1=0.002, lx2=0.012, lx3=0.02; mx1=1,mx2=0.5,mx3=0.5;tp=100;当备件保障概率PB1=PB2=PB3=1。
按照现行的使用可用度模型得到的系统的使用可用度为0.99561;根据新的使用可用度模型得到的系统的使用可用度为0.99543。
根据计算结果可以看出,通过现行的模型算得的系统的使用可用度低于系统实际的使用可用度,但却高于通过新模型算得的结果,这主要是由于系统发生失效停机修理时,现行的对冗余结构同时进行检修的模型有错,即现行的错误模型的平均修复时间与检修单个单元的时间相同,而实际上两个单元同时检修的平均修复时间比单个单元检修的时间增加了1.5倍,这在前面已经讨论过。
当备件保障概率PB1=0.9,PB2=PB3=0.1;按照现行的模型算得的系统的使用可用度为0.93893;按照新模型算得的系统的使用可用度为0.73088。说明随着备件保障概率的降低,现行的模型偏离实际的现象将变得更加显著。这是因为现行的模型只计及了短缺备件时的延误时间,而没有计及联机检修中备件的效应。
6 结束语
针对目前RMS军用标准已经大大地落后于军用装备的实际需求的情况,提出了确立顶层参数设计模型的建议;并建议对上述所提出的理论及其模型召开相关的研讨会议,达成共识,以便为改革和建造系列RMS军用标准建立前提,使我国RMS设计理论超越国际水平,进而大幅度地提升我国军用装备的RMS设计水平。
[1]丁定浩.系统可靠性结构模型的新进展[J].电子学报, 1988, 17 (5): 110-112.
[2]丁定浩.固态相控阵雷达天线阵的列可靠性数学模型 [J].电子学报,1982,11(6): 46-52.
[3]丁定浩,陆军.维修时间新参数与维修性设计的新进展 [J].中国电子科学研究院学报, 2010 (4): 381-384.
[4]丁定浩,陆军,王斌.新型战备完好率模型 [J].电子产品可靠性与环境试验,2010,28(3):5-9.
[5]丁定浩.可修备件保障概率的适用模型 [J].电子产品可靠性与环境试验,2013,31(2):4-7.
[6]丁定浩.RMS一体化设计及其验证方法 [J].电子产品可靠性与环境试验,2014,32(1):6-10.
[7]丁定浩.联机检修的冗余结构使用可用度模型修正 [J].电子产品可靠性与环境试验,2012,30(5):4-8.
[8]丁定浩.以试验鉴定任务成功率取代基本可靠性验证[J].电子产品可靠性与环境试验,2014,32(2):6-8.
[9]丁定浩.能执行任务率模型 [J].电子产品可靠性与环境试验, 2011, 29 (6): 5-9.
[10]丁定浩.雷达中减轻故障影响的系统可靠性设计 [J].电子学报,1986,15(5):23-28.
[11]丁定浩.装备寿命周期使用保障的理论模型和设计技术[M].北京:北京电子工业出版社.2011.
[12]丁定浩.全寿命周期任务可靠度得到持续保持的新系列设计模型 [C]//第四届国防科技工业试验与测试技术发展战略高层论坛论文集.2012.