APP下载

军用通信装备网络可靠性仿真评估

2018-09-04王蓬张金彪陈刚

电子产品可靠性与环境试验 2018年4期
关键词:系统可靠性链路关联

王蓬,张金彪,陈刚

(1.广州海格通信集团股份有限公司,广东 广州 510663;2.工业和信息化部电子第五研究所,广东 广州 510610)

0 引言

可靠性是装备质量建设的重要内容,传统的装备可靠性研究已较为成熟,形成了一套完整科学的理论工程体系,产生了显著的经济效益。近年来,随着信息化建设的推进,装备形态逐渐地向网络化、信息化和系统化的方向发展,尤其是在军事通信领域,多种大型复杂通信与指控系统陆续开始被研制和装备部队,促进了战斗力的生成,但同时也带来了隐患,例如:系统一旦发生故障,将无法实现信息沟通,从而直接瓦解战斗力。因而,军事通信网络的可靠性研究越来越受到关注[1]。

在可靠性研究上,对可靠性概念的认知和可靠性参数体系的建立是关键的第一步,直接影响项目方案阶段、工程研制阶段和生产使用阶段的可靠性论证、设计、试验和评估工作的开展。与传统的装备不同的是,通信网络具有链路方式多样、配置机动灵活和拓扑结构复杂等特点,通信网络的研究和实践工作中始终没有解决通信网络究竟有哪些故障、什么是通信网络可靠性,以及应该用哪些参数来度量通信网络的可靠性等问题。

1 通信装备网络可靠性研究现状

随着通信装备更新步伐的不断加快,通信装备的研发周期愈来愈短,如何在最短的时间内,评价研发、生产各个阶段的装备可靠性,是目前军事领域急需解决的问题。

目前,研制、生产各个阶段的可靠性评估现状如下所述。

a)对于单机设备或是由串并联模型组成的简单系统产品,其可靠性水平可利用已有的数学模型进行计算,但是目前的大型系统尤其是网络系统,其数学模型较为复杂,网络拓扑存在不确定性,按已有的方法难以对其可靠性水平进行评估。

b)对于军用通信网络产品,网络抗毁性是其可靠性的重要组成部分,现有的可靠性试验仅面向网络内部节点的设备来开展的;因此,如何进行测度建模,通过仿真试验来全面反映网络产品的可靠性水平已成为了大型军事通信网络发展面临的一大课题。

c)目前,相关的军用标准针对系统可靠性指标仅给出了 “故障关联”的相关要求,如表1所示,缺少 “功能关联” “拓扑关联”这些相关的可靠性参数,例如:系统功能可用度和完成任务 (功能)的成功率等[2]。

表1 GJB 1909.10-98系统可靠性参数选择

基于上述问题,本文建立了基于 “故障关联”“功能关联”和 “拓扑关联”的系统可靠性综合测度体系,并据此编制了通信装备可靠性评估仿真软件,能够较为全面地仿真评估系统及单机产品的可靠性水平,为通信网络的可靠性评估提供数据支撑,这对合理地安排试验项目,协调网络系统中各个节点的单机试验量,节省试验经费,缩短研制周期,发现通信装备系统或单机的薄弱环节等有着重要的作用。

2 系统可靠性综合测度及算法

2.1 系统可靠性综合测度

随着信息化装备的发展,系统产品组成的复杂程度越来越高,旧有的以装备 “故障关联”的基本可靠性指标已不能全面地反映系统的可靠性水平。实际上,军用通信网类产品的设计者和使用者更为关心的是网络在执行任务的过程中,部分节点、链路处于失效 (被毁)状态下的全网业务能力,如网络节点、链路设备在某一失效 (或被毁)状态下,用户可容忍的端到端业务传输的最小成功率、最大时延等。故此必须增加系统 “功能关联”和 “拓扑关联”的可靠性指标。

目前,相关军用标准针对系统可靠性指标仅给出了 “故障关联”的相关要求,如:GJB 1909.10-98《装备可靠性维修性参数选择和指标确定要求》建议选择的系统可靠性参数中缺少 “功能关联”“拓扑关联”相关的可靠性参数,即系统功能 (全功能、主要功能和最低功能)可用度和完成任务(功能)的成功率等。

本文提出了基于网络设备 “故障关联”、网络结构 “拓扑关联”和网络业务 “有效性关联” (含功能与性能)的系统产品可靠性综合测度体系 (如图1所示)。值得指出的是: “故障关联”与 “功能关联”的系统可靠性参数是基于可靠性试验工程的 “可测性”提出的; “有效性关联”与 “拓扑关联”的系统可靠性参数是基于仿真环境的 “可测试”提出的,两者相辅相成将更加全面地完成对军用通信网系统可靠性的综合评估。

同时,对由平均故障间隔时间 (MTBF:Mean Time Between Failure)、平均故障修复时间 (MTTR:Mean Time To Repair)、基本可用度、网络吞吐量和网络业务时延等9个参数组成的系统可靠性综合测度体系提出了具体的测度算法。

图1 系统可靠性综合测度体系

2.2 系统可靠性测度算法

2.2.1 MTBF

依据GJB 451A-2005中的定义,MTBF的度量方法为:

2.2.2 MTTR

依据GJB 451A-2005中的定义,MTTR的度量方法为:

2.2.3 基本可用度

依据GJB 451A-2005中的定义,基本可用度的度量方法为[3]:

2.2.4 完成任务的成功率

设 “规定的任务剖面”共有M个,某个任务剖面用m表示; “规定的功能”集合为S={s1,s2,…,sk},这里,全功能集合即为S,主要功能或最低功能集合为S的子集,具体地,用si(i=1,2,…,k)表示功能集合S中的第i个功能,如双工话音功能、分组数据传输功能等,则任务剖面m中,能够完成si=(i=1,2,…,k)功能的成功率为:

2.2.5 网络吞吐量

网络吞吐量[1]是单位时间内传输的无差错的业务负载流量,是综合衡量网络设计容量、网络效率和业务传输成功率的综合性指标参数。

设网络由N个节点、M条链路组成,网络的业务负载流量类型共有K类,用集合S={s1,s2,…,sK}表示,这里,业务类型即可定义为不同优先级的业务负载流量,也可对应为不同应用层的指控、态势和情报等业务;再设网络节点i,j=1,2,…,N之间第k类的业务负载流量为Lij(sk),则sk类业务的全网负载流量与全网的总业务负载流量为:

再设网络仿真试验测试时间为T,则网络业务负载的平均吞吐量为:

2.2.6 网络业务传输时延

设网络节点i,j=1,2,…,N之间第k类业务的平均时延为τij(sk),则sk业务的全网传输平均时延和全网总的业务传输平均时延为:

2.2.7 网络坚韧度

网络坚韧度是为断开一对节点 (i,j)之间的所有通路所需去掉的最少节点数 (最小节点割集)。网络坚韧度分为点坚韧度和边坚韧度,其中,点坚韧度对应网络中节点设备的损坏情况;边坚韧度对应网络中链路设备的损坏情况。

设C(G)表示图G的全体点割集构成的集合,则其点坚韧度N(G)的定义为:

同理,其边坚韧度C(G)的定义为:

显然,C(G)、N(G)是网络拓扑连通性矩阵E(t)的函数。

2.2.8 网络粘聚度

网络粘聚度是为了断开一对节点 (i,j)之间的所有通路所需去掉的最少链路数 (最小链路割集)。

设CLij分别为断开一对节点 (i,j)之间的所有通路所需去掉的最少节点数和最少链路数,则网络粘聚度为:

显然,CL是网络拓扑连通性矩阵E(t)的函数。

2.2.9 网络加权端到端连通概率[4]

仿真过程中还可用加权的端到端连通概率参数,计算分析其由于节点、链路设备失效所带来的连通概率的变化情况,并通过基于业务负载流量的加权,即节点对 (链路)业务负载流量越重,其对网络拓扑连通性影响越重,较合理地对网络拓扑结构的连通性进行评估。

设Lij,Pij分别为网络节点i,j=1,2,…N在E(t)条件下的端到端的业务负载流量和连通概率,这里,Lii=0,Pii=1,则加权的网络端到端连通概率为:

3 通信装备网络可靠性仿真

3.1 可靠性测试业务加载模型

该模型由仿真控制器、网络有效性仿真、设备可靠性仿真和网络拓扑连通性仿真终端设备构成分布式仿真系统。各个仿真终端作为分布式仿真的成员依托LAN网实现互联及各个仿真成员之间的数据交互与仿真时钟的同步。

仿真控制器构造整体仿真想定,并将网络拓扑(E(0))、各节点 (终端)业务负载流量 (流量模型及参数)、节点与链路可靠性模型与参数等仿真参数分发到各个仿真成员。并由联合仿真控制器最终根据定制情况,给出系统可靠性的综合评估。此外,也可根据网络的实际情况,重点关注某些节点或链路,给出详细的针对某节点、链路或某些节点对之间的业务有效性的评估结论 (业务流量的成功率、平均时延等)。

3.2 仿真数据的采集与处理原则

系统可靠性试验及生产过程中的数据采集与处理是进行软件仿真的关键 (如图2所示),可完成MTBF、MTTR、使用可用度、固有可用度和任务可用度的计算;通过记录不同时段剖面内各类业务的成功率,可完成功能的成功率、功能可用度的计算 [5]。

图2 可靠性试验数据采集与处理

3.3 系统故障与维修处理算法

仿真过程中设备是否出现故障是一个服从指数分布的随机事件,如何真实地 “模仿”设备的故障状态是一个必须解决的关键问题。

3.3.1 故障处理算法

由于故障数决定了系统运行的可用度,仿真过程中,必须模拟 “故障发生”,基于实际故障发生是随机概率事件的原则,我们利用已知的节点固有特征寿命和节点已仿真的运行时间,计算得到了故障发生的门限值,并通过随机数函数产生0~1之间的均匀分布值,将该分布值与门限值进行比较,当分布值小于门限值时,定义为故障,如图3所示。

图3 系统故障定义图

计算系统各个节点的故障发生门限值 (瞬时失效概率),系统第i个节点失效的概率为:

式(17)中:t——该节点截止目前已连续工作时间;

λ——该节点的失效率。

3.3.2 故障维修性处理算法

由于各个节点的MTBF观测值是累计正常工作时间与故障数的比值,因此故障发生时,必须计算故障修复时间;对于仿真系统,无法实际地统计故障修复时间。基于电子产品的失效多为正态分布,我们采用以MTTR为中心的正态分布的随机数,取整后作为该节点的修复时间同时即为节点的退网时间,详细情况如图4所示。

图4 维修时间定义图

3.4 仿真实现

3.4.1 设计原则

基于系统可靠性综合测度体系及相关的测度算法模型,建立通信系统装备可靠性仿真分析与评估平台,实现对通信系统可靠性综合分析与评估,为系统可靠性设计、分析与鉴定提供有效的手段。

3.4.2 实现功能

a)仿真想定的建立编辑

系统通过引入Ext JS框架入,实现了节点、链路添加的随意拖拽,节点、链路设备状态变换的颜色形状改变,以及图形、样式的随意变更。

b)仿真过程的实时监控

系统在仿真过程中,可实时地监测各个节点的仿真状态,可显示仿真节点的累积故障次数、累积故障时间和累积运行时间等可靠性相关信息并按图5-6所示的方式在系统主界面中显示。

图5 系统实时仿真状态显示图

图6 系统节点实时状态显示图

c)仿真结果的统计分析

1)根据系统可靠性参数的选择,分析各种系统可靠性统计计算功能;

2)分析系统可靠性综合评估功能。

3.5 仿真系统的应用

为了验证本仿真系统的效果,以“通信装备可靠性仿真评估系统”为平台工具,以某电台互联网系统集成联试任务为背景,构建典型的最小规模系统。

3.5.1 系统仿真想定

系统仿真想定构成包括1个由5个节点构成的高速数据电台网。

在系统仿真想定中,各个节点(圆圈数字标号)的主要设备构成及基本互联关系如图7所示,对应的系统仿真想定的网络拓扑图如图8所示。

3.5.2 系统仿真过程与结果

a)计算 (集成)节点的MTBF

依据节点设备串联可靠性计算模型,完成系统仿真想定的各个节点的MTBF的计算。

b)运用通信装备可靠性仿真评估系统,完成系统仿真计算

1)仿真初始阶段

首先,利用仿真评估系统的显示模块将网络拓扑输入软件,如图8所示;

然后,将系统的各个组成节点参数输入到软件数据模块中;

最后,设定系统的总仿真时间和最短仿真时间。

2)仿真过程中

在仿真过程中,随着仿真时钟的不断推进,按照各个节点设备预先输入的失效率和概率分布,依托仿真时钟,以及以前各个仿真时刻节点的工作状态,模拟节点、链路设备的故障和故障设备的维修过程。

图8 战术电台互联网系统仿真拓扑图

图7 战术电台互联网系统仿真分析逻辑拓扑图

网络有效性与拓扑连通性仿真由软件根据仿真过程中产生的网络连通性矩阵E(t)计算。其中,网络有效性仿真会针对新的网络拓扑,运行相关的动态组网协议,并实现其路由算法的收敛过程,统计相关业务负载流量的成功率、时延等业务参数指标。

网络连通性仿真会依据新的网络拓扑,重新计算其网络的连通度、粘聚度和加权连通概率等参数,并最终统计出网络连通度、粘聚度的变化结果。

表2 战术电台互联网系统集成联试测试数据统计表

在仿真过程中,可按照仿真想定,由各个联邦成员将其中间统计结果,以及自身的仿真运行状态发送于联合仿真控制器,由联合仿真控制器监视系统总体仿真的状态,并可随时终断仿真。

3)仿真结束后

仿真结束后,由联合仿真控制器最终根据所定制的情况,给出系统可靠性的综合评估。

c)系统仿真分析

1)某电台互联网系统总体性能

该战术电台互联网系统集成联试测试数据统计如表2所示。

经测试数据整理,通过统计分析可得,网络总体性能为:平均成功率为97.9%;平均时延为14.4 s。

2)某电台互联网的系统 (设备)固有可用性

通过仿真的统计结果分析,系统总体的固有可用性为:0.873。

3)综合分析结论

通过系统有效性与系统故障关联性能指标分析可得,战术电台互联网系统总体性能基本满足设计要求,能够支持指挥控制信息系统的综合应用。

4 结束语

对于大型系统而言,受试验设备的限制,无法进行全系统的可靠性试验,对其可靠性试验仅限于反映系统组成节点的可靠性及修复能力的单一指标 (可用度)。而且,由于受网络规模、试验场地和保障条件的限制,一般较难进行工程实施,并且试验费用巨大,试验周期长。因此,本项目的研究与开发填补了系统产品可靠性试验仿真工程的空白,并且将大大地节省试验费用。

本文的研究成果依托某电台互联网进行了试用及验证,结果表明该研究成果具有一定的实用价值,具有非常良好的推广应用前景和军事经济效益。

猜你喜欢

系统可靠性链路关联
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
天空地一体化网络多中继链路自适应调度技术
试析提高配网系统可靠性的技术措施
“一带一路”递进,关联民生更紧
电气化铁路牵引系统可靠性分析
奇趣搭配
智趣
基于数据包分割的多网络链路分流系统及方法
基于故障树模型的光伏跟踪系统可靠性分析
基于系统可靠性的工程质量量化研究