一种基于可用性的战术通信子网评估方法*
2021-02-03曲少春傅妍芳
李 杰,卢 颖,曲少春,郭 琪,傅妍芳
(西安工业大学,西安 710000)
0 引言
网络可用性是战术通信网建设和运行最重要的性能之一,是衡量网络系统结构设计优劣和系统稳定性以及维护能力的一个重要指标,直接影响到作战信息和指挥命令的实时传递。因此,研究如何建立战术通信网的可用性模型和评估技术,从而采取相应的措施来提高战术通信网在战时的可靠可用性具有重要意义。目前,针对复杂战术通信网的可用性研究至今仍尚无完整的体系结构,对其进行可用性能的评价也没有一个统一指标。在评估一个战术通信网系统的好坏时,须要以“可用性”来衡量,而可靠性和可用性常常被混淆。“可靠性”只能反映出网络系统或者设备组件出现故障的概率,而“可用性”考虑了网络的可修复能力,更能反映出网络的品质。目前,国内文献[1-4]在网络可靠性方面的论述较多,可用性较少,也没有对战术网进行相关的仿真。本文针对网络可用性评估问题,采用Markov 数学分析法对子网可用性进行了模型分析和计算机仿真,接着运用Monte Carlo 法进行了仿真建模,该方法根据战术通信子网的特点,在K/N 端连通可用度方法的基础上,结合深度优先搜索算法和权重减枝法给出含权节点连通度P 来判定系统当前时刻的状态,最终计算出网络可用性参数,同时对子网进行了可用性分析评估。
1 可用性定义
工程中通常采用平均无故障间隔时间MTTF(Mean Time To Failure)来衡量系统的可靠性[5],而用平均维修时间MTTR(Mean Time To Repair)来衡量系统的可修复[6]性,可用度A 可由这两个参数得出。
由式(1)可知,当MTTF 趋于无穷大时或当MTTR 趋近于0 时,则可用度A 趋向于1。因此,可通过提高设备可靠性和对系统的修复能力两种方法来提高可用性。
2 可用性Markov 模型
战术通信子网中可工作节点数随着故障以及维修事件而发生变化,即在故障事件的驱动下,整个系统运行的时间被不同的时刻划分,而每个时刻系统的工作状态(可工作节点数)将发生变化,工作状态由上一个时刻的工作状态决定,因此,系统中可工作节点数的状态[7-8]具有马尔可夫性。
2.1 Markov 模型分析
将战术通信子网系统视作多状态Markov 可修复系统[9]。对于系统的工作状态和故障状态可依据K/N 连通可靠度准则[10]来进行判定,即当n 个部件中有k 个或k 个以上部件工作,则认定系统处于正常工作状态(n≥k)。由此得出,系统故障状态可根据出现故障的节点个数定义为E={0,1,…,n-k+1},该集合由工作状态集W 和网络故障集F 组成,即E={W,F},W={0,1,…,n-k},F={n-k+1}。系统状态之间的转换如图1 所示,由于节点的故障与维修事件的发生,系统的运行状态根据K/N 连通可靠度准则在W 和F 之间转换。
图1 系统状态转换图
2.2 计算模型
战术通信网系统由多个网络节点设备和修理部门组成。本节研究基于以下假定:
1)系统中各节点的故障时间与修复时间相互独立,且故障节点在维修过后,按照新节点[12]的损坏概率来计算。
2)节点的故障和维修是服从指数分布的无记忆随机过程。每个设备节点的故障时间Tn为:
3)维修部门的维修能力无限,且节点损坏后立即进行维修。
可得到时间连续多状态的齐次Markov 链{X(t),t≥0},其中,X(t)=j,j∈{0,1,…,n-k+1},该式表示时刻t 系统有j 个节点故障并在修理,系统的状态转移概率图如图2 所示(为表达清晰图中未画出自己转移到自己)。
图2 网络多状态转移概率图
对式(5)求Δt→0 求极限可得转移概率矩阵:
令Pj(t)表示t 时刻系统处于j 状态的概率,并令P(t)=(P0(t),P1(t),…,Pn-k+1(t)),它表示t 时刻系统处于各状态的分布概率,即一组行向量。由式(5)建立微分方程如下:
这是一阶线性微分方程组,可由此求出P(t),则系统的网络可用度如式(7)所示。
将3.2 节中表1 的参数代入上式并利用matlab软件计算系统可用性参数,其结果如下页表2 所示,用Markov 方法建立一个简单例子与仿真方法得出的可用性进行比对验证。
3 仿真分析
在战术通信网中引起系统状态改变的故障与修复事件是在离散时刻出现的,因此,可通过离散故障事件[13-14]驱动法对其进行仿真分析。
3.1 单网Monte Carlo 仿真建模
3.1.1 网络连通度计算
在仿真过程中使用了深度优先算法,实时更新当前系统的最大节点连通度参数n,并通过K/N 端连通可靠度准则来判定当前子网是否处于可工作状态,接下来通过计算式(1)得出网络的可用性参数A。
初始化时,设置一个子网标准阈值k,如果最大连通节点数大于或等于k,将定义网络当前“可用”,否则网络系统瘫痪。定义一个函数Φ(x)来描述当前时刻网络的状态x∈{0,1,…,k-1,k,k+1,…,n},系统中最大节点数为n。
Φ(x)的值由x 与K 之间的关系确定,Φ(x)为0,表示系统瘫痪,Φ(x)为1,则表示系统可正常工作。
3.1.2 可用性参数评估
可用性仿真评估参数计算如下:
1)平均无故障间隔时间MTTF(MTTF 记录为TTF)计算公式如下:
其中,NS为仿真运行总次数,ti是第i 次仿真的平均故障时间。
2)平均修理时间MTTR(MTTR 记录为TTR)的计算公式如下:
其中,NS为仿真运行总次数,tmi是第i 次仿真中的网络平均修复时间
3)稳态可用度Ai的计算公式如下:
其中,Ai为第i 次仿真的稳态可用度,WT 为第i 次仿真的网络系统可工作总时间,WT 为第i 次仿真的网络系统瘫痪的总时间。
4)平均可用度A(t)的计算公式如下:
其中,Ai(t)为第i 次仿真在当前t 时刻下的稳态可用度,NS为总仿真次数。
3.1.3 仿真流程
实验中设定仿真次数为NS,每一次仿真时长为Tmax,仿真过程中将根据可用性参数的定义来评估计算网络可用性,仿真流程如下页图3 所示。
仿真步骤如下:
1)设置系统仿真次数初值为NS,将网络拓扑初始化为邻接矩阵。
2)仿真是由两种故障事件推进的,故障产生事件和修复事件,先根据一定的故障修复比来产生随机事件,并针对每一次不同随机故障事件的时间值TFi,排序并生成链表。
3)根据故障事件驱动的方法,推进仿真进程,直至仿真次数达到NS。
4)事件处理过程中,判断当前发生事件是故障产生事件还是故障修复事件,在仿真推进中对网络拓扑结构动态更新。并实时进行深度优先搜索,求出当前的最大连通数n,当n≥k 时,网络系统可用,若n<k,则网络瘫痪,并记录系统瘫痪时间TF和可用时间Tw。
图3 仿真算法流程图
5)仿真结束,统计网络可用性参数值。
3.2 实验分析
实验设置:假定战术通信子网为10 节点单元,不考虑作战任务、组织关系、重要程度等因素,将通过计算机仿真和马尔科夫方法来计算系统可用性。仿真参数如表1 所示,M 表示仿真节点数量,E(F)为故障期望,P1、P2、P3、P4分别代表4 种不同的修复期望(修复时间由短变长),Stimes为仿真总次数,Tmax为仿真时长。表1 中阈值K 为6,同时修复期望、节点故障期望和仿真时长的时间单位都为min。
表1 仿真参数设置
实验所得可用性评估结果如表2 所示,A1、TTF、TTR分别表示蒙科卡洛方法中所获得的平均可用度、平均故障时间、平均修复时间;A2表示马尔可夫方法获得的可用度,Vi代表的是网络节点中损坏i 个节点的状态。
表2 可用性结果参数
如表2 可知,两组实验的系统可用度(A1与A2)呈现出了较为接近的趋势,即与节点的修复期望呈线性相关,修复期望值越大(由于战术环境、自然环境的限制,设备的损坏程度不同以及维修部门的维修力度不同导致了修复时间的期望值不同),系统的可用性就会越低。
将表2 的马尔可夫方法中各个状态Vi的损坏概率提取出来,其生成结果如图4 所示。
图4 各损坏状态概率折线图
从图4 中可以看出,当节点的修复期望越大,同时损坏多个节点的概率明显上升,而无损坏节点的概率降低。两组实验的可用度结果都显示出了该系统具有高可用性,不同修复期望比的情况下可用度误差在6%以内,说明了所采用基于蒙特卡洛的网络可用性仿真建模法对战术通信网可用性的评估具有一定的参考价值。
4 战术层级子网可用性仿真建模
战术通信网中信息的传递呈现出一种“纵向化”的特征。同时,根据战术通信网层级特点以及各节点级别的不同,仿真可以设定一个简单的3 级指挥结构。第1 层为营指挥节点;第2 层为连指挥节点;第3 层为火炮节点,构建如图5 所示的网络拓扑结构。
图5 层级指挥网拓扑示意图
仿真模型中,为符合实际情况将根据战术通信网各节点的层级关系及系统中所处的不同重要程度,为该树状层级指挥网各节点赋予相应权值Pij。
4.1 层级子网拓扑生成
仿真算法中,用P 值取代网络连通度n。由此,生成简化条件下的作战体系网络。战术三级指挥网拓扑结构(含权重)生成算法如下:
1)设网络中有N 个信息节点,生成第1 层(层级h=1)的旅节点,个数为1,并赋予此节点重要度权值P1j;
2)以第1 层的旅节点为父节点,生成N2个第2层(层级h=2)团节点,并赋予本层各节点权值P2j;
3)重复算法2)直至h=L(L 为最大层数),即完成了网络系统的生成,此时节点个数N 由式(13)所得,其中,Ni表示第i 层节点的个数;
网络各节点权重值之和P 由式(14)所得,其中,L 表示网络系统当前层数,m 表示每层的节点数。
4.2 权重剪枝法计算连通度
仿真过程中,如若某节点随机损毁,则其本身权重值及其所带分枝上所有节点权重值均不予计算(即此路不通),从网络最大连通节点的权值之和中将其剔除即为权重剪枝法。剪枝后,若当前最大连通权重总和P 达不到阈值K,则认定当前战术通信网运行状况不符合生存要求,系统瘫痪。如图6 所示,当V1与V2的链路损坏,由于虚线中除去了坏掉的链路,V2,V4,V5无法与系统中其他节点连通,所以,计算总权重P 时将会去排除此枝中所有节点。
4.3 实验分析
仿真实验仍在5 种不同修复期望强度P1、P2、P3、P4和P5(修复强度逐渐减弱),仿真次数都为10,仿真时间都为5 000 min。
图6 权重剪枝
表3 仿真实验参数
表3 中,M 表示仿真节点数量,E(F)为故障期望,根据M 和E(F)可算出含权三级子网满枝权值总和N=70,分别在K=35、45、55、60、65 时,测试修复期望在由强减弱的过程中系统可用性变化情况。
表4 平均可用性结果参数
图7 修复强度与可用度关系图
从表4 和图7 所示的实验结果中可以看出,战术通信网的可用度与节点的修复期望有关,修复期望值越大,则系统的可用性就越低,原因是维修的期望值较大,被维修节点不能够进行工作,而在此维修这段时间内损坏的节点数在不断增加,造成了多个损坏节点在单位时间内大量冗余,总体上导致系统的瘫痪时间变多。随着设定的阈值K 逐渐增大(对战术网要求变高),低连通值不能满足战术指令下达以及情报共享功能,导致系统可用性降低。
根据实验结果,为了提升系统可用性可采取以下措施:1)在战前对设备进行加强维护,定期更换或者维修老化的设备部件;2)可以采用多个备用设备节点,加固战术网的网络拓扑结构;3)提升通信技术,保证战术网在网络严重打击(低阈值K)下依然能够获取到战术指令以及情报数据;4)需依据网络的规模来相应地增加并合理地安排维修人员,改进维修技术,提高通讯设备维修能力。
5 结论
如何在复杂战术指控网络环境下实时、快速评估网络可用性,进而为网络的规划建设进行指导有着一定的现实意义。本文在构建战术通信层级子网模型的基础上,针对子网可用性进行了仿真评估,并通过实验分析了该方法的有效性和可行性,从而为战场通信网络的可用性研究提供了新的方法和参考。本文在可用性评价过程中仍存在很多简化的假设,有一定的局限性。因此,还需要结合实际的战场网络背景进行针对地可用性研究。