基于GSPN的舰载服务器系统可靠性建模及分析
2015-06-23单士华
李 展,单士华
(黄河科技学院,郑州 450063)
基于GSPN的舰载服务器系统可靠性建模及分析
李 展,单士华
(黄河科技学院,郑州 450063)
提出一种基于广义随机Petri网(Generalized Stochastic Petri Net,GSPN)的舰载服务器系统可靠性分析方法。深入分析舰载服务器系统故障模式的基础上,建立冗余服务器子系统的GSPN模型和共享数据盘子系统的GSPN模型,进而综合得到舰载服务器系统的全局GSPN模型,有效模拟了舰载服务器系统的动态行为。仿真实验验证了所提方法的有效性,为舰载服务器系统的分析与设计提供理论参考。
广义随机Petri网,舰载服务器系统,可靠性,可用度
0 引言
随着现代舰船智能化、信息化水平的日益提升,其系统规模和复杂度不断扩大,舰载服务器系统需要处理更多的实时数据等关键使命信息[1]。但是现役舰载服务器系统往往由于暂时性的错误或停机等故障导致数据丢失,甚至灾难性的后果,这是因为现有舰载服务器系统大多基于传统解析法进行设计的,无法适应现代舰船对服务器系统可用性要求[2-3]。因此,选择一种合适的理论工具从定量的角度评估舰载服务器系统可靠性是一个尤为紧迫的理论与工程性问题。
广义随机Petri网[4](Generalized Stochastic Petri Net,GSPN)是一种高级Petri网,已经在航空、装甲车和软件等诸多领域的可靠性建模与分析中得到了研究与应用[5-8]。本文的目的在于引入GSPN技术建立舰载服务器系统的可靠性分析模型,评估其的可靠性,为舰载服务器系统的分析与设计提供新的思路。
1 舰载服务器系统故障模式分析
1.1 舰船服务器系统工作原理
如下页图1所示为舰载服务器系统拓扑结构[2-3],包括冗余服务器子系统和共享数据盘子系统。在冗余服务器子系统中,每台服务器又包括基本处理单元、NIC网卡和SCSI控制器模块。每台服务器有各自的系统盘,用以安装各类功能软件,此外还拥有共享数据盘,用以存储应用数据。两台服务器备份工作,当一台服务器出现故障时,另外一台服务器接管相应的工作任务,保证为各个终端提供安全、可靠、及时稳定的服务。
图1 舰载服务器系统拓扑结构
1.2 故障模式分析
如图2所示为舰载服务器系统的故障树,用以描述其故障的传递关系。冗余服务器子系统故障B1和共享数据盘子系统故障B2以或门逻辑引发全局系统故障A。服务器A故障C1和服务器B故障C2以与门逻辑引发冗余服务器子系统故障B1。基本处理单元1故障D1、NIC网卡1故障D2和SCSI控制器1故障D3以或门逻辑引发服务器1故障C1;基本处理单元2故障D4、NIC网卡2故障D5和SCSI控制器2故障D6以或门逻辑引发服务器2故障C2。共享数据盘1故障D7和共享数据盘2故障D8以与门逻辑引发共享数据盘子系统故障B2。系统中各种故障通常可以通过重新启动和更换设备得以修复。
图2 舰载服务器系统故障树
2 舰载服务器系统的GSPN模型
2.1 基本假设
①根据舰载服务器系统的构成特点及静动态特性对其进行分解,将基本处理单元、NIC网卡、SCSI控制器和共享数据盘等作为建模基本单元。
②仅考虑建模单元正常与故障两个状态。
③建模单元从正常到故障的过程服从参数为λ的Poisson过程。
④建模单元从故障到正常的维修过程服从参数为μ的Poisson过程。
2.2 GSPN模型要素用法
在舰载服务器系统的GSPN建模过程中,各种模型要素的具体用法见表1。
表1 GSPN模型要素用法
2.3 基于GSPN的舰载服务器系统建模
基于模块思想,首先建立冗余服务器子系统的GSPN模型和共享数据盘子系统的GSPN模型,进而综合得到了舰载服务器系统的全局GSPN模型。
2.3.1 冗余服务器子系统的GSPN建模
图3 冗余服务器子系统的GSPN模型
冗余服务器子系统的GSPN模型如图3所示。模型注释见下页表2和表3。模型工作过程:模型初始化,模型标识如图3所示,此时,冗余服务器子系统正常工作,某个随机时间后,假设服务器1中NIC网卡1由工作状态Pd2w变为故障状态Pd2f(库所Pc1n标记个数为1,用以禁止服务器1中其他工作单元发生故障),则服务器1由工作状态Pc1w变为故障状态Pc1f。如果此时服务器2也由于某个工作单元发生故障也由工作状态Pc2w变为故障状态Pc2f,则即时变迁Tb1f激活,冗余服务器子系统由工作状态Pb1w变为故障状态Pb1f。再过某个随机时间后,假设服务器1中NIC网卡得到维修,其由故障状态Pd2f变为工作状态Pd2w(此时,库所Pb2f和Pc1n的标记都消失),则服务器1也由故障状态Pc1f变为工作状态Pc1w,接着即时变迁Tb1w1和Tb1r激活,库所Pb1f的标记消失,而库所Pb1w获得一个标记,表明冗余服务器子系统恢复工作状态。
表2 主要库所及其含义
表3 主要变迁及其含义
2.3.2 共享数据盘子系统的GSPN建模
共享数据盘子系统的GSPN模型如图4所示。模型注释见表4和表5。模型工作过程:模型初始化,模型标识如图4所示,此时,共享数据盘子系统正常工作,某个随机时间后,假设共享数据盘1由工作状态Pd7w变为故障状态Pd7f,库所Pb2w的标记个数由2变为1,库所Pb2n的个数由0变为1。当库所Pd2w的标记个数变为0,库所Pb2n的个数变为2时,即时变迁Td2f激活,共享数据盘子系统变为故障状态Pd2f。再过某个随机时间后,假设数据盘2由故障状态Pd8f变为工作状态Pd8w,则共享数据盘子系统又恢复工作状态Pd2w。
图4 共享数据盘子系统的GSPN模型
表4 主要库所及其含义
表5 主要变迁及其含义
2.3.3 舰载服务器系统的GSPN全局模型
舰载服务器系统的GSPN模型如下页图5所示。模型工作过程:舰载服务器系统正常工作,某个随机时间后,假设共享数据盘子系统发生故障,变迁Tb2f激活,则共享数据盘子系统变为故障状态Pb2f,同时舰载服务器系统变为故障状态Paf。再经过某个随机时间后,共享数据盘子系统恢复正常工作,变迁Tb2r激活,则共享数据盘子系统由故障状态Pb2f变为工作状态Pb2w,同时库所Paf中的标记消失,表明舰载服务器系统恢复正常工作。
图5 舰载服务器系统的GSPN全局模型
3 仿真实验
3.1 实验环境及仿真配置
TimeNET4.0软件[9]是德国工业大学Zimmermann A领导的研究团队研发的一套可以支持GSPN建模与分析工具。本文在该软件环境下,实现了舰载服务器系统的GSPN模型,定义舰载服务器系统A的可用度为Pa=1-P{#Paf>0};冗余服务器子系统的可用度为Pb1=1-P{#Pb1f>0};共享数据盘子系统的可用度为 Pb2=1-P{#Pb2f>0};服务器的可用度为Pc1=Pc2=1-P{#Pcif>0}(i=1,2);基本处理单元的可用度为Pd1=Pd4=P{#Pdiw>0}(i=1,4);NIC网卡的可用度为Pd2=Pd5=P{#Pdiw>0}(i=2,5);SCSI控制器的可用度为Pd3=Pd6=P{#Pdiw>0}(i=3,6);共享数据盘的可用度为Pd7=Pd8=P{#Pdiw>0}(i=7,8)。系统参数设置如表6所示;软件参数设置:仿真置信区间为95%,最大相对误差为10%,采样点25个。
3.2 仿真结果及分析
仿真结果如图6~图13所示。舰载服务器系统的全局可用度变化范围为[91.8%,100%],冗余服务器子系统和共享数据盘子系统的可用度变化范围分别为[97.1%,100%]和[92.5%,100%],可见全局可用度小于冗余服务器子系统和共享数据盘子系统的可用度,这是因为冗余服务器子系统和共享数据盘子系统是按照或门逻辑进行连接的。服务器可用度的变化范围为[75.1%,100%],共享数据盘可用度的变化范围为[64.7%,100%],分别小于冗余服务器子系统和共享数据盘子系统的可用度,这是因为由于冗余服务器子系统和共享数据盘子系统采用了与逻辑,因而可用度得到了较大的提高。基本处理单元、NIC网卡和SCSI控制器的可用度变化范围分别为[90.1%,100%]、[88.2%,100%]和[87.0%,100%],都大于服务器可用度,这是因为按照或逻辑彼此连接的,因而整体可用度减低了。综上,在设计舰载服务器系统时,应当尽量增加与门逻辑设计,减少或门逻辑设计;可以根据系统设计需求,选择不同的模块进行模拟仿真,设计满足特定可用度要求的方案。
表6 系统故障率和维修率
图6 全局可用度
图7 冗余服务器子系统可用度
图8 数据盘子系统可用度
图10 基本处理单元可用度
图11 NIC网卡可用度
图12 SCSI控制器可用度
图13 共享数据盘可用度
4 结 论
以舰载服务器系统为研究对象,研究一种新的基于GSPN的可靠性评估方法。将舰载服务器系统分为冗余服务器子系统和共享数据盘子系统,分别建立其GSPN模型。在此基础上,综合两个子系统模型得到系统全局GSPN模型,有效地刻画了舰载服务器系统的动态行为。仿真实验验证了所提方法的有效性。本文的研究可以为设计满足特定可用度要求的计算机系统提供理论参考。下一步将结合智能算法,研究各个模块在不同故障率和维修率情况下的系统可用度变化规律和特点。
[1]马伟明.舰船电气化与信息化复合发展之思考[J].海军工程大学学报,2010,22(5):1-4.
[2]刘湛,李孝明,唐良佐.构建高可用的舰载作战指挥信息系统[J].舰船电子工程,2008,28(6):83-86.
[3]黄坤,李成,杨子晨.Oracle备份策略在舰船电子信息系统中的应用探索[J].舰船电子工程,2009,29(1):143-146.
[4]林闯.随机Petri网和系统性能评价[M].北京:清华大学出版社,2005:15-25.
[5]孙晓哲,李卫琪,陈宗基.飞控计算机系统分层混合可靠性建模方法[J].上海交通大学学报,2011,45(2): 277-283.
[6]石健,王少萍,王康.基于GSPN的机载液压作动系统可靠性模型[J].航空学报,2011,32(5):920-933.
[7]尹辉燕,郭伟华,石健,等.容错网络系统可用性[J].计算机应用与软件,2011,28(9):174-178.
[8]杨志义,张琛雨,董云卫.AADL软件容错系统建模与评估[J].计算机测量与控制,2009,17(4):779-782.
[9] ZimmermannA,KnokeM.TimeNetUserManual4.0[EB/OL].[2013-12-26].Berlin:Real-Time Systems and Robotics Group,2007.http://iv.tu-berlin.de/TechnBerichte /2007/2007-13.pdf
Modeling and Analysis of Reliability for Shipboard Server System by GSPN
LI Zhan,SHAN Shi-hua
(Huanghe Science and Technology College,Zhengzhou 450063,China)
This paper presents to introduce Generalized Stochastic Petri Net(GSPN)in the application of reliability analysis of Shipboard Server System(SSS).On the basis of analyzing the fault mode of SSS,constructing the GSPN model of redundant server subsystem and the GSPN model of sharing data disk subsystem,the GSPN model of SSS is obtained and the dynamic behaviour of SSS can be simulated with the model.The proposed method is verified by the simulation experiment.The work in this paper can be useful for the analysis and design of SSS.
generalized stochastic Petri net,shipboard server system,reliability,availability
TP393
A
1002-0640(2015)05-0057-04
2014-02-26
2014-05-14
李 展(1983- ),男,河南南阳人,硕士,讲师。主要研究方向:可靠性、软件工程等研究。