APP下载

基于层次式架构的信息系统健康度模型及优化方法

2019-12-04李叶飞张明明袁国泉王松云钱柱中

关键词:链路信息系统矩阵

李叶飞, 张明明, 袁国泉, 王松云, 钱柱中

(1. 南京大学计算机科学与技术系, 南京 210023; 2. 江苏方天电力技术有限公司, 南京 210000;3. 国家电网江苏省电力公司信息通信分公司, 南京 210000)

计算机信息系统是保证现代企业各项网络业务正常运行的基础性设施, 对计算机信息系统的运行方式进行有效评估和保证其稳定运行尤为重要.信息系统运行状态的传统评价方法可以分为客观性评价和主观性评价[1].客观评价法主要是对数据具有的显著效应进行分析, 通常采用经济模型评价法[2-4]和数学评价法[5]等, 因评价指标较为单一, 故精确性受限.主观性评价一般结合领域专家的评估经验, 建立更为全面的评价体系.Mohammed[6]仅依靠专家分析法进行评估, 结果具有一定的主观性和随意性, 容易受专家技能和经验的影响.郎登何[7]、Kar[8]、Frenette[9]等则采用人工神经网络法对历史数据进行训练, 避免了过多的人为因素,更为准确地建立了评估模型.然而, 人工神经网络法需要大量样本数据,而信息系统中往往难以获得.本文基于层次分析法[10-12]综合考虑影响信息系统健康度的诸多因素,构造系统的递阶层次结构,通过计算合成权重构建综合性信息系统运行方式系统的健康度模型.该模型将信息系统分解为业务逻辑和物理设施两个维度, 并分别分解为业务的效率和可靠性,以及节点的CPU利用率和链路带宽利用率,由此构造判断矩阵得到各指标的权值,计算系统的健康度.由于系统运行中健康度会发生变化,本文进一步提出局部调整算法,以期通过及时的节点维护和业务逻辑模块迁移,保障系统健康运行.

1 信息系统评估模型

1.1 业务系统与物理设施健康度指标

可靠性和效率是评价业务性能的两个重要指标, 决定了信息系统能否有效满足用户的需求.每个业务都是一组具有特定功能的子逻辑模块集合,子业务模块之间相互具有依赖调用关系,从而形成业务的子逻辑模块依赖调用关系网络.将该关系网络抽象为有向带权图Gt=V,E,CV,b,τ, 其中节点V表示业务模块, 其权值CV表示运行该模块所需的计算能力; 有向边E表示业务模块的逻辑调用关系, 其权值b表示模块间通信所需带宽,τ表示两个子业务模块的通信最大时延.

业务tk的可靠性Rk表征业务模块及其通信的可靠度, 定义为Rk=∏v∈Ni,∀vαi∏j∈Pe,∀eβj, 其中Ni表示节点i的业务子逻辑模块的集合,v,e分别为业务tk中的节点和边,αi为节点i的故障率,βj为链路j的故障率.

业务tk的效率τe表征业务模块的执行速度, 由于计算时延是确定的, 故τe主要考察业务所有链路通信时延, 定义为δe=∑j∈Petj, 其中Pe表示业务相关通讯链路的集合,tj表示链路j的通信时延.

1.2 信息系统运行方式健康度层次模型

1) 构造判断矩阵.为了精确度量上述权重,需要为每一层的权重分布构造判断矩阵.现采用一致矩阵法, 改进专家分析法[6], 由领域专家给出两因素间的权重比值, 尽可能降低性质不同的因素之间相互比较的难度,从而提高准确度.以业务的可靠性指标为例, 领域专家针对业务的历史负载、复杂度和核心重要度等给出专业判断, 并对m个业务的可靠性指标进行m(m+1)/2次两两比较,进而构造为相应的判断矩阵A,

(1)

此外,考虑到专家判断标准的差异性, 根据专家的历史判断数据,得到各专家判断矩阵的可信度, 然后采用加权平均法得到每一层的综合判断矩阵,从而提高准确性.

2) 计算指标权重.对判断矩阵A的每一列进行归一化处理, 得到矩阵B,

(2)

类似地, 计算各层次的指标权重,进一步得到信息系统在任一时刻的健康度

(3)

2 信息系统健康度评估与局部调整策略

2.1 信息系统健康度实时评估算法

信息系统的业务和物理资源规模庞大,底层的指标体系达数万甚至数十万个,指标权重的实时度量和更新较困难.为了减小计算代价,本文基于判断矩阵的增量更新方法[13], 提出信息系统运行方式的健康度实时评价算法,其流程如图1所示.当信息系统物理资源状态GP(t)发生变化时, 算法将更新物理层及业务层各项指标的权重.当业务状态发生变化时, 则更新判断矩阵,且为了降低计算开销, 仅计算业务增量ΔT的判断矩阵.

图1 健康度评估算法流程图Fig.1 The flow chart of health assessment algorithm

图2 局部调整算法流程图Fig.2 The flow chart of local adjustment strategy

2.2 基于健康度优先级的局部调整算法

当信息系统运行时整个系统的运行状态处于变化过程中.一般地, 当CSD∈[80,100], 信息系统处于高可用状态, 进入健康稳定的常态运行; 当CSD∈[50,80), 信息系统处于可用状态, 进入应急运行状态; 当CSD∈[0,50), 信息系统处于不可用状态,此时可能发生严重故障,需要进行检修和维护.信息系统中每一个最底层的指标X都有预设的服务质量阈值α, 当阈值无法满足时, 则须动态调整指标所对应的业务或物理资源.对于每一个指标X, 定义其健康度优先级P(X)=|α-X|WX.健康度优先级越高,意味着该指标对整个信息系统的健康度的负面影响越大.当有多个指标的阈值无法同时满足时, 应首先调整健康度优先级高的指标.本文提出的资源配置局部调整算法流程如图2所示.当判定物理资源或业务状态的某一指标(如CPU利用率或带宽利用率)超过规定阈值时,系统将采取相应的迁移措施,将子业务模块迁移至满足要求的物理节点,从而使得信息系统保持较高的健康度.在节点迁移过程中,首先筛选可靠性、计算能力与效率满足业务需求的节点, 并在备选节点中选择CPU利用率或带宽利用率最低的为目标迁移节点,以实现负载均衡.

3 实例与结果分析

笔者基于国家电网电能管理服务平台进行仿真评估,系统包含200个固定容量但可靠性会随机下降的节点和100个具有3~10个业务逻辑子模块的初始业务.设置3组实验观察健康度的变化:第一组实验每1 h随机部署20个新业务,直至有300个业务同时运行;第二组实验采用局部调整策略,观察健康度在新业务加入时是否得到改善; 第三组实验观察节点出现故障时系统恢复情况, 结果如图3所示.

由图3(a)可见,新增业务提高了物理设施的资源利用率,初始阶段系统健康度有所提升;但随着新业务进一步增多,部分资源利用率超过阈值,业务健康度呈下降趋势.由图3(b)可见,随着新业务的不断加入,信息系统出现热点节点和链路,此时局部调整策略能提高物理层的健康度并减缓业务层的健康度下降,整体改善系统健康度.当系统运行超过7 h时,其负载已经处于饱和状态, 此时新业务的加入使得整个信息系统运行方式健康度下降,但整体下降较为缓和.由图3(c)可见, 在系统运行3 h和7 h时出现节点故障, 局部调整策略能够逐步处理故障, 使得信息系统恢复正常运行.

图3 健康度评估结果Fig.3 Health assessment

4 结语

本文综合考虑业务逻辑和物理设施,构造了信息系统运行方式的健康度模型, 然后采用层次分析法确定指标权重,计算信息系统运行方式的健康度.同时提出了基于健康度优先级的局部调整算法,通过节点维护或业务模块迁移改善信息系统的薄弱环节,从而保证信息系统的健康运行和高可用性.

猜你喜欢

链路信息系统矩阵
一种移动感知的混合FSO/RF 下行链路方案*
基于凸优化的FSO/RF 自动请求重传协议方案
天空地一体化网络多中继链路自适应调度技术
2022年信息系统与运营管理专栏征稿
基于排队论的信息系统装备维修保障效能分析
基于并行构件技术的医疗信息系统的设计与实现
多项式理论在矩阵求逆中的应用
一种IS?IS网络中的链路异常检测方法、系统、装置、芯片
矩阵
矩阵