APP下载

一种基于控制图法的网络告警闭环管控策略*

2016-07-05璐,苏

通信技术 2016年4期
关键词:闭环分级

张 璐,苏 醒

(中国移动通信集团广东有限公司东莞分公司,广东 东莞 523129)



一种基于控制图法的网络告警闭环管控策略*

张璐,苏醒

(中国移动通信集团广东有限公司东莞分公司,广东 东莞 523129)

摘要:当前被动地维护各种网元及其触发的告警,已不能满足如今复杂的网络管理需求。网络告警闭环管控策略从各类网管系统上梳理出影响业务的各类网络重要告警标题,通过运用控制图方法,统计分析各类重要告警异常突变量的上下波动受控情况,结合业务影响关联分析,建立重要告警异常突变预警模型,从而提出了一种先于故障处理的网络告警闭环管控策略。该策略为告警预警和快速响应调度提供了有效可行的数理统计模型和依据。

关键词:告警;控制图;闭环;分级

0引言

网络告警预警是先于网络故障处理、主动挖掘网络隐患的有效管控机制,有利于网络管理员对网络故障和告警进行预防性维护。随着网络规模的日益扩大,网络上各种网元及其触发的告警量大量涌现。如何对这些海量告警进行有效分析预判成为网络运行管理急需要解决的问题。综观现有网络告警分析和操作,有如下不足之处:

(1)仅在各网元出现告警和故障后对其被动地进行响应处理,缺少对告警量突变和趋势进行科学的分析,建立合理的分级别告警门限和触发策略。

(2)各网元出现的告警仅与网元自身有关,缺少各种告警与前端业务感知和后端网络隐患相关联。

(3)缺少网络告警分级别闭环管控策略,即建立可行的后评估机制,推动网络告警管控策略的更新优化。

针对以上不足,文章从影响客户感知、客户投诉、网络运行安全等维度梳理出影响业务的各类网络重要告警标题。通过运用控制图方法,统计分析各类重要告警异常突变量的上下波动受控情况,结合业务影响关联分析,建立重要告警异常突变预警的分级预警模型和算法,提出了一种先于故障处理、主动挖掘隐患的网络告警预警动态闭环管控策略。

1控制图工具原理概述

控制图是有效的质量控制工具,即是一种反映质量特性值状态随时间的变动,从而评定质量是否处于控制状态的统计方法。广泛适用监测产品质量、服务质量等领域。

控制图(见图1)是趋势分析的延伸,引入了上、中、下三条控制线作为判断有无异常的标准和尺度[1]。其中以控制质量特性值典型分布的分布中心μ为控制中心线,符号为CL;以μ+3σ为控制上界限,符号为UCL;以μ-3σ为控制下界限,符号为LCL。

图1 控制图原理

若数据落在控制界限内,则认为质量的波动是正常的波动;若数据落在控制界限外或其排列有明显不随机,则说明质量有异常因素的影响。

目前常用的控制图工具根据控制量属性的不同大致可分为计量值控制图和计数值控制图两类,前者主要用于分析控制长度、时长、比例等属性,后者主要用于数量属性[2]。文章总结出8种常用的控制图及其应用场景如表1所示。

表1 控制图分类及其应用场景

2网络告警突变预警分析中的控制图

2.1控制图工具选择

网络告警突变预警分析中各类全量告警是在一天内统计告警量,即某类全量告警每天只得到一个累计数据,样本数据无需分组,并希望尽快发现异常并消除异常因素。结合第1部分对各种控制图工具的适用场景分析,选取“X-Rm单值—移动极差控制图[4]”作为网络告警突变预警分析工具最为合适。见图2。

2.2控制图主要参数

在“X-Rm单值—移动极差控制图”中,取样本空间[X1、X2…Xk],k∈(1~n)。各项主要参数介绍如下:

(4)单值X的控制图中:控制中心线CL、控制上界限UCL、控制下界限LCL分别为:

极差Rs的控制图中:控制中心线CL、控制上界限UCL、控制下界限LCL分别为:

图2 网络告警突变预警分析中的控制图选择

2.3控制图异常判断

网络告警突变预警分析中应用控制图的目的是要及时发现告警突变过程中出现的异常,判断异常的原则就是出现小概率事件。为此,判断的准则有两类:

(1)第一类异常:网络突变告警越出控制界限。

(2)第二类异常:网络突变告警在控制界限内,但是排列的形状有缺陷。

一般认为,超出控制限是由偶然事件引起,而出现异常的可能性α非常小,故3σ为控制限,4σ为行动限。另加上2σ警戒限,作为失控状态即将来临的一个警示信号。

在网络告警突变预警分析中,根据不同类型的告警标题建立分级预警模型:

(1)为避免犯第一类异常:采用2σ、3σ、4σ作为三级预警模型阈值;

(2)为避免犯第二类异常:用于判断趋势是否异常,作为趋势预警评判规则。

3搭建网络告警突变分级预警模型

文章以控制图作为建模工具,以与业务影响相关的各类告警量变化情况作为分析对象,通过各类告警量历史收集数据搭建分级预警模型。主要分为以下4个关键步骤:

3.1选择收集数据

根据影响客户感知、客户投诉、网络运行安全等维度,在现网告警标题中梳理出传输专业、无线专业、核心设备、外部环境等方面的重要告警类型,作为本次建模样本对象。

结合各告警标题告警量的疏密程度,选取一年中具有代表性月份的每日全量告警,作为基础分析数据样本。要求样本空间不得小于25。

3.2计算制作控制图

根据步骤一析出各重要参数,关联已知故障现状,剔除已知故障的告警异常突变点。同时采用Dixon检验法剔除离群异常数据。即剔除样本中离其它观测值较远的样本值。

以传输专业的单板脱位重要告警标题为例,极差Rs控制图有异样点落在控制限之外,判断极差Rs控制图处于不稳定未受控状态。如图3所示。

图3 未受控状态下极差Rs控制

通过Dixon检验法判断和关联已知故障现状剔除异常点,使得极差Rs控制图和单值X控制图均处于稳定受控状态,即Rs和X的样本值均在上下控制线内。如图4、图5所示。

图4 受控状态下极差Rs控制

图5 受控状态下单值X控制

3.3关联建立预警模型

极差Rs控制图和单值X控制图均处于受控状态后,将单值X作为全量告警的预警模型。即根据2.3节中控制图第一类异常判断和预防措施原则,采用2σ警戒限、3σ控制限、4σ行动限分别作为三级、二级、一级预警模型阈值。以传输专业的单板脱位重要告警标题为例,制定分级预警模型阈值如表2所示。

表2 传输专业单板脱位告警突变分级预警模型

同时根据2.3节中控制图第二类异常判断原则,制定趋势异常预警规则。以传输专业的单板脱位重要告警标题为例,制定该告警标题趋势异常预警规则如下:

(1)连续7天落在中心线(6.7宗/天)上方,判为三级趋势异常预警;连续9天落在中心线上方,判为二级趋势异常预警;连续11天落在中心线上方,判为一级趋势异常预警。

(2)连续4天递增,判为三级趋势异常预警;连续6天递增,判为二级趋势异常预警;连续8天递增,判为一级趋势异常预警。

(3)连续3天中有2天落在中心线上方2σ区外,判为二级趋势异常预警;连续5天中有4天落在中心线上方2σ区外,判为一级趋势异常预警;连续5天中有4天落在中心线上方1σ区以外,判为三级趋势异常预警。

3.4预警模型滚动优化机制

网络告警突变分级预警模型是建立在极差Rs控制图和单值X控制图均已受控的前提下。由于选取的样本空间仅反映一定时间段各全量告警的变动范围,根据3.3节趋势异常预警的规则,当网络全量告警趋势变好后,可优化趋势变好的告警预警阈值,从而建立网络告警突变的滚动优化调整触发机制。滚动优化机制触发条件建议如下:

(1)网络告警标题全量告警连续6天递减。

(2)网络告警标题全量告警连续9天在中心线以下。

(3)网络告警标题全量告警连续5天中有4天超过 2σ警戒限以内。

网络告警突变分级预警阈值可在滚动优化机制下做周期性修正。滚动优化机制触发条件可结合网络告警的实际情况而设定。

4网络告警突变分级预警模型应用

根据网络告警突变分级预警模型,文章在全网各类告警标题中以影响客户感知、客户投诉、网络运行安全等维度,筛选出传输专业、无线专业、核心设备、外部环境等方面的重要告警类型如表3所示。

表3 网络告警标题梳理分类

通过控制图工具对上述各类网络告警异常突变量的上下波动受控统计分析,并结合业务影响关联分析,建立各类网络告警异常突变预警的分级阈值,包括阈值突变预警和趋势异常预警。以外部环境重要告警标题为例,列举其与业务影响相关的重要告警标题及其分级阈值如表4所示。

表4 外部环境类重要告警标题及其分级阈值

根据预警阈值建立网络告警突变的分级别管控策略,包括启动条件、响应人员配备、调度响应机制、处理和闭环管控等。同时通过预警模型的后评估环节,结合关联告警各类失败场景、用户感知(故障、业务),优化预警判断的模型,从而形成网络告警预警闭环管控体系,见图6。

图6 网络告警预警闭环管控策略流程

5结语

文章在梳理出影响业务的各类网络重要告警标题的基础上,选用控制图工具,统计分析各类重要告警异常突变量的上下波动受控情况,结合业务影响关联分析,建立重要告警异常突变预警的分级预警模型和算法,为告警预警和快速响应调度提供了有效可行的数理统计模型和依据。

文章最后根据各类网络重要告警标题的分级预警阈值建立相应的网络告警突变管控策略,通过预警模型的后评估环节,结合关联告警各类失败场景、用户感知(故障、业务),优化预警判断的模型,从而形成网络告警预警闭环管控体系。

参考文献:

[1]向 伟,张剑峰,邵鑫鸿等. 基于基站休眠的负载合并动态功率控制算法[J].通信技术,48(05):555-559.

XIANG Wei, ZHANG Jian-feng, SHAO Xin-Hong, et al. Load Merge Dynamic Power Control Algorithm based on Base Station Sleeping-Mode[J].Communications Technology, 2015, 48 (05): 555-559.

[2]Ata Ebrahimzadeh, Vahid Ranaee. Control Chart Pattern Recognition Using An Optimized Neural Network and Efficient Features[C].ISA Transactions, 2010 July, 9(3): 387-393.

[3]Stelios Psarakis. The Use of Neural Networks in Statistical Process Control Charts[J]. Quality and Reliability Engineering International Journal, 2011 July, ENBIS 10 27(5): 641-650.

[4]WAI Chung-yeong, Michael B, Khoo C, ZHANG Wu, Philippe Castagliola. Economically Optimum Design of A Synthetic Chart[J]. Quality and Reliability Engineering International Journal, 2012, 28(7):523-525.

Network Alarm Closed-Loop Control Scheme based Control Chart

ZHANG Lu, SU Xing

(Dongguan Branch, China Mobile Group Guangdong Co., Ltd., Dongguan Guangdong 523129,China)

Abstract:Nowadays, passive maintenance of various network elements and trigged alarmings could not satisfy the present requirement of complex network management. Network alarm closed-loop control scheme sorts out various types of important service-related network alarm titles from all kinds of network management systems, and via control chart,makes statistics and analysis of the fluctuation of different important alarms mutation. In combination of the service-related analysis, the graded early-warning model for alarm mutation is established, and thus, a dynamic closed-loop control scheme preceding fault handling is presented. The scheme provides an effective statistics model and basis for the network pre-alarm and rapid-response dispatch.

Key words:alarm;control chart;closed-loop;grading

doi:10.3969/j.issn.1002-0802.2016.04.015

*收稿日期:2015-11-02;修回日期:2016-03-05Received date:2015-11-02;Revised date:2016-03-05

中图分类号:TP393

文献标志码:A

文章编号:1002-0802(2016)04-0457-05

作者简介:

张璐(1982—) 女,学士,工程师,主要研究方向为无线网络优化;

苏醒(1982—)男,硕士,高级工程师,主要研究方向为网络运行支撑管理。

猜你喜欢

闭环分级
欢迎订阅4-6级《新课标 分级阅读》
基于安全闭环的“两客一危”动态监管平台
健管师基于多模态闭环式健康管理模式对2型糖尿病患者健管构建及应用
一种新型烟气含氧量闭环动态自适应控制系统的研制和应用
基于四元数卷积神经网络的移动机器人闭环检测
分级诊疗路难行?
重型直升机-吊挂耦合系统闭环飞行品质分析
分级诊疗的“分”与“整”
分级诊疗的强、引、合
就医进入分级时代