APP下载

基于改进GSP的电力通信告警关联挖掘研究∗

2021-04-04

计算机与数字工程 2021年3期
关键词:网络拓扑电力通信关联

(国网江苏省电力公司信息通信分公司 南京 210024)

1 引言

近年来,电力行业信息化、智能化水平的持续提高,作为承载众多电网业务的电力通信系统,其在总体规模、网络容量、网架结构、覆盖范围和承载能力等各个方面均得到长足的发展。电力通信在智能电网体系中的基础性技术支撑作用越发突显,这对大规模通信网络的整体管控和风险防范提出了更高运维管理要求。然而电力通信网络复杂、异质的特性决定了通信运行维护人员在告警监视的实时性与故障处置的及时性方面始终面临着极大的挑战[1]。

在一个现实的电力通信网络中,通常包含着多个设备厂家、不同技术体制的系统和设备,这些系统和设备会以光、电方式通过各种物理介质连接起来,相互之间存在着复杂的关联关系。在运行中的通信网络中,一个故障往往会引发不同系统/设备之间,以及同一设备不同层次的多个告警事件,而且告警事件的种类和原因各不相同。这些众多的告警信息错综叠加,使得发生故障的真正根原因告警被掩盖掉了,运维人员不得不花费大量时间与精力来诊断故障原因,造成运行维护效率低下,现场故障处置缓慢等问题。目前针对电力通信告警关联分析的方法主要有基于规则(Rule-Based)、基于事例推理(Case-Based Reasoning)、基于因果关系(Casual-Model Approach),以及基于模型(Mod⁃el-Based)等分析方法[2~5]。这些分析方法通常需要借助专家经验构建出相应的分析模型或甄别规则,具有针对性强、处理准确性高等优点。但随着网络结构的日趋复杂,告警发生机制以及告警之间关联关系的不断变化,纯粹依赖于专家经验很难真正构建出跨系统、跨厂家的动态关联分析模型。因此,利用数据挖掘分析海量告警,从中挖掘出告警之间的关联关系已成为一种发展趋势。

本文在系统分析电力通信告警关联特点的基本上,深入研究了泛化序列模式GSP(Generalized Sequential Pattern)算法原理,在此基础上构建了通信网络分层模型作为网络拓扑约束,通过两者结合实现了改进的GSP告警关联挖掘。经过算例分析表明,本方法对电力通信告警关联分析具有较好的适用性。

2 相关概念

在电力通信网中,设备网元之间是相互关联、相互影响的关系。通常某一设备网元发生故障或异常,会引发同一拓扑关系图内多个相关设备网元或承载业务的告警,这种情况称之为告警传播。告警传播的路径可以是纵向的,即从物理层面向上层逻辑层面和业务层面扩散;也可以是横向的,即向周边的网元或系统扩散。因此,告警关联需要发现这些原始告警信息之间的关联关系,进而定位出发生故障的实际根原因告警。其形式化定义为:告警事件a和告警事件集合{a1,a2,…,an}有相关性,则a ⇒{a1,a2,…,an}表示a为根原因告警,由其引发了一系列告警事件集合[6~9]。

告警的关联关系一般分成主次告警关系和衍生告警关系。而其中衍生告警关系又可细分为阈值触发告警关系和同源关联告警关系,如图1所示。

主次告警关系表示存在着由主要告警引发一系列次要告警的因果关系,在实际操作中可屏蔽掉次要告警,只对主要告警进行展示与操作即可。阈值触发告警关系表示在某一划定区域和时域范围内,多次发生的同类型告警超过了指定数量或比例的门限阈值后,衍生出一条新的告警信息。同源关联告警关系表示对同一资源拓扑关系内无明显因果关系的一批告警信息进行归并,衍生出一条新的告警信息。

图1 告警关联分类图

因此,电力通信网络中的告警关联挖掘需要从海量原始告警信息中找出各类告警信息之间直接或间接存在的关联关系规律,从而提升告警定位的准确性。这种关联关系规律一般是从频繁出现的告警信息集合中找出集合内告警之间的内在关系,所以告警关联挖掘可间接转变为发现具有频繁模式特性的告警信息集合。

3 改进的GSP序列模式算法

3.1 GSP序列模式算法原理

GSP引入了滑动时间窗口、时间约束、分类层次等约束条件,比较适合通信网络中告警数据的频繁模式挖掘[11~16]。其主要算法过程如下。

1)设定原始序列集为S,最小支持度为Supmin;

2)设定i=1,遍历原始序列集S,生成长度Length=i=1,满足最小支持度Supmin的初始频繁序列集Li=1;

3)遍历长度Length=i的频繁序列集Li,通过连接操作和剪枝操作生成长度Length=i+1的候选序列集C_Li+1;

连接操作:若长度Length=n的两个频繁序列S1={s1,s2,…,sn}和,满足条件S1=,则S1和S2可通过连接生成长度Length=n+1的候选序列Ci+1=

4)遍历原始序列集S,计算候选序列集C_Li+1中每个候选序列的支持度,若支持度满足最小支持度Supmin,则将其放入Length=i+1的频繁序列集Li+1;

5)若Length=i+1的频繁序列集Li+1为空,表示无新的频繁序列产生,则算法结束;否则令i=i+1,重复步骤3)。

3.2 网络拓扑约束

在通信网络中告警的传播必然是沿着拓扑连接进行上下左右的扩散,因此将网络拓扑结构作为GSP算法的额外约束条件可以提高告警挖掘的针对性和有效性。

SDH传输网络作为电力通信的核心骨干层,是日常运行维护的重点监视对象。SDH传输网络中的实体类型主要有分插复用器(ADM)、同步数字交叉连接设备(DXC)、终端复用器(TM)、再生中继器(REG)以及传输线路(Trans Link)等。SDH传输网络中对数据信息的放大、复用和再生等操作,以及支路之间的交叉连接实现可通过这些传输设备来实现。在TM与TM之间物理链路上承载的是端到端业务通道。通过对SDH传输网络进行抽象,建立SDH的拓扑模型图,从而能够直观、明晰地反映网络中各组成部分之间的物理与逻辑关系,其可抽象为如图2所示的分层模型图。

图2 SDH网络分层模型示意图

通过采集SDH网管系统北向接口的配置信息,依据图2的分层模型构建相关的网络拓扑约束关系,在传统GSP序列模式算法中引入网络拓扑约束关系,可以有效降低噪音和数据缺失带来的不利影响,过滤掉可能存在逻辑错误的频繁序列,进而有效提高挖掘的效率与正确性。

3.3 改进的GSP告警关联挖掘过程

在具体实现过程中,利用电力通信网络收集到的海量原始历史告警数据,通过对告警的压缩、布尔化和归一化等预处理,消除数据冗余和不一致性。从网络拓扑数据库中分析网元设备之间的拓扑关系,生成网络拓扑模型。在进行告警关联规则挖掘和告警序列模式挖掘时,访问网络拓扑模型。若候选序列不在网络拓扑模型中,则说明候选序列中的设备网元之间不存在告警传输路径,可以过滤掉该候选序列。经过剪枝后的候选序列集可作为告警关联规则与序列经验库。从而为后续实时告警的相似性分析提供科学依据,最终实现根告警的准确定位。其告警关联挖掘过程如图3所示。

图3 告警关联挖掘过程图

4 算例分析

从某省传输网中获取一月内产生的原始告警信息65714个,分别采用传统GSP与改进GSP进行关联频繁序列的数据挖掘。在传统GSP算法中滑动步长采用定长时间,设定时间窗口大小为1600s,定长时间为940s,从而确保邻近的原始告警信息能够划分到同一个事务中。在改进GSP算法中以网络拓扑约束动态调整时间窗口的大小,尽量避免具有相关性的原始告警划分到不同的事务中。选择不同的最小支持度Supmin={0.7,0.6,0.5,0.4}分别对传统GSP和改进GSP进行测试。其测试对比结果如表1所示。

测试对比结果表明,在最小支持度Supmin=0.5时,改进GSP算法执行时间只是传统GSP算法执行时间的1/3,改进GSP挖掘出的频繁序列模式数量也只是传统GSP挖掘出的频繁序列模式数量的1.3%。可见网络拓扑约束的引入,从根源上能够有效过滤掉大量不符合网络实际拓扑的无用频繁序列模式,从而使得改进GSP在数据挖掘算法的速度与精度上均明显优于传统GSP。

表1 原始告警数据测试对比表

5 结语

告警监视是电力通信调度管理的重点要工作,也是运行检修的主要依据。在复杂、异质的电力通信网络结构中,各个设备网元之间相互影响。一旦网络出现故障,运行维护人员很容易淹没在一系列突发、海量的告警风暴中,从而延误了故障排除的时间。在实际电力通信网络中传统的通信告警关联挖掘方法由于其自身的局限性或多或少存在着缺陷,难以实现实用化。本文以电力通信网络的原始告警信息为研究对象,结合电力通信网络自身的拓扑结构特点,将网络拓扑约束引入到传统的序列模式挖掘中,大大减少了无用频繁序列模式的输出,有效提高了序列模式挖掘算法的速度与精度,保证了最终输出结果具有实际的指导价值。

采用通信告警实验数据对传统GSP与改进GSP进行告警关联的数据挖掘,测试结果表明改进的GSP在电力通信网络的关联分析中具有较好的适用性,为进一步研究通信告警关联挖掘奠定了一定的工程实践基础。后续工作中,将继续完善电力通信网络的分层模型,使得网络拓扑约束能够真实反映复杂网络环境下不同设备网元之间的真实连接关系,同时加大对原始告警信息的数据挖掘范围与深度,确保改进GSP算法能够指导实际的通信网络运行维护工作。

猜你喜欢

网络拓扑电力通信关联
新时期下5G移动通信技术在电力通信中的应用探析
电力通信技术的发展及展望
“一带一路”递进,关联民生更紧
奇趣搭配
电网运行风险评估与辅助决策系统的应用
智趣
自动化控制系统设计方法探索
电力通信设备的电源管理和运行维护
数据中心网络拓扑结构研究
一种FC网络管理软件的设计