基于大数据的通信系统故障定位方法
2020-11-11王伟
王 伟
(河南工业贸易职业学院 信息工程系,河南 郑州 451191)
0 引 言
通信系统用于完成信息传输,通常借助电磁波在自由的立体空间中通过传播或导引媒体传输信息。在通信系统发生故障时,传统方法是通过人工巡检各个系统的内部结构,以目测的方法找出故障发生的具体位置[1]。人工目测的方式不仅会消耗大量的人力和时间,带来物力和财力的额外支出,而且已经完全无法适应现代化的通信系统需要[2]。基于此,本文结合现代化的大数据技术开展对通信系统故障定位方法的设计研究。
1 通信系统故障定位方法设计
1.1 通信系统输入数据源的选取与处理
在定位通信系统故障位置前,本文将通信系统中的通信网管子系统、OMS ERP管理子系统以及通信资源管理子系统作为通信系统的原始数据源。在通信网管子系统实时发送的告警信息中,找出与继电保护通信告警信号相关的信息进行匹配,从而对故障点所在保护装置内的通信系统进行初级阶段的判断[3]。通信系统故障发生时,多向通信通道会发出相应的告警信号,此时罗列OMS ERP管理子系统中的告警信息,并与通信告警信号信息一一对应。在分析通信系统中的故障路径后,可更加准确地识别出故障问题发生的具体区域。
在选取通信系统输入数据源后,通信系统的各个子系统的数据源还需要进行结构化处理。不同的数据信息类型在设置相应的数据库时应当进行统一的存储和管理,再将多项数据进行统一建模[4]。对于数据源的结构化处理,需要按照存放数据信息的规则将其进行统一放置,然后针对当前数据源中的非结构化数据解析其原始文件,并提取原始信息展开后续的存储工作[5]。
根据通信系统各个子系统的数据源数据类型,按照不同的故障主体进行统一的定位和组织,实现维度表和事实表的设置,从而完成对通信系统输入数据源的结构化处理。
1.2 通信系统故障区域判断
完成对通信系统输入数据源的选取和对数据源中数据进行结构化处理后,如果多条保护通信系统的传输通道同时发出告警信号,则利用系统中告警信号通道对应的名称调出OMS ERP管理子系统中对应通信通道的具体路由走向形成路由连接拓扑结构,并利用大数据分析技术进行分析。当通信系统发生故障问题时,处于故障中的设备会与该传输链路上与之相关的信息一同发出通信告警信号,因此对应通信设备中路由连接拓扑结构最多的交汇点即为故障设备的具体发生位置,由拓扑结构中的多条链路围绕形成的区域即为通信系统出现故障问题的区域。在实际应用中,通信系统故障可能在路由连接拓扑结构的一个站点或一条线路上,所有连接线段表示为能够实时发出告警信号的通信保护通道,箭头指向方向为不同通信保护通道的路由走向。通信系统中若干个通信保护通道的部分路由走向如图1所示。
图1 通信系统中通信保护通道的部分路由走向图
图1中,线路LAF、线路LBG以及线路LCH均为通信路由走向,其中线路LBG和线路LCH的通信保护通道均配备直达的路由和迂回的路由两种走向。线路LBG的直达路由路径为B→G,迂回路由路径为B→E→G和B→D→G;线路LCH的直达路由路径为C→H,迂回路由路径为C→E→H。
将各条线路保护通道直达路由设置为保护通道A,将迂回路由设置为保护通道B。当线路LBG的保护通道A和线路LCH的保护通道B同时发出告警信号时,告警信号在传输通道的最多交汇位置出现通信系统故障问题的概率最大。
1.3 基于大数据的通信系统故障点动态实时监控
结合大数据中的改进贝叶斯算法定位通信系统保护通信故障时,先从通信系统的网管子系统中提取历史信息进行数据清洗处理。数据清洗处理完成后,纠正出现错误的数据并将其直接用于数据分析处理的优质数据样本资源。通过对数据样本进行大数据挖掘处理,分析每种可能存在的故障问题的发生概率以及发生故障问题时对应的告警信号。
计算每个故障贝叶斯的疑似度,并输出最大概率的疑似故障。发生概率是疑似故障的发生次数与总共统计的故障次数之间的比值。根据上述论述,得出疑似故障的发生概率为:
式中,C(pi)为通信系统疑似故障的发生概率,pi为通信系统疑似故障,k(pi)为通信系统疑似故障的发生次数,k(p)为总共统计得出的通信系统传输通道故障次数。
完成对通信系统疑似故障的发生概率计算后,还要将通信系统网管子系统中的告警信号按照时间顺序进行排列,并生成由所有故障问题组成的原始告警信号集合。在原始告警信号集合中,按照告警信号中的数据信息依次搜索,最终将搜索出的频繁程度的告警信息组成告警信息集合。根据上述两个步骤计算各类数据信息,从而得出故障的定位结果。
2 实验论证分析
2.1 实验准备
将某调控中心接收到的400 kV通信线路告警信息作为实验对象,根据企业实际运维经验,设置告警事件的时间间隔为5 min,根据通信系统数据维度获取数据库中有关告警信息维度的所有数据信息定位通信系统故障。本次实验在MATLAB软件平台上进行,提出的定位方法与传统定位方法均采用相同的网络环境和设备参数:实验平台的系统内存为IntelCore6-280 64 GB,操作系统为Windows2020.VS2018CPU,内置X2500中央处理器。试验进行时,先向通信系统添加2 000个正常节点,再添加500个故障节点,后将通信系统故障告警信号的提取频率设置为156.57 kHz。两种定位方法采集到的故障告警信号采样频率幅度如图2所示。
2.2 实验结果与分析
按照上述实验环境,通过本文故障定位方法与传统故障定位方法完成对500个故障节点的定位,从而对比两种故障定位方法在实际应用中的性能。具体的,将本文提出的基于大数据的通信系统故障定位方法设置为实验组,将传统故障定位方法设置为对照组,两组实验方法对500个故障节点的定位结果对比如表1所示。
图2 两种定位方法故障告警信号采样频率幅度图
表1 两组实验方法对500个故障节点定位结果对比表
从表1可以看出,本文设计的通信系统故障定位方法能够高精度定位实验对象中500个存在故障问题的节点,而传统定位方法无法找出存在故障问题的全部故障节点,且故障定位正确个数与实验组相比较低。实验证明,本文提出的基于大数据的通信系统故障定位方法具有更高的定位精度,能够有效保障通信系统的稳定运行。
3 结 论
长期以来,通信系统的故障定位都难以解决,且通信系统一旦出现故障将会威胁整个工厂或企业的稳定运转。通过设计研究基于大数据的通信系统故障定位方法,利用先进的大数据分析技术实时监控故障点,一定程度上解决了通信系统故障定位中存在的技术难题,有效提高了故障定位的可靠性和时效性。