APP下载

PTN网络故障诊断流程故障定位思路探讨

2014-03-05杨晶晶程荣

现代电子技术 2014年3期
关键词:故障定位

杨晶晶+程荣

摘 要: 针对PTN网络的特点,结合目前电信网络管理的发展趋势,在综合考虑PTN网络故障诊断处理方式的基础上,设计了一个通用的PTN网络故障诊断流程,对该故障诊断流程中故障定位部分的详细设计思路以及具体实现方法做了进一步的阐述,使该诊断方式能够用于PTN网络进行及时故障诊断。

关键词: PTN网络; 故障诊断流程; 故障定位; 专家系统知识库

中图分类号: TN915.07?34 文献标识码: A 文章编号: 1004?373X(2014)03?0022?02

Discussion on fault location thought in PTN network fault diagnosis process

YANG Jing?jing1,2, CHENG Rong1

(1. Fiber home Communication Technologies Co., Ltd., Wuhan 430073, China;

2. Wuhan Research Institute of Post and Telecommunications, Wuhan 430074, China)

Abstract: Aiming at the feature of PTN networks, and combine with the development tendency of telecommunications network management in current, a general PTN network fault diagnosis process is designed, which is based on overall consideration of PTN networks fault diagnosis process method. The detailed design thought and implementation method of fault location during the fault diagnosis process are analyzed, so that the diagnosis can be carried out in a timely manner for PTN network to deal with the fault.

Keywords: PTN network; fault diagnosis process; fault location; expert system knowledge base

在电信事业蓬勃发展的今天,电信网络管理技术正朝着综合化、分布化、智能化的方向发展[1]。而故障管理作为网络管理中最基本的功能之一,其智能化的要求也受到越来越多的关注。在PTN网络中,传统的依靠人工经验进行故障诊断的方法正逐步向智能化方向演变。本文设计的故障诊断流程是根据专家们的故障处理经验,将以前人为的诊断过程固化成为流程和规范,让系统代替人员操作,使人类专家的领域知识突破时间和空间的限制,在不同的地区和部门帮助故障处理人员及时的解决分组传送网(PTN)网络产生的故障。

1 故障诊断流程总体介绍

在PTN网络中,由于设备量以及业务量的巨大,一个故障的发生往往会伴随产生大量的告警,要在如此众多的告警中分析出故障发生的具体原因同时又要保证其分析效率,首先就需要对众多的告警进行一系列的处理,然后根据处理后的告警定位故障发生的大致范围,最后再在这个范围内进行相应的检测,从而定位故障发生的具体原因,如图1所示为故障诊断的整体流程图。

在该故障诊断流程中,可以将故障诊断分为两大部分,一部分为告警处理,另一部分为故障定位。告警处理部分主要是分析产生的众多告警是否存在某种相关性关系[2],在这里,把这种相关性关系称作根源告警和衍生告警的关系,通过这种关系可以对告警进行筛选,从而找到主要的告警即根源告警。在告警处理部分,告警校验是保障,告警预处理分派是前提,告警相关性处理是关键,知识库为告警相关性处理提供判定的规则和标准[3]。故障定位部分是根据根源告警进行相应的性能,配置,告警以及操作管理维护(OAM)检测,从而找到故障发生的具体原因。在故障定位部分,可以将故障的定位机制分为两部分。一部分是通过性能配置以及相关的告警检测定位到设备相关状态的故障;另一部分利用PTN设备独有的OAM检测定位到链路发生的故障。

2 故障定位设计思路

在PTN网络中,设备状态以及链路状态的相关故障是导致网络出现故障的主要原因,所以要将故障定位到具体的原因就需要对这两方面进行具体检查。首先进行设备状态相关的检查,包括检查设备相应的性能,配置以及与该告警相关联的其他告警,然后再利用OAM进行链路状态的检查。

图1 故障诊断流程图

在进行设备状态检测时,由于不同的单盘或端口的性能,配置以及告警数据不同,所以在进行故障定位的时候既要考虑到故障定位的效率,避免对所有设备的性能,配置以及相关的告警数据进行逐一检查,同时又要保证其通用性,使其能够囊括典型的性能,配置以及相关的告警数据,基于这两者的考虑,特制定了故障场景。在故障定位场景中,将常见的故障制定成典型的场景,再根据场景的不同,将每个典型场景中需要检查的性能,配置以及告警相关项的数据进行归类与总结,然后再依据一定的规则依次进行性能,配置以及告警的检测。

如果进行了前一方面的检测,但是并不能找到故障发生的具体原因,那么分析故障发生的具体原因可能并不在设备上,这时利用OAM检测中的链路环回(LB)的方法可以对业务传送的链路情况进行分析,判断是否是链路出现故障,从而对故障发生的原因进行定位。

针对链路故障诊断,是利用OAM发送以及接收LB报文的情况来判断。以前发送LB报文是利用人工的方式在每两个网元之间进行目的发送,现在根据业务传输的路径,将该业务路径上的所有的网元都找出来,然后自动的根据距离的远近依次向该业务路径中的每个节点网元都发送LB报文进行检测,根据接收到的LB报文的情况可以定位发生故障的链路。

如果所有项都检查完成,但是发现这些数据都是正确的,那么这时系统会给出其他的故障原因,这些其他的故障原因可能是由于外界的环境或者是人为的操作失误引起的。

3 故障定位实现方法

故障定位部分实现的重点在于,故障定位场景的建立。这里故障场景的建立不仅包括典型场景的归纳还包括在进行检测时采用何种标准和规则进行数据的检查。本文将常见的工程中需要覆盖到的业务中断类场景,业务性能劣化类场景以及其他类的场景进行细化,概括出典型的场景见表1。

表1 故障场景

[1.温度故障类\&7.连接确认信号丢失类\&2.信号丢失类\&8.高阶通道踪迹标识适配类\&3.激光器关断\&9.低阶通道踪迹标识适配类\&4.丢包类\&10.光模块不在位类\&5.PK_LOS过限类\&11.单盘失效类\&6.CRC过限类\&12.电源故障类\&]

在故障定位场景中进行数据检查的时候,需要运用专家系统中知识库建立的方法[4],将故障定位场景中性能,配置以及相关告警检查项的内容采用一定的标准进行规范制定成相应的规则[5]写入知识库中,然后在知识库中根据指定的规则进行逐一的检查。由于场景以及场景中检查的内容不同,其规则也不同。虽然每个检查项的判定规则不同,但是这些判定规则制定的标准是类似的,就是将设备在运行时产生的数据值与设备本身设置的数据值进行大小比较,看看设备在运行时产生的数据值是大于,等于或是小于设备本身设置的数据值。由于每个检查值的范围不同,有可能是大于产生故障,有可能是小于产生故障,有可能是等于产生故障,不管比较的结果是怎么产生故障,但是其基本要求都是要求设备在正常的工作值范围内。

采用故障场景的方式来进行故障检查,可以大大的提高故障诊断的效率,但是由于目前场景的种类还不够齐全,所以暂时不能分析不常发生的故障。但是,在知识库中,这个故障场景具有自主学习的能力,知识库中的故障场景还可以随着经验的累积从而不断的积累。故障处理人员只需要将首次不能分析的告警记录在知识库中,那么下次发生的时候便可以运用上次记录的知识进行相应的分析。

4 结 语

本文运用专家系统知识库的思想以及OAM检测的思想制定了PTN网络故障诊断中故障定位部分的流程,并详细的介绍了该部分的设计思路与实现方法,提出了故障场景定位分析法去分析设备产生故障的原因。但是该系统依然存在一些不足之处,随着日后技术的发展,相信故障定位智能化的程度会越来越高,帮助人们更加完善的管理PTN网络。

参考文献

[1] 张晓颖.电信网络管理的现状及未来发展趋势探索[J].中国新技术新产品,2011(24):34?35.

[2] 马秀丽,王红霞,张凌云.网络故障管理系统中告警相关性分析实现技术研究[J].沈阳理工大学学报,2009(3):9?14.

[3] 吴扬扬,陈怀南.基于关联规则的通信网络告警相关性分析模型[J].通信和计算机:中英文版,2004(1):57?60.

[4] 邵军力,张景,魏长华.人工智能基础[M].北京:电子工业出版社,2000.

[5] MAS C, THIRAN P. A review on fault location methods and their application to optical networks [J]. Optical Network Magazine, 2001, 2(4): 8?10.

[6] 董成根,吴今培,张其善.一种通信网络故障主动管理方法[J].现代电子技术,2011,34(11):124?126.

针对链路故障诊断,是利用OAM发送以及接收LB报文的情况来判断。以前发送LB报文是利用人工的方式在每两个网元之间进行目的发送,现在根据业务传输的路径,将该业务路径上的所有的网元都找出来,然后自动的根据距离的远近依次向该业务路径中的每个节点网元都发送LB报文进行检测,根据接收到的LB报文的情况可以定位发生故障的链路。

如果所有项都检查完成,但是发现这些数据都是正确的,那么这时系统会给出其他的故障原因,这些其他的故障原因可能是由于外界的环境或者是人为的操作失误引起的。

3 故障定位实现方法

故障定位部分实现的重点在于,故障定位场景的建立。这里故障场景的建立不仅包括典型场景的归纳还包括在进行检测时采用何种标准和规则进行数据的检查。本文将常见的工程中需要覆盖到的业务中断类场景,业务性能劣化类场景以及其他类的场景进行细化,概括出典型的场景见表1。

表1 故障场景

[1.温度故障类\&7.连接确认信号丢失类\&2.信号丢失类\&8.高阶通道踪迹标识适配类\&3.激光器关断\&9.低阶通道踪迹标识适配类\&4.丢包类\&10.光模块不在位类\&5.PK_LOS过限类\&11.单盘失效类\&6.CRC过限类\&12.电源故障类\&]

在故障定位场景中进行数据检查的时候,需要运用专家系统中知识库建立的方法[4],将故障定位场景中性能,配置以及相关告警检查项的内容采用一定的标准进行规范制定成相应的规则[5]写入知识库中,然后在知识库中根据指定的规则进行逐一的检查。由于场景以及场景中检查的内容不同,其规则也不同。虽然每个检查项的判定规则不同,但是这些判定规则制定的标准是类似的,就是将设备在运行时产生的数据值与设备本身设置的数据值进行大小比较,看看设备在运行时产生的数据值是大于,等于或是小于设备本身设置的数据值。由于每个检查值的范围不同,有可能是大于产生故障,有可能是小于产生故障,有可能是等于产生故障,不管比较的结果是怎么产生故障,但是其基本要求都是要求设备在正常的工作值范围内。

采用故障场景的方式来进行故障检查,可以大大的提高故障诊断的效率,但是由于目前场景的种类还不够齐全,所以暂时不能分析不常发生的故障。但是,在知识库中,这个故障场景具有自主学习的能力,知识库中的故障场景还可以随着经验的累积从而不断的积累。故障处理人员只需要将首次不能分析的告警记录在知识库中,那么下次发生的时候便可以运用上次记录的知识进行相应的分析。

4 结 语

本文运用专家系统知识库的思想以及OAM检测的思想制定了PTN网络故障诊断中故障定位部分的流程,并详细的介绍了该部分的设计思路与实现方法,提出了故障场景定位分析法去分析设备产生故障的原因。但是该系统依然存在一些不足之处,随着日后技术的发展,相信故障定位智能化的程度会越来越高,帮助人们更加完善的管理PTN网络。

参考文献

[1] 张晓颖.电信网络管理的现状及未来发展趋势探索[J].中国新技术新产品,2011(24):34?35.

[2] 马秀丽,王红霞,张凌云.网络故障管理系统中告警相关性分析实现技术研究[J].沈阳理工大学学报,2009(3):9?14.

[3] 吴扬扬,陈怀南.基于关联规则的通信网络告警相关性分析模型[J].通信和计算机:中英文版,2004(1):57?60.

[4] 邵军力,张景,魏长华.人工智能基础[M].北京:电子工业出版社,2000.

[5] MAS C, THIRAN P. A review on fault location methods and their application to optical networks [J]. Optical Network Magazine, 2001, 2(4): 8?10.

[6] 董成根,吴今培,张其善.一种通信网络故障主动管理方法[J].现代电子技术,2011,34(11):124?126.

针对链路故障诊断,是利用OAM发送以及接收LB报文的情况来判断。以前发送LB报文是利用人工的方式在每两个网元之间进行目的发送,现在根据业务传输的路径,将该业务路径上的所有的网元都找出来,然后自动的根据距离的远近依次向该业务路径中的每个节点网元都发送LB报文进行检测,根据接收到的LB报文的情况可以定位发生故障的链路。

如果所有项都检查完成,但是发现这些数据都是正确的,那么这时系统会给出其他的故障原因,这些其他的故障原因可能是由于外界的环境或者是人为的操作失误引起的。

3 故障定位实现方法

故障定位部分实现的重点在于,故障定位场景的建立。这里故障场景的建立不仅包括典型场景的归纳还包括在进行检测时采用何种标准和规则进行数据的检查。本文将常见的工程中需要覆盖到的业务中断类场景,业务性能劣化类场景以及其他类的场景进行细化,概括出典型的场景见表1。

表1 故障场景

[1.温度故障类\&7.连接确认信号丢失类\&2.信号丢失类\&8.高阶通道踪迹标识适配类\&3.激光器关断\&9.低阶通道踪迹标识适配类\&4.丢包类\&10.光模块不在位类\&5.PK_LOS过限类\&11.单盘失效类\&6.CRC过限类\&12.电源故障类\&]

在故障定位场景中进行数据检查的时候,需要运用专家系统中知识库建立的方法[4],将故障定位场景中性能,配置以及相关告警检查项的内容采用一定的标准进行规范制定成相应的规则[5]写入知识库中,然后在知识库中根据指定的规则进行逐一的检查。由于场景以及场景中检查的内容不同,其规则也不同。虽然每个检查项的判定规则不同,但是这些判定规则制定的标准是类似的,就是将设备在运行时产生的数据值与设备本身设置的数据值进行大小比较,看看设备在运行时产生的数据值是大于,等于或是小于设备本身设置的数据值。由于每个检查值的范围不同,有可能是大于产生故障,有可能是小于产生故障,有可能是等于产生故障,不管比较的结果是怎么产生故障,但是其基本要求都是要求设备在正常的工作值范围内。

采用故障场景的方式来进行故障检查,可以大大的提高故障诊断的效率,但是由于目前场景的种类还不够齐全,所以暂时不能分析不常发生的故障。但是,在知识库中,这个故障场景具有自主学习的能力,知识库中的故障场景还可以随着经验的累积从而不断的积累。故障处理人员只需要将首次不能分析的告警记录在知识库中,那么下次发生的时候便可以运用上次记录的知识进行相应的分析。

4 结 语

本文运用专家系统知识库的思想以及OAM检测的思想制定了PTN网络故障诊断中故障定位部分的流程,并详细的介绍了该部分的设计思路与实现方法,提出了故障场景定位分析法去分析设备产生故障的原因。但是该系统依然存在一些不足之处,随着日后技术的发展,相信故障定位智能化的程度会越来越高,帮助人们更加完善的管理PTN网络。

参考文献

[1] 张晓颖.电信网络管理的现状及未来发展趋势探索[J].中国新技术新产品,2011(24):34?35.

[2] 马秀丽,王红霞,张凌云.网络故障管理系统中告警相关性分析实现技术研究[J].沈阳理工大学学报,2009(3):9?14.

[3] 吴扬扬,陈怀南.基于关联规则的通信网络告警相关性分析模型[J].通信和计算机:中英文版,2004(1):57?60.

[4] 邵军力,张景,魏长华.人工智能基础[M].北京:电子工业出版社,2000.

[5] MAS C, THIRAN P. A review on fault location methods and their application to optical networks [J]. Optical Network Magazine, 2001, 2(4): 8?10.

[6] 董成根,吴今培,张其善.一种通信网络故障主动管理方法[J].现代电子技术,2011,34(11):124?126.

猜你喜欢

故障定位
城市轨道交通供电直流侧短路故障定位技术探讨
小电流接地系统故障定位技术研究
基于配电网故障停电管理系统的设计与应用研究
基于GIS的电力系统光缆故障快速定位研究
测控区和非测控区并存的配电网故障定位实用方法
探讨智能配电网故障快速定位与故障恢复
电力电缆故障定位的探讨
CDMA 网络IP 问题故障定位研究
配网自动化系统小电流接地故障定位方法分析
国内常用的通信检修定位方法探究