综合网络管理告警系统
2017-10-23张福庆
◎狄 健 张福庆
综合网络管理告警系统
◎狄 健 张福庆
项目背景
随着公司业务的不断发展,公司形成了广播电视传输基本业务﹑数字电视增值业务﹑宽带双向交互业务和基于有线电视网络的网络服务业务四大主营业务。公司力争走出一条主业突出﹑多业并举的多元化经营之路,全力打造全新的数字电视新业态。面对多种多样的业务接入,公司的运营网络已经分成了数据城域网﹑SDH传输网络﹑波分传输网﹑大客户专网等网络平面。为了更好的监控和管理各种网络接入设备,也为了提高接入用户的网络保障,针对各种网络,安装了各种网管系统,如管理传输类的网管系统T2000,管理数据城域网的网管系统N2000,管理EPON无源光网络的网管系统U2000,管理个机房电视信号环网的HFC网管等等。目前各类网管独立运行,当发生如机房断电,光缆中断等物理类故障时,导致同一机房的有源设备或经过同一光路由的业务同时告警,导致值班人员不知所措,找不到发生问题根本原因。
解决方案
针对该问题的发生,吉视传媒长春分公司开发了一套综合网络管理告警系统,该系统利用SNMP协议,从各类网管中采集相关的告警信息,并做根源性的分析,统一的处理。为每一种网络故障分配一定的权值,如停电告警和无光告警的权值高于业务中断告警,业务中断告警高于业务流量过高告警,这样,当高权值的告警引发低权值的告警时,只上报高权值告警,这样减少由同一故障源引发的设备告警条目,使故障定位更精准,更及时。此外,我们还将各类设备和各类业务所经过的光缆录入系统,这样,当出现机房停电和光缆中断时,会直接报告具体中断的光缆位置,而不再报告中断的业务进而人工分析断缆位置。如下图:
此外,网管不仅采用常规的声光告警,还采用发送Email和短信的多重告警,第一时间通知相关负责人员,缩短抢修时间,提高网络品质。
目前,该套系统已经部署在吉视传媒股份有限公司长春分公司数据城域网中,通过该套系统对公司各类网络设备实时监控,可对整个网络的性能与质量进行宏观的判断,排除潜在的网络故障隐患,减少甚至杜绝故障的发生。同时在网络发生故障时,能够智能分析故障源,精准定位故障位置,缩短抢修时间,提高网络品质。
总结
综合网络管理告警系统是吉视传媒股份有限公司长春分公司自主研发的,研发经费为零,研发周期较短。该系统是针对吉视传媒股份有限公司长春分公司环网的特殊需求,专门定制的,所以具有免安装﹑易操作等优势,大大降低了系统的安装﹑维护等成本。该系统可以7×24小时不间断的监控公司在线网络设备,当由同一故障源引发的多重告警时,会过滤掉次级告警,而只上告高级告警,甚至直接报告停电的机房或者光缆中断的位置,同时在故障发生时第一时间通过短信或者电话通知网络管理人员大大缩短了故障抢修时间,为公司增加经济效益,树立用户口碑。
(作者单位:吉视传媒股份有限公司长春分公司)