运营商网管系统五项监控全力支撑春节保障
2011-11-14中国移动天津公司李荣盛
中国移动天津公司 | 李荣盛
根据经验,春节的专题监控通常是从业务量监控、网络运行质量监控、重要客户服务监控、省际互联监控、网间互联监控等五大方面展开。
作为中国最传统、最重要的节日,春节对于电信运营商来讲,是一年一度的重点保障时期,全网各个部门均会进行多方面的网络运行保障。在春节保障中,OSS系统发挥了非常重要的作用。从宏观全局的监控、细节告警的监控,再到问题处理的运维流程承载均需要网管系统的有效支撑。
在春节期间,电信运营商支撑系统的能力要求与平时相比还存在着一定差异。首先,从系统用户层面,平时基本由一线监控人员负责网络运行监控;而在春节期间,通常由公司高管带队进行监控,这样要求支撑系统能够提供从不同视角监控网络的能力。其次,在关注重点方面,平时更多地关注于网络的实时运行质量、设备运行质量;而在春节期间,会更偏重于网络运行性能的监控。
鉴于此,对于春节期间的支撑系统保障,通常可以划分为例行监控支撑与节日监控支撑两大方面。其中,对于例行监控而言,与日常的网络监控没有明显区别,各网管支撑系统在此方面无需进行调整即可满足工作需要。对于节日监控支撑,由于通常会受到网络发展、业务发展的影响,每年的监控主题也会存在一定的差异性。
根据经验,春节的专题监控通常是从业务量监控、网络运行质量监控、重要客户服务监控、省际互联监控、网间互联监控等几大方面展开。笔者在此根据往年的经验进行适度总结,并形成一些专题设计思路,供同行参考。
业务量监控
业务量监控,通常以话务量、短信收发量作为核心监控内容,同时可以进一步细分为历史同期累积对比监控与历史同期趋势跟踪对比监控两大呈现形式(如图所示)。
考虑到春节的特殊性,此类业务量的监控,通常会选取从大年三十的凌晨两点至初一凌晨两点这24小时作为重点监控时间段。根据经验,初一凌晨两点以后业务量会大幅回落,网络负荷趋于平稳。实际上,经过春节假期的调整,近年来初一零点的话务激增比呈逐年下降的趋势。
那么,通过对业务量的历史同期累积对比(通常是选取最近两年的同期数据作为参照)可以有效地突出历史同期业务量总量的变化。通过历史同期趋势跟踪对比监控掌握每个小颗粒时间段的业务量变化,直观地把握话务负荷高峰的变化趋势。
此类业务量的监控是每年节假日监控的必备内容,因为它对于掌握全网的负荷情况有着非常直观的呈现能力,利于管理层把握全局状况;从用户定位上,其更偏重于管理层。
省际互联监控
在中国的节假日中,以中秋节和春节省际互联方面的话务负荷波动影响最为明显。为了更好地掌握各省的省际互联情况,网管部门通常会通过“逻辑GIS+逻辑拓扑”的形式来呈现省际互联运行质量。通过对阻断情况、负荷情况方面的监控,及时地进行网络参数的调整,保障省际互联的运行质量。
图 历史同期累积对比监控与历史同期趋势跟踪对比监控
网络运行质量监控
网络运行质量监控,由于春节期间,话务模型相较日常会发生明显的变化,特别是从短信业务开通以来,短信量逐年递增,其对于网络的负荷冲击非常大。由此,在例行的对设备故障监控的基础上,会更多地关注实时的网络运行关键指标监控。网管人员通常会选取寻呼成功率、网络接通率、掉话率等几个较能反映网络运行情况的指标进行实时监控。
综上,每当春节期间,伴随着短信量的攀升,会导致寻呼成功率下滑,通过实时的监控,能够及时地启动应急预案,对网络参数进行调整,保证网络的整体运行质量。
重要客户服务监控
随着通信市场竞争的加剧,对于客户服务质量的保障要求也越来越高,特别是针对重点客户,由于其业务特征更明显,关注度也就越高。运营商网管人员通常可以将各个重点客户的监控信息汇聚为一个矩形,通过整体的客户矩阵监控,直观地把握各个重点客户的当前服务质量。当关键服务质量产生波动时,系统将通过颜色的变化及时提示监控人员进行跟进处理。
当然,对于很多重点客户的客户侧设备,还缺乏良好的监控手段,同时集团客户对于节假日期间的话务模型变化也非常明显,这都对有效监控提出更新、更高的挑战,还需要不断地深入研究,才能进一步提升客户服务的监控能力。
网间互联监控
互联互通一直以来都是各个运营商重点关注的内容,春节期间则可以通过逻辑拓扑来实时地监控网间互联的运行情况,其重点可以从话务量、接通率、每线负荷等几个指标展开。
通过以上OSS系统在春节期间对整体运维保障几个方面的支撑作用的简要分析,可以看到,由于各省情况不同,其保障手段也不尽相同。但总体来讲,其核心都是通过尽可能直观的方式将重要信息呈献给不同层次的监控人员,使得大家能够一目了然地把握网络运行质量,及时应对各种突发状况,作出网络调整,尽最大可能保障网络运行质量,并满足最终用户的通信需求。