告警管理数据采集层详细设计
2016-12-21刘向峰
■文/张 宇 刘向峰 王 薇
告警管理数据采集层详细设计
■文/张 宇 刘向峰 王 薇
本文对移动网管中的告警管理子系统要完成的功能进行简要说明,按照层次式的思想对告警数据的采集层进行了分析,并对数据采集模块给出了详细设计方案。
移动通信;告警管理;数据采集层
告警管理子系统是移动网络管理系统中的一个子系统,它主要功能是从全省所有移动设备中采集各种与设备运行有关的告警数据,经加工处理后产生各种告警统计分析报告,同时也负责对全省所有移动设备的告警监视和分析,为维护部门和管理部门提供信息,指导网络工程规划和网络调整,改善网络运行质量。
1.告警管理子系统概要说明
由功能需求说明书确定功能分割与公共模块的提取结构,如图1。子系统分为基本、呈现、处理、设置、知识库五个部分。
1.1 基本部分
负责接收告警数据并将其拆分、存储。负责过载处理。
1.2 呈现部分
负责对告警数据根据要求呈现,给出用户友好的界面使用户很方便处理。
1.3 处理部分
负责声音告警、告警确认、派发工单。
1.4 设置部分
告警复位义:对网元类型、所属厂商、告警类型等进行复位义。系统按照可能原因、网元类别、网元识别码、原告警类型、告警级别、时间类型等条件及各种条件的组合来设置。告警级别分为严重告警、主要告警、次要告警、警告告警;告警级别定义对于厂家设备不同定义不同,以实际数据为准。告警类别分为通讯告警、环境告警、设备告警、处理错误告警、服务质量告警。
告警过滤:网元类型、告警类型的过滤,有告警对象、告警级别、过滤模式、确认模式四种设置模式。对某一地区内同一网元类型的所有对象过滤。并可以对同一网元类型的单个或多个告警信息过滤;对同一网元类型的所有对象过滤。
相关性的定义:合成告警条件的设置(例:单位时间产生过多、产生的时间过长(没有处理))。
告警前转定义:前转方式、前转前提条件、对脚本的维护。
声音告警:声音的响应标准(例:先等级后次序的原则),等级对应的声音设定。
图1 告警管理子系统功能结构图
日志:告警日志设置。
告警显示:告警排序设置:排序条件、升降等。告警字段设置:显示字段的先后顺序。
1.5 知识库
对知识库数据的查询、增加、修改、删除、导出提供友好的界面和便捷的接口。
2.告警数据采集模块设计
2.1 告警原始数据采集量算法:
2.1.1 网元数据
告警原始数据是本地所有网元产生的告警信息在一段时间内的总和。因为告警的产生具有很大的随机性,所以选取一个相对极限值。按每个网元每天产生1500次告警计算。每条告警信息一般是一百多byte,按500byte计算。比如某地区网元数达到217个,我们以220个网元为例计算,据此估算告警数据的存储量需求。按用户要求,原始数据存储六个月,汇总数据存储十二个月。
告警原始数据总和=500B*1500*220*180=29.7G
注:500byte为每条告警信息占用量;
1500次告警为每网元每天告警次数;
220为全省网元数;
180天为六个月。
告警汇总数据总和=29.7/6*0.2*12=11.88G
注:29.7/6为每月的告警原始数据;
0.2 为汇总数据与原始数据的压缩比;
12为12个月。
综上所述,网管系统的存储介质采用RAID 0+1技术的冗余备份方式,并预留一部分临时空间作为临时表存储,数据库管理的加乘系数为1.8,则该地区网管系统需要的硬盘存储量至少为:
(626.4+250.56+29.7+11.88)*2*1.8+300= 3606.75G
2.1.2 网管中心与网元之间传输故障数据带宽计算:
每个网元每天发生告警数为随机数,每个告警数据大约是几百字节,在出现大规模告警的峰值情况,因为告警信息要求实时传送,所以FM数据对数据传输带宽的影响也很大。如上节计算,每条告警数据约为500byte,在某些严重告警出现时,会发生很多与之相关的关联告警,以出现100个关联告警为例,如需要在30秒内传送出去,则网络带宽需要为500*8*100/30»15kbps,在链路中传输的数据加入传输开销比特,网络带宽需为20kbps。
图2 告警数据采集模块流程图
2.2 告警数据采集模块的详细设计
告警数据采集模块流程如图2:
下面主要从方式、接口及原始数据存储方式三个方面进行说明。
2.2.1 采集方式
我省网管系统对具备厂家操作维护中心(OMC)的地区,通过操作维护中心(OMC)采集数据,对没有操作维护中心的地区,可采用直联网元的方式采集数据。对现有设备升级为智能网设备的网元或具有GPRS功能的网元通过原有设备所属OMC采集数据,新增的智能网设备通过智能网功能管理域采集数据。
在现有条件下,数据的采集可以有多种方式,可能的方法包括:从GSM厂商的OMC数据库中采集数据;从GSM厂商的OMC文件中采集数据;从CMIP代理获取数据;从GSM厂商的MSC或BSC上采集数据;从一定功能管理域采集数据。
新增的SSP、SCP、SCE、SMP、SMAP、充值中心等智能网设备统一纳入智能网管理域,由其提供数据接口到省网管系统。
其他方式:对于不能自动采集的数据,可以通过手工输入来完成,力保数据的全面性、准确性。
2.2.2 接口要求
根据集团公司的规范,接口将采用Q3或CORBA接口,但由于集团公司接口模型尚未确定,因此Q3及CORBA接口暂时不能实现。一旦集团公司接口模型确定,网管开发商及厂家均要实现Q3接口或CORBA接口。
对于现状,各厂家根据自己的实际情况充分提供接口,开放数据库和文件,供采集层采集数据。对于文件型的数据,必需提供FTP协议或相关协议,以及文件说明,字段说明。
对于数据库中的数据,必需提供TCP/IP协议,以便用ODBC连接数据库或其它相关协议,同时对数据库中的表及关联关系和字段加以说明。
对于实时告警,各厂家均要提供解决措施,采取相关接口,使实时告警能够前转到省网管系统。
2.2.3 原始数据存储方式
根据规范,采集来的原始数据要统一保存在省网管的原始数据库中,对于从OMC或网元采集来的数据库格式的表,保存在省网管原始数据库时,要求表的名称及字段名及类型仍保留原型,对于采集上来的数据文件,采集程序能够将其中的数据转换为数据库的表形式,统一保存在省网管的原始数据库中。
辽宁移动网管系统在2002年3月15日开始在全省试,采集到的数据在数据处理模块能得到及时地处理,不会造成数据的堆积,保证了系统的实时性。在功能上说,目前的移动网络管理系统主要实现了对GSM900/1800网中网元(MSC/ GMSC/HLR/BSC/BTS)的管理功能。总体上说,这样的网络管理系统只是实现了真正网管意义上的一些初级功能,在现在移动业飞速发展的今天,它面临着诸多问题和挑战。
[1] 孙青卉,王钧铭.移动通信技术[M].北京:机械工业出版社,2009:7-38.
[2] 孟洛明,亓峰.现代网络管理技术[M].北京:北京邮电大学出版社,2010:2-29.
[3] 陈建亚.现代通信网监控与管理[M].北京:北京邮电大学出版社,2010:2-48.
[4] 陈德荣,林家儒.数字移动通信系统[M].北京:北京邮电大学出版社,2010:62-75.
[5] 孟洛明.通信网网管系统建设中的基本问题、现状和发展[J].通信世界:电信网管专题,2010(7):2-4.
[6] 杨玉,王文辉.网管系统在移动通信网络中的应用及问题[J].通信世界:电信网管专题,2010(7):9-13.
(作者单位:沈阳农业大学理学院)
TN915.07
A
1671-0134(2016)11-054-03
10.19483/j.cnki.11-4653/n.2016.11.022