APP下载

浅谈先于客户发现宽带障碍的新方法

2020-09-14周庆华熊振斌陈浩中国电信股份有限公司江西分公司网络运行维护部南昌市330046

江西通信科技 2020年3期
关键词:轮询网管分光

周庆华 熊振斌 陈浩 中国电信股份有限公司江西分公司网络运行维护部 南昌市 330046

0 背景

随着“宽带中国”、“全光城市”等战略的实施,江西电信光宽带用户规模不断扩大,全省网管管理ONU数量接近650万,每个月10000号的宽带用户申告量居高不下,希望通过运维手段来降低宽带用户申告,减轻10000号座席话务压力。同时随着农村宽带用户的规模发展,大量农村宽带用户出现故障,第一报障渠道不是拨打10000号申告,而是找装维工程师报障,导致大量故障工单循环在系统之外,障碍处理时限和质量无法得到管控,较大影响用户感知,因此急需一种先于客户发现宽带障碍的新方法来解决以上问题,提升用户感知。

1 总体架构

1.1 诊断流程

通过PON网管系统轮巡ONU状态,自动识别出掉电、断纤状态,并自动过滤掉由于OLT、板卡、PON口或者一二级分光器故障引起的ONU故障,精准定位出故障点。

图1 用户故障精准诊断全流程示意图

(1)轮询采集全网所有FTTH ONU,找出所有断电、断纤故障;

(2)针对OLT故障、OLT pon板卡故障、PON口故障,找出符合条件的ONU;

(3)针对GIS系统的ODN数据进行ODN分析,过滤一、二级分光故障;

(4)在派单前进行批量端到端(PON网管部分)诊断测试,找到外线故障ONU;

(5)针对ODN进行分析,排除二级OBD断纤故障告警(有3个以上的ONU断纤);

(6)通过Webservice接口派单给10000号、装维工程师。

1.2 关键技术

(1)全网FTTH ONU状态轮询采集

FTTH ONU状态轮询采集模块独立封装、部署及运行,高频度状态轮询,确保ONU状态采集实时性及准确性。

(2)基于数据仓库模式的告警管道过滤

系统轮询全网OLT获取ONU状态信息,并实时更新MySQL数据库中ONU状态值,数据处理模块建立数据模型,根据特定算法定期查询OLT、板卡、PON口是否存在故障,通过数据管道算法进行告警过滤,过滤掉片障影响的ONU。

(3)高并发端到端实时故障诊断测试

通过批量测试模块实时批量测试验证,与OLT上的ONU状态信息进行比对,将二次验证的数据进行存储并派单。

(4)基于一级、二级分光器ODN诊断分析

根据分光器下O N U是否在线智能判断分光器故障,自动过滤ODN分光器故障数据。

(5)48小时告警池自动维护

系统具备告警自动清理功能,故障在一定时限内无需二次派单,对于不在告警池内的告警进行增量派单。

2 实施关键点

2.1 接口对接封装

打通PON网管与综合告警系统、综合资源系统、ITMS平台、10000号、CRM等多个系统接口,将用户信息、资源信息、终端信息、设备信息、用户申告情况汇集进行大数据建模分析,建立用户资源树,实现全流程端到端诊断。

2.2 采集架构改造

图2 改造前的系统采集架构

改造前的PON网管采集架构是基于AMQP协议的消息引擎和独立的Nodes集群结构,状态轮巡集成在性能采集模块monet、设备发现模块disco当中,轮询的进程数据通道是与monet采集进程绑定在一起,没有校验机制,往往会因为性能数据采集导致状态入库超时等情况。为此,我们改造采集系统架构,将轮巡ONU状态模块独立,同时增加校验机制,实现ONU状态轮巡独立运行,准确进行ONU状态的轮询。下图为改造后的系统架构,蓝色部分为ONU状态轮巡模块,独立部署在新的云服务器上,作为独立进程运行,轮询采集ONU状态信息。

图3 改造后架构

2.3 大数据建模分析

(1)过滤有源告警

用户ONU离线有可能是由于上层的片障导致的,比如OLT离线了,OLT PON板故障,PON口LOS告警等。系统轮巡全网OLT获取ONU状态信息,并实时更新MySQL数据库中ONU的状态值,数据处理模块根据特定算法,定期查询OLT、板卡、PON口是否存在故障,通过后台数据管道算法进行告警过滤,过滤掉片障影响的ONU。

(2)过滤ODN故障

图4 ODN诊断测试

根据ONU状态建立ODN诊断测试分析模型,同步GIS系统一、二级分光器的资源信息,针对同一个二级分光器下只要有ONU在线,则该二级分光器正常;同一PON口下只要有ONU在线,则该一级分光器正常。将ODN分光器故障数据和正常ONU掉电数据进行过滤,仅保留正常情况下的ONU断纤告警。

(3)过滤二级OBD故障

由于GIS资源数据准确性在80%左右,网管无法根据GIS资源准确找到二级OBD下的光猫数据,无法根据光猫状态准确判断二级OBD是否存在故障,只能给出疑似故障,网管先过滤出PON口下所有断纤的光猫数据,再根据光猫最后一次离线时间进行过滤(将离线时间超过48小时的数据过滤),如果存在两个同一时间离线的光猫,则判断该PON口下存在疑似二级OBD故障,带出该PON口下所有的二级OBD信息并标注疑似故障的二级OBD及带出光猫LOID信息,方便运维人员处理故障。

3 实施效果

先于客户发现宽带故障方法经过景德镇乐平县试点后逐步推广至全省,在用户发现故障拨打10000号申告前派单给装维工程师处理,降低了10000号话务坐席的话务压力,减少了话务人员、话务设备的投入,实施效果明显。根据统计,全省推广之后先于客户发现故障派单量达到了每天3000张,用户拨打10000号并派装维的工单明显下降,派申告量下降35.6%,皮线故障原因占比由11.6%下降至4.32%。

4 结束语

近两年江西正在规模推进秀美乡村建设、城乡改造、创文创卫等政府主导的工程,先于客户发现宽带故障方法在应对新常态的突发性市政施工导致通信中断积累了经验,为探索降低用户申告,实现智慧运维提供了新思路,对于兄弟省份而言,具有可实施性和一定的参考实用价值。

猜你喜欢

轮询网管分光
两种分光光度法测定茶类产品中茶多酚含量的比较
基于等概率的ASON业务授权设计∗
给水网管的优化布置研究
紫外分光光度法测定红枣中Vc的含量
依托站点状态的两级轮询控制系统时延特性分析
利用时间轮询方式操作DDR3实现多模式下数据重排
紫外-可见分光光度法测定多糖铁复合物的铁含量
北京市中小学网管教师培训需求研究
“五制配套”加强网管
紫外分光光度法测定曲札芪苷的解离常数