宽带接入网无源故障的主动发现和定位研究
2022-10-11蔡林峰戴斌王亮中国电信股份有限公司江西分公司云网支撑事业部南昌市0029
蔡林峰 戴斌 王亮 中国电信股份有限公司江西分公司云网支撑事业部 南昌市 0029
万宏谋2 中国电信股份有限公司江西分公司云网运营部 南昌市 330029
1 问题描述
传统宽带故障的监控定位,基于宽带PON网管实现,定位最小颗粒是宽带接入设备的端口--PON口,但每个PON口通常接无源分光器OBD 4-8个,每个OBD可接入4-8个用户,即一个PON口下有16-64个用户。其中单个OBD的故障或OBD的光路故障,在PON口上并不产生告警,网管无法监控定位。实际上,OBD故障(含连接它的主光路)占宽带片障的比例比较大(约47%),对客户感知影响大。基于PON网管监控的宽带故障定位,颗粒大,在以3个用户宽带同源故障即为片障的监测方面,存在较多的遗漏。
2 解决过程
通过对所有单个宽带、ITV用户的申告信息的实时AI分析处理,实现OBD颗粒级别的故障主动发现,要求实现宽带故障主动发现精度达到3个用户的级别。步骤如下:
采用对所有单个光宽带ONU(光猫)的掉线信息的实时数据分析处理,实现了分光器故障主动发现,宽带3个用户以上的片障主动发现率提升到了95%。
2.1 故障发现
“片障”,是指影响3个及以上用户的网络故障,因为颗粒细,数量庞大(每月150万次)。其中有源故障部分(PON口及以上部分),系统通过将PON网管、IP网管告警信息与资源系统用户信息关联,可实时分析设备告警影响的用户情况,生成用户片障单,进行故障管控处理。
对于宽带无源部分(PON口以下)的二级分光故障,通过ONU状态关联分析,对同时超3个用户ONU断纤、PON口无用户在线、PON口下不在线用户超阈值、PON口下同时申告用户超阈值进行分析及片障发现,实现对宽带片障影响的用户、关联的申告用户、未关联宽带片障的潜在申告用户进行监控,主动处理故障。如图1所示。
图1 无源片障分析流程
实现原理:①系统实时监控处理PON网管中所有ONU离线告警数据,在排除PON设备、板卡级别的情形、排除PON口告警的情形(主光路中断);②对剩余的掉线ONU进行大数据实时聚类:是否在同一个二级分光器内,有3个ONU同时断线。如是,查询该二级分光器下ONU在线状态,如果是断纤(LOS),则判该二级分光器光纤断;③生成告警,并在告警系统中关联资源系统该二级分OBD ID,派故障单给服保系统进行故障处理。系统实现原理如图2所示。
图2 宽带二级分光故障数据分析处理流程
2.2 故障恢复
判定为二级分光故障后,系统轮询监测AAA平台上故障用户的上线状态(是否上网在线),结合现场修障人员通过APP反馈的修复状态,如该二级分光下的ONU有用户上线,则认为该二级分光段故障恢复,释放故障状态,解除跟踪。
2.3 判别依据
在随机事例中,有一类现象,只产生两种互斥的结果,如某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。这种随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量(Dichotomous Variable)的离散型随机事件。它的发生概率,可以由二项分布(Binomial Distribution)对这类随机事件的规律性进行描述。
一般地,如果随机变量服从二项分布,n次试验中正好得到k次成功的概率由二项分布计算公式给出:
宽带接入网二级无源分光器的故障状态,只有两种随机状态,要么是中断,要么不中断。扣除割接、电源故障引起的中断情况以后,线路中断、分光器老化引起的故障是随机发生的,因此满足二项分布。
实际中OBD上用户关联(即OBD-ONU关联)的准确率为68%,当3个ONU故障聚类到同一OBD,同时发生中断,则该OBD发生故障的概率为:
如上所述,根据同一OBD以下的3个ONU同时断线,则可判定属于该二级分光故障的准确率为96.7%。
将OBD无源片障定义到(10秒-60秒之间均可)一分钟内同PON口下ONU同时断纤大于3且PON设备本身无故障告警,则判断为二级分光故障以后。系统调取网络资源系统数据,建立网络拓扑结构图,进行OBD可视化展现,便于现场的定位处理,如图3所示。
图3 定位到PON以下的二级分光单元
3 实施效果
为提升片障主动发现,将智能片障分析的触发提前到用户申告之前,进一步开展无源片障主动分析工作,通过对天翼网关掉线、告警,通过PON口、时间段等进行聚类、触发同时掉线分析,进行片障预警,抢在用户申告前触发片障预警信息,进行申告拦截,发起主动维护。比申告触发的片障分析量提升80%,完整率95%以上。显著减少了客服10000号的宽带、ITV用户的申告和投诉数量(全省由每月23.5万次减少为14.5万次,下降38%)。
客服系统片障自助拦截量,从每月的2124次,增长每月17529次,增幅达8.6倍,说明大量宽带用户申告时故障已经在处理当中,先于用户发现故障,大大缩短了业务中断时长,提升了客户感知。图4是宽带无源故障定位功能上线后的申告拦截量增长情况,图5是宽带无源故障主动发现量的占比情况。
图4 系统月均片障拦截数量
图5 无源片障拦截数量对比
4 结束语
关于宽带的无源故障定位,武汉邮科院提出了一种部署OBD以下的光分支检测信号,进行物理检测的方法(专利《一种无源光接入网络中支路故障定位的装置和方法》2018年——CN105577458A),这种方法硬件成本高;华为提出一种终端设备掉电或者正常关电时,判断是设备故障还是线路故障的方法(专利《一种无源光网络的故障定位方法及系统》2010年——CN101345581A),这种方式可实现PON口级别的故障定位,不能进行PON口以下的二级OBD无源故障定位。本文基于数据分析的方法具有成本低、准确率高的优点。