流氓ONU产生原因及解决方案
2016-12-12闫飞刘萱毛宇黄涌梅
[闫飞 刘萱 毛宇 黄涌梅]
流氓ONU产生原因及解决方案
[闫飞 刘萱 毛宇 黄涌梅]
PON是光接入网的主流技术,流氓ONU是PON网络运营维护中的故障难点。文章提出了一种流氓ONU预防、监测和隔离的系统解决方案,可以保证PON网络业务稳定、安全、高效地运行。
吉比特无源光网络 光线路终端 光网络单元 光功率监测
闫飞
毕业于基辅国立航空大学计算机专业,在北京邮电大学电子工程学院获工程硕士学位,在中国电信集团长期从事传输、接入网的技术研究与网络规划工作。
刘萱
毕业于华中理工大学获学士学位,在中国电信广东分公司从事接入网规划和建设工作。
毛宇
毕业于南京邮电学院获硕士学位,在中国电信广州研究院从事宽带接入技术研究和规划工作。
黄涌梅
毕业于重庆邮电学院,在中国电信广州研究院从事宽带接入技术研究和规划工作。
2013年8月17日,中国国务院下发了《国务院关于印发“宽带中国”战略及实施方案的通知》(国发〔2013〕31号)将“宽带战略”上升为国家战略。
按照“宽带中国”战略的要求,工信部领导电信、移动和联通等大型通信运营商开展了“宽带中国专项行动”,加大了铜缆接入网改造为光接入网的进度。根据工信部发布的《通信业经济运行情况》,到2015年9月底,中国光纤接入(FTTH/0)用户突破1亿户大关;到2016年1月,中国光纤接入FTTH/O用户总数已达到1.2亿户,占宽带用户总数的比重达到58%。
光接入网以PON技术为主,具有全程无源、带宽高、抗干扰性强等特点。随着光接入网的规模和光用户的增长,基于PON技术的光纤到户网络已经成为运营商占比最大的接入网模式,光接入网的故障处理也成为运营商需要面对的重要课题,其中流氓ONU又是光接入网故障处理的难题之一。本文提出了一整套预防、检测流氓ONU的解决方案。
1 PON网络结构和技术原理
PON网络由局端设备(OLT)、光分配网(ODN)和光网络终端(ONU)三部分组成。OLT的PON端口连接一根光纤至分光器(OBD)合路侧端口,在从OBD的多个支路侧端口使用一根光纤连接至ONU。为了能够在一根光纤上承载多个用户的业务,PON系统采用了波分复用和时分复用技术。
在下行方向(OLT向ONU发送数据),PON系统采用1490nm的波长,通过广播方式将所有数据发送给每个ONU,各ONU根据下行数据的标识信息接收属于自己的数据,丢弃其他用户的数据;在上行方向(ONU向OLT发送数据),PON系统采用1310nm波长(与下行方向波长不同),通过时分复用方式在一根光纤中传送多个ONU的上行业务。各ONU上行数据分时发送,每个ONU的发送时间与长度由OLT集中控制。
图1 PON技术原理
ITU-T和IEEE在GPON、EPON的技术标准中制定了点到多点协议,采用了测距、时间窗口授权、光发射器突发发射和关断等机制,防止多个ONU在发送数据出现冲突。OLT为每个ONU分配了可以发送上行数据的时间段,只有在该时间段内,指定的ONU才可以发送数据。
2 流氓ONU类型及影响
由于PON系统在上行方向采用时分复用技术,所有ONU必须在OLT指定的时隙内发光才能使PON系统正常工作;不在OLT指定的时间段内发光的ONU,如长发光、乱发光的ONU将造成上行信号冲突,这类ONU统称为流氓ONU。
根据流氓ONU的发光现象,又可以分为以下几类:
(1)长发光ONU
上电后在任意时刻一直保持发送光信号的ONU。当系统中存在长发光ONU时,故障现象为一个PON端口下仅有少量ONU可以正常注册,或者多个ONU反复注册。
图2 长发光流氓ONU对正常ONU的影响
(2)不在规定时间段发光的ONU
这种流氓ONU发送上行数据仍然受OLT控制,但其发光时间与OLT指定的时间不一致。这种流氓ONU对系统的影响相对较小,不定时的影响同一个PON口下的其他ONU,导致其他用户网速下降;流氓ONU自身的网速一直受影响。
图3 不在规定时间段发光的光流氓ONU对正常ONU的影响
(3)占用其他ONU的ONU ID/LLID的流氓ONU
这种流氓ONU发送上行数据仍然受OLT控制,也与OLT指定的时间一致,但是会与同一个PON口下的其他ONU在同一个时间段内发光。这种流氓ONU产生原因是(以EPON系统为例):OLT为每个ONU分配唯一的LLID。OLT通过GATE帧向每个LLID分配不同的上行时隙进行调度,避免冲突;OLT监测ONU状态,当OLT判断某个ONU不在线时,回收LLID并分配给新上线ONU。在某些情况下原来的ONU a并不认为自己已经下线,而OLT又把该LLID分配给了新上线的ONU b,在OLT向ONU b分配上行时隙时,ONU a会使用同样的时隙发送上行数据,a和b两个ONU的上行业务冲突,导致ONU b无法正常发送上行业务。
图4 ID冲突的流氓ONU对正常ONU的影响
这种流氓ONU只影响一个特定的正常ONU,导致一个用户网速异常。
3 流氓ONU的解决方案
解决流氓ONU的思路主要有两种:
3.1 通过对优化ONU ID/LLID的分配机制来防止流氓ONU的产生
这种优化机制主要针对第3类强占ONU ID/LLID的流氓ONU,防止系统中的ONU ID/LLID,其解决思路是将PON系统在分配ONU ID/LLID时,通过算法将ONU的ONU ID/LLID散列到ONU ID/LLID允许的范围内,具体如下(以EPON系统为例):
(1)正常的EPON系统注册过程:①OLT广播GATE帧通知未注册ONU开窗时间;②未注册ONU发送REGISTER_REQ帧,其中包含ONU的MAC地址;③OLT给ONU分配LLID,并通过REGISTER帧通知该ONU,ONU确认完成注册。
(2)一般来说,OLT会顺序分配LLID,从OLT的空闲LLID中选择最小的数值分配给新上线的ONU。如果这个LLID被类型3的流氓ONU使用,就会出现LLID冲突的情况。
(3)解决这种流氓ONU的思路是OLT不再顺序分配LLID。比如:当未注册ONU发送的REGISTER_ REQ帧后,OLT获取到ONU的MAC地址;OLT通过哈希算法计算出ONU的LLID值(比如采用除数取余法,LLID=ONU_MAC_Address MOD P(其中p=65536),如果计算出的LLID未被使用,则分配给该ONU;如果计算出的LLID已被使用,则二次探测法LLID LLID=ONU_ MAC_Address MOD P+1,重新计算一个LLID)。这样可以避免数值小的LLID反复使用,将LLID值较随机的分布在0~65535这一区间内,防止因ONU故障导致的LLID重复导致的上行数据冲突问题。
或者OLT建立一个ONU MAC地址、LLID、老化时间的地址表,当某个ONU下线时,OLT并不马上回收对应的LLID,而是经过一个老化周期后再回收进行重新分配。
表1 MAC地址与LLID对应关系及老化时间
3.2 加强对流氓ONU的检测,进行定位和隔离
通过网管对ONU光功率和误码进行监测,来检测系统中是否存在流氓ONU,并进行定位和隔离。具体方案如下(以EPON系统为例):
(1)在网管上建立ONU ID/LLID、OLT接收ONU的光功率、ONU上行帧的误码周期监测任务,并维护一张对应关系表(此表格应保存较长时间内曾经注册过的ONU),判断是否有流氓ONU产生。
表2 MAC地址与LLID对应关系及误码表
多次比较连续两个周期的数据,每次比较的结果均出现以下现象时可以判断ONU对应的PON端口下可能存在流氓ONU:
① 如LLID、MAC地址无变化,某个或多个ONU的平均收光功率较上一周期有所提升,且BIP编码错误值同步提升。
② 同一个PON口下多个ONU下线,未下线的ONU BIP编码错误数量有所上升
(2)判断流氓ONU类型进行定位
当系统比较两个周期的数据,出现只有一个ONU的光功率增加且BIP编码错误帧数上升时,可以判断此时有强占LLID的流氓ONU存在。系统根据表格可以定位到被强占LLID的ONU,强制正常ONU下线,不回收这个LLID正常ONU再次上线时,OLT不会再将这个LLID分配给正常ONU;同时,OLT将该LLID的上下行带宽均设定为最小值(64kbps),以此强制用户手动重启ONU。
当网管系统判定某个PON口下存在流氓ONU时,可以通过以下步骤判定流氓ONU的类型:
① OLT发送PAUSE帧给所有ONU,仅保持ONU处于激活状态但不发送任何数据。OLT在此时间段内采集PON端口收到的发光功率,如果光功率不为0,则可以判断此PON口下有长发光且不受OLT控制的流氓ONU存在。此类流氓ONU无法通过系统判断来定位,应向外线工作人员派工单,通过逐个拔纤的方式来定位并隔离流氓ONU;如果在步骤①中PON口收到的光功率为0,进入步骤②。
② OLT逐一关闭列表内各ONU的光模块,使其进入07状态(紧急停止状态)一段时间,如果此时故障仍然存在,则判断该ONU不是流氓ONU,等待其回到02状态(待机状态)并关闭下一个ONU的光模块;如果关闭了某个ONU的光模块后,PON系统工作正常,其他ONU可以正常注册并应答OLT的消息,则可判定被关闭光模块的ONU为流氓ONU。此时,应在网管上将次ONU的LOID设置为非法,阻止其正常注册,并由外线人员为用户更换新的ONU。
4 结束语
本文提出了一种预防、检测和定位流氓ONU的系统解决方案,通过对PON系统ONU ID/LLID分配机制的优化来防止强占ONU ID/LLID流氓ONU的产生;利用网管的光功率和误码监测判断流氓ONU的存在,并通过PON管理消息对流氓ONU进行定位和隔离。本文提出的解决方案可以应用于PON网络的建设和维护,从而保证PON系统承载的业务高效稳定。
10.3969/j.issn.1006-6403.2016.11.013
(2016-08-18)