基于GPON 系统的PON 保护设计
2022-01-06韩莉敏
韩莉敏
(武汉邮电科学研究院,湖北武汉 430070)
在当前的网络时代,人们对网络的使用频率逐渐上升,对网络的速度有了更高的要求[1]。吉比特无源光网络(Gigabit-Capable Passive Optical Networks,GPON)有着带宽高、接入业务全面的特点[2],能够提高用户的体验感受。GPON 系统使用光纤作为传输介质,传输距离至少达到20 km,且采用的光分路器最大有1:128[3-4]。对于运营商而言,GPON系统传输距离长、设备利用率高,有合理的价格优势。GPON 系统由于具有以上优势而有较大的市场需求量,它作为“最后一公里”的关键节点[5-6],一旦出现故障,会引起大面积的网络瘫痪,所以对于GPON 系统的保护方法的研究是非常必要的。为了尽量不影响业务,PON 保护的研究中最受关注的就是倒换时间[7]。
1 PON保护方案分析
1.1 根据保护范围
国际电信联盟电信标准化部门(International Telecommunications Union Telecommunication Standardization Sector,ITU-T)对GPON 系统制定了标准。下面介绍的4 种PON 保护方式,在G.984.1 标准的基础上进行了些许修改,厂家和运营商等可根据需求进行选择[8-9]。
A 类保护为主干光纤冗余保护,如图1 所示。OLT 的一个PON MAC 芯片通过1∶2 电开关与两个光模块相接。两个光模块连接2∶N光分路器的两根主光纤。该方法只对光模块和主干光纤进行了保护,且所使用的光模块较为特殊,实现较为不便。
图1 A类PON保护
B 类保护为PON 口和主干光纤冗余保护,如图2所示。OLT 的每个PON 口由一个光模块和一个PON MAC 芯片构成,这是最普遍的PON 口结构。该方法对独立的PON 口和主干光纤进行保护,且对现网的改变不大,实现较为简单。
图2 B类PON保护
C 类保护为全光纤保护,如图3 所示。该处使用了两个的1∶N的光分路器。ONU 采用一个PON MAC芯片和两个的光模块[10],C 类保护的ONU 需要特定的型号。该方法对OLT PON 口、主干光纤、光分路器、分支光纤和ONU 光模块进行冗余保护。保护范围较大,可靠性较好,但相比B 类保护,资源消耗较多。
图3 C类PON保护
D 类保护也为全光纤保护,如图4 所示。仍然使用了两个的1∶N的光分路器。ONU 采用两个PON MAC 芯片分别对应两个光模块,此类保护的ONU 也需要特定的型号。该方法对OLT PON 口、主干光纤、光分路器、分支光纤和ONU PON 口进行冗余保护。4 种方法中D 类保护范围最大,可靠性最好,但资源消耗也最多。
图4 D类PON保护
根据以上分析,B 类PON 保护方式具有一定的可靠性、成本较低,而且对于现网新增PON 保护影响不大[11],作为该文研究的主要方法。
1.2 根据组网方式
根据组网方式进行分类,也就是根据PON 保护的两个PON 口是否跨OLT 来决定。在1.1 节中全部在单台OLT 的情况下进行介绍。当PON 保护采用两台OLT 时,称之为手拉手保护方式[12-13]。以B 类保护为例,单台OLT 的组网如图2 所示,手拉手保护的组网如图5 所示。
图5 B类手拉手PON保护
手拉手保护将OLT 设备也加入保护范围,当OLT 产生故障或需要进行升级时,可以启用备用OLT,使得业务能够恢复[14]。
2 软件设计
2.1 系统整体软件结构
OLT 设备的系统整体软件结构[15]如图6 所示。
图6 系统整体软件结构
主控软件运行在主控盘上,实现各功能的总体控制,对各模块进行管理和维护,并向网管软件提供管理维护接口。
线卡软件运行在各个线卡上,实现各板卡的业务,各板卡实现的业务基于GPON、10GPON 等。线卡软件通过背板总线与主控软件进行通信。在此特别说明,文中实验所使用的线卡为双CPU。
上联盘软件运行于上联盘上,主要进行端口工作状态等信息的采集,并将这些信息上报到主控盘。上联盘软件通过背板总线与主控盘建立通信。
网管软件运行在网管服务器上,通过SNMP 协议和主控盘建立通信,并提供图形化的操作维护界面。
2.2 PON保护功能设计
2.2.1 保护组的创建与删除
PON 保护组的创建和删除在网管软件上进行。创建保护组时,主控盘配置模块接收网管下发的创建命令,包括保护组端口号、类型、组网等。并向保护组端口对应的线卡下发保护组创建命令。线卡配置模块收到主控下发的创建命令后,更新保护组数据,创建成功后上报保护组状态,主控盘更新保护状态。网管上则可以读取PON 保护组的工作状态。
删除PON 保护也是由网管下发给主控盘的配置模块,主控盘删除本地存储的保护组数据,并向保护组端口对应的线卡下发删除保护组的命令。线卡删除保护组数据,并使PON 保护控制模块删除底层芯片配置。
2.2.2 保护倒换
PON 保护倒换功能可以分为强制倒换和自动倒换。
强制倒换由网管来控制。主控盘收到强制倒换的命令后,根据组号发送给对应线卡。线卡首先判断是否为手拉手保护。非手拉手保护时,主口关闭光模块,备口打开光模块。当为手拉手保护时,需要判断主备口,若为主口则进行主口关光,并通知备端口开光;若为备口,则发送倒换消息到主口,从主口发起倒换流程。
自动倒换的触发条件有光信号丢失、光通信质量差、线卡不在位等。例如当触发LOS 告警时,线卡判断是否为板内保护,若为板内保护,则倒换模块直接进行倒换或通过RPC 传递倒换消息到备口;若不为板内保护,则发送至主控盘。主控盘判断是否为手拉手保护,若为非手拉手保护,直接判断PON 口,发送消息到备口对应线卡;若为手拉手保护,则通过UDP 协议转发到相应的OLT,对端OLT 接收到报文后,发送给相应的线卡进行处理。
2.2.3 状态回调和上报
PON 保护组有3 种状态:工作态、备用态和探测态。探测态是保护组的中间状态,比如保护组正在创建,或倒换后处于未知的状态。
在网管上可以对PON 保护组状态、PON 口的工作状态进行查询。线卡会向主控盘实时上报保护组的状态。当处于工作态的PON 口发出倒换消息,线卡上报主控盘,保护组进入探测态。直到一个PON口稳定在工作态,另一个PON 口稳定在备用态,则保护组再次进入工作态。
2.3 PON保护数据通道设计
主控盘与线卡之间已有的TCP/IP 协议用于各类数据消息的传递,但保护倒换消息的实时性要求高,采用这种传输通道可能会导致PON 保护倒换失败,所以对PON 保护通道进行了优化。
设计一种PON 保护专用的二层私有协议用于传输PON 保护的状态、告警以及倒换消息等。实验研究的线卡内拥有双CPU,而对包含主备CPU 的线卡,主CPU 和备CPU 分别与主控盘建立PON 保护专用二层数据通道。PON 保护数据通道如图7 所示。
图7 PON保护数据通道
主控盘传送同步数据时,首先会判断目的端口所在的线卡是否为双CPU,若为双CPU 则判断主备CPU,并向对应的CPU 直接发送同步消息,从而减少倒换时间,特别是对于保护组端口在备CPU 上的情况,不用经过主CPU 进行转发。非手拉手保护的板间倒换、手拉手保护倒换中,倒换消息都要经过线卡与主控之间的专用二层数据通道。而非手拉手保护的板内倒换,也分为在同一CPU 和不同CPU 间的情况。保护倒换在同一CPU 下的过程是最简单的,直接调用接口进行切换,倒换成功后再上报状态给主控;而不同CPU 的情况下,是通过远程过程调用(Remote Procedure Call,RPC)通道进行倒换消息的传递。
3 测试与结果
实验搭建的实验组网以手拉手保护为例,如图8所示。非手拉手保护在此基础上减少一台OLT。
图8 手拉手保护组网
此处的两台交换机是为了减少所使用的仪表口,减少资源的利用,从而方便测试。
实验为了全面测试各传输通道,需要对PON 保护组各种情况都进行测试。根据保护组端口的分布,要对以下情况进行测试:
1)非手拉手保护模式:板内同主CPU、板内同备CPU、板内一主一备CPU、板间同主CPU、板间同备CPU、板间一主一备CPU。
2)手拉手保护模式:板间同主CPU、板间同备CPU、板间一主一备CPU。
测试内容主要有强制倒换和断纤倒换,以下将以非手拉手保护模式的板间一主一备CPU 和手拉手保护模式的板间同备CPU 为例,分别进行强制倒换和断纤倒换的实验。
3.1 非手拉手保护模式
在非手拉手保护模式下,板间一主一备CPU 时,进行强制倒换实验。测试情况如下,首先下发PON保护组配置,如图9 所示。
图9 保护组配置
PON 保护组创建成功后可在网管上显示其状态,如图10 所示。
图10 保护组状态查询
如图11 所示,通过TestCenter[16]模拟数据流,进行强制倒换后,通过查看仪表显示的丢包数计算出倒换时间。
图11 丢包情况
根据数据传输速率8 446 fps,以及上行数据流丢包数量210 fps可以计算出最大丢包时间约为24.8 ms。
重复倒换操作多次,记录每次的倒换时间,分析结果发现倒换时间能够保证在50 ms 以内。
3.2 手拉手保护模式
在手拉手保护模式下,板间同备CPU 时,进行断纤倒换实验。测试情况如下,首先对OLT1 和OLT2分别下发PON 保护组配置,如图12 所示。
图12 OLT1&OLT2保护组配置
手拉手PON 保护组创建成功后暂不可在网管上查看状态,通过命令行可以在两台OLT 上查看其状态,如图13 所示。
图13 保护组状态查询
线卡上查看状态时,是直接到相应的CPU 上进行查看,所以主控对应的PON 口号9-16,在备CPU上则显示1-8。
如图14 所示,通过TestCenter 模拟数据流,进行断纤倒换后,通过查看仪表显示的丢包数计算出倒换时间。
图14 丢包情况
根据数据传输速率8 446 fps 和上行数据流丢包数量246 fps 可以计算出最大丢包时间约为29.1 ms。重复倒换操作多次,记录每次的倒换时间,分析结果发现倒换时间能够保证在50 ms 以内。
在大量的倒换测试中,有时发现丢包时间能够在10 ms 以内,根据分析这时OLT 处于空闲状态,即除了本实验的PON 保护业务,基本无其他业务进行。
4 结论
在实验与结果中仅对两种情形的测试过程进行了描述。实际上实验对所有情景下都进行了强制倒换和断纤倒换的测试。
实验结果表明基于双CPU 线卡的保护倒换功能能够正常进行,倒换时间能够保证在50 ms 以内,且当OLT 空闲时倒换时间能够达到10 ms 以内。由于资源有限,实验组网采用交换机将ONU 端进行了汇聚,在这一情况下有可能会增加倒换时间。