基于城域网与GPON组网的OLT双上联流量均衡研究与应用*
2018-09-29廖伟全喻林峰李继龙周圆圆
廖伟全,喻林峰,李继龙,江 圣,周圆圆
(中国移动通信集团广东有限公司韶关分公司,广东 韶关 512099)
0 引 言
GPON(Gigabit-Capable PON)主要由 OLT、无源光分配网和ONU组成,是基于ITU-TG.984.x标准的无源光综合接入标准。GPON具有高带宽、高效率、大覆盖范围、用户接口丰富等众多优点,促成OLT承载更多的功能业务[1]。GPON采用单纤双向传输机制,在同一根光纤上使用WDM技术,用不同波长传输上下行数据,其中下行数据流采用广播技术,上行数据流采用TDMA技术。
城域网一般由核心层、汇聚层和接入层构成。以广东某运营商为例(如图1所示),城域网设备主要有CR、BNG、SR和SW等,GPON以FTTx形式出现,并主要承载运营商的家宽、专线和IPTV等业务。为实现业务保护,OLT双上联城域网被运营商列入备选建设拓扑[2]。因各种业务双路由承载协议不同,对OLT双上联链路有效利用提出了挑战。当双上联链路出现不均衡时,将影响链路数据包时延,严重时将影响用户感知。因此,需要对OLT双上联链路均衡方案进行研究和分析应用。
图1 某运营商城域网与GPON拓朴
1 OLT主要业务双上联承载情况
1.1 互联网专线双上联保护及承载介绍
城域网与GPON组网中,互联网专线业务流为PC-ONU-OLT-SW/BNG,专线客户均是公网地址接入。接入方式分为双上联城域网SW场景和双上联BNG场景。在OLT直联BNG场景中,通过VRRP+BFD进行OLT双上联保护,可提高主链路中断时链路切换到备用链路的速度和可靠性[3];而在OLT双上联SW场景中,双上联保护通过在SR/BNG与OLT之间配置单臂BFD+VRRP协议来实现主备保护。当OLT到SR之间多段链路中断后,业务切换到另一条链路[4]。如图1所示,当OLT01-SW01-SR01之间出现断点,会触发BFD协议down,从而使SR01下联端口down,引发VRRP倒换,业务切换到OLT01-SW02-SR02链路承载。上述保护中,专线业务在某一时刻只能使用主链路承载业务,备用链路是空闲,但也可以通过平均分配VRRP网关到两台BNG/SR来基本实现双路由负载分担[5]。
1.2 PPPoE双上联保护及承载介绍
城域网与GPON承载的宽带接入业务ADSL主要采用PPPoE协议进行认证上线。PPPoE协议认证的工作流程包含发现和会话两个阶段,如图2所示。
图2 PPPOE客户端认证流程
1.2.1 发现阶段
(1)客户端在本以太网内广播一个PADI包,包中包含主机想要得到的服务类型信息;
(2)以太网内的所有BRAS/BNG设备(PPPoE接入服务器)在收到初始化包后,将其中请求的服务与自己能提供的服务进行比较,其中可以为此主机提供此服务的宽带远程接入服务器发回PADO包;
(3)客户端可能收到多个BRAS/BNG的PADO包,主机通过PADO的内容,依据一定的条件从发回PADO包的可提供服务的BRAS/BNG中挑选一个(一般选择最先到达),并向它发回一个会话请求包PADR(非广播),这个包中再次包含所想得到的服务信息;
(4)被选定的BRAS/BNG收到会话请求包PADR后,开始准备进入PPP会话阶段。它会产生一个会话标识,以唯一标识它和主机的这段PPPOE会话,并把这个特定的会话标识包含在会话确认包PADS中发回给主机。如果没有错误发生,就进入到PPP会话阶段。而主机在收到会话确认包后,如果没有错误发生,也进入到PPP会话阶段。
1.2.2 会话阶段
会话阶段和数据传送阶段与PPP协议相同。主要是BRAS/BNG将客户的帐号、密码、VLAN/逻辑接口信息传递给AAA服务器进行认证,通过认证后,BRAS分配地址给客户,然后就可进行数据通信。
现有通过实时监测OLT下联口链路质量和流量,然后用贪婪算法周期性调整OLT下联口带宽占用量,以进行流量均衡[6],但对OLT双上联均衡却停留在基于MAC奇偶地址的负载均衡。当OLT双上联两台BRAS/BNG时,PPPoE协议在发现阶段会选择最先到达的PADO包进行下步认证通信。通过在BRAS01/BNG01子接口上对偶MAC地址客户配置接入延时(如延时100 ms),而在BRAS02/BNG02子接口上对奇MAC地址客户配置接入延时(如延时100 ms)。上述设定将使BRAS01/BNG01的PADO包先于BRAS02/BNG02到达奇MAC地址客户,并使奇MAC地址客户选择BRAS01/BNG01进行后续的认证和通信,即选择路由OLT到BRAS01/BNG01承载数据流量。反之亦然,偶MAC地址客户选择路由OLT到BRAS02/BNG02承载数据流量。上述在BRAS/BNG配置奇偶接入时延,将使奇偶MAC用户数据在OLT双上联链路进行负载分担。
1.3 IPTV业务双上联保护及承载介绍
IPTV业务一般包含点播和直播业务。点播和直播实现协议有所区别。点播仍使用单播路由协议,而直播使用组播路由协议。
1.3.1 点播双上联保护与承载介绍
视频点播有多种认证方式。为便于控制,现在运营商一般采用DHCP开机认证接入[7]。广东某运营商点播客户端认证流程如图3所示。
图3 点播业务认证流程
(1)用户开机,发出DHCP Request。
(2)BRAS设备收到DHCP Request先缓存下来,将用户的VLAN、逻辑端口等信息向Radius Server上报。
(3)Radius Server根据BRAS设备送来的逻辑端口、用户名、密码进行认证,并将认证结果返回给BRAS设备。
(4)如果认证通过,BRAS完成DHCP Relay功能,并中转用户发出的DHCP Request。
(5)DHCP Server下发IP地址给用户。
(6)用户获取地址后,客户可正常使IPTV平台进行点播。
通过在BRAS01/BNG01子接口上对偶MAC地址客户配置接入延时(如延时100 ms),而在BRAS02/BNG02子接口上对奇MAC地址客户配置接入延时(如延时100 ms)。上述设定将使BRAS01/BNG01分配的地址先于BRAS02/BNG02到达奇MAC地址客户,并使奇MAC地址客户选择BRAS01/BNG01分配的地址进行后续通信,即选择路由OLT到BRAS01/BNG01承载数据流量。反之,亦然,偶MAC地址客户选择路由OLT到BRAS02/BNG02承载数据流量。通过上述配置,将使奇偶MAC点播用户在OLT双上联链路进行基于奇偶MAC地址的负载分担。
1.3.2 直播双上联保护与承载介绍
PIM是Protocol Independent Multicast(协议无关组播)的简称,可利用单播路由协议生成的单播路由表为IP组播提供路由。组播路由与所采用的单播路由协议无关,只要能够通过单播路由协议产生相应的组播路由表项即可。PIM借助RPF(Reverse PathForwarding,逆向路径转发)机制实现对组播报文的转发。当组播报文到达本地设备时,首先对其进行RPF检查。若RPF检查通过,则创建相应的组播路由表项,从而进行组播报文的转发。当OLT双上联BNG时,将根据BNG组播子接口的PIM优先级选举一台BNG复制组播流量到OLT。当一条链路故障时,自动切换到另一路由。而在OLT01-SW01-BRAS01场景中,OLT只能逻辑上单上联一台SW01。当主链路有问题时,采用手工切换方式将链路切换到另一条OLT01-SW02-BRAS02路由。因此,直播只能占用一边链路传输数据包。
2 OLT双上联流量均衡分析和应用
2.1 OLT双上联流量均衡分析
经统计某运营商城域网流量情况,网络忙时超过90%流量是家宽、点播和直播业务。此三种业务导致OLT双上联流量不均因素有:
(1)直播业务只能走OLT单边链路;
(2)不同用户对应的网络流量存在差异;
(3)OLT承载的PPPoE和IPoE用户MAC奇偶数比值不对称(可达到1:2及以上),使两台BRAS/BNG接入用户数量和流量不对称。
针对第三点,广东揭阳某运营商提出优化方案(下面简称揭阳方案),分别在配对的两台BRAS/BNG中,给OLT的每个外层VLAN配置2个子接口。利用这两个子接口按100为步进基数,间隔地设置1 000~2 999的内层VLAN,在两个子接口中分别配置互为交叉的奇偶响应延时策略,尽可能控制用户使其平均分布到配对BRAS/BNG,使得配对BRAS流量尽可能均衡。此方案需要配置大量数据,因此限制了推广。
经过对主要业务负载均衡分析,现汇总OLT主要承载的家宽、专线和电视业务对OLT双上联链路承载情况表,如表1所示。
表1 OLT双上联链路承载业务情况
2.2 OLT双上联动态流量均衡方案
经统计某运营商流量情况,网络的流量忙时为晚上7点到10点。考虑到晚忙时超90%流量是家宽和IPTV业务,本文提出一种实时提取OLT双上联BRAS链路利用率,并计算两条链路利用率的绝对值。当绝对值超过10%时,通过实时抑制BRAS/BNG下联OLT的PPPoE与IPoE用户数来实现OLT双上联动态流量均衡的方案。
主要实施流程为:
(1)使用一台操作系统为CentOS的服务器搭建LNMP环境(Linux系统下Nginx+MySQL+PHP网站服务器架构),同时安装开源zabbix系统。服务器与城域网设备通过内网对接,zabbix系统使用SNMP协议实时采集OLT双上联流量和链路利用率,并保存到mysql数据库。
(2)OLT动态流量均衡系统监控程序实时计算OLT双上联两台BRAS链路利用率的绝对值,同时计算两条链路利用率的平均值,取平均值加上5%为高阈值,取平均值减去5%为低阈值。当绝对值连续9 min(为避免频繁调整,所以设定9 min稳定时间)超过10%且上联链路利用率超过45%(考虑链路利用率低于45%时属于轻载不调整)时,调用均衡程序。
(3)OLT动态流量均衡系统均衡程序。对链路利用率高的链路的BRAS接口,增加PPPoE和IPoE用户认证接入时延,使新增用户均优先从轻载链路上线,从而减少两条链路流量的差值。
(4)OLT动态流量均衡系统监控程序发现连续9 min内原重载链路利用率比低阈值小,则恢复PPPoE与IPoE用户的接入时延。
2.3 OLT双上联链路流量均衡测试比较
为验证OLT双上联动态流量均衡方案有效性,下面对广东某运营商二台典型的OLT在晚上7点到10点时间段的均衡性能进行测试。
OLT02双上联BNG,两边带宽分别为1 GE,现比较现状均衡方案和动态流量均衡方案效果。从图4可看到,基于奇偶MAC地址均衡的现双上联链路利用率相差较大,而用动态流量均衡方案的双上联链路利用率比较接近。图5展示了两种方案双上联链路利用率绝对值的曲线,可看出新方案的绝对值均小于现方案。另外,现方案绝对值的平均值达到了42.1%,而新动态均衡方案链路利用率绝对值的平均值为5.06%,效果明显。
图4 OLT02两种均衡方案的链路利用率
图5 OLT02采用两均衡方案链路利用率绝对值比较
OLT01双上联SW,两边带宽为2 GE,现比较揭阳方案(针对家宽和点播)和动态流量均衡方案效果。从图6可看到,揭阳方案双上联链路利用率相差较大,而动态流量均衡方案的双上联链路利用率较接近。图7展示了两种方案双上联链路利用率绝对值的曲线。可以看出,动态均衡方案的绝对值基本小于揭阳方案。另外,动态均衡方案链路利用率绝对值的平均为5.27%,而提阳方案链路利用率绝对值的平均值达到了14.35%,均衡效果明显。
图6 OLT01两种均衡方案的链路利用率
图7 OLT01采用两均衡方案链路利用率绝对值比较
3 结 语
OLT双上联是保障OLT流量安全的一种保护措施。为有效利用双上联链路,通过部署OLT双上联动态流量均衡方案,可有效应对家宽和电视等业务引起的流量不平衡。使用少数服务器部署开源软件,可实时采集流量数据并进行流量均衡,成本低。OLT双上联在大部分地市有部署,可复制性高;现均衡方案在链路不均衡时,只能采用手工方式进行均衡,效率低。综合考虑成本、效率、复制性,认为OLT双上联动态流量均衡方案存在推广应用价值。