环回对MSTP以太网业务的影响及规避分析
2013-02-28沙庆良
沙庆良
(中国电信股份有限公司广东研究院 广州 510630)
1 前言
环回是传统电信传输和交换网络维护中典型的操作,用以判断整个链路的通断情况,由于操作简单、效果明显,在处理信号中断、劣化等故障中被较多地使用。但在IP化网络中,数据转发处理在二层或三层以地址转发方式进行,错误地使用环回会造成地址学习错误、端口关闭、处理器吊死等故障,因此环回操作被有限制地使用。
MSTP网络通过在SDH设备上增加以太网业务封装和处理模块实现数据业务组网承载,可以实现以太网业务的两点间透传连接、多点到一点的汇聚及多点间对等组网等灵活组网,使跨地域的以太网连接成为可能。但由于数据分组为透明传输、网络多点连接、对接的数据设备多样,发生环回操作、造成的影响情况等更具复杂性。
2 环回的产生及影响
2.1 环回的产生
(1)可产生环回的网络操作点
环回是通过软件开关或硬件链接将信号的收发端进行短接,让信号回到发送设备的对应接收端口,主要用来测试信号传输路径的通断或质量,可通过逐段环回判断故障点位置。
在MSTP网络中可环回的操作点如图1所示,具体介绍如下。
·尾纤ODF:以太网通常使用RJ45型接头,电接口一般不会发生环回,但光接口由于收发端独立,可人为实现环回。
图1 MSTP网络可环回操作点
·设备以太网端口:为提供更强的维护性能,部分厂商设备提供了以太网端口软件环回功能,一般包括向用户侧环回和向网络侧环回。
·SDH层VC-n通道:SDH处理模块可实现VC-n通道向用户侧和网络侧的环回。
·STM-N光接口:SDH处理模块可实现STM-N光接口向用户侧和网络侧的环回。
·SDH线路及网络:以太网数据被封装后,以SDH的VC-n方式穿通整个SDH传送网,在此过程中,任何涉及对应VC-n的环回都形成以太网数据分组的环回。
(2)可产生环回的操作习惯
在传统SDH网络的维护中,环回测试常用于排查那些无法通过设备告警指示判断的故障,对一些质量劣化的疑难问题尤其有效,所以是SDH网络维护人员常用的测试操作,特别是在已确认相应链路中断或严重劣化时,往往被轻易地使用。
2.2 环回的影响
(1)普通MSTP设备无检测环回数据分组的能力
由于MSTP设备定位在传输设备,在功能实现方面更侧重于对以太网数据的透明传输:将以太网信号封装进入SDH帧的VC-n中进行传输,同时通过二层处理(包括二层地址学习与转发、VLAN处理、网桥、标签技术等)实现简单的组网功能(最常用的是多点汇聚),这使得在MSTP网络中产生的数据环回可能被不经处理地送出给对接设备。
(2)单节点环回可能影响网络中的其他节点
MSTP实现的以太网二层组网主要有如下3种形式,实际应用中以前两种应用为主,不同组网中产生环回操作后环回的情况有所不同。
①两点间透传连接
实现远距离两点间的以太网连接,应用最为普遍。网络中产生环回后,两点间连接中断,所有数据被回传到环回指向的数据设备,若此时承载的为多个VLAN数据,环回指向的数据设备将收到所有VLAN的环回数据。
②多点到一点的汇聚
较常用的方式,可实现分支到汇聚点的以太网汇聚,分支点间数据在MSTP网络中以不同VLAN或外层标签的方式互相独立,汇聚点根据规划实现三层间的按需连接。这种组网也被较多地应用在HGN的AG上连承载中。汇聚点向分支环回将导致整个网络的中断,往往被重点关注,被人为操作的可能性很小;但分支点向汇聚点方向的环回通常被忽视,一种错误的认识就是:毕竟分支点已经中断或质量劣化了,分支点可以向汇聚点环回测试中间链路,不会有更大的影响。事实是,分支点环回的数据会经过MSTP网络透传到汇聚点数据设备,不同的组网方式透传的情况不同,对汇聚点数据设备的影响也将不同,如图2所示。
当采用EPLAN或EPL方式汇聚时,由于MSTP设备通过创建VLAN过滤表、VLAN路由或标签隧道方式,将不同的VCG端口指向汇聚端口以实现业务汇聚,环回数据将被限制在自身的VLAN内,对接的数据设备将仅收到相应VLAN的环回数据。
图2 汇聚型组网中的环回示意
当采用EVPLAN、EVPL或网桥等地址学习的方式汇聚时,由于汇聚点下行至各分支的数据通过二层寻址的方式进行转发,不可避免地产生广播数据,导致所有下行的数据都可能被广播到存在环回的链路上,最终被透传回汇聚点对接的数据设备。
③多点间对等组网
多点对等即任意两点间在MSTP设备上实现二层互通,实际应用中较少见。任意两点互通通过二层寻址转发的方式实现,所有节点的数据不可避免地存在广播,当任意点方向的链路上产生环回时,所有节点对接的数据设备都会接收到环回数据。
(3)MSTP的环回最终影响对接的数据设备
MSTP对接的数据设备处理环回数据的机制是过程影响的关键因素,不同类设备、厂商设备在对环回数据处理的机制上可能有所不同,介绍如下。
·无环回检测的数据设备:由于发送出的数据由源端口接收,造成MAC地址表频繁更新,引发广播风暴,造成网络拥塞。
·具备端口环回检测的数据设备:目前二/三层交换机及路由器通常都具备端口环回检测功能,当检测到环回数据时,设备会自动将指定端口关闭,若为汇聚点设备,则表现为全网业务中断。
·具备VLAN环回检测的数据设备:部分厂商的二/三层交换机及路由器提供VLAN环回检测功能,当检测到VLAN存在环回数据时,将关闭对应的VLAN端口,其他VLAN并不受影响。
综上所述,即使汇聚点数据设备具备VLAN环回检测功能,仍可能造成业务中断,具体介绍如下:
·当MSTP网络采用EPLAN或EPL方式汇聚时,单一节点的链路环回仅会造成对应的VLAN业务中断,其他节点若涉及这些VLAN业务也会中断,但其他通信正常;
·当采用EVPLAN、EVPL或网桥等地址学习的方式汇聚时,由于广播的存在,单一节点的链路环回也会导致所有VLAN被环回,最终造成全网性业务中断。
3 MSTP设备环回检测技术
早期MSTP设备并不具备环回检测技术,随着MSTP设备在现网应用的普及、维护经验的反馈、多种组网需求的推动,部分厂商在部分型号设备中增加了以太网环回检测功能,可在一定程度上避免链路中产生环回。
(1)SDH开销扩展检测技术
利用SDH空余开销字节,在发送侧进行标记,一旦本端接收侧识别该标记,判定为环回发生,将对应VCG端口关闭。该技术可实现VC-n层段的环回检测,消除VC-n、STM-N层段环回。典型设备为中兴ZXMP S385设备的SEC单板。
(2)以太网侦测分组检测技术
通过以太网处理模块发送随机OAM检测报文,一旦本端接收侧识别该OAM检测报文,判定为环回发生,将对应VCG端口关闭。该技术可实现以太网层的环回检测,消除各层段环回,但由于检测分组为随机发送,一旦环回在检测报文间隙产生,仍会有环回数据被透传至对接的数据设备,从而产生影响。典型设备为华为OSN系列设备的EMS4等单板。
(3)以太网逻辑端口检测技术
接收侧VCG端口检测接收到数据帧的源MAC地址,一旦接收帧的源MAC地址已在MAC地址表中且未达到地址表更新时限,即判定为环回,将对应VCG端口关闭。该技术可实现以太网层的环回检测,消除各层段环回,是解决MSTP以太网业务环回问题较为彻底的技术。典型设备为华为Metro3000设备EFS0指定软件版本的单板。
4 环回规避的建议措施
综合上述分析,MSTP以太网业务环回产生的影响是系统问题,取决于维护习惯、组网方式、对接设备性能和环回产生的位置等多个环节,有效消除环回造成的影响需要加强各环节的处理。
合理规划设计MSTP网络:比较两种实现多点汇集型组网的实现方式,不难发现,采用EPLAN或EPL方式汇聚,可将影响限制在个别VLAN范围内,建议采用,采用该方式配置网络时,需要MSTP网络与对接数据设备共同规划VLAN。
采用具备环回检测技术的MSTP设备及单板:具备环回检测技术的设备在一定程度上可有效阻断环回数据透传,从而避免影响的产生,所以在综合满足网络规划需求的同时,应尽可能地采用具备环回检测技术的MSTP设备及单板。
图3 故障段的网络连接
采用具备VLAN环回检测的数据设备:采用提供VLAN环回检测的数据设备,可将MSTP网络中环回的影响有效限制在个别VLAN,配合合理的MSTP网络规划,彻底消除环回的影响。
加强维护人员的维护知识普及:尽可能地避免环回操作,是维护MSTP以太网业务维护的关键,加强维护知识的普及包括掌握业务网络的详细配置、避免由分支点向汇聚点方向的任何层面的环回、确需对分支链路做环回测试时,可通过修改配置将分支链路分离成两点间透传连接等方式进行。
5 案例分享
5.1 背景及故障描述
T运营商采用MSTP网络为某银行客户提供市区所属十余个分支营业节点至分公司总部的以太网业务汇聚解决方案:客户因关注信息安全,不告知其VLAN规划,T运营商采用L厂商的MSTP设备通过EVPLAN方式(采用QinQ技术)实现汇聚,由于该设备不具备环回检测功能,客户汇聚点采用了具备VLAN环回检测功能的路由器,T运营商也对维护人员进行了充分的宣贯,并制定维护规程有效避免换回操作,业务开通1年运行正常。
某日,T运营商在为客户业务扩容接入新增节点业务后,客户申告:全网业务中断,汇聚点路由器显示产生环回,全部VLAN端口关闭;删除汇聚MSTP设备上新增节点业务配置、重启汇聚路由器各VLAN端口后各分支业务恢复。
5.2 故障排查及分析
依经验和故障现象可判断新增节点链路中存在环回。维护人员进行逐段排查后,确认环回由新增分支点至运营商接入机房间配对使用的光电转换器(将以太网电信号转换成光信号用于远程连接)产生,网络连接如图3所示,更换其他品牌光电转换器可消除故障,后经分析和检测发现了问题原因,具体介绍如下。
·为节省接入端光缆纤芯资源,选用了单纤双向收发合一的某品牌光电转换器。
·客户分支点机房在下班后习惯将设备断电,导致光电转换器A关机。
·由于该光电转换器收发信号使用相同波长光信号,且接收灵敏度较高,此时光电转换器B将光纤连接处产生的回波信号识别为接收信号,环回产生。
该故障虽属特例,但也充分说明了环回对MSTP以太网业务影响的复杂性,人为操作虽然可以尽可能避免,但仍有不可预知的因素,这个案例中使用EVPLAN方式汇聚是导致故障的关键。运营商建议客户提供VLAN规划,修改汇聚点MSTP设备的汇聚方式为EPLAN方式,调整后网络运行正常,没有再次出现环回类故障。
6 结束语
MSTP以太网组网中环回引发的故障触点多、场景杂、影响大,人为操作往往是其直接原因,设备对以太网数据透明传输是其根本原因,解决问题的关键是合理规划设计网络,通过尽可能地采用更可靠的组网方式,消除隐患,减少风险的产生。
1 曹蓟光,吴英桦.多业务传送平台(MSTP)技术与应用.北京:人民邮电出版社,2003