ATC3000系统网络故障分析与研讨
2020-01-08陈云
摘 要:民航珠海进近管制中心ATC3000自动化系统网络异常降级。通过故障调查和网络结构研究,结合STP、VLAN、MPLS VPN协议在系统中的应用,调查结果为中南宽带网MPLS L2 VPN未配置VLAN导致深圳ADS-B网络的生成树协议BPDU广播到ATC3000网络。发生根桥震荡,重新收敛生成新的树拓扑,此时因ATC3000交换机过度级联发生了网络环路,造成网络风暴,系统降级。
关键词:生成树;根桥;VLAN
中图分类号:TN929.5;TP393.1 文献标识码:A 文章编号:2096-4706(2020)15-0067-03
Abstract:The network of ATC3000 automation system in Zhuhai Approach Control Center of CAAC was degraded abnormally. Through fault investigation and network structure research,combined with the application of STP,VLAN and MPLS VPN protocol in the system,the investigation results show that MPLS L2 VPN of Central South broadband network is not configured with VLAN,which causes the spanning tree protocol BPDU of ADS-B network in Shenzhen to broadcast to ATC3000 network. The root bridge oscillates and converges to generate a new tree topology. At this time,due to the excessive cascade of ATC3000 switches,network loops occur,resulting in network storm and system degradation.
Keywords:generation tree;root bridge;VLAN
0 引 言
民航珠海进近管制中心ATC3000自动化系统与深圳空管站、珠海空管站采用三地联网模式,主要处理雷达融合、飛行计划处理、告警计算、雷达目标显示等。某日ATC3000系统出现异常网络故障,进近所有席位终端处于黄色降级模式,珠海空管站所有终端显示红色离线模式,但深圳空管站终端正常。本文通过网络结构研究、故障调查,结合传输系统配置分析,确定故障主要原因为传输系统配置不合理导致ATC3000系统发生网络风暴,系统降级。根据调查报告,对ATC3000系统结构及传输配置进行整改,排除ATC3000系统故障隐患。
1 网络结构
ATC3000自动化系统共3条工作网络(A网、B网、C网),其中A网、B网为主工作网络,A网、B网在系统核心交换机和三地的席位终端接入层交换机端均采用Trunk相互级联,席位终端网卡采用Bond模式。联网模式如图1所示。
珠海进近与深圳和珠海两个空管站之间均为A网、B网级连,C网独立。当三地联网的A网、B网出现异常时,三地设备均会工作于自己的C网降级模式下。珠海进近的监控终端(CMD)可监控到三地所有终端的连接状态,其中深圳空管站和珠海空管站的终端仅能通过A网、B网看到,其本地旁路服务器未加入珠海进近的监控界面,只在本地独立监控。
2 网络故障
某日珠海进近ATC3000备用自动化系统出现网络异常时,监控终端显示珠海进近所有席位终端处于黄色降级模式,珠海空管站所有终端显示红色离线模式、但深圳空管站所有终端均为蓝色正常模式。
排查时发现珠海进近侧A、B网的根桥为A网交换机,而与珠海进近B网连接的深圳侧的交换机设备(简称交换机Z)在珠海侧不可见。交换机Z为珠海进近B网经中南宽带网(简称宽带网)传输至深圳后的落地交换机,该交换机后连接至深圳终端室机房的ATC3000 B网交换机。而后排查发现交换机Z的网络根桥并非珠海进近A网交换机,而是MAC地址为28b4.****.7940的交换机设备。
用另一台交换机更换交换机Z,网络故障依旧。随后断开交换机Z与宽带网的网线连接后,网络生成树根桥变成本机,MAC地址为28b4.****.7940的交换机消失,由此判断问题来自宽带网,于是对宽带网所接入的业务进行排查。使用Wireshark软件对网络封包进行分析,发现了STP数据包来源为MAC地址为488e.****.dc50的设备。在宽带网交换机查找该设备的来源,确定该MAC地址端口为中南高速网的G1/0/*,该端口连接深圳ADS-B系统防火墙,检查确认28b4.****.7940为ADS-B系统的交换机。暂时将ADS-B防火墙与宽带网保持断开,备用自动化网络恢复正常,所有业务恢复。
3 故障分析
通过故障排查发现两个问题:一是ATC3000自动化网络交换机、宽带网交换机均未划分独立的VLAN ID;二是STP生成树结构在多层交换机trunk级联时有环路风险。
3.1 VLAN问题分析
虚拟局域网(Virtual Local Area Network,VLAN)就是将一个局域网在逻辑上隔离成若干个相互独立的广播域,在二层设备中若干个同一系统业务的端口划分到同一个VLAN。每个VLAN分配不同VLAN ID号,配置不同的VLAN IP地址,VLAN可通过与三层交换机或者路由器与外部网络相连。如果二层设备未划分VLAN,某端口发出广播信息时会把广播数据发送至所有的端口。如果交换机没有配置VLAN,缺省状态所有端口均默认为VLAN1。思科和华为交换机都存在的缺省VLAN,且不可删除。
宽带网交换机上采用MPLS VPN技术,配置了不同的VPLS标签用于二层MPLS VPN通道的建立,但没有配置不同的VLAN ID来隔离不同的业务。MPLS VPN是多协议标签交换(Multi-Protocol Label Switching,MPLS)与虚拟专用网络(Virtual Private Network,VPN)结合的技术。MPLS VPN技术简单地说,就是两端用户设备建立VPN点对点虚拟专用通道网络,用MPLS标签交换技术实现数据通信。MPLS VPN又分为MPLS L2VPN和L3VPN技术,宽带网络采用的是基于MPLS L2VPN的VPLS技术,从用户侧看,可以把整个MPLS网络看成一个二层交换设备。宽带网路由器作为PE路由器,配置了二层MPLS VPN通道,不同的业务利用不同的二层标签进行数据交换。MPLS网络就像二层交换机,如果没有划分VLAN,所有二层端口均默认为相同的VLAN1,也就是所有二层业务端口都处于同一个广播域中。
因为高速宽带网没有配置VLAN,所以业务端口都为相同默认的VLAN1,从而造成网络风暴。当宽带网交换机上的二层MPLS VPN透传通道中断时,透传通道所承载业务的私网网桥协议数据单元(Bridge Protocol Data Unit,BPDU)会广播到宽带网交换机上同一广播域的所有其他端口,进入其他二层MPLS VPN透传业务的私网中。
ADS-B系统MAC地址为28b4.****.7940的设备是一台华为交换机,也存在VLAN1。同时ADS-B系统防火墙并未屏蔽生成树协议的BPDU数据包,所以MAC地址为28b4.****.7940的华为交换机的BPDU数据包被转发到了深圳端的ATC3000自动化网络。由于该交换机在生成树协议中的优先级是0,为最高优先级,而深圳端自动化网络的交换机未手动配置生成树根桥,所以该华为交换机被自动选举为生成树根桥。因此ATC3000自动化网络内存在这台ADS-B交换机和进近A网核心交换机两个根桥,当ADS-B网络拓扑发生变化时,两个根桥各自重新收敛,导致ATC3000网络根桥发生震荡改变。当宽带网交换机上的二层MPLS VPN透传通道正常时,虽然私网设备的报文不会广播给其他业务,但却无法隔离其他私网设备广播的数据链路层报文。在传输网络对二层MPLS VPN业务划分不同VLAN ID,隔离成相互独立的广播域,避免不同业务网络之间互相干扰,修改系统界面如图2所示。
3.2 STP生成树结构和交换机级联问题探讨
STP(Spanning Tree Protocol),它的主要作用是防止局域网络形成环路,从而引发网络风暴。STP的基本原理是通過在交换机之间传递一种特殊的协议报文——BPDU来确定网络的拓扑结构。珠海进近ATC3000 A、B网采用RSTP快速生成树协议,其比STP协议具备更快的网络收敛速度,在主用链路故障时可以更快地更新网络拓扑结构并启用备用链路。
STP的基本思想就是按照树的结构构造网络的拓扑结构,树的根是一个称为根桥的桥设备,根桥的确立是由交换机或网桥的BID(Bridge ID)确定的,BID最小的设备成为二层网络中的根桥。BID是由网桥优先级和MAC地址构成。由根桥开始,逐级形成一棵树,根桥定时发送配置BPDU,非根桥接收配置BPDU,刷新最佳BPDU并转发。新接入的设备也会发送BPDU,如果该设备的BID比当前根桥大,相邻设备会向新接入的设备发送自己存储的最佳BPDU,以告知其当前网络中的根桥;如果相邻设备接收到的BPDU更优,将会重新计算生成树拓扑。如果网络拓扑发生变化,也将重新生成树拓扑。
STP生成树的作用就是当网络拓扑发生变化时能快速更新并切换至备份链路,但是当备份链路级联程度过高就会容易发生网络环路。珠海进近、深圳空管站、珠海空管站三地的A、B网交换机均对A、B双网卡进行绑定,配置Trunk相互级联,备份程度很高。ATC3000系统A、B网络的根桥是进近机房的A网核心交换机。在此案例中,高速宽带网因未配置VLAN造成深圳ADS-B网络的生成树协议BPDU进入到ATC3000网络。ADS-B交换机又因优先级最高被深圳ATC3000选为根桥,从而发生同一网络存在两个根桥的情况。当ADS-B网络拓扑发生改变,两个根桥震荡,各自重新收敛生成新的树拓扑,此时因交换机过度级联发生了网络环路,从而引起A、B网同时发生网络风暴。适当简化ATC3000 A、B网交换机级联线路,三地均由两条级联线更改为一条级联线,既保证链路冗余,又减少网络环路风险。整改后的系统拓扑图如图3所示。
4 结 论
通过对ATC3000系统的故障调查和网络结构分析,结合ATC3000与传输系统配置的相关协议研究,总结珠海进近ATC3000系统网络故障原因为中南宽带网接入业务网因VPN协议配置问题导致各业务在数据链路层联通,引起自动化系统A、B网络根桥震荡,导致自动化系统降级到C网运行。通过对系统网络架构和中南宽带网配置整改,系统隐患得以解决。
参考文献:
[1] 姜鹏,黄宇军.ATC3000自动化系统网络架构缺陷的分析与优化 [J].中国新通信,2017,19(13):43-44.
[2] 杨华.STP在网络配置中的规划 [J].网络安全和信息化,2018(12):58-60.
[3] 沈宇超.第二层和第三层MPLS VPN [J].中国数据通信,2002(6):30-32.
[4] 卞琛,于兴艳,修位蓉,等.基于MPLS VPN技术的网络监控系统分析与设计 [J].信息网络安全,2015(5):28-33.
[5] 纪弘.MPLS VPN在CMNET-GD的应用 [J].广东通信技术,2006(3):30-33+48.
[6] 吴福龙,赵家定.利用有线电视HFC网建设城市监控报警系统 [J].中国有线电视,2007(17):1596-1599.
[7] 滕旻厉.BGP/MPLS VPN的实现技术 [J].中国数据通信,2004(6):100-103.
作者简介:陈云(1986.11—),男,汉族,浙江舟山人,主任工程师,本科,研究方向:通信、甚高频、UPS。