探讨排除专线网络MAC地址发生漂移故障方法
2020-09-10徐波
在网络的发展中,专线网络是一个重要组成部分,在网络安全发展到中起到关键作用,因此开通与维护专线网络就显得极为关键,在专线网络中要对其故障情况具备敏锐洞察能力与观察能力,进而及时发现故障点,缩减故障排除的时间。
专线;网络;MAC地址漂移
1.前言
伴随在人们生活与工作等领域对网络的技术广泛加以应用,各个公司对网络安全要求越来越高,通过数据专线组建专网,可以有效的隔离互联网对网络造成的影响,减少因公司网络安全故障造成严重的损失。
2.建设专网的网络结构解析
专线网络的结构,是内网结构,是许多客户端组成一个局域网,与外部网络隔离。大型网络是通过交换机进行互联的,而交换机是通过MAC地址来确定数据的传送目的,所以MAC地址需要唯一确定。
当交换机收到数据时,它会检查它的目的MAC地址,然后把数据从目的主机所在的接口转发出去。交换机之所以能实现这一功能,是由于交换机内部有一个MAC地址表,MAC地址表记录了网络中全部MAC地址与该交换机各PORT的相应信息。某一数据帧须要转发时,交换机依据该数据帧的目的MAC地址来查找MAC地址表,从而得到该地址相应的PORT。即知道具有该MAC地址的设备是连接在交换机的哪个PORT上。然后交换机把数据帧从该PORT转发出去。
工作步骤为:
(1)交换机依据收到数据帧中的源MAC地址建立该地址同交换机PORT的映射,并将其写入MAC地址表中。
(2)交换机将数据帧中的目的MAC地址同已建立的MAC地址表进行比较,以决定由哪个PORT进行转发。
(3)如数据帧中的目的MAC地址不在MAC地址表中。则向全部PORT转发。这一过程称为泛洪(flood)。
(4)广播帧和组播帧向全部的PORT转发。
交换机其它PORT利用源MAC地址学习的方法在MAC地址表中不断加入新的MAC地址与PORT號的相应信息,直到MAC地址表加入完整为止。为了保证MAC地址表中的信息可以实时地反映网络情况,每一个学习到的记录都有一个老化时间,假设在老化时间内收到新地址信息则刷新记录。不断的循环这个过程,交换机对于全网的MAC地址信息都能够学习到。也可以手工加入交换机的MAC地址表的静态记录,手工配置的静态记录没有老化时间的限制。因为MAC地址表中对于同一个MAC地址仅仅能有一条记录,所以假设手工配置了MAC地址和PORT号相应关系后。交换机就不再动态学习这台计算机的MAC地址了。
3.MAC地址漂移产生的原因和解决方案
3.1MAC地址漂移产生的原因及现象
MAC地址漂移是指:在同一个子网内,一个MAC地址有两个出接口,并且后学习到的出接口覆盖原出接口的现象。这是官方定义,通俗的讲,MAC地址漂移指的是MAC地址表项的出接口发生了变更。即同一个MAC地址出现在一个子网内交换机的不同端口上。
MAC地址漂移会有什么影响?终端现象:上网响应慢,上网无响应,页面卡着不能动,ping网关掉包严重。交换机现象:CPU使用率高(超70%),端口流量大,伴有MAC地址漂移现象。
这些都是MAC地址漂移,组网设备形成环路导致的。只要解决MAC地址漂移,破除组网中的环路,这些讨厌的故障就会自动消失的。
为什么会有MAC地址漂移呢?
如图1,正常情况下,PC的报文通过PORT1进入Switch后,会从PORT3转发出去,MAC地址表项学习到的出接口是PORT1。但是当Switch、Switch1和Swtich2三台设备之间存在环路时,PC的报文通过Switch2-¬¬¬->Switch1后,又会通过PORT2进入Switch,导致MAC地址表项的出接口更新为PORT2,从而就会产生MAC地址漂移告警。由此可见MAC地址发生漂移的根本原因就是组网中存在二层环路。
3.2引起原因和解决方法
(1)计算机病毒引起。因专线网络通常与互联网相隔离,普通的杀毒软件无法安装到每台电脑,导致许多电脑的补丁未有更新,给新病毒提供了可乘之机。这需要安装内网的杀毒软件,如瑞星、江民、360等软件,安装离线升级包。或者临时将电脑接入互联网进行升级补丁,完成后断掉互联网并接入内网。
(2)传输数据检查。检查PTN数据是否都做了水平分割的参数,如果未进行分割,会导致内网内的终端可以互相访问,出现网络风暴的可能性大增。
(3)加强网络组网的规划。对大型网络进行vlan划分,划分为若干个子网,尽量减少子网间的相互影响。
(4)在交换机上进行抓包分析,查找那个MAC,那个端口会在网络引起的漂移故障,然后对端口进行删除。
(5)专线传输及时处理。大多数的专网是租用运营商来组建的,交换机是客户维护的资产,运营商维护人员无法及时登录交换机进行处理。这需要查看传输网管,找到有告警的端口进行删除处理(因MAC地址漂移,会许多端口有告警,但不一定是该端口引起的故障)。故障发生时,传输网管会出现ELAN业务学习到的源MAC地址发生漂移的告警。解决问题的关键在定位环路端口,关停端口,解除环路。
4.故障案例分析
4.1故障概述
某酒店反映公安身份证上传专线无法使用,维护人员接到通知及时到现场进行测试,发现ping服务器出现频繁掉包的情况。反馈给监控中心,监控按照一般故障处理情况,查看链路、光功率、上联基站是否正常,查询这些均正常,并倒换到备用电路,现场人员测试还是出现掉包的情况。
整体网络结构如图2所示:
2018年5月24日18时30分,荔浦蓝海酒店反映公安身份证上传专线无法使用,18:45荔浦县维护人员到现场进行测试,发现ping服务器出现频繁掉包的情况。反馈给监控中心,监控按照一般故障处理情况,查看链路、光功率、上联基站是否正常,查询这些均正常,并倒换到备用电路,现场人员测试还是出现掉包的情况。19:30-20:20,陆续有其他的5家酒店报公安网身份证上传系统不能使用,查询其中一个汇聚口(共有4个汇聚口,从不同的PTN网口上联至交换机)、下带许多业务口有“ELAN业务学习到的源MAC地址发生漂移”的告警。20:40,维护人员赶到监控中心,查看了告警,初步判断是网络环路引起故障。当日下午16:50,因公安网身份证上传的2个PTN传输端口已经达到了85%的业务,急需扩容,安排维护在现场从移动PTN设备新跳接了2个端口到移动收敛交换机,跳接完成后查看网管在5分钟內均无新告警产生。考虑到广播风暴、MAC地址漂移需要累计到一定程度才会出现,可能是新加网线引起的,已经把PTN端口进行了停闭,但故障依旧存在。维护人员停闭汇聚口开通的电路进行环路点排查,发现恢复几个业务后依旧后出现MAC漂移的告警,考虑可能是新加网线引起的广播风暴故障,提出拆除物理连线。21:30安排人员到现场进行网线拆除,拆除了连接线,告警消除。通知投诉客户测试网络,均恢复,故障处理完成。
故障原因分析:
告警产生情况:
查询华为PTN其中一个汇聚口下带许多业务口有“ELAN业务学习到的源MAC地址发生漂移”的告警,导致网络中断,如图3所示。
新增了2个PTN端口至交换机,接通网线后短时间内不会出现告警,但长时间导致了MAC地址漂移的产生,在拆除物理连线后故障恢复。
改进方案:交换机进行端口隔离设置,每一个端口设置一个VLAN,减少子网之间的相互影响,此次划分了4个VLAN端口。但我们不必要将交换机的每个端口都划分一个VLAN,这样会大大增加网络维护的难度,我们需要在简便和安全之间找到平衡点。
5.结束语
大量MAC地址发生漂移故障会对网络的环境造成严重影响,严重威胁到用户对专线网络的应用。在大型网络中,切实做好预防处理MAC地址漂移故障的工作就显得极其关键,这对提升网络安全的水平具有深远的意义。
参考文献
[1]余小珊.MAC地址漂移引故障[J].信息系统工程,2014,(03):108-109.
[2]冯凯.交换机网络环路检测分析[J].信息通信,2019,(05):246-247.
[3]赵咸红,桂刚.一种MAC漂移检测功能的实现与应用[J].邮电设计技术,2013,(08):18-21.
作者简介:徐波(1974-),男,江苏吴县人,硕士,工程师,主要从事集团数据专线、互联网专线的建设和维护工作。