物理端口管控问答
2020-12-30江苏孙秀洪
■江苏 孙秀洪
某网管员对H3C S7500E系列交换机的千兆/百兆SFP光口进行日常维护时,发现有个端口无法处于UP状态。在排除链路因素后,他怀疑该交换端口的光模块出现了问题,那如何才能判断光模块是否工作正常呢?
答:首先尝试进入交换机后台系统状态,通过“display transceiver alarm interface”命令,检查特定端口上的光模块故障告警信息,如果显示为“None”,就意味着该模块没有问题;如果显示有报警提示,则意味着该光模块有问题或该模块与光接口类型不匹配。其次使用“display transceiver interface”命令,看看两端的光模块波长、距离等参数是否相同。第三借助光功率计分析测试特定端口收发光功率是否在正常范围内,是否稳定。如果上述方法仍然无法判断,只要更换与光接口匹配的光模块来进行替换排查了。
两台H3C品牌路由交换机在连通性正常的情况下,尝试在其中一台将对端环回端口设置为bgp邻居,可是发现bgp邻居无法成功创建,不知道该如何是好?
答:可以先进入路由交换机后台系统命令行状态,执行字符串命令“display ip routing-table”,观察本地路由表有没有成功学习到对端环回接口路由内容。如果能够成功学习到的话,继续利用ping命令测试对端环回接口的IP地址,看看目标地址能否被正常ping通。在测试出连通性正常的情况下,通过“display current-configuration bgp”命令判断bgp参数有没有配置正确,同时判断有没有通过“peer peer-address connect-interface”命令将本地环回接口设置作为和对端建邻居的接口,有没有在vpnv4子地址族视图激活邻居。之后,在对端pe查看bgp信息有没有配置正确,以及有没有将本地环回接口设置作为建邻居的接口,同时查看有没有配置vpn能力。
很多型号的交换机产品,都支持交换端口的回路监测功能,有效借助该功能可以及时发现局域网中存在的网络回路,不过这种功能有时不能随便启用,请问这是什么原因?
答:因为回路监测功能不小心会影响到其他工作子网的运行状态。比方说,如果某交换端口处于Trunk状态,那么该端口一旦有多个网段在通行时,启用回路监测受控特性,就可能造成这些网段上网不正常。正常情况下,可以考虑在汇聚层交换机端口上启用回路监测特性,但不能启用回路监测受控特性;而在楼层交换机的端口上,既可以启用回路监测特性,又能启用回路监测受控特性,确保楼层交换机在自动发现网络回路现象时,自动关闭对应交换端口的工作状态。
隔壁单位有十几台普通上网终端,它们先连接到TPLINK楼层交换机上,再通过局域网核心路由交换机上网访问。最近,不断有员工反映,普通计算机的上网速度很慢,有的计算机甚至连简单的网页都打不开,估计是网络中有人在进行恶意下载。请问如何通过控制交换端口的方法,限制用户恶意下载?
答:以Quidway品牌交换机为例,使用line-rate命令来限制端口流量速度,来避免网络出口带宽资源被用户恶意下载操作过度消耗。例如,将某交换机第2个以太网端口,最大传输速度限制为5Mbps时,只要先以系统管理员身份进入交换机后台管理系统,执行“system”字符串命令,将其切换到系统全局配置状态,在该状态下继续执行字符串命令“interface Ethernet 0/2”,进入第2个以太端口配置模式,在该配置界面下执行“line-rate outbound 32”命令,这样指定交换端口的出方向报文流量速度就被限制为5Mbps了。同样地,再使用“line-rate intbound 32”命令,将入方向报文流量速度也限制为5Mbps。
大家知道,H3C S7500E系列交换机能够支持4台设备组成IRF,不过在向已建立的IRF中增加设备时,经常会遇到设备无法加入IRF的问题,请问如何解决这类问题?
答:第一通过“display irf”命令查看当前IRF中的成员设备数量是否超过了4台,如果超过该数值,自然就会出现无法加入问题。其次判断成员设备型号是否相同,只有同一型号的设备才能建立IRF。第三使用“display interface brief”命令,查看成员设备是否处于IRF模式,只有工作在IRF模式,才能允许加入IRF。第四使用“display interface”命令,检查IRF物理端口的状态是否正常,要是交换端口状态显示为“DOWN”,那要查看堆叠物理端口的光模块/光纤或者电缆是否工作正常。要是物理端口状态显示为“DOWN (Administratively)”,那 就意味着该交换端口已经使用“shutdown”命令关闭,用户需要使用“undo shutdown”命令将其重新启用。第五执行“display version”命令,检查每台交换设备当前运行的软件版本是否相同,只有软件版本相同的交换设备才能组成IRF。要是发现成员设备之间软件版本不一致时,可以尝试通过软件升级使所有成员设备都使用较高软件版本。
当遇到网络故障,检查交换机的工作状态是否正常时,我们可能会在现场发现交换端口信号灯状态不正常,而连接到对应端口上的终端系统自然也无法上网访问。碰到这类问题时,该怎样恢复终端系统的上网连接状态呢?
答:大家知道,交换机是由管理模块、堆叠模块、扩展模块等多个模块组合而成的,几乎每个模块都有属于自己的外部接口,这些模块一旦发生了故障时,我们往往能够直接通过信号灯状态来判断出它们的工作状态。所以,当看到某个端口的信号灯状态不正常时,我们可以考虑重新启动一下交换机后台系统,看看通过重启方式能不能解决软性故障;如果重启方式无法解决问题的话,我们可以考虑更换交换机的端口模块,在更换端口模块时,我们尽量将交换机设备的电源断开,之后插入新的端口模块,如果实在无法解决问题的话,我们就只能够联系设备供应商了。
H3C S8500系列路由交换机能支持多块板卡插入,每块板卡允许负载24个光端口,所有端口状态都会影响板卡运行状态,要是光端口输入、输出请求很多,板卡会占用更多CPU资源应付这些请求,要是CPU资源被占用严重时,整块板卡都将无法工作。请问,怎样识别端口所在板卡运行状态是否正常?
答:必须加强对板卡CPU资源占用状态进行监控,如果看到CPU占用率在50%以上时,就要排查板卡上每个光端口流量是否正常了,直到找出不正常的端口,并输入“shutdown”命令停用对应端口运行状态。在查看板卡CPU资源消耗情况时,可以先将交换机系统切换到全局视图模式状态,通过“display cpu”命令,就能发现板卡最近五秒钟、最近一分钟、最近五分钟的CPU资源消耗情况了。除了CPU消耗情况会影响板卡状态,板卡温度也会对其工作状态产生影响,要是交换机散热不良的话,那么板卡温度将会持续上升,同时温度的不断攀升,会影响路由交换机的响应能力,严重时能造成交换机发生死机现象。所以,使用“display en”命令检查端口所在板卡温度,也能判断板卡的运行状态是否正常。
为了保证网络运行稳定,网管员一般会对单位局域网交换机定期进行升级、更新,可是在升级、更新完交换机后台系统后,有时会遇到交换机后台系统无法正常工作的现象,这是什么原因呢?
答:在排除误操作的情况下,出现上述问题,多半是网管员没有同步升级与交换机相连的网络设备,引起了其他网络设备与交换机在参数配置方面不匹配,最终造成了交换机后台系统无法正常工作。例如,有时升级完交换机后台系统后,交换机端口传输速率会被自动修改为100Mbps,这个时候与交换机相连的终端端口速度,要是没有及时修改为100Mbps时,交换机控制面板中的对应端口指示灯就会不正常。遭遇这类问题时,不妨先以系统权限登录交换机后台界面,从中找到交换机端口参数,检查端口传输速度是否被强行修改为了100Mbps,如果已经被修改的话,只要重新将交换端口的传输速率修改为合适数值即可。如果看到交换机配置参数还没有被修改的话,那么唯一能做的就是对终端端口进行升级,保证它能与交换机端口保持性能匹配。
大楼某单位工作子网连接到核心交换机的g1/2/10光端口上,利用路由交换系统访问Internet,平时该工作子网中的每台计算机上网速度比较理想。可是,最近上网速度明显没有以前那样快捷了,刚开始还以为是终端计算机自身问题,采取查杀病毒、优化系统等措施后,上网速度还是很慢,严重时还频繁出现掉线现象,请问怎样有效应对这种类型故障?
答:首先查看特定工作子网接入交换机与核心交换机之间的物理连接是否牢靠,在物理连接牢靠的情况下,检查交换端口的工作模式是否匹配,如果不匹配时,或许会要不断地协商、纠错,这容易引起网络传输发生丢包现象。要是上面的因素被排除后仍然无法解决问题,很可能是交换端口发生了损坏,比方说,交换端口频繁遭遇大流量冲击发生性能老化现象,或者是用户使用端口的方法不当,从而造成了上网数据严重丢包故障,此时只有更换新的端口才能解决问题。
对于H3C品牌的交换机来说,遇到交换端口缺省的VLAN ID配置不成功故障现象时,该怎样进行排查?
答:可以尝试使用“display port”命令或“display interface”命令查看特定交换端口的工作模式,看看它们的工作模式是不是hybrid模式或者trunk模式,如果不是的话,那就必须及时将它的端口工作模式修改过来;在确认端口工作模式配置正确的情况下,再重新配置一下默认VLAN ID,相信这样一来配置就能成功了。
在Quidway S8500系列路由交换机命令行状态下,执行“display stp”命令,查看指定交换端口的Stp/Rstp状态时,看到特定端口状态显示不正常,这时该如何才能恢复该交换端口的工作状态呢?
答:指定交换端口状态不正常,主要有两个方面的表现:一是交换端口的forwarding状态变成了discarding状态,二是交换端口的discarding状态变成了forwarding状态。对于前面一种情况,只要重点检查特定交换端口的优先级参数、STP的cost值参数是否正常,在这些参数都正常的情况下,再看看该端口下面是否存在网络环路现象,要是看到有网络环路时,必须立即排除环路故障,这样就能解决问题了。对于后面一种情况,主要是判断交换端口STP数据报文是否收发正常。
在一台安装了Vista系统的终端计算机中,系统任务栏明明显示网络连接速度为1Gbps。不过,在实际进行数据文件传输时,发现传输速度连百兆网络的性能都达不到,这是什么原因?
答:造成这种故障的因素有很多,比方说线缆、水晶头、外界干扰、网络配置等等。在解决这类故障时,应该先保证使用质量好的物理线缆,同时水晶头要用原装AMP的。其次确保物理线缆不受挤压,不与其他强电线缆靠在一起,并暂时退出网络防火墙或病毒程序。第三要确保网卡设备工作模式与所连交换端口模式保持匹配,还要尽可能停用网卡设备的“流控制”功能,同时将绑定在网卡设备上的其他无关协议全部取消掉。
有的时候操作不小心,将一条直连线缆同时连接在同一台H3C交换机的两个不同交换端口上,结果这台交换机立即发生了“死机”,具体现象表现为该交换机下层连接的所有无线上网接入点全部停止了工作,请问这是什么原因?
答:要是我们没有为交换机端口划分设置VLAN的话,那么一台交换机上的所有交换端口在默认状态下都处于相同的VLAN中,它们共用一个VLAN虚拟接口。
当我们不小心使用直通线缆将同一台交换机相同VLAN的两个交换端口相互连接起来时,那就相当于使用一条网线将同一块网卡的两个网卡接口连接在一起(假设目标网卡同时存在两个接口),最终结果会导致交换机或网卡出现内部死循环,IP地址发生冲突现象(因为这个时候目的IP地址和源IP地址是相同的),数据包自然会发送不出去。从物理的角度来理解,那就是交换机发生了物理性短路故障,从而造成该设备停止了工作。