常见网络硬件故障分析与处理
2013-06-08韩胜利高红云
韩胜利 高红云
【摘要】本文对网络故障的测试与分析来对常用的模型与方法,无法上网故障的分析与处理,网络故障的定位与常用的排除方法做以探讨。
【关键词】网络硬件 故障 分析 处理
伴随着现代信息技术的快速发展,网络日益庞大和复杂。由于网络之中要实现不同计算机之间的资源共享,如何更好地维护同一网络当中的计算机,保证各个计算机的安全稳定运行就成了一个至关重要的问题。
1 常用的模型与方法
1.1 传统的七层结构分析法
七层结构分析法是最基础、最传统的网络分析与测试方法,是按照网络七层结构的功能与定义挨个进行排查和分析。总体来说,我们有两种思路,一种是自下而上的思路,另一种是自上而下的思路。所谓的自下而上的思路就是先检测物理层的链路,再检测应用层。所谓的自上而下的思路则是先从应用层开始分析,对分析数据包和流量进行统计,从中寻找有价值的资料。
1.2 基于网络连接结构的分析方法
从构成来看,网络包含服务器端、网络链路、客户端三个模块。在对服务器端进行分析时,应该根据各种网络应用知识来进行,这就要求分析者对于服务器的配置与性能、系统的配置与性能、网络应用情况、不同网络应用对服务器的影响有较为深入的了解。在对网络链路进行分析时,通常要用到现场测试仪、网管,有时候还需要用到协议分析仪。
1.3 借助测试工具和测试软件进行分析
借助各种测试工具和测试软件来检测网络,可以快速、自动地给出相应的网络参数和故障分析结果。
1.4 经验型、综合型分析
这种方法是网络维护人员在长时间的工作过程中,经历了大量的成功和失败之后所积累起来的,同时这种方法也受到了大多数网络维护人员的青睐。实践中,多数维护人员都是先根据经验对故障做出判断,然后再借助测试工具和软件快速准确地对网络故障进行定位。
2 无法上网故障的分析与处理
2.1 单个计算机不能上网故障的分析与处理
遇到这种情况,我们首先判断存在故障的计算机的网卡是否存在故障,主要检查网卡的安装是不是正确、是不是存在硬件故障、网络配置有无异常。实践中我们通常采用的是ping本机的回送地址的方法。如果能够Ping通则说明网卡没有故障;否则出现超时,就要检查是否有设备与网卡存在冲突。检查的方法是从系统属性中的设备管理器中查看是否存在红色的叉号或黄色的惊叹号,如有则须重新安装相应硬件的驱动。当然,我们还要确保正确的TCP/IP协议绑定在网卡上。在完成这些振作之后,如果仍然Ping不通,就要换一块新的网卡进一步测试了。在保证硬件正常的情况下,我们应该检查计算机到交换机的双绞线、交换机的配置、交换机的RJ45端口。
2.2 批量计算机同时不能上网故障的分析与处理
如果同时有多个计算机不能上网,我们就要首先找出这些机器的共性,如果属于同一VLAN且所连接的交换机不同,就要检查路由器是否对其加以限制了、是否进行了正常的VLAN配置;如果不能上网的计算机都是连到同一交换机上的,就要检查交换机的电源是否松落、负荷是否过高、是否正常连接到上一级网络设备上。
如果与某交换机相连的所有电脑都无法正常连接到其它电脑上,可以重新启动交换机;如重新启动后故障仍不能消失,就要逐一检查连接到此交换机上的每台电脑,以定位出出现故障的电脑。实践发现,多数此种情况下是某台电脑的网卡故障引起的。
如果我们发现交换机的某个端口速度变得特别慢,甚至出现所有连接到该交换机的所有电脑都慢下来,如果从控制台中来看,就会看到交换机的缓冲池增长特别快,可以达到90%甚至更多。对于此种现象,我们应该首先判断是否是连接到这个交换机的某台电脑出现了网络故障,常用的方法就是用别的电脑重新连接到出现网络故障的交换机上;当然我们还可以对出现错误的端口进行重新设置,并重新启动交换机。
3 网络故障的定位与常用的排除方法
3.1 告警和性能定位法
这种方法就是从网管中获得告警和性能信息,然后进一步对故障做出判断定位。如果我们使用了Siteview网络网管,我们可以从网管中对所有的网络设备进行监测,对于各个设备的CPU负载率及各个线路的流量多加关注,一旦有人反映无法上网或上网速度较慢时,通过网管来观察电脑与交换机之间的连接情况,是不是出现了时断时续的现象,交换机的负载率是不是太高,线路的流量是不是太大。我们通过对设备端口的观察,就可以分析出与交换机哪个端口相连的电脑发包量没有处于正常状态。
3.2 网络设备日志查看法
经常查看网络设备日志,对于我们对设备故障的分析与判断非常有利。笔者在工作过程中曾利用showlonging命令对4006交换机与2950交换机相连时经常出现每七个小时就down掉,随后又能正常上网了,由于每两次掉线相隔时间较长,在线人员从未感觉到网络中断的存在。发现这些问题后,我们对光网线、收发器、交换机配置和端口进行了检查,发现均处于正常状态。可是后来的间隔时间竟然减少为七分钟。由此,我们断定2950交换机存在故障,迅速地将备用交换机换上了。
3.3 替换法
所谓的“替换法”就是使用一个工作运行正常的物体去更换一个工作表现不正常的物体,以此来较快地对故障位置进行定位,进而迅速排除故障。
3.4 配置数据分析法
这种方法就是对当前设备的配置数据进行查询和分析,在对这些配置数据分析的基础上来对故障进行定位,如果配置的数据有错误,就要进行重新配置。