网络设备风扇故障分析与解决策略
2014-03-15李翔宇胡晨
文/李翔宇 胡晨
网络设备风扇故障分析与解决策略
文/李翔宇 胡晨
随着计算机网络的普及和广泛应用,网络设备分别放置在各种位置,比如机房、楼梯间等,放在专门机房里的设备由于环境较为干净、温度恒定,一般运行稳定。而放在楼道里的设备由于环境较为恶劣常会出现一些故障告警,经过分析发现有相当一部分的告警是来自于设备风扇故障的告警。而机房的网络设备,包括服务器、交换机、防火墙、路由器等设备发热量都比较大,一般上面会配置多个风扇或风扇板,安装在设备出风口或进风口,通过风扇增加加速空气流动对设备降温。然而,这些风扇的结构和控制方式不同,导致在处理这些故障时使用的方法也不同。当风扇出现故障时,最常用的排除法是直接找到相同型号风扇予以跟换,但有些设备用的是型号特殊的异型风扇,其相同型号的风扇在市面上较难找到,或换上相同型号的风扇依然报警(其原因在后面论述),这时可对风扇进行维修。在维修风扇前,首先,要了解这些风扇的类型、结构和控制方法方面的知识。其次,要了解常见风扇的故障类型。
风扇的类型,目前散热风扇可分为:滚动轴承散热风扇、含油轴承散热风扇、磁悬浮散热风扇等。
滚动轴承改变了轴承的摩擦方式,采用滚动摩擦,并辅以一些油脂润滑,有效提升了风扇轴承的使用寿命,减小了散热器的发热量,但存在工艺复杂、工作噪音大和成本高的问题。含油轴承采用润滑油作为润滑剂和减阻剂,减小了轴承之间的滑动摩擦力,具有噪音小、制造工艺简单和成本低廉的优点。磁悬浮轴承采用磁悬浮技术,将转子与定子隔离开,保证二者之间没有机械接触,使转子可以高速运转;也因此具有噪音小、磨损小、寿命长、耗能低等优点,同时因无需润滑可以防止油污染的问题,但因成本较高,仅在高速、真空和超净等特殊环境中应用。综合考虑成本和性能,滚动轴承是较好的选择,因而滚动轴承散热风扇被广泛应用在电子设备散热系统中。下面就着重介绍滚动轴承风扇的结构,主要包括电子和机械两个部分,其机械零件包括轴承、润滑油、扇框、风扇叶片和风扇罩;电子部分包括控制电路、PCB板、电动机、电子元件及导线插头等。滚珠轴承风扇的结构和部件如图1所示。
图1 滚珠风扇结构和部件
风扇故障总结如下。风扇轴承磨损导致运转中的扇叶阻力过大而停转,风扇报警(绝大多少是这类故障);另一类就是风扇上的线圈断开或元器件出现故障(这种情况较少出现),出现这种故障维修往往比较复杂。就风扇故障及维修有以下两个具体事例。
故障一及排除方法
故障现象描述
设备名称某厂商S8505交换机。风扇板报警指示灯报警,交换机运行日志中也提示风扇出现故障。检查运行中风扇板,发现风扇板上有一个风扇停转,取下风扇板用手拨动停转的风扇发现该风扇运行阻力明显大于该风扇版上正常运转的其他风扇。
故障原因分析
设备运行环境灰尘较大,风扇在附着灰尘的情况下高速旋转导致风扇轴承磨损,风扇电机提供的动力大于风扇在转动过程中由于轴承磨损产生的阻力导致停转。
故障排除方法
图2 滚珠轴承结构
由于该风扇是一款在市面上不常见的异型风扇,风扇的厚度和电压在(120×120×25.4mm、DC48V)市场上较难找到(市场上外形尺寸和厚度相同的风扇电压一般都在12V、24V),无法通过更换相应型号的风扇予以排除。故障排除方法:前面已经了解了滚珠风扇的结构,通过拆卸故障风扇的扇叶,发现由于风扇长期高速运转,而且轴承缺少润滑油,风扇轴承已经损坏,有两种情况:1.由于轴承中的滚珠磨损严重,滚珠破损从轴承内掉出影响扇叶旋转;2.滚珠还在轴承中,但由于滚珠磨损滚体积变小导致轴承的内圈和外圈间隙增大,使风扇扇叶运转不稳定,轴承的结果和部件如图2所示。在这种情况下更换风扇轴承即可,但需要注意的是,要找到相同规格的轴承更换(需要注意的是轴承的内径、外径和轴承的厚度)。风扇轴承的购买一般在市场上都可以买到,这种轴承的品牌有NSK(精工)、SKF(斯凯孚)、NMB(美蓓亚)等,价格也从几角钱到几元钱不等,本人的经验是换价格贵一些的轴承,用的时间也比较长,否则经常更换也很麻烦。一般来说稍大一些的轴承在轴承盖上标有型号,但较小的轴承上则没有标出型号,可以通过用游标卡尺量出轴承的内、外直径和厚度,到市场上寻找。这种方法是排除风扇轴承问题的最佳方法,也是非常有效的方法。本人遇到的风扇故障80%以上都是风扇轴承的故障,用这种方法可以解决异型风扇或找不到同型号风扇的轴承故障。
故障二及排除方法
故障现象描述
设备名称SUN440小型机电源报警。小型机电源报警指示灯亮,风扇停转,用小起子拨动风扇扇叶感觉阻力较大,期间有响声发出,初步判断为电源风扇损坏。
故障原因分析
拆开风扇扇叶发现轴承已损坏,用万用表测量发现该风扇线圈是开路状态线圈已断开,应该是由于扇叶长时间不转导致风扇线圈烧断。幸运的是该电源模块有风扇故障自动停止工作,没有损坏到电源模块的元器件。
故障排除
因风扇线圈烧断不能通过更换轴承排除故障,所以在市场上找到与该风扇相同型号的风扇,更换后把电源模块插入到SUN440中,该电源模块风扇旋转正常,但电源报警指示灯继续报警。
查阅类似风扇的技术资料后发现,这款风扇除了正负两根电源线外还有一根线,这根线是电源主板监测风扇的运行状态,风扇的运行状态通过特殊的波形发送给电源主板,以便了解到风扇的运行。用示波器查看原风扇和更换同型号风扇波形图,比较后发现波形不同,如图3、图4所示。这种类型风扇都是通过特定的载波信号向主控板(电源主板)提供其运行状态,设备主控板在识别到相关信号后可以跟实际情况(如设备温度)控制风扇的转速等,如果风扇状态信号发出的波形不能被主控板识别,那么主控板就认为风扇出现故障,即便是风扇在正常运转,报警指示灯依然报警认为风扇出现异常。所以在这种情况下,通过型号相同、外形尺寸、电压、电流相同还不够,这时风扇运行状态的信号波形也要相同。随后更换另一个尺寸、电压、波形相同,如图5所示的不同型号风扇(Nidec BEAV 34709-58),该电源模块风扇运转正常且电源模块没有出现报警。
风扇控制原理
风扇的运行状态和转速控制是通过PWM控制芯片发出的PWM脉冲信号进行监控和调节的,这种调节通过特定的信号进行传输和控制,这些控制型号又是通过特殊的载波进行传输。
若风扇芯片发出的控制信号载波不能被控制主板识别,风扇的运行状态不能被控制主板识别、控制。上述例子出现更换风扇后依然报警就是这种情况,更换风扇的型号虽然和之前正常使用风扇的型号相同,但新风扇发出的状态信号电源模块主控板不能识别该种载波的波形。
图3 市场购买NMB3610KL-04W-B69散热风扇波形
图4 SUN 440电源模块中原配NMB3610KL-04W-B69散热风扇波形
图5 Nidec BEAV 34709-58散热风扇波形
总结
由于设备出保后更换相应的配件模块非常贵(一般是按照目录价购买不打折),以本例中的两起故障为例,原厂更换这些部件,换交换机的风扇单元板需要三千多元、SUN小型机的电源模块需要六千多元,价格昂贵,经分析这些故障都是由于风扇的故障引起的报警。由于设备性能的提高,相应发热量的增加,网络设备和服务器上用到更多的设备专用风扇,这些风扇对设备的稳定运行起着重要的作用,而对设备风扇维护就显得时候重要。上述两起风扇故障是在实际的设备运维中遇见的,处理故障的方法较有代表性。
(作者单位为武汉东湖学院)