OLT设备降温处理方法
2021-05-07齐洪伟
齐洪伟
(中国电信股份有限公司沧州分公司,河北沧州 061000)
1 问题描述
在OLT运行过程中,机房环境情况、设备安装情况、风扇运转情况再加上天气炎热、机房温度升高等因素,都可能会引起设备单板高温。单板在高温环境下运行,会引发单板业务异常,影响用户感知和设备运行的稳定性,严重的会导致板卡因高温异常重启,单板损坏,显著降低设备寿命,甚至导致单板报废无法修复。
2 分析过程
详细介绍案例的分析过程、问题分类定界方法,最终定位问题原因等。主要针对改进风扇转速温控合理性的同时,定期对网元温度及现场情况进行巡检和处理,确保设备风扇通风良好,热量及时有效地散发出来,降低设备温度,确保设备运行状态良好。
3 解决措施
3.1 操作网元范围
为避免出现误判以及遗漏,建议所有网元都进行检查、清洁降温操作。OLT单板正常运行温度应低于50度,机房环境温度低于30度。可优先处理梳理出来的单板温度高网元。
3.2 操作频次
每季度进行一次清洁降温处理,在夏季到来之前一定要进行清洁降温处理。
3.3 实施计划安排
由于OLT作为接入网站点,数量多,分布广。对于前往站点的时间计划和线路安排尤为重要。一般情况下,开门顺利的话,一个网元进机房加操作需要20~25min,另外需要加上前往网元的时间。根据网元的分布情况,按区域或分局制定线路图比较合适,根据站点分布情况确定。
3.4 工具准备
螺丝刀、镊子、软毛刷、吹尘球、吸尘器、清洁剂、抹布、防静电手腕、绝缘手套、扎带、斜口钳、笔记本电脑、串口线、网线等。工具准备见图1。
3.5 备品备件准备
不仅限于一定数量的风扇备件、假面板、光纤、法兰等。
3.6 网元批量单板温度扫描
此步骤需要提前操作,避开找到单板温度高网元,用以重点处理。
3.7 网元降温处理操作
图1 工具准备Fig.1 Tool preparation
注:为了个人及操作安全,在接触设备整个操作过程中,务必戴好绝缘手套、并带上防静电手环。操作完成后,务必联系机房或网管、厂家工程师,确认降温效果是否达到要求,然后再离开现场。OLT单板正常运行温度应低于50度,机房环境温度低于30度。
(1)环境检查。
检查机房空调运转情况,如空调出现损坏或制冷效果不好,尽快联系相关责任人处理空调问题。室外站点需检查室外机柜周围的通风情况、机柜空调或热交换器的运行情况等。并记录空调当前温度,并对机房环境和温度等使用手机拍照留存。
(2)登录网元查看相关信息(这部分操作可由机房或网管、厂家工程师配合完成)
Telnet或串口登录网元,使用命令查看网元风扇状态、网元线卡温度、告警、板卡状态等信息。命令如下:
Show fan
Show card-temperature
Show alarm pool
Show card
(3)机柜状况检查及处理。
1)检查机柜门是否完全闭合或无机柜门。
处理方法:
如因为一些障碍物挡住,先处理障碍物以便清洁处理后关闭机柜门。如没有安装机柜门,则进行安装。如果现场未找到机柜门,则需要记录下来,在整改报告中给出建议,请局方处理。
图2 机框上的空槽位Fig.2 Empty slots on the chassis
2)机框上的空槽位是否有缺少假面板,请拍照留存。如图2所示。
处理方法:
按照机框假面板,并拍照留存。
3)风扇是否存在告警(检查告警灯),请拍照留存。如图3所示。
处理方法:
Telnet或串口连接网元,使用下列命令进行操作:
Show fan
(config)#fan reset
过一分钟后再次show fan看看是否能够恢复。如果还是无法恢复进行风扇拔插(注意戴好绝缘手套和静电手环)。如果此时告警还是无法恢复,使用自带的风扇进行更换。如此时还是无法恢复,则系统存在异常,需要联系厂家工程师定位处理。
(4)风道通风情况检查。
1)机框上侧出风口间隔是否过小,请拍照留存。
处理方法:
拍好照片留存,在后续报告中标出,联系相关责任人整改,至少需要空出3U的高度。
2)PON口光纤布放凌乱,请拍照留存。
处理方法:
对光纤进行梳理,如果需要拔出PON口才能梳理的,由于会断业务,先拍照留存,后续请相关人员处理。
3)机框下侧入风口间隔是否过小,请拍照留存。
处理方法:
拍好照片留存,在后续报告中标出,联系相关责任人整改,至少需要空出3U的高度。
(5)灰尘清洁。
1)C300风扇清洁。
戴好绝缘手套和静电手环,将现场风扇拔出,插上自带的备用风扇。由于风扇之前属于快速转动状态,拔出风扇时,需要停30s再从机框中拿出来。然后进行清扫和吸尘。
图3 风扇是否存在告警Fig.3 Whether the fan has an alarm
图4 C300机框底部进风口未清理前Fig.4 Before cleaning the air inlet at the bottom of the C300 chassis
图5 清理后的效果Fig.5 The effect after cleaning
风扇清洁后,再将备用风扇更换成原有风扇。
2)C300入风口和出风口的灰尘清洁。
针对机框底部入风口和机框顶部出风口的积灰进行清洁,使用软毛刷进行清扫,并使用吸尘器及时将灰尘吸出。如灰尘黏连的比较严重,需要使用抹布擦拭并使用吸尘器吸出。
图4为C300机框底部进风口未清理前堵塞情况,严重影响进风。
清理后的效果如图5所示。
C320入风口和风扇清洁。
C320从机框右侧进风,左侧出风,风扇框在机框左侧。注意清理机框右侧入风口和左侧出风口,并清理风扇,清洁后的效果检查。
再次telnet或串口登录网元使用下面命令检查,观察网元降温效果:
Show fan
Show card-temperature
Show alarm pool
Show card
对于暂时解决不了的网元,网元风扇控制模式可以调整为固定转速,强制使用4的最大转速。
3.8 验收标准
具体对风道清洁处理后的降温效果验收规范如下:
所有板卡温度没有高于50度的线卡(10G PON板低于60度),环境温度低于30度。
现场假面板安装、机柜门关闭、风道口不堵塞、上下通风口至少留有3U空间、风扇告警灯灭等。
查看记录整改后的温度值备案:
Show fan
Show card-temperature
Show card
4 经验总结
通过以上方法,可以有效降低设备(中兴OLT设备)温度,确保设备运行在合理的温度,保证设备状态良好,不影响用户感知。