APP下载

减少TDCS主机硬盘故障

2015-05-30莫建国

关键词:工控机故障率硬盘

莫建国

摘 要:当今铁路信号技术中电子计算机得到了广泛运用,提高计算机及部件的使用寿命显得十分重要,本文主要以现场实际运用为基础,通过具体分析、深入调研、攻关整治等手段,从四个方面点介绍了延长工控机硬盘使用寿命的措施和方法,最后经现场试验运用,在安全风险和维修成本上都收到了明显效果。

关键词:工控机;硬盘;隔热板;管式散热器;维修成本;故障率

随着铁路自动化进程的不断加快,铁路信号设备在系统中的地位愈加重要,尤其是计算机技术在铁路信号领域的大量运用,更是带动了智能控制的技术水平。因此,各类工业化计算已经成为铁路行车的核心设备,它不但运算输入或输出的大量数据,而且要完成连续几个月甚至几年的不间断工作,另外受资金、环境等因素限制,电子设备超期运用是普遍存在的。这样就要求现场维护人员更加注重延长工控主机及部件的使用寿命,实际上,发生工控机硬盘、风扇等器材不良引起的设备故障比较多,不但影响行车秩序还大大增加了维修成本。如何使硬盘、风扇等消耗性电子器件的使用寿命更长,是摆在我们面前的现实性课题,为了解决这个问题,进行了大量的调研、分析、试验和改进,现就TDCS设备中工控机的硬盘故障的分析控制情况进行介绍。

1 硬盘故障影响

如右图所示,铁路信号TDCS系统由三层组成,涉及到路局中心及各车站,所以系统中的工控主机分散到铁路沿线。TDCS站工控机一般采用研华610H型,其硬盘接口为IDE,且硬盘故障在站机故障总数中所占比例最大,经统计,管内共有77个TDCS车站,平均每年发生TDCS工控机硬盘故障达80次。

1.1 成本分析:一块IDE接口80G硬盘需要770元,且这种类型接口的硬盘已经停产,市场上买不到,购买器材到货的速度也是很慢,有时长达3个月。据统计全段每年仅更换硬盘一项的费用支出达到12万元,而且呈不断上升趋势。如果要控制维修成本,就要从根本上分析硬盘故障原因,通过攻关问题找到延长硬盘寿命、减少硬盘故障的办法。

1.2 安全分析:由于硬盘故障可造成TDCS设备前台终端黑屏,耽误调度监督、站间透明,车站值班员也不能正常进行列车运行报点、查看调度命令等操作,甚至看不到邻站的站场信息,严重影响了正常的行车秩序,而且故障设备分布在沿线各站,电务人员(包括现场车间和电子车间)总是疲于应对,花费了大量的人力物力,还增加了人身安全等方面的风险系数。

2 硬盘故障原因分析

2.1 现场运用环境差是硬盘故障的主要原因。经过有针对性的现场抽样调研,我们发现由于铁路沿线运转室条件的不同,硬盘在现场的安装环境也各不一样。不利的因素主要是:①部分车站的机柜运行环境很差,不利于通风或灰尘大的处所较多,有的车站还将设备安装在太阳直射或暖气片加温位置,造成了机器外部温度、湿度变化大;②有的受机柜空间限制,将两(三)台工控机直接摞放在一起(如图所示),造成机箱的通风口通风不畅,严重影响了机器的散热;③因设备安装在运转室,距离铁路线路较近,随着列车的运行而颤动,颤动对硬盘的伤害是很明显的。

2.2 工控机本身结构也是造成硬盘易损的重要原因。①由于安装硬盘架底部与底板间距太小、环境温度高、自身散热不好,造成硬盘运用时无法及时散热;②硬盘与主板连接使用的电源线和数据线都是插接的,而且处于未绑扎状态受外界颤动影响更为明显,容易造成硬盘供电的电压波动或数据变化,使硬盘工作在一个不稳定的工作状态。

2.3 硬件质量存在问题是硬盘故障的次要原因。①由于IDE接口硬盘已经基本处于停产状态,所以厂家新供的硬盘多是多年的存货,甚至是回收翻新的旧货,有的新硬盘运用到现场不到一年就坏了;②风扇作用不良也是造成硬盘故障的因素之一,现场检查发现有的新购置的风扇结构不合理,风力达不到、转速不足,还有的風扇短时间就停转了,因风扇问题造成主机箱内空气对流效果差,温度较高,也加快了硬盘的损坏速度。

2.4 没有试验和监测设施是硬盘故障的间接原因。通过以上分析我们发现硬件材质不良是设备维护上的漏洞,使用人员没有可用的监控试验设备和控制管理手段,新货到达现场后,只好根据目测表面的方法进行直观判断,几乎不能发现实质性问题,得不到可信的数据信息,硬件设备质量只能过分依赖于厂家。

2.5 连续运用时间过长是造成硬盘损坏的不可控因素。由于列车不间断运行,铁路信号设备不能停止,有的设备连续运用可能达到几年,电子设备长期运用时,会对硬盘等设备造成损害,但这是铁路的运输要求决定的,不能改变,只能通过解决以上四方面问题,优化环境、改变结构、加装部件来延长硬盘等设备的使用期限。

3 采取的有效解决措施

3.1 解决IDE接口硬盘问题。针对现用的IDE接口硬盘价格贵、供货慢、容量小、质量差等问题,对比市场上最通用的SATA串口硬盘,发现SATA串口硬盘有容量大、缓存大、运行速度快、稳定性高等特点。提出了将IDE接口硬盘更换为SATA串口硬盘的方案,同时试验并制作了SATA转IDE的硬盘转换板,在SATA串口硬盘上加接转换板后,就可以代替IDE接口硬盘的工作,从而解决了IDE接口硬盘型号问题;此外还对4个厂家生产的大风扇现场运用质量进行了全面的统计,发现“酷冷至尊”牌风扇故障率最低,且使用期限最长,规定了使用固定厂家生产风扇的要求。

3.2 搭建CTC、TDCS设备试验台。确定硬盘、2T模块、风扇的使用标准,将新购置的硬件上道前进行通电试验,并规范上电试验时间,试验进行时时监控,此外建立一套基础数据档案,记录期间特性变化、风扇风力等相关数据。

3.3 解决环境及温度对硬盘的影响。调研中发现车站TDCS终端有四个方面的弊端,第一,安装在暖气附近或太阳直射的,会造成机柜内或主机箱内的温度快速变热,这类情况要在机柜门处安装隔热板,起到恒温的作用。第二,针对有的车站值班员终端的两(三)台工控机摞在一起影响散热的问题,采用在两个工控机间用10mm支架隔开的方法,加大散热面积。第三,在个别车站采用加大工控机风扇功率的办法,加强工控机散热。第四,对工控机内部的电源线进行绑扎固定,防止颤动对连线接触的影响。

3.4 解决硬盘自身散热和颤动问题。调研发现硬盘本身热量散发的效果不良是导致硬盘故障的主要原因,解决这个问题提出三个方案,第一,在硬盘架上安装硬盘散热风扇,这样做的优点是散热效果最好。缺点是风扇长期运行,容易产生噪音和振动,对于高速旋转的硬盘来说,噪音和振动是最不利的条件,将使磁头在读写时易划伤磁盘,因此不建议采取这种方案。第二,改变硬盘安装位置,提高硬盘散热间距,原硬盘安装在硬盘架底部,与底板间距太小,用自制的转接支架,安装在空闲的光驱卡槽上,提高硬盘与底板的间距,提高散热效果。其优点是成本低易实施;缺点是靠硬盘外壳自散热效果不明显。第三,安装热管式硬盘散热器。如图所示,根据硬盘大小自制适用于3.5英寸的散热器,通过加大散热面积来降低硬盘的温度,就是用铝制材质热管靠在硬盘上,硬盘产生的热量通过热管散发到机箱内,被机箱散热风扇冷却。具体安装方法如下:①用螺丝将硬盘散热器与硬盘固定好。②再将装好的硬盘用螺丝固定到光驱卡槽上面即可。这样做的优点是无噪音、无振动、散热效果好。缺点是需要自制器材。通过一年的上道试验,发现这种方法效果良好,所以建议使用这种散热方式,保证降低TDCS站机硬盘损坏频次。

4 总结效果

4.1 通过以上分析、攻关、试验和尝试,2015年以来月均仅发生一次硬盘故障问题,具体数量对比如右表所示。人员大大减少了现场处理故障的频次,既减少了人力物力资源,也规避了人员现场作业的安全风险。

4.2 由于硬盘故障的减少,相关维修成本也在直线降低,而且改用SATA串口硬盘价格仅180元/块,预计每年能够节约成本在10万元以上。

猜你喜欢

工控机故障率硬盘
HiFi级4K硬盘播放机 亿格瑞A15
Egreat(亿格瑞)A10二代 4K硬盘播放机
定制工控机在老旧线路计算机联锁设备中的应用
中压电子束焊工控机Windows NT系统文件丢失故障的修复方法
探索零故障率的LED智能显示终端
基于故障率研究的数字保护最优检修周期
我区电视台对硬盘播出系统的应用
降低空气开关跳闸故障率的措施研究
中国工控机市场新Style
新汉 前插拔CoreTM-i系列无风扇工控机