APP下载

监控系统工控机的日常维护与维修

2013-04-16王兆勇

交通运输研究 2013年20期
关键词:死机工控机驱动程序

王兆勇

(邢台邢临高速公路管理处,河北 邢台 054000)

工控机是一种加固的增强型个人计算机,它可以作为一个工业控制器在工业环境中可靠运行。早在20世纪80年代初期,美国AD公司就推出了类似IPC的MAC—150工控机,随后美国IBM公司正式推出工业个人计算机IBM7532。IPC的性能可靠、软件丰富、价格低廉,因而在工控机中异军突起,后来居上,应用日趋广泛。在邢临高速公路监控系统中,工业控制计算机(以下简称“工控机”)起到了关键作用。因此,工控机的安全也显得尤为重要。本文结合邢临高速公路的实际情况,就高速公路监控系统中工控机的日常维护与维修展开分析与讨论。

1 工控机硬件故障原因分析

1.1 硬件本身质量不佳

粗糙的生产工艺、劣质的制作材料、非标准的规格尺寸等都是引发故障的因素,常常引发板卡上元件焊点的虚焊脱焊、插接件之间接触不良、连接导线短路断路等故障。

1.2 人为因素的影响

操作人员的使用习惯和应用水平也不容小觑,例如带电插拔设备、设备之间错误的插接方式、不正确的BIOS参数设置等均可导致硬件故障。

1.3 使用环境的影响

使用环境包括温度、湿度、灰尘、电磁干扰、供电质量等方面。每一方面的影响都是严重的,例如过高的环境温度会严重影响设备的性能,等等。

1.4 其他影响

设备的正常磨损和硬件老化也常常引发硬件故障。

2 工控机硬件故障检修步骤

2.1 先检查软件,后检查硬件

工控机发生故障后,一定要先排除软件方面的原因(例如BIOS参数设置不当引起工控机不能重启、电子盘扇区损坏导致红外线程序不能运行等)之后再考虑硬件原因。

2.2 先检查外部设备,后检查主机

由于外部设备原因引发的故障往往比较容易发现和排除,可以先根据系统报错信息检查外部设备的各种连线和本身工作状况。在排除外部设备方面的原因后,再考虑主机。

2.3 先检查电源,后检查部件

电源的作用很重要。电源功率不足、输出电压电流不正常等都会导致各种故障的发生。因此,应该首先排除电源的问题,然后再考虑其他部件。

2.4 先考虑简单故障,后考虑复杂故障

硬件产品并不易损,因此在遇到硬件故障时,应该从最简单的原因开始检查,如判断各种线缆的连接情况是否正常、各种插卡是否存在接触不良的情况等。若在进行上述检查之后故障依旧,这时方可考虑部件的电路部分或机械部分存在较复杂的故障。

3 工控机硬件故障检修方法

3.1 由于软件设置方面的原因导致硬件无法工作的故障检修方法

对由于软件设置方面的原因导致硬件无法工作的,故障检修方法为还原BIOS参数至缺省设置:开机后按Del键进入BIOS设置窗口→选中“Load Optimized Defaults”项→回车后按Y键确认→保存设置退出。

3.2 对硬件资源冲突或是在添加安装完某硬件或更新某硬件的驱动程序后出现频繁“死机”故障的检修方法

对于硬件资源冲突这类情况来说,通常是发生了设备冲突问题,如中断、DMA、端口、I/O等出现冲突。

对于添加安装完某硬件或更新某硬件的驱动程序后出现频繁“死机”这类情况来说,是所安装的硬件驱动程序存在兼容性问题,可能是这个硬件设备新安装的驱动程序与另一个设备的驱动程序存在冲突,或是新驱动程序本身存在问题,或是新驱动程序与系统的某个文件存在版本冲突,还有可能是安装了别的操作系统下的驱动程序(比如把用于Windows XP的驱动程序安装到了Windows 2000的操作系统中)以致于发生死机故障。由于引发该故障的可能性非常多,所以要采取相对应的解决方法,比如:以“安全模式”启动,然后在“设备管理器”中进行相应的查看和设置,或者卸载这个驱动,安装经过微软认证的驱动程序。安装后在硬件驱动程序版本里边有“数字签名程序:Microsoft Windows Hardware Compatibility Publisher”字样。

3.3 直接观察法

直接观察法即通过看、听、摸、嗅等方式检查比较明显的故障。例如根据BIOS报警声或Debug卡判断故障发生的部位;观察电源内是否有火花、异常声音;检查各种插头是否松动、线缆是否破损、断线或碰线;电路板上的元件是否发烫、烧焦、断裂、脱焊虚焊;各种风扇是否运转正常等。有的故障现象时隐时现,可用橡皮头轻敲有关元件,观察故障现象的变化情况,以确定故障位置。

3.4 插拔替换法

初步确定发生故障的位置后,可将存疑的部件或线缆重新插拔,以排除松动或接触不良的原因。例如将板卡拆下后用橡皮擦擦拭金手指,然后重新插好;将各种线缆重新插拔等。如果经过插拔后不能排除故障,可使用相同功能型号的板卡替换有故障的板卡,以确定是板卡本身已经损坏还是主板的插槽存在问题,然后根据情况更换板卡。

3.5 系统最小化法

最严重的故障是机器开机后无任何显示和报警信息,应用前文所述方法已无法判断故障产生的原因。这时可以采取最小系统法进行诊断,即只安装CPU、内存、显卡、主板。如果不能正常工作,则在这四个关键部件中采用替换法查找存在故障的部件。如果能正常工作,再接硬盘(电子盘)等。以此类推,直到找出引发故障的罪魁祸首。

3.6 交换法

将同型号插件板,总线方式一致、功能相同的插件板或同型号芯片相互交换,根据故障现象的变化情况判断故障所在。此法多用于易拔插维修环境,例如内存白检出错,可交换相同的内存芯片或内存条来判断故障。总之,若能找到相同型号的微机部件或外部设备,使用交换法可以快速判定是否是元件本身的质量问题。交换法也可用于以下情况:没有同型号的微机部件或外部设备,但有相同类型的微机主机,则可以把微机部件或外部设备插接到该同型号的主机上以判断其是否正常。

3.7 对比检查法

运行两台或多台相同或相类似的计算机,根据正常计算机与故障计算机在执行相同操作时不同表现可以初步判断故障产生的部位。

3.8 敲击检查法

用手指轻轻敲击机箱外壳,有可能解决因接触不良或虚焊造成的故障问题。比如:用手指或塑料棒轻敲主板的南、北桥芯片来判断是否是BGA虚焊;然后据此再进一步检查并确定故障点的位置。

3.9 由信息阻断造成工控机“死机”的故障检修方法

中控室工控机(上位机)监视和控制S7—400PLC(下位机),信息阻断时故障现象为:工控机画面上监控信号处出现阴影且信号数值都为零,上位机对下位机无法监视和控制。这种故障与前面提到的“死机”现象不一样。该故障是由信息阻断造成的,由于下位机“死机”或传输信号网线和网卡发生故障,导致上位机接收不到信号,其实上位机并没有“死机”。这种故障曾于2011年11月初在邢临高速公路发生过,是由于网线和网卡接触不良导致上位机对下位机无法监视和控制。

针对这类故障的处理办法为:当上位机画面出现“阴影”时,首先需要检查下位机的工作状态,S7—400PLC的CPU模板上有各种错误指示灯,可根据指示灯的状态进行操作。如果PLC“死机”,则用钥匙将PLC的CPU重新启动就能恢复正常。如果网线和网卡有问题,操作工应立即检查上、下位机的信号电缆插头有无接触不良,用手对各插头轻压或摆动,很有可能找出故障点。

4 结语

在工控机常见故障维护中,应先根据现场情况分析问题可能出在哪儿,然后再动手操作。先从软件入手,然后再从硬件着手分清是机械原因还是电气原因造成的。笔者在实际工作采用上述办法,快速修复了工控机故障,保障了正常生产。

猜你喜欢

死机工控机驱动程序
电脑死机时在干什么
提醒
定制工控机在老旧线路计算机联锁设备中的应用
中压电子束焊工控机Windows NT系统文件丢失故障的修复方法
计算机硬件设备驱动程序分析
脸死机了
中国工控机市场新Style
新汉 前插拔CoreTM-i系列无风扇工控机
基于MPC8280的CPU单元与内部总线驱动程序设计
计算机“死机”故障原因与排除