工业自动化控制DCS系统维护技术分析
2021-12-10郝宏伟
郝宏伟
(国能锦界能源有限责任公司,陕西 神木 719319)
随着中国科学技术的发展,工业生产领域的自动化程度越来越高,一些高科技含量的设备投入越来越多,这些设备运行参数复杂,需要功能更加完善的控制系统来监控其运行。在工业自动化控制中,DCS系统的广泛应用让自动化控制的可靠性越来越高。但由于DCS系统运行的环境复杂,加上系统本身的软硬件组成复杂,难免会出现一些故障。为了更好地发挥DCS系统在工业自动化控制中的作用,需要加强对系统的维护,总结其在运行中常发生的故障类型,并结合生产实践,针对性地采取科学措施进行系统维护,确保其稳定运行,更好地发挥控制功能。
1 DCS系统
DCS系统也被称为集散控制系统,即集中管理、分散控制系统,它是区别于集中控制系统的。DCS系统的信息传输主要是依靠网络通信,而且其过程控制主要依靠计算机系统,这些计算机系统又设置成不同的层级,进而实现对不同层级的设备进行过程控制。DCS系统不是由单一的系统组成的,而是融合了计算机网络、自动化控制等现代技术,正是由于这些现代技术的融合应用,才让DCS系统的运行速度更快,对设备的控制更加可靠。其控制原理是所有的运行系统都通过中央控制室来监控,而执行控制任务的每个单元都是分散独立的。比如,控制芯片、显示器等,包括相对应的数据库之间的运行都是独立的。这样的话,就保证了整个系统的可靠运行。而且DCS系统监控以及组态的软件包都具备良好的功能,运行起来的安全性能很高,再加上结构冗余的硬件设计,让DCS系统有了更好的拓展性。当前,随着科学技术的发展,DCS系统的功能也越来越完善,可以和一些系统进行结合,满足不同生产环境下的控制需求,进而发挥更大的作用。比如,DCS系统可以和企业资源计划系统进行结合,不仅可以监控生产过程,还可以在原料的调度方面、生产计划方面等发挥作用,让工业生产更加的稳定,更加有秩序。
2 DCS系统的故障诊断流程及方法
2.1 故障诊断流程
在实际运行中,DCS系统运行的环境不同,高温、高湿、粉尘等恶劣环境都有可能会给系统带来危害。而且不同的运行环境下,DCS系统的故障也可能不同,不同故障的外在表现也有差异。长期在高温环境下运行出现的故障和在高湿环境下运行出现的故障也有不同,因此要根据DCS系统运行的环境以及不同故障的外在表现等来判断故障发生的原因,哪些部位以及零部件易出现故障等。结合生产实践,对DCS系统的故障排除流程为:
第一,要确定好故障源。发生故障以后,要先判断故障源是现场仪表故障引起的,还是DCS系统故障引起的。首先排除仪表,如果是仪表出现问题,要进行维修,损坏的零部件要及时更换;如果是DCS系统故障,需要进行进一步的排查。
第二,人为操作不当引起的故障。这类故障相对来说在实际中出现的比较多,而且排查起来比较便捷,比如线路断开、短路、零部件损坏等,这些都比较易发现。主要包括接线故障、模块安装不当等,还有相关的操作人员在进行系统操作时,由于操作不当导致的参数整定错误,系统的状态设定错误等[1]。
第三,确定故障源是DCS故障后,要明确是硬件损坏引起的故障还是软件系统导致的故障。如果是硬件故障,要结合工作环境及生产实践经验,快速排查易发生故障的部位或零部件,之后进行零部件的修复或更换。如果是软件系统故障,可以尝试先将系统进行重启,如果故障无法消除,再尝试安装新的系统软件,若故障消除,则可正常启动;如果故障仍未消除,要检查系统中编写的程序及组态的数据,再由专业的系统人员进行维护,或者可以和系统的供应商进行联系解决。
2.2 常用的故障诊断方法
DCS系统自身带有故障自诊断程序,自诊断程序会定期对总线及网络上的一些模块、部件等进行诊断。如果在运行中出现异常,系统就会形成故障代码,而相应的故障代码则通过操作站来传送给操作人员。操作人员根据故障代码了解到故障信息后,需要进行常规的检查,主要是对发生故障的部位进行逐步排查。在实际中,常用的故障排查法主要有以下几种:
第一,直接判断法。根据系统生成的故障代码,结合故障现象以及之前的故障记录等,对发生故障的部位及原因直接判断[2]。这种诊断方法需要操作人员有丰富的维护经验,能够根据经验基本上判断出故障的原因。但是通过直接判断法有时候并不能确定故障的准确部位,只能确定出故障的大致部位,还需要进行检查确认,确定故障后再进行排查。
第二,外部检查法。这种检查方法适用于表面易发现的故障诊断。通过外部检查,可以将故障诊断的时间大大缩短,主要是通过观察来发现一些零部件是否有损坏、接线头的连接是否良好、插头是不是有松动以及线路是否存在断开等情况。有的故障可以通过对设备的轻微敲击或晃动等进行判断,比如线路连接不良的情况,可以通过轻微晃动将连接不良的部位查找出来,一般连接不良的部位易发生脱落。
第三,分段查找法。对于发生故障的部位不明确,或者是影响的范围不清晰,可以采用分段排查法,缩小故障的排查范围。可以将发生故障的大致范围进行分段查找,对于在实际运行中可能出现故障的线路及零部件进行分段检查,进而确定故障发生的部位。
第四,替换对比法。在实际的故障排查中,这也是比较常用的一种方法。该方法操作起来也比较便捷,但前提是要对故障发生的部位尽可能地缩小,以减少零部件替换的时间。对于疑有故障的零部件,用新的零部件进行替换安装,如果故障排除,则是零部件损坏导致的故障,如果故障没有排除,则需要进一步对怀疑有故障的零部件进行替换安装,直到故障排除。需要注意的是,在进行新的零部件替换安装前,要确定系统中不存在短路或断路的情况,否则会导致新替换安装的零部件出现损坏,不仅浪费了维护的时间,还提高了维护成本,造成不必要的浪费。
3 工业自动化控制DCS系统常见故障
3.1 通信网络故障
在DCS系统中,其通信网络主要是两个方面:一方面是用于过程处理器的通信,一方面是用于人机交互的通信。在实际运行中,不论是哪个方面的通信网络出现问题,都会让DCS系统的控制功能受到影响[3]。导致DCS网络通信故障的主要原因是数据传输不通畅或中断、信号干扰等。在通信网络中,信息数据的传输主要通过节点之间的问询进行,如果某节点向其它的节点问询某数据,而被问询的节点没有此类的数据,那么问询的节点就会不断地向其它节点问询数据,这样的话就会导致通信不通畅。还有就是进行信号传输的电缆若长期未进行更换,出现老化、腐蚀等现象后,会导致通信线路中断。此外,在工业生产控制中,会有很多的运行设备,这些不同的设备在系统中承担着不同的作用,设备之间的信号传输存在一定的干扰,对DCS系统的信号传输形成干扰,影响其正常传输。
3.2 服务器切换异常
一般在DCS系统停运检修后,易出现DCS系统的主、辅服务器切换异常的情况。主要的故障现象是:CRT画面显示为灰色,而且显示的信息均为乱码,点击报警记录,显示服务器B(A)→服务器A(B),点击右下角的系统图后,显示为网络故障。有故障的服务器显示为红色,无故障的服务器显示为绿色,控制器部分是正常的。主要原因是:DCS系统只进行一次对时,有可能导致主、副服务器的时间不一致,出现无法切换的情况,也有可能是主服务器的信号未发出,或者是故障信号发出后,副服务器没有收到信号,导致主、副服务器切换异常。
3.3 电源故障
电源是保证DCS系统稳定运行、有效监控的基础。DCS系统中,为了防止突发故障后电源出现断路,导致系统停止运行,经常采用冗余双电源的模式进行供电,即一个主电源,一个备用电源。在实际运行中,主要依靠主电源进行供电,一旦主电源发生故障,系统可以主动切换到备用电源上,确保系统的运行安全稳定。电源故障主要是电源接线头接触不良、松动、回路端子排接线螺栓松动或过热等,电源的阻抗值变大影响输出、电源线布设不合理等,在一些具有强磁干扰的区域会导致电源过度的损耗。此外,电源保险烧毁、机笼烧毁等也是比较常见的电源故障[4]。
3.4 系统插件故障
DCS系统插件是一种连接器件,主要的功能是根据系统的运行要求,对电缆及电缆端头进行接通、断开,这些插件有的是需要接通的,有的需要绝缘的。在实际运行中,由于接触插件的材料选用不当、设计不合理以及运行环境影响等,会导致接触插件出现接触不良的情况,导通不畅。还有就是接触插件之间的灰尘、金属屑以及绝缘老化等,导致接触插件出现绝缘不良的情况。
4 工业自动化控制DCS系统维护技术
4.1 优化通信网络
根据DCS系统故障排查流程及排查法确定发生故障的原因及部位,确定部位、明确原因后进行针对性的维护。在日常的网络系统维护中,要多查看DCS主系统以及和主系统相连的系统之间的通信负荷率,可以采用网络测试仪器定期检查通信负荷率,如果该指标超过正常值,要及时进行网络通信优化,还可以将系统的运行参数进行调整,确保通信负荷率在正常的范围内。在实际生产中,降低通信负荷率也可以用优化网络架构的方式,比如在操作站与主控单元之间的服务器,一般采用的是单层网络架构,可以将其进行优化,采用双层网络架构的方式,以更好地降低通信负荷率。要定期检查通信电缆情况,有老化、绝缘损坏、腐蚀等现象要及时更换,还要保证新更换的电缆质量达到实际运行的标准。同时还要注意,对于双路冗余方式配置的电缆,要查看是否有插头松动、接触不良等情况,要及时进行维护。对于信号干扰带来的通信故障,要采取有效的措施让电气设备相互隔离开来,可以加大电气设备之间的间隔,也可以安装信号隔离装置,将地线网络隔开,这样的话,就会降低设备之间的相互干扰影响[5]。
4.2 服务器异常的维护
对于主、副服务器切换异常的维护,要先将CRT操作停止,确定机组的主机负荷稳定。之后,将红色报警服务器进行手动重启,检查服务器是不是一主一备,如果系统图上显示的是一台为绿色,另外一台为黄色,则确认为一主一备。再检查系统的网络和控制器有没有存在故障,如果网络和控制器均正常,则需要查看服务器的对时系统有无差别。如果是对时系统差别导致的切换异常,需要重新启动主服务器,并从软件设置上让主、副服务器每间隔一段时间进行一次对时,确保主、副服务器的时间一致。如果不是主、副服务器对时系统差别带来的切换异常,需要进行下一步排查。
4.3 加强电源维护
电源是DCS系统的重要组件,对于电源的维护主要是做好预防工作。首先,要把好质量关,在电源的投入使用前,要选择质量更好的产品,确保产品的参数满足实际运行要求。其次,在日常的维护中,要定期检查电源的回路以及输出电压等,查看电源内部元器件是不是有老化的现象,要及时更换元器件。利用红外线测温仪测试接线螺栓的温度,查看有无存在接线螺栓温度过高现象。查看电源的保险丝容量是不是符合运行的要求,有无存在保险丝容量过大或过小的情况。另外,需要注意的是,冗余双电源供电方式有其必然的优势,但也会导致电源故障报警信息不准,不利于对故障的判断。需要在停机检修时,尤其是要加强机笼的检修,因为机笼更换的流程较为繁琐,更换难度大,检修过程中很少进行更换,导致其长期运行,易出现烧毁的情况,因此最好是定期更换机笼[6]。最后,建立电源使用及维护情况管理日志,让检修人员能够掌握电源设备的运行情况,及时进行检修或更换零部件,也为后期的检修维护提供一些必要的参考依据。
4.4 系统插件维护
要定期对系统插件进行维护,尤其是装机后,要对插件的导通情况进行静态状态下的逐点检查。检查工作比较繁琐,需要检查的项目比较多,依靠人工手持仪器进行检查的话,需要耗费不少时间。实际中,可以借助导通检测仪进行检测,检测过程简单、效率高,而且不会出现漏检或错检的情况。还要做好动态振动试验,在静态下插件即便接触良好,实际运行中由于振动也会导致插件出现信号瞬时中断的情况,因此通过振动试验可以检验插件在系统运行情况下的接触情况。针对绝缘不良的情况,要经常进行插件清理工作,用吹灰器清理插件上的灰尘、金属屑等。在机组停运检修期间,对于平常难以清理的死角进行全面清理,使用专用清洗剂清洗插件以及插件的卡槽,确保插件与卡槽接触良好。检查插件的绝缘情况,出现绝缘老化的要及时更换,防止出现绝缘被击穿的情况。
5 结束语
DCS系统是工业生产领域的重要部分,对于工业自动化控制具有重要的作用。因此,需要加强对DCS系统的维护,根据其常见的故障进行针对性的维护排查。排查的过程中,要合理地应用一些常用的排查方法,可以快速便捷地查找故障部位,还要加强对DCS系统日常的检修,对于一些易发故障部位及零部件要重点监控,做到及时发现故障,及时维护排查,让DCS系统更加稳定地运行,为工业自动化控制发挥自身的作用。