富士SX电控系统通讯故障的分析与处理
2022-01-11毛慧樑
毛慧樑
上海振华重工(集团)股份有限公司 上海 200125
0 引言
随着可编程控制技术与电力电子技术的发展,由PLC和变频器组成的电控系统已经成为码头起重机的控制中枢和标准配置。电控系统的正常工作是起重机安全、高效运行的基础,也能使维修人员方便快捷地对设备状态进行监控、及时发现和处理设备故障。不过一旦电控系统发生通讯故障,将导致整个电控系统停摆。不同于一般的电气故障,在出现通讯故障时,PLC系统就已无法正常运行,因而无法实现程序监控、程序强制等操作。平时维修人员可依赖的HMI设备也成为摆设,这种情况下经验不足的维修人员常感到束手无策。若故障发生在班轮作业时,更将严重影响码头的正常装卸作业。因此,要求维修人员尽快找到问题的根源,及时解决通讯故障,使设备重新恢复正常运行。
1 故障案例
某国外集装箱码头的1台富士电控岸边集装箱起重机(以下简称岸桥)在作业过程中会出现不明原因的机构急停,且每天都会报警2、3次,维修人员检查后发现:故障发生时CPU模块上报Error和Alarm双红灯状态,将PLC的控制电源断掉再重新送上后又一切正常,但再过一段时间又会报相同的故障。由于无法预测故障发生的具体时间,有时甚至会在起升、小车高速运行中发生故障,使结构晃动厉害。这种问题已持续一段时间,但维修人员始终无法找到问题的原因并彻底解决。
2 富士SX电控系统
富士SX电控系统主要由富士Micrex-SX系列可编程控制器、富士Frenic系列变频驱动器以及各种配件组成,具有性能优越、运行稳定、性价比高等特点。SX总线是一条用于连接富士Micrex-SX系列可编程控制器和富士驱动器的高速数据总线,是一个环形网络,系统的头尾两端都需要接上SX终端插头。所有的PLC模块都必须安装在基板上,每块基板上至少要安装1块电源模块和1块非电源模块。基板与基板之间使用SX通讯线来连接,每块基板的SX通讯线插槽分为IN和OUT,连接时SX通讯线的一头接IN,则另一头接OUT。
一个地点的SX通讯线总长度最多为25 m,超过25 m则需配置中继器来放大SX通讯信号。当2个基板之间距离较长时,一般推荐使用光缆模块通过光缆连接,2个光缆模块之间允许的最大传送距离为3 km(允许损耗9 dB)。PLC基板与驱动器之间由SX通讯线连接,这需要在驱动器内安装SX通讯选项卡。图1为富士SX通讯系统。
图1 富士SX电控系统
3 通讯故障的检测与识别
3.1 程序侧的模块故障检测
在所有硬件PLC模块安装好后,还需在富士PLC配套软件D300win的System Definition中将PLC模块逐一进行注册,并分配不同的SX总线地址,这样模块才能正常使用(System Definition是PLC程序的一部分)。此外,在CPU模块的系统内存中有一部分固定地址范围,用于表示每个模块的SX总线配置信息和SX总线故障信息。通过配置信息与故障信息的组合可表示SX总线上所有模块的状态。
由表1可知,仅当配置信息为1且故障信息为0时,对应的模块才正常。因此,可在PLC程序中依据表1内容编写简单的程序,以判断每个模块的状态是否正常(见图2)。程序的输出点可作为起重机控制合的条件,也可将对应的故障输出到HMI设备,供维修人员参考。
表1 利用CPU系统内存中的相关信息判断模块的状态
图2 PLC模块通讯故障的判断程序
这种通过PLC程序来判断模块故障的方式仅适用于较轻微的故障(即CPU仍能正常运行)。在D300win软件的System Definition中,进入CPU模块属性页面,可将所有已注册的模块(CPU模块除外)添加到故障弱化列表中以激活故障弱化功能(见图3),这样即使某个模块出现轻微故障,也不会影响CPU的正常运行。但是,如果模块发生的是致命故障,将导致CPU停止运行,程序逻辑也将停止扫描执行,则图2中的模块故障检测程序即失去作用。
图3 根据需要将指定的PLC模块添加到故障弱化列表
3.2 驱动器侧的通讯故障检测
驱动器与PLC模块之间也是通过SX通讯线连接的,驱动器与PLC之间的通讯遵循某一固定格式。若驱动器与PLC之间的SX通讯连接出现故障,可能导致PLC程序对电机速度控制的失效,酿成严重后果。为了防止这种情况的发生,在驱动器与PLC之间的SX通讯协议中增加2个Bit的触发信号(Toggle信号),用于判断SX通讯是否正常。
如图4所示,驱动器与PLC之间SX通讯故障检测机理为:1)当SX通讯建立时,从PLC定期发送2位触发器信号给驱动器,按00⇒01⇒10⇒11的顺序发送;2)驱动器把接收到的触发器信号再原封不动地反馈给PLC;3)由于2位触发器信号是按照一定顺序、一定规律发送的,若驱动器在运行中检测到触发器信号异常时(如接收的信号一直不变或未按正确的顺序来变化时),则驱动器会报Ar_1故障,并立刻停止输出,使电机停止运转。上述检测机制的实现需要PLC和驱动器的配合:
图4 驱动器与PLC之间SX通讯故障的检测机理
1)在驱动器侧 需要设置相关参数,以激活SX通讯故障监测的功能;还可设置参数来决定Ar_1故障报出之前的延时时间,以及报出Ar_1故障以后是否立即停止驱动器的输出等。每个驱动器都应进行正确的参数设置,以确保SX通讯监测功能正常。
2)在PLC侧 需要编写相应的程序逻辑,以保证2位触发器信号能按照00⇒01⇒10⇒11的顺序变化,并定期发送给驱动器(如每100 ms发送1次)。此外,在程序中也可定义一些故障连锁逻辑(软件故障),将这些连锁逻辑作为各个机构能正常运行的必要条件。每个带有驱动器的机构都应编写一段类似的程序。从程序侧或驱动器侧报出的通讯故障,一般都可通过复位按钮或断电重启的方法暂时复位掉,不过若频繁报故障,则必须引起重视并及时彻底排查(见图5)。
图5 PLC与起升驱动器之间SX通讯故障的判断程序
3.3 通过CPU模块上的指示灯提示故障
如图6所示,通过CPU模块指示灯可直观地了解当前SX系统的状态。当SX通讯故障的程度较轻微时,通常以驱动器故障代码或程序逻辑的形式来报出故障,此时虽有故障但CPU模块仍可正常运行(图6中轻微故障)。不过,当SX通讯故障的程度严重时,则会导致CPU模块停止运行。按照严重程度又可分为单红故障和双红故障2种。
图6 不同状态下CPU模块上指示灯情况(ONL是online的缩写)
一般在起重机的电气房内都会安装有工控机,并通过Ethernet网络和富士PLC连接(需安装专用的富士Ethernet通讯模块),主要目的是方便用户进行程序监控、驱动器参数读取、起重机管理系统(CMS)监控等。当单红故障时,富士PLC与工控机之间的Ethernet连接仍有效,用户仍可通过工控机进行程序修改、程序下载等操作。当双红故障时,Ethernet网络连接无效,用户必须使用笔记本电脑通过USB连线直接与富士PLC进行连接(CPU模块上自带USB接口),从而进行程序修改、下载的操作,这是单红故障与双红故障的区别。
4 通讯故障的原因分析
造成SX通讯故障的原因大致可分为硬件本身损坏、软硬件不匹配、其他外部原因等3类。
4.1 硬件本身损坏
即整个SX系统中存在1个或多个器件本身故障或损坏,硬件包括各种PLC模块(CPU、电源、I/O、通讯模块等)、PLC底板、SX通讯线、SX终端接头以及安装在驱动器内的SX通讯卡等,这类故障一般会导致双红故障。
4.2 软硬件不匹配
软件设置与硬件安装不匹配,即实际安装的各系统硬件本身都正常,但在PLC程序System Definition中的配置与实际安装的硬件不匹配,这种不匹配表现在:
1)程序中配置的硬件数量与实际安装的不一致;
2)程序中配置的硬件型号与实际安装的不一致;
3)程序中配置的硬件排列顺序与实际安装的不一致;
4)驱动器参数的设置不正确也可能导致不匹配,如前述驱动器与PLC模块之间是通过SX通讯线连接的,驱动器与PLC之间的通讯遵循某一固定格式。富士SX系统支持3种不同的传输格式:8W+8W标准模式(输入8个字输出8个字)、4W+12W监控模式、29W+22W高级模式。通过设置驱动器内相关参数的值来决定采用传输格式。同样,在PLC程序的System Definition配置中也要选择相应传输格式的驱动器。若驱动器参数与程序配置所选择的传输格式不一致,也将导致通讯故障,这类由软件与硬件不匹配产生的通讯故障一般会导致单红故障。
4.3 其他外部原因
这类原因一般是指由于通讯线在设计、安装、排布等的过程中考虑不周,使SX通讯信号受到外部干扰或信号衰减而产生的故障,可能有几种情况:
1)SX通讯线排布不当 SX通讯线中传输的是高频弱电信号,在施工走线时应尽可能远离强电电缆,有条件时可套金属软管,并将软管可靠接地。若需要符合CE标准,还必须在每一根SX通讯线的两端安装铁氧体磁环。通讯光缆在排布时应注意避免弯曲半径过小,以防止过度弯折导致的光缆损坏。
2)SX通讯线过长 SX通讯线在一个地点的总长度应尽可能短,若该长度大于25 m(如岸桥的电气房内底板、模块、驱动器数量较多时),这种情况必须加装SX通讯中继器来放大信号强度,否则会使SX通讯信号在传输时过度衰减,造成通讯故障。
3)SX通讯线的质量问题或使用时间过长使屏蔽性能、传输性能下降,若发现频繁报通讯故障,并确认是某一段通讯线问题的,应及时更换新的通讯线。同样,老旧机器的光缆可考虑重新测试其传输损耗,并根据情况更换备用光缆芯线或更换光缆。
4)SX通讯线接头未可靠固定或连接 起重机在运行时不可避免地会产生晃动,随着时间的推移会使接头松动,从而导致通讯故障。光缆在中间连接盒的对接接头做得不好、SX通讯线的水晶头子未压好等都可能导致通讯故障。
这类由于外部原因导致的通讯故障,可能报单红故障,也可能报双红故障,甚至可能暂不影响CPU的运行,但却是安全隐患。
5 富士SX通讯故障的处理方法和步骤
5.1 初步了解故障情况
由CPU模块上指示灯状态可知故障的严重程度,还可通过查看软件中SX通讯故障的诊断信息了解故障的详细情况。在D300win软件中,故障诊断信息的查看路径为:Project Control Dialog→Failure Diagnosis→点击左侧CPU图标→点击右侧选项卡的Fatal Failure,即可显示当前CPU故障的详细信息。图7~图9为可能遇到的故障诊断信息。
图7 CPU模块故障信息举例一(单红)
图8 CPU模块故障信息举例二(单红)
图9 CPU模块故障信息举例三(双红)
D300win软件中的故障信息对于前述的硬件与软件不匹配情况有帮助,而对于另外2类原因造成的通讯故障有可能帮助不大。当发生双红故障时,虽然也能使用USB连接线尝试读取PLC软件中的相关故障信息,但几乎无参考意义。
在D300win软件中,除了查看故障诊断信息外,若CPU模块正常运行还可查看SX总线数据包错误计数器,以判断SX总线传输中是否有错误。计数器的查看路径为:Project Control Dialog→Failure Diagnosis…→点击左侧CPU图标→点击右侧选项卡Bus transmission,就会显示一张SX总线数据错误的计数器列表。在正常情况下,所有计数器都应为0(见图10),若发现某些计数器不为0或计数器的值正在累加,则表示SX总线数据在传输中有错误。
图10 SX总线数据错误计数器列表
5.2 使用排除法和两分法定位到具体的故障点
这一步是故障排查中最重要的,因为软件中经常无法直接提示SX通讯故障的具体位置,需要按部就班地进行排查。
岸桥和轮胎式集装箱起重机(以下简称场桥)都是集装箱码头的主要作业设备,场桥的电控系统比岸桥的要简单(场桥体积小,需要控制的设备较少,对应需要的输入输出点较少,则系统中PLC底板数量、模块数量也相对较少),但处理通讯故障的思路和方法一致。所以,为了简便说明,本文以场桥电控系统为例来介绍。
故障排查前的重要注意事项:由于在故障排查时需要插拔SX通讯回路中的一些硬件(包括PLC模块、变频器内的SX通讯卡、SX通讯线、SX终端插头、光缆跳线等),在硬件插拔前务必切断PLC模块的控制电源和驱动器的控制电源,否则带电插拔很可能会损坏硬件。
由图11可知,电气房与司机室的PLC站点之间由于距离较远,所以用光缆连接,而电气房或司机室内部各PLC站点之间都用SX通讯线来连接,SX通讯系统的头尾必须安装SX终端插头,以形成环形结构。
图11 典型的场桥富士SX电控系统通讯结构图
与通讯结构图相对应的D300win软件中的System Definition设置如图12所示(光缆模块可不必注册)。当发生通讯故障后,为了定位具体故障点,可将该电控系统分为电气房和司机室2部分。然后尝试将司机室部分脱开,组成新的较小的SX系统。为了组成该SX系统,需在软件和硬件上分别进行修改:
图12 与实际通讯结构对应的D300win中system definition配置
1)软件 应修改程序的系统定义,在D300win的System Definition页面上方有一排功能按钮(见图13),使用其中的 No equipment按钮(将一块模块脱开,使之不参与程序扫描)或No equipment batch setting按钮(将一块底板上的所有模块脱开,使之不参与扫描,且仅选中底板时有效)将所有司机室的底板、模块等暂时开(即不参与程序扫描,脱开后该硬件左侧的图标上会有红钩标记,见图14红框中的部分),然后重新编译并下载程序。
图13 D300win软件中System definition页面上方的功能栏
2)硬件 为了与软件定义相匹配,应将司机室的所有器件脱开(仅需脱开电气房的光缆模块即可)。修改以后的软件配置和硬件连接如图14所示。
图14 将司机室部分脱开以后的硬件和软件配置
将司机室部分脱开并重新送电后,若CPU正常工作(双绿灯),则说明问题在电气房外部;若仍有故障(单红或双红),则说明问题在电气房内部;假设以上尝试后故障依旧,则问题在电气房内部。由于电气房内部的器件较多,若逐个模块用排除法则太费时。因此,可将电气房内部的器件再一分为二,带有CPU的部分又能组成一个新的更小的SX系统。例如,将电气房内的所有变频器也脱开连接,同样需同时在软件和硬件上进行修改。修改后的软硬件设置如图15所示。
图15 将司机室模块和4个驱动器都脱开以后的硬件、软件配置
经过上述修改并下载程序重新送电后,假设故障已消除,说明问题就在4个变频器中间(可能是变频器间的SX通讯线,也可能是变频器内的SX通讯卡或参数设定问题等),可将这4个变频器再一分为二,把其中的2个变频器(起升变频器和小车变频器)利用No equipment release按钮(将一块模块或一块底板上的所有模块重新加入程序扫描)重新加入程序扫描,组成一个新的稍大一些的SX系统(注意此时需调整终端插头位置,确保SX系统的头和尾各有一个终端插头),见图16。
图16 将司机室模块和2个驱动器脱开以后的硬件、软件配置
以此类推,继续排查,直到找到具体的故障点。在上述排查过程中,假设有且只有1个故障点。对于多个故障点的情况可采用相同方法逐一查找,不再赘述。一般地,场桥电控使用3、4次的排除法和两分法即可准确找到故障点。
在使用排除法将系统不断缩小时,至少要保留1块底板、1个电源模块、1个CPU模块和2个终端插头,形成最小SX系统(见图17)。若最小系统模式下仍报双红灯故障,则说明某个器件出现硬件损坏,只能逐一替换进行排查。
图17 最小SX系统
5.3 根据故障点具体情况,采取措施解决故障
若是纯硬件故障,则使用相同型号的备件进行替换(平时用户应准备一些常用的模块、板卡、SX通讯线、SX终端插头等,以备不时之需,起重机制造商一般会推荐一些常用的备件,用户可根据需要进行采购);若是软硬件不一致问题,则只需逐一核对硬件信息、修改D300win软件中System Definition的设置即可;若排除了这2种情况,则可能是外部原因造成的故障,可尝试将通讯线重新插拔一下、更换通讯线、将通讯线重新排布、重新制作通讯线的接头等措施。
在CPU正常运行期间,监控SX总线数据错误计数器列表,发现其中有几个计数器的值在持续增加,若维持现状,则数小时后当所有错误计数器累计值之和大于某个预设值(如99999)时CPU模块就会报双红故障,并导致机构急停。且每次将PLC断电重启后,这些计数器的值都会重新归零,系统就又能正常工作。这就是该系统不定期地报通讯故障,但重启PLC后又能恢复的原因。根据该故障情况,维修人员使用排除法和两分法来定位故障点,发现在紧靠电气房的门外还有一个较小的控制屏,其中也有PLC模块和底板,且该控制屏内的模块底板是整个电气房SX系统的最后一站(即底板OUT端接了一个终端插头)。若将该小控制屏的PLC模块从整个系统脱开,错误计数器就停止累加,说明问题就在小控制屏内或在电气房到小控制屏之间,将电气房到该控制屏之间的SX通讯线更换,问题得到解决。
6 结束语
通讯故障的处理需要维修人员对整套电控系统(包括硬件、软件、图纸等)有较高的熟悉程度。遇到通讯故障问题后,首先要读取软件内的故障信息和SX通讯错误计数器,再采用排除法和两分法逐个查找故障源头。处理时必须思路清晰,特别是对于岸桥电控这样比较复杂的系统,排查时要根据前一步所得到的不同结果来决定下一步的不同操作,这种处理思路也适用于其他环形结构的电控系统。