对地铁SCADA通讯中断问题的分析
2015-11-05黄涛苗因山
黄涛 苗因山
摘 要:SCADA通讯中断主要由通讯网络故障和设备参数配置错误两个方面造成。该文从通讯网络和设备参数的配置两个方面对地铁SCADA通讯中断的问题进行了分析和阐述,并根据不同的通讯介质和通讯接口详细介绍了通讯故障产生的原因和排查处理方法。通讯网络故障方面文中根据通讯网络传输介质的不同,主要介绍了光纤网络和铜线网络的通讯原理,影响通道的因素及分析排查的方法。设备参数配置错误方面,主要介绍了数据寻址的原理,以及影响以太网和串口通讯的有关参数的配置及参数对通讯的影响。
关键词:地铁 SCADA 通讯中断 故障分析
中图分类号:TN85 文献标识码:A 文章编号:1674-098X(2015)09(a)-0051-03
Abstract:SCADA communication interrupt is mainly caused by two aspects: communication network fault and equipment parameter configuration error. This paper analyzes and expounds the problem of the disruption of the SCADA communication from two aspects: communication network and equipment parameters,And according to the different communication medium and communication interface, the cause of the communication failure and the method of troubleshooting are introduced in detail. In the communication network, according to the different communication medium, the communication principle of the optical fiber network and the copper wire network is introduced, and the factors affecting the channel and the method of analyzing the network are introduced. In the aspect of equipment parameter configuration error, the principle of data addressing is mainly introduced, and the influence of the configuration and parameters of the configuration and parameters on the parameters of the Ethernet and serial communication are introduced.
Key Words:Subway;SCADA;Communication Interrupt;Failure Analysis
SCADA系统是数据采集与监视控制系统的简称,是以计算机通讯网络为基础设备,依托调度自动化软件实现的调度监视控制平台。随着技术日渐完善,对调度生产起到的作用也越来越大。目前地铁SCADA系统的作用是向控制中心上传现场设备信息,如果SCADA与智能设备之间不能正常通讯,控制中心将无法对现场设备进行监控,会对安全生产埋下重大隐患。SCADA通讯中断的原因主要有以下两个方面:(1)通讯网络故障。(2)设备参数配置错误。该文将从上述两个方面对SCADA通讯故障进行分析。
1 通讯网络故障原因分析及处理
根据传输介质,目前地铁SCADA主要通讯网络可分为光纤网和铜线网。
1.1 光纤网故障原因分析及处理
光纤通讯的原理是利用光调制器将电信号转换成不同振幅、位相、频率、偏振、波长的光信号,然后利用光的全反射特性使光在光纤内沿直线或曲线传播,最后再利用光解调器将光信号解调成所需的电信息。
光纤通讯网络一般由光调制器、光解调器、光纤和光缆、中继器(光交换机)、耦合器五部分组成。图1是光纤通讯的原理图。
从原理图可以看出变电所光通讯通道采取单向传播方式,如果某一个环节出现问题就会导致通讯故障。通常导致光纤通讯故障的原因有:(1)光纤本身质量问题造成的通讯故障,一方面是光纤内部杂质含量过高引起光传播途中散射增加以及杂质的吸收作用将传输的光能转变为热能导致光功率损失;另一方面光纤内部结构的缺陷导致入射角小于全反射角从而引起散射及反射增加。(2)光纤的弯曲半径过小,在光纤弯曲处,入射角将减小,当光线入射到纤芯包层界面上的入射角小于全反射角时,部分光线将进入包层损失掉。(3)光线在光纤内的传播距离过长而导致光功率衰减。(4)光纤连接及耦合器件损坏或装配不达标导致光纤传输回路不连续,包括光纤对接时错位、接口面倾斜、空隙等,将增加散射损耗,也会使一部分光反射回发送端使光功率减小。(5)单模/多模光纤接口、尾纤接混,因单模/多模材料折射率不同导致光功率反射损失。(6)光电调制解调器或中继器损坏导致通讯故障[1]。
当发生光纤通讯故障时我们通常利用以下方法进行分析处理。(1)如果是线路长度较短的光纤回路,判断回路是否接错,可以使用光照法进行判断,即从一头将可见光射入,看另一头有无光线射出,如果有说明回路畅通,如果没有说明回路有断点或线接错。(2)通过光电调制解调器自环的方式来检测光电调制解调器发送与接收功能是否正常,如不正常应更换光电转换设备。(3)检查单模/多模光纤接口、尾纤有没有接混,如发现混接则立即更换对应尾纤。(4)检查光纤接头、耦合法兰有无磨损裂纹,如有应立即进行更换。(5)检测光调制器发出的光功率是否合格,如不合格应立即更换。
长光缆可使用光缆测试仪进行精确故障定位。光缆测试仪是利用光线在光缆故障处产生高反射和功率大幅下降这两个特性对光缆故障点进行定位的仪器。图2是使用光缆测试仪对光缆检测的结果图。
从图2检测结果中我们可以看出尖峰1表示光线有明显的反射,但是光功率没有明显下降,判断该处应有耦合器或固定接头的位置。尖峰2处光线同样有明显的反射现象,同时伴随光功率大幅的下降,表示在尖峰2处的光缆可能出现断裂等故障,应立即进行检查。其它尖峰,由于a、b、c、e、f的长度相等,故可以判断尖峰3、4、6、7为2的光复反射影像,g和d的长度相等,可以判断尖峰5为1的光复反射影像,应该在分析时排除。最后可以判断出只有尖峰2处为真正的故障点。
1.2 铜线网故障原因分析及处理
铜线网工作原理是:通讯设备间通过通讯电缆相连接,依靠电位信号进行数据传输。铜缆通讯网络的节点核心是交换机,服务器、工作站、智能单元通过屏蔽双绞线与交换机相连接。
通常影响铜线网通讯的因素有:(1)连接故障,包括铜缆发生断股造成通讯中断、接头压制不好造成接头与接口接触不良、串口或以太网接头与接口接错。(2)受通讯距离影响大,通讯信号随距离增加而衰减。(3)容易受到电磁波的干扰。(4)受传输频带的限制通讯容量较小,不适合大数据传输[2]。
当铜线通讯网络发生故障时我们通常利用以下方法进行分析处理:(1)检查网络回路是否通畅,对于RJ45以太网可以采用ping IP地址的方法,对于RS485通讯电缆可以采用量线路通断的方法。(2)检查是否接错接口,对于RS485串口线还需考虑到正负是否接反。(3)检查网线接头是否有压接不良的情况。(4)更换通讯设备上的网络插件或调换接口,检查是否为网口或串口故障。(5)减小通讯距离对网络的影响。例如100BASE-TX是一种使用5类数据级无屏蔽双绞线或屏蔽双绞线的快速以太网技术。它的最大网段长度为100 m,如果连接距离超过100 m应加中继器或使用光纤。对于RS485通讯,可以在开始端和结束端加终端电阻(一般120 Ω)。(6)为减小电磁波对网络的影响,应尽量使用屏蔽型电缆,使用时屏蔽层一端需接地。(7)如果铜线网络不能满足大数据传输要求,应考虑设备分流或在条件允许的情况下改造成光纤网络。
2 设备通讯参数配置及故障分析
在外部网络接线正常的情况下如果通讯地址参数配置不正确也会导致通讯中断。设备的寻址原理如图3所示。
设备寻址原理是:设备接收网内的数据帧,并且根据数据帧上的地址判断数据目标地址与本机地址是否匹配,如果匹配则会按照数据帧上的请求进行处理,如果不匹配则忽略该数据帧。目前变电所常用的通讯方式有以太网通讯方式和串口通讯方式[3]。
2.1 以太网通讯参数配置及故障分析
根据TCP/IP协议的需要,每台设备都需要一个“IP地址”和一个“子网掩码”,目前大多使用的协议版本为IPv4,其“IP地址”格式是四个用点号分开的数,如:192.168.30.1。并且规定计算机网络中在同一物理层直接通讯的设备必须要运行在同一网段上。即,如果有多台设备需要通讯,应满足以下条件:①设置了不同的IP地址;②设置了相同的子网掩码;③IP地址需要设置在同一网段上。同一网段是指设置的IP地址的四个数中,前三个数字相同,最后一个数字不同。例如两台互通设备的地址设置如表1所示。
因此,当通讯故障时,我们需要确认装置的IP地址是否设置正确,子网掩码设置是否相同。
一般来说IP地址的四个数中,最后一个数字默认为通讯规约中的装置地址,但需注意有些厂家的设备除了需要设置IP地址,还需要另外设置装置地址,这些地址也是唯一的。
2.2 串口通讯基本参数配置及故障分析
串口通讯的基本参数包括:装置地址、波特率、数据位、停止位、奇偶校验位。
装置地址作为装置的身份标识具有唯一性,每台装置都不能相同。
波特率规定了数据每秒传输的比特数,对于发送端,波特率表示每秒发送的比特数;对于接收端,波特率表示串口通信的采样率。由于波特率和距离之间成反比,因此只有距离很近的设备间才能实现高波特率通信。
数据位是规定了信息数据位的参数,取决与所要传输的数据码的范围,如果要传输的是标准的ASCII码,由于ASCII码的范围是0~127,因此使用7位数据位就能够满足数据传输需要。但如果要传输的是扩展ASCII码,其范围是0~255,就必须使用8位数据位。
停止位表示所发数据包数据结束,可以取1位、1.5位或2位。由于数据传输过程中有可能会出现不同步现象,因此停止位还可以提高对不同步的容忍度。停止位的位数越多,对不同步的容忍程度就越大,但同时数据传输率也越慢。
奇偶校验位用于串口通信中的简单检错,也可以不使用校验。奇/偶校验是通过统计数据中高位或低位的个数来实现校验的。通过校验可以判断出数据是否存在干扰,以及接收是否存在不同步的现象[4]。
综上,如果串口通讯出现中断,可以尝试以下处理方法:(1)装置地址是否按要求配置,不能有重复的地址;(2)波特率、数据位、停止位、奇偶校验位是否相同;(3)如果通讯距离比较长可考虑降低波特率;(4)确定数据位是否满足数据传输的要求;(5)增加停止位的位数,提高对传输不同步的容忍度;(6)更改奇偶校验的方式。
3 结语
综上所述,对SCADA通讯中断故障的分析应从网络通道和设备通讯参数配置两个方面进行。由于上述包含的因素较多,因此需要根据所使用的通讯介质、通讯接口及使用的协议方式逐步进行筛选和排查。其中网络通道受环境的影响较大,而软件配置基本不受环境影响,但受软件设备升级的影响较大。所以如果是初调项目,则网络通道和通讯参数配置两方面排查的优先级别相同;如果是既有项目,在没有进行软件升级或配置修改的情况下应优先考虑是否是网络通道的问题,如果通讯中断现象发生在软件升级或配置修改之后则应考虑配置错误的可能性较大。
参考文献
[1] 邓大鹏.光纤通信原理[M].北京:人民邮电出版社,2009:5-37.
[2] 王士政.电力系统控制与调度自动化[M].北京:中国电力出版社,2007:101-106.
[3] 高志远,黄海峰,姚建国,等.基于I/O空间分析的调度主站软件系统检测模型[J].电力系统自动化,2014(22):91-96.
[4] 杜华.Linux编程技术详解[M].北京:人民邮电出版社,2007:169-175.