简谈铁路数据通信业务故障维修和相关维护建议
2019-12-11臧贺宇
臧贺宇
(中国铁路武汉局集团有限公司,武汉 430071)
1 概述
2 铁路数据通信业务的种类
铁路数据通信系统是采用各种新技术与铁路生产中数据业务需求的特点相融合,是充分利用了计算机通信技术来实现和扩展铁路各种数据业务的功能。近几年在武汉局管内铁路数据通信业务故障率时有发生,故障现象也从前几年的纯通信通道中断硬性故障发展到通信掉包、网络堵塞等软性故障,铁路数据通信业务的故障处理也是复杂多变的,现针对现场出现的一些故障做简单的概括,重点对软性丢包故障进行分析,并对现场管理提出一些建议。
行车专用:包括TDCS/CTC行车调度系统、FAS调度系统、GSM-R系统、自然灾害及异物侵线防灾系统。
资金结算和安全保密专用:客票系统、公安信息网。
各类行车设备监控:包括用于车辆监控的5T系统(即TADS、TPDS、TFDS、TCDS、THDS);动车TEDS监控系统;用于电务监控的信号微机监控、道岔视频缺口监控及LKJ系统;用于机务的综合信息网专用系统;用于供电的电力AT远动、电力AT故标系统、电力/电牵SCADA系统;用于车务的站场视频监控系统、综合信息网、电子货票系统、编组站及客站视频监控网、综合视频监控网。
综合信息办公业务:包括路局办公网、旅服系统、路局电视电话会议网。以上所有数据通信业务都承载在通信基础承载网上。
3 铁路数据通信业务故障的分类
铁路数据通信业务故障分为以纯通信通道中断为主的硬性故障,及以网络堵塞、丢包故障为主的软性故障。
3.1 硬性故障
硬性故障主要包括光电缆中断故障、通信设备故障、服务器、采集机、交换机(用户侧)、路由器(用户侧)故障。以上故障可直接通过监控各系统的网管终端、查看设备状态指示灯、利用仪器仪表检测、更换设备检测等手段进行判断。通常对产生故障的设备及设施进行更换,或通过本地及远程方式重启设备,就能排除硬性故障。
3.2 软性故障
软性故障就是通过测试手段已经判断通信的设备工作正常,而网管监测数据业务还是出现网络堵塞、通信丢包现象。因软性故障存在随机性及不确定性,经常会出现通信与铁路相关单位组织人员联合查找时,故障现象消失,设备自动恢复等情况。
由于软性故障排查难度大,处理耗时长,需要针对现场故障处理的实际情况进行分析,因此本文主要针对软性故障的产生原因进行分析。
4 软性故障原因
4.1 设备安装环境问题
管内部分数据通信设备安装环境差,使得设备的各项性能指标严重下降,大大减少设备的使用年限,而且容易产生大量误码、丢包现象而造成端口数据堵塞。如设备安装在密闭铁皮柜,柜内设备多、散热空间不足,在发生丢包软故障后通过对设备物理降温后能恢复正常工作。
4.2 音频电缆通道传输不稳定问题
管内红外检测系统通道均采用音频通道传输,下部通道为电缆通道,因天气原因造成电缆特性指标发生变化,造成通道传输数据不稳定,出现故障后会因环境变化自动恢复,不便于维修人员锁定故障点。当红外机房设置在雷区,还容易发生设备被雷击的情况。
4. 3 设备间的电位差问题
此类问题主要集中在下部2 M通道接点间。下部2 M线的传送电压最大在3.5 V左右,由于MSAP、协议转换器接电源、地线位置不同,造成有电位差情况发生。因电位差存在不确定性,容易造成通道误码、丢包等软故障现象。
4.4 设备使用年限问题
管内部分MSAP、协议转换器设备均已超过规定使用年限,由于设备老化使其设备性能指标下降造成通信丢包等故障。
4.5 设备电源保护问题
此类问题主要集中在没有直流电源供电的地点,如铁路站段会议室、办公网机房内。
4.6 业务组网方式缺陷问题
红外系统业务:采用树型组网方式,无法做保护通道。
下部2 M通道:主要是PDH光端机的数据业务,通常都是敷设单条光缆,点对点开通2 M通道,主要在设有传输室的站场和编组场内应用,存在重大的通信安全隐患。
传输网和数据网混合组网方式:产生故障后需对通过传输网和数据网的网管进行综合分析判断,既占用了传输网资源带宽,还存在带宽不足的问题。
4.7 视频传输带宽不足问题
主要是使用单位自身设备数据设置的问题,也有因同时调看多路视频,超出限定网络带宽,造成带宽严重不足的情况。
5 改进措施
1)针对设备安装环境问题,建议与路局各站段加强协调沟通,配合改善设备的工作环境。
2)音频电缆通道传输不稳定问题,建议与车辆部门沟通协调,将车辆监测采集设备升级为带光口的采集设备,将音频电缆通道更新改造为光缆通道。
3)针对设备间的电位差问题,建议用户单位侧将设备改造带光口的设备,对通信机房传输设备侧改造,增加光口用户板,为用户侧提供光纤通道,从而彻底解决电位差问题。
4)针对设备使用年限问题,建议逐步更新且统一光端机设备的厂家及型号;采用带有协议转换功能的路由器,替换现有的V.35协议转换器。
5)针对设备电源保护问题,建议与各站段单位协调,在站段信息机房加装UPS电源设备并加强日常维护管理。
6)针对业务组网方式缺陷问题:红外系统业务,建议与车辆部门协议沟通,利用数据网提供网络通道,重新优化组网,形成一个混合型多路由保护网络;下部2 M通道,建议另外增加光缆及PDH光端机或直接更换为SDH设备;传输网和数据网混合组网问题,建议同相关业务部门对接联系,由业务使用部门牵头,通信配合,对各种数据业务全面规划,尽量利用数据网提供网络通道,简化网络结构。
7)针对视频传输带宽不足问题。建议同相关业务部门多宣传、多交流,加强技术层面的沟通,理解“共享带宽”的概念,并下发相关管理办法加强日常使用管理,针对各单位的实际业务带宽需求,优化数据配置及调整带宽,满足应用。
8)网络接入方式
为了有效的改善目前网络组网结构上的不足,现提出几种典型的网络接入方式以供参考借鉴。
a.中间站交换机接入
如图1所示,三层交换机以“口”字型上连接入路由器。互联线路配置链路聚合,以达到互联端口的冗余保护。接入路由器和三层交换机互联端口类型配置成Trunk类型,并且启用MSTP协议防止二层环路。接入路由器上配置多个vlan,对应不同的业务系统。
图1 中间站数据网交换机接入网络拓扑图Fig.1 Access network topological graph of data network switch in intermediate station
b.站段交换机接入
如图2所示,三层交换机以交叉互联的方式上连接入路由器。互联线路配置链路捆绑,以达到互联端口的冗余保护,且可以通过跨设备的链路聚合实现链路冗余备份。接入路由器和三层交换机互联端口类型配置成Trunk类型,且不需要启用生成树协议来防止二层环路。三层交换机启用iStack虚拟化功能进行堆叠,堆叠可扩展核心的接口数量,增加背板带宽和数据处理能力。
图2 站段数据网交换机接入网络拓扑图Fig.2 Access network topological graph ofdata network switch in station and depot
c. CE路由器接入
如图3所示,CE路由器采用“口”字型上连至PE路由器,信息交换机的网关指向CE路由器,业务流量以双平面互为备份冗余。CE路由器与PE路由器,配置EBGP路由。
图3 CE路由器接入网络拓扑图Fig.3 Access network topological graph of CE router
d. OLT接入
如图4所示,OLT双上行至PE路由器,不需要运行动态路由协议;接入路由器下联接口配置为Trunk接口; OLT业务网关指向接入路由器的VRRP虚地址。
图4 OLT接入网络拓扑图Fig.4 Access network topological graph of OLT
e. ONU接入
如图5所示,未设置OLT的节点,ONU单链路旁挂于三层接入交换机。在交换机上建立ONU管理网关,ONU上配置同一网段管理IP进行管理,业务数据作法不变,将业务VLAN二层透传到交换机即可。ONU业务网关指向接入路由器的VRRP虚地址,接入路由器上只需要将直连路由引入至BGP。
6 对今后维修的一些建议
进一步提高现场维护人员的综合素质。必须结合现场实际情况,有针对性的培训,理论和实际相结合,理论和实做并重,重视培训效果,并形成人才梯队,防止发生人才断层,造成青黄不接的问题发生。
图5 ONU接入网络拓扑图Fig.5 Access network topological graph of ONU
建立定期联系机制,互通有无。通信维护人员要积极主动的同局TDCS/CTC中心、车辆监测中心、信息所等各种铁路数据业务的网管龙头单位建立联系,并建立双方都认同的判断自身设备是否工作正常的测试方法和手段,当出现故障后,双方能积极配合,尽少出现推诿扯皮的现象发生,从而能更快捷查找、排除故障。
加强数据业务备品、备件和测试仪表的管理。定期测试和维护并登记造册,更换下来的设备要及时返厂修,以便保证备品充足。
优化既有铁路数据业务网络。针对部分铁路数据通信业务在组网方式上存在的不足,要同铁路局相关主管部门、站段单位协商,合理优化数据业务的组网方式,从而确保铁路数据通信业务的安全、畅通。
把好工程源头关。积极、主动介入到铁路各项信息化建设工程中,结合自身通信网的优势、特点,主动提出新技术、新运用的合理化建议,今后新开通的数据业务,原则上除行车业务和涉及到资金结算的业务走传输网专线通道外,其他业务都以走数据网通道为主,各业务系统同通信专业结合部以光口和网口直连为最优选择。
加强对通信网络自身安全的管理,最大限度的为中国铁路武汉局集团有限公司的安全生产提供优质、畅通、可靠的通信服务保障。