空管自动转报系统的运行风险评估及措施探析
2022-06-11高钰婷
摘要:空管自动转报系统是负责存储、查询、转发、监控、统计民航业务报文的系统,也是空管地面通信网络的核心模块。文章以空管自动转报系统为对象,简单介绍了空管自动转报系统的组成,评估了空管自动转报系统运行中存在的风险,并提出了几点处理措施,希望为空管自动转报系统安全、可靠地发挥作用提供依据。
关键词:空管;自动转报系统;运行风险;转报机
一、引言
空管自动转报系统承担着为本地区空中交通管理单位传递关于航班飞行动态信息的重任,可以为民航航班飞行安全提供保障。近几年,随着各地区航班量的持续高速增长,空管自动转报系统承担的运行压力不断增大。特别是电报绝对数量的飞速增加,对空管自动转报系统的数据处理能力、干线带宽容量均提出了挑战。因此,评估空管自动转报系统的运行风险并寻求针对性处理措施具有非常重要的意义。
二、空管自动转报系统的组成
根据国际民用航空组织关于航空固定电信网以及国际航空电信协会关于通信的相关规定,可知:空管自动转报系统包括传输网络、转报机、用户线路、用户终端几个部分。其中传输网络特指由分组交换组网、帧中继、KU波段卫星通信网络、民航C波段、地区空管局复用器数据网组成的传输网络,负责连接自动转报系统各节点并实现电子报文的高速传输。
转报机又可称之为自动转报服务器,位于通信机房内,包括异步控制器、前置处理机、电报处理机(超级终端)、网络交换机、线路备份切换器等几个部分。其中异步控制器负责转报机终端异步串行数据的处理;数据集中器负责输入输出数据分配与主备机切换;前置处理机负责以太网数据帧判定以及异步串行数据流转换;电报处理机负责系统网络控制、数据存储与同步、界面管理等;网络交换机负责交换以太网中数据帧;线路备份切换器负责快速切换收发线路[1]。
用户线路负责连接上级自动转报系统、下级自动转报系统,并将系统与同步单元、异步单元、机架通信设备相连接。
用户终端包括空管分局所在地区的终端、空管分局下属航站的异地终端,主要为气象、机场等用户单位。
三、空管自动转报系统的运行风险评估
(一)人员操作风险
空管自动转报系统日常运行维护多由内部人员负责,相关人员业务开展经验、技术能力以及责任意识均对系统运行安全性造成了影响。同时空管管理者对于系统运行规章执行度的监控能力也间接影响着空管设备维护操作规范性,最终影响了自动转报系统的运行可靠性。比如,在空管管理者未选择专业人员操作自动转报系统,未强化开展机房管理、人员管理,也未健全自动转报系统维护维修细则与应急预案时,会导致自动转报系统管理脆弱性突出,埋下的安全隐患较大。
(二)传输网络风险
当前空管转报业务主要使用的传输链路为民航通信网,辅助传输链路为自有网络及光纤。虽然民航通信网具有较为突出的可靠性、稳定性,但是在转报业务数据量持续增加、设备运行时间持续延长的背景下,民航通信网设备备件缺失、节点硬件资源缺乏、部分业务无备份通道等问题逐渐显现。加之多数空管分局运用了单主控板卡的交换机,一旦交换机板卡出现故障,就会导致区域报文传输中断,威胁管制运行、航班安全[2]。
(三)系统软件风险
从系统特征来看,空管自动转报系统主要承担着传递飞行计划、交换飞行动态信息的责任,关乎空中交通管制移交、协调效果。多数自动转报系统承载着气象台、進近管制室、飞行报告服务室、塔台管制室以及机场集团等驻场单位的报文,数据集中度处于较高水平,数据处理、转发对实时性也具有较高要求。加之主用转报系统与终端相连,一旦主用转报系统突发故障或因恶意攻击停止运行,就会形成连锁效应,致使与之相连的转报终端节点瘫痪。
(四)系统硬件风险
近期,空管转报业务量呈现指数式递增态势,越来越多自动转报系统在用户容量层面接近饱和。特别是RS232信道,在工作量不断增加、系统运行时间持续延长过程中,与信道相关的软硬件设备逐渐呈现出疲态。虽然部分空管分局扩展了自动转报系统容量,但是因独立备份系统的缺失,以往转报备份系统自始至终承担着系统的独立备份任务。而以往转报备份系统设备老化、零备件缺乏情况较为常见,正常运行保障能力较弱,给维修工作也提出了较大的难题。此时,一旦情报网络与气象网络存在疏漏,自动转报系统易在突发因素的干扰下出现服务中断情况,且无法在有效时间内恢复到正常水平,最终对飞行安全造成了威胁。
(五)环境风险
空管自动转报系统多处于机房内,机房湿度、温度以及静电均会对系统运行造成了干扰。比如,机房湿度(或温度)超出空管自动转报系统要求范围,将会致使空管自动转报系统内元件失灵,最终影响系统报文的顺利传输。再如,机房内静电防护不到位将直接导致自动转报系统运行失控,甚至发生火灾问题。
四、空管自动转报系统的运行风险处理措施
(一)加强人员管理
人员管理是应对自动转报系统运行风险的有效措施之一。空管分局应制定完善的自动转报系统日常巡检制度,落实周维护、月维护与年维护标准,保证自动转报系统运行风险因素的及时发现、处理。同时空管分局应增设自动转报系统运行安全岗位,与自动转报系统管理员、信息安全员、网络管理员签订安全责任协议,明确不同岗位人员自动转报系统访问权限。若人员调离岗位,则第一时间终止其访问自动转报系统的权限;若外来人员访问,则需要严格审批并记录访问过程。
在选聘专业人员担任自动转报系统操作与维护责任人的基础上,空管分局应加强对人员专业水平提升的重视,制定自动转报系统维护人员、操作人员业务培训计划,定期开展人员培训。同时依据前期设计的应急预案,每间隔一定时期组织值班人员进行应急演练,为值班人员应急事件处理意识与能力的提升提供依据。
在日常管理过程中,空管分局应严格落实《信息安全技术-信息安全风险评估规范》GB/T20984、《信息安全等级保护管理办法》的相关要求,以自动转报系统独立终端为边界,定期组织人员围绕自动转报系统的运行、维护管理过程进行安全评估。将评估结果作为人员绩效设置依据,并责令人员统筹多项措施进行整改,形成富有实效的考核激励机制,降低人员错误操作、错误维护概率。
(二)完善数据网络
在民航通信网运行过程中,维修者可以将FA36路作为备用传输链路增设到空管分局与航站之间。同时根据业务传输要求,将综合业务网设置为双星型网络,配合全部节点的双中继+双设备冗余设计,规避全网单点故障对业务造成的负面影响。
在优化数据网络的基础上,针对数据网络运行过程中存在的不同风险故障表现,可以选择不同的处理措施[3]。比如,针对主动转报系统无法接收引接的信号问题,相关人员可以检查转报系统信号,在确定信号正常后,进入信号接入地址端(TELNET192.168.11.41),查看对应路的配置是否存在错误。若配置中显示串口线路无数据变更,则对信号时钟源、自动转报系统之间的网络线路进行测试。在确定网络线路无异常后,对信号接入路的串口焊接牢固性进行检查。若串口焊接正常,则根据时钟源传输方式以及输入端、输出端接口方式相同的特点,对系统输出端进行检查[4]。在发现系统时钟源输出分别为串口输出、网口输出后,可判定自动转报服务器接入信号路为串口接入,此时,转报系统无法接收引接信号的原因就是网口输出、串口输入不匹配,为消除故障,可以将时钟信号输出端的网口输出更换为串口输出。部分情况下,技术人员还可以从引接过程入手,检查自动转报设备所用接口类型,排查线路各节点是否存在异常表现。同时查看连接路、信号输出端配置、状态灯是否存在异常。在发现异常现象的第一时间将其单独列出,并根据制度尽早处理。
(三)加强软件管理
针对当前空管自动转报系统软件运行风险表现,空管分局可以根据软件安全政策和信息的标准规范,对自动转报系统软件风险因素进行溯源,定期进行梳理。并在日常维护管理过程中,严格监理系统软件投产使用与维护维修、报废、应急管理、监控信息台账制度。同时执行自动转报系统存储介质管理制度,依据制度执行存储介质维修、领用、交回、报废与销毁操作,阻断磁带库、存储阵列等大容量存储介质外连其他通道。
在自动转报系统软件维护过程中,空管分局应依据等级保护与密码防护的相关规定,以硬件设备安全配置为前提,制定软件安全防护边界,完全隔离内部系统软件、接入互联网与内部网络,确保自动转报系统关键数据传输、转发、存储的安全性。同时以转报终端为对象,根据终端信息判定终端软件是否存在异常。若存在异常,则可以尝试重新启动数据访问进程处理。若上述方法无法发挥良好作用,则交由远程协调厂家技术人员对自动转报系统软硬件兼容性、软件授权情况进行核查,直到异常现象消除。比如,在发现部分报文无法查询现象后,相关人员可以重新启动数据库访问进程,在电报写库无异常且报文无法查询现象未消失时,相关人员可以告知工程师,由其远程登录系统排查故障消除异常[5]。
(四)升级系统硬件
在双机器、双数据库、双网络结构运行的基础上,针对两台转报主机同时故障(或机柜掉电、交换机故障)的极端情况,为避免转报业务大面积中断致使飞行动态电报、气象电报、管制移交电报传输延误,维修者可以进行以往转报硬件系统的升级。即增设144路异步端口,以便在主用系统发生故障时立即切换到备用系统,实现系统级冗余备份,确保空管自动转报系统的可靠运行[6]。部分情况下,即便自动转报机设置主备模式,在主用转报机因故障向应急转报机切换过程中仍会发生堵报,去报队列内积累报文在数千份左右,且报文数量处于持续增加状态,形成了严重的报文处理延时问题,常规重启处理机、前置机方法无法发挥良好效果。针对转报地址表设置不正确引发的报文堆积甚至环堵情况,若无法通过重新启动前置机、处理机恢复,则需要检查系统路。
在升级自动转报硬件系统的基础上,空管分局应根据自动转报系统内硬件组成,结合各硬件故障表现,采取针对性解决措施。比如,在自动转报机日常运行阶段,线路故障风险较大,极易引发电报终端收发电报异常。为消除上述风险,空管分局技术人员可以利用分段打环测试的手段,进行传输线路风险检测。首先,面向用户端接口,利用随机配方的短路头进行收发线路的短路处理。这种情况下,转报机端用户多功能接口板收发状态灯处于关灭状态。若转报机端用户多功能接口板收发状态灯仍然未关灭,则可以重新选择多功能接口板重复上述操作。若转报机端用户多功能接口板收发状态灯状态仍然未变换,则表明集中器内部存在故障,可以利用空闲路代替集中器路[7]。反之經控制台端口对主处理机显示屏幕进行观察,在发现对应路故障后,根据提示检查线路所在集中器与异步控制器之间线路、前置机与前置机之间线路连接完好性,反之则经主处理机启动线路监视功能,对线路进行测试。在顺利接收“RYRY...”电报后,表明转报机无故障,反之则更换线路多功能板重复上述操作,若仍然未接收到电报,则表明该路故障,需要更换该路。
其次,在确定转报机部件无故障后,借助配线架,进行收发线路短路处理,并经主处理机启动线路监视功能,开展线路测试。与此同时,借助用户终端,进行收发线路短路处理,并经主处理机启动线路监视功能,开展线路测试。在这个基础上,观察用户终端接地是否完好,在确认无误后,观察转报机房电路接地是否存在故障。
最后,在确定连接转报机外线、终端无故障后,重新连接终端收发线短路,观察是否存在电报接收或发送情况。若存在,则表明终端收发线无故障,反之则表明存在故障。
(五)注重环境管理
机房环境的适宜性是保障空管自动转报系统安全可靠运行的关键。根据自动转报系统自身需求,空管分局应贯彻通风良好、温湿度恒定、无静电的原则,控制湿度在20%到80%左右,温度在5℃以上、35℃以下。同时配置UPS(不间断电源),利用直径为10mm的圆钢良好接地并控制接地电阻在4Ω以内,规避因供电问题、雷电问题造成的通信中断。
在良好接地的基础上,空管机房管理者应根据《民用航空通信导航监视设施防雷技术规范》MH/T4020关于自动转报机房所在地区年平均雷暴日数大于等于30天、小于80天的要求,将避雷针装设到机房顶部,以建筑内部混凝土钢筋为引下线,达到防护直击雷的效果[8]。
有条件的情况下,相关人员可以从总配电室引入1路交流电作为机房供电系统,并将一个电源电涌保护器安装到配电机房电源箱的适当位置,同时将电源电涌保护器安装到电话专线端口、网络交换机端口、机柜电话配线架、数据传输网络机柜的适当位置,形成良好的雷电防护体系。或者利用M型等电位连接方式,将30mm×3mm铜带制作而成的等电位网设置到机房内部,促使机房周边形成均压环。并在100mm高绝缘子与地面连接的基础上,将自动转报系统接入均压环预留的接地螺栓孔内,有效消除静电危害。
五、结束语
综上所述,空管自动转报系统是空管通信基础设施之一。通过自动转报系统的平稳运行,可以确保民航安全飞行。因此,针对空管自动转报系统运行过程中存在的人员、系统、环境及基础软硬件风险,维修者应根据现有规范确定风险类别及等级。在確定风险类别及等级后,维修者可以采取针对性解决措施,提高自动转报系统风险防范能力,为空管自动转报系统的安全、可靠运行提供保障。
作者单位:高钰婷 民航河南空管分局
参 考 文 献
[1]侯海坤. DMHS-M型和ZB-16/64D型转报系统异同点分析与研究[J].中国新通信, 2019(04):43-45.
[2]黄顺利,陈蔚,刘国锋.东进转报系统典型故障案例分析[J].科技创新与应用, 2018(11): 117-119.
[3]汪勇.民航转报系统台联MODEM专线与拨号互备传输模式研究[J].电子制作, 2019(20): 22-23.
[4]杨丽.中国民航自动转报系统的相关设备与信号传输[J].价值工程,2019(26):241-243.
[5]李岩.自动转报DMHS-H系统远程维护探析[J].科技资讯,2019(12):27-28.
[6]蔡芸芸.关于民航空管自动转报系统基本表恢复的研究[J].中国新通信,2018(19):219-220.
[7]俞雪梅.解析空管自动转报系统的网络安全防护能力[J].中国新通信,2019(11):163-163.
[8]林尤霞.浅析民航自动转报系统的干线路由保护[J].信息通信,2019(06):119-120.