管制指令语音识别技术应用之我见
2021-06-01民航呼伦贝尔空管站呼木吉勒
□ 民航呼伦贝尔空管站 田 军 呼木吉勒/文
随着近些年航班量的不断增加,空管管制员的通话量和安全压力也随之增大,如何避免因人为原因造成的民航安全事故,是提升管制效率、确保飞行安全的重要课题。
管制指令识别技术是将语音识别技术和基于空管大数据的深度学习算法相结合,将管制指令语音转换为计算机可处理的数字记录,通过综合处理管制指令信息及空管监视数据信息,分析管制指令中可能存在的错误,及时提示管制员化解风险。管制指令语音识别技术在民航领域的应用对提升空管系统智能化水平和提高管制指挥效能都具有非常重要的意义。
管制指令数字化理论分析
中国民航局参照国际民航组织的ATC用语手册制定了《空中交通无线电通话用语标准(MH/T4014-2003)》,从用语规范可知管制指令具有专业特征强、发音高度清晰、指令公式化、简练性、词语的单一意旨性及结构祈使性等特性。空中交通管制针对不同的飞行阶段可以分为塔台管制、进近管制和区域管制。这些管制模式的管制用语格式固定,如航班呼号+指令动作+状态,简单类指令和复杂类指令结构如图1图2所示。同时,管制指令词汇样本空间小、指令较少、重复率高。因此,建立深度学习模型,利用管制指令语音迭代训练语音模型,可以提高语音匹配成功率,为高准确率转换管制指令语音提供了理论基础。
图1: 简单类指令的结构(高度变化)
图2: 复合类指令的结构(调制航线并改变高度)
自20世纪60年代Denes等人研究成功了世界上第一个计算机语音识别系统至今,语音识别技术已经取得巨大的进步并趋于成熟,已在通用办公及智能语音对话领域取得良好应用效果。目前使用的主流语音识别引擎为卡耐基·美隆大学基于Java语言研发实现的Sphinx-4语音识别引擎。20世纪80年代,卡耐基·美隆大学的J.K.Baker以及IBM的F.JelineK等人将隐马尔夫模型(HMM)应用于语音识别,大幅度增强了语音识别引擎Sphinx-4的识别性能,使Sphinx-4成为当前最好的识别引擎之一。因Sphinx-4原代码开源,便于功能的增加和更改,可根据民航系统特定的管制语音发音特点及语音结构修正语音模型。又因其基于Java语音开发,可移植性好,可以在多个平台上运行,便于系统在民航领域的研究开发。Sphinx-4可以使用自定义空中交通无线电地空通话标准用语语言模型,识别特定组合的语音模型,经声学模型训练后的识别率可以高达90%以上,为识别转换管制语音指令奠定了技术基础。
管制指令语音识别技术应用思考
管制指令语音识别是将管制员模拟的音频信号转化为计算机可处理的数字信号,使处理服务器可以获取管制员的指挥意图,结合空管自动化系统输出的综合航迹信息及飞行计划信息,给出指令意图是否与现行飞行动态冲突的告警提示,可将告警关口前移至管制员发布指令阶段,使管制员有更充足的时间提前更正指令,进一步避免了因指挥过程中“错、忘、漏”现象而导致的安全事故的发生,系统逻辑判断流程如图3所示。语音指令识别技术可以为民航领域带来一种全新的监控手段,具备非常广阔的应用前景和巨大的应用价值。
图3: 系统逻辑判断流程
(一)管制指令规范性及复诵一致性监控
国际民航组织规定的标准陆空通话用语精炼、严谨,明确了单词的用法和含义,消除不同语言、不同国家、不同习惯产生的交流障碍,避免通话中歧义的产生,并且一次完整的陆空通话过程包括:管制员“说”,飞行员“复诵”收到的内容,管制员“听”复诵内容的正确性和完整性,并进行“更正”这几个环节组成,而在其中各环节出现因人为因素造成的民航事故均有案例发生。以1993年发生在我国西北地区某机场的空难为例,管制员向机组发出高度表拨正值指令,而机组错误当成高度值处置,最终酿成机毁人亡的惨剧。语音识别技术可以在管制员发出指令后,在系统规定的可变参数时间内,接收并识别机组复述语音,系统将对复述数据中的高度、速度和航向等关键信息与管制指令做比对,如果发现管制指令与机组复述不一致,系统会给出不一致告警,提示管制员与机组进一步核实指令信息,通过技术手段降低此类因陆空通话中用语不规范及错误理解导致的民航事故。通话流程处理逻辑流程如图4所示。
(二)管制指令正确性监控
目前,飞行目标短期冲突告警及低高度告警等均由空管自动化系统通过对目标监视数据的距离等信息进行判别后给出,告警的及时性受到判别门限及判别周期的限制,管制指令语音识别可将管制话音提取为可处理的管制意图信息,结合S模式雷达及ADS-B等监视数据中飞行意图数据,故障告警判别提前至管制指挥意图阶段,弥补当前ATC系统中短期冲突和最低安全高度告警的局限性。通过获取管制指挥意图,可给出管制指令正确性的监视,第一时间给出管制员指令可能存在错误的提示。以2016年华东某机场跑道入侵事件为例,管制员指挥一架航班横穿跑道后,遗忘该飞行动态,并向另一架飞机发出起飞许可,导致两架航班危险接近,若管制员发出语音指令后,通过语音识别技术将管制指令转换为可计算的管制意图信息,结合监视数据信息推算一段时间内可能出现的冲突并给出指令错误提示,可避免此类危险接近发生,逻辑流程如图5所示。
图4: 指令规范性及复诵一致性监控
图5: 指令正确性监控流程
(三)提高模拟机应用效率
管制模拟机是专门供管制人员训练使用的仿真模拟系统,由管制席、机长席和教员席三部分组成,管制员在管制席位下达的语音指令需教员在机长席位手动输入管制指令以控制飞机的模拟飞行路径,再进行人工机长应答才能完成完整的训练。目前,空管培训系统中所有的雷达、程序和塔台管制模拟机都配备专门的模拟机长席位,训练时必须和管制受训席位按1∶1比例配置模拟机长,专门为模拟飞机做人工响应和输入操作。随着培训人数和次数的增多,教员少、模拟机长不足、席位利用率不高等因过度依赖人工操作而导致的这类问题日益突显。语音识别技术在模拟机领域的应用,可以使系统代替教员在机长席位自动接收管制指令并给出应答,减轻教员的训练负荷,减少训练成本,提高训练效率。国外已成功地将语音识别技术应用于管制模拟机中,研发出具体的产品,成功地用于管制学员的培训,实现管制训练过程中学员语音识别、指令解析、模拟机长语音合成(请求、应答)、机长自动操作等功能。相比之下,国内管制指令语音识别技术起步较晚,目前仍处于研发阶段。
(四)管制语音质量分析
相比空管记录仪模拟语音,管制指令语音数字化为管制数据统计分析提供了广阔的应用场景,如管制指令规范性分析、事故原因分析、基于语音识别与管制指令统计的管制员工作负荷评估、指挥飞机总架次/高峰架次/平均架次、基于声学特性对管制员疲劳程度监视等。与传统基于模拟话音的数据分析不同,语音数字化后的管制话音记录在管制话音时长统计和保障架次等的量化分析更为精准,检索定位效率更高,管制语音数字化在民航统计分析领域的应用将为各类民航政策的制定提供精准的基础数据支撑。