实现复杂机载语音通信的混音方法①

2019-04-10马永松冉进刚

计算机系统应用 2019年2期

马永松,冉进刚,彭健

(中电科航空电子有限公司,成都 611731)

机载语音通信系统一直是航空电子系统的最重要组成部分,在通飞航电系统中机载语音通信功能包括飞机内部各岗位之间的通话和空地通话.

中小型通航飞机通信参与成员比较少,大多采用对讲方式;但是大型通航飞机(括大型水陆两栖飞机、大型固定翼通用任务型飞机、民用重型直升机等)通信参与成员变多、执行的任务也更加复杂,在许多任务中要求不同任务岗位之间更紧密的协作[1].随着国产大型通航飞机的研发,需要机载语音通信系统成为支持飞行员、观察员、执行任务的各岗位、飞机状态提示(告警音、各种提示音)以及地面指挥员之间进行的多边语音交互的平台.这对机载语音通信系统提出了更高的期望,如果能把所有的任务参与者都放在一个“会议”里,所有信息将在第一时间传输到各岗位,这对协作应对复杂任务和突发情况将极为有利.

本文提出了一套简单实用的混音方法,并在此基础上设计出了“有优先级、用户可定制的机载会议系统”;不但大幅提升机载语音系统的性能,而且软件简单,开发成本低、耗时短、安全性高,对快速取得适航证、投入市场极为有利.

1 机载语音通信系统的需求变迁和挑战

传统的机载语音通信系统多采用对讲模式.其优点包括:

(1)采用“你一言”、“我一语”的沟通方式,沟通清晰、准确;

(2)一般主驾驶员具有最高的通话优先级,随时可以抢占通话信道.

但其缺点也很突出的: 参与成员不能太多、只能满足相对简单的任务交互.

随着通航飞机的大型化、任务复杂化,对机载语音通信系统的要求也越来越高.这些飞机往往需要执行救援、灭火、空投等各种复杂任务.要完成这些复杂任务,需要包括驾舱(主驾驶、副驾驶、机械师、观察员)、后舱任务舱(参与任务的各岗位)、飞机告警及各种提示音和地面指挥的有效协作.这就给语音通信系统提出了更高的要求,包括:

(1)系统可以工作在“会议模式”,容纳更多成员参与通信,同时避免高优先级成员长时间占用信道,导致延误;通信参与成员在通信建立之后随时可以说话,每个通信参与成员能听到所有成员(包括自己)的语音;

(2)系统是“用户可实时定制”的;在任务进行中,由通信参与成员进行简单的设定就可以完成新的定制;每个通信参与成员应该可以根据所在任务岗位的实际需要选择重点收听某路或者某几路音源,突出重点避免次要音源的干扰.

(3)由于空地通信的特殊性,机上各岗位应该有权进行空地通信(但是其它机上乘员可以收听到双方的通话),以便在某些任务的关键阶段,地面可以直接指挥对应岗位,而不是通过飞行员间接指挥.

(4)赋予关键成员(主驾)管理者角色,如有空地通话优先权、通话接入管理权等.

当前航电各LRU之间的基本都实现了总线通讯;随着DSP、FPGA以及数字化语音处理芯片的成熟和稳定,机载语音通信系统也走入了数字化时代.这给实现理想的“有优先级、用户可定制的机载会议系统”带来了机遇,但同时也面临许多挑战:

(1)在民用航空领域,语音通信系统软件对飞行安全有重要作用,属于C级软件.DO-178C对C级软件的计划、需求、开发、集成验证、生命周期等有一系列规范,遵照这些规范进行软件开发,更容易满足适航要求、取得适航认证;但是严苛的开发规范也导致了更高的开发成本,在国内,一款C级民机机载软件从计划阶段到取得适航证往往要数年时间.因此,满足功能的情况下尽量的精简设计,对于保证安全、节约开发成本、缩短开发时间极为重要.

(2)鉴于航电的特殊性,如果能不改变机载语音通信系统硬件体系架构,仅仅通过优化软件算法,就可以实现“有优先级、用户可定制的机载会议系统”,那么就可以最大限度的保证系统安全性、降低研发成本、控制研发周期,这就给软件开发提出了很高的要求.

(3)在混音环境中,一般只能将混音后的音量整体调大或者调小.而“有优先级、用户可定制的机载会议系统”要求各成员可以动态配置想要收听的信息以及各分量权重,这要求软件算法有所突破.

(4)机载语音通信系统需求对实时性、信噪比、系统稳定性等提出了明确的指标,要求软件算法简单实用而且工作稳定.

2 有优先级、用户可定制的机载会议系统

2.1 方案背景

机载语音通信系统是CN系统的一部分,涉及众多LRU(如图1)[1],且由于CN系统的重要性,要将整个系统推翻重新设计其成本和耗费的时间是难以接受的.因此,本文正是在图1所示系统上通过优化RIU软件实现语音通信系统的品质提升.

图1 机载语音通信系统框图

由于CN系统中各LRU来自不同的厂家、接口各异,系统中涉及的主要语音格式包括A429数字音频、RS422/RS485数字音频、模拟音频.RIU作为音频接口和处理单元,是整个系统中枢,负责所有语音的信号、语音控制信号的收发和处理;也就是说RIU软件的质量直接影响整个机载语音系统的品质.

RIU的外围设备主要包括空地通信电台、ACP/TACP(如图2),其中ACP/TACP可以接入耳机和麦克风,也可以设置通信状态和音量.

图2 常见的ACP/TACP操作面板

2.2 软件方案

软件方案简述如图3[2],首先将所有语音输入转换成相同的数据格式并进行降噪处理[3],由于不同设备的采样率和采样精度的不同,可能对有些数据要进行裁剪或插值处理[4].当所有数据对齐后即可以按照既定的频率进行混音,本文将着重对混音算法的两个关键的环节进行阐释,首先是任意输出通道的混音算法,其次是多输出通道的混音组织逻辑.

图3 语音通信系统软件方案简图

2.2.1 任意输出通道的混音算法

传统的混音算法有很多,但对于机载语音通信系统来说都有一些缺点.

式(1)[5]描述了最简单的混音算法.直接将t时刻的语音输入线性叠加,这种算法在通信信道容量是最大输入音量的n倍(n是通信参与成员的数量)的时候显得简单实用;在复杂机载通信中,通信参与成员可能有近10路,信道容量要做到10倍余量是不可能的.

箝位算法(如式(3)和式(4))[5,6]引入了箝位机制避免溢出,当混音参与数量少、极少出现溢出的时候是极为实用的,箝位算法是对式(1)的有益改进和补充.

当Voice_sum[t]＜Voice_max时,

当Voice_sum[t]≥|Voice_max|时,

平均值算法如式(4)[5,6].将语音输入的线性叠加值除以n,避免了溢出问题的产生;但是如果多达10路的语音同时输入,而每路音量又被缩减为原来的十分之一,可能会出现听不清楚任何一方讲话的情形.

针对机载环境的实际应用,本方案对混音算法进行了综合改进.首先加入实时权重,如式(5)和(6)所示[6,7],In[i,t]是第i路输入的t时刻的声音强度,Volumei[j,t]是输出到通道i的混音中来自j通道的输入分量的t时刻音量,来自通道i所对应的ACP/TACP面板上的用户配置.将权重因子fi[t]引入混音式(6),即得到的第i通道混音输出Voice_sumi[t].这种算法解决了两个问题:

(1)混音权重由声音的输入强度和混音接收端主动设置的音量组合决定,即通过音量配置就可以影响混音输出中各个分量的权重.

(2)按照权重分配各输入分量在混音中的占比,直接避免了混音溢出问题.

式(6)解决了混音溢出的问题,但是牺牲了混音输出中各分量的音量.特别是在每路音量都比较小的时候最后的混音结果中分配给各分量的音量将更小,甚至小到影响收听.在加入混音的通道比较少的时候,用户可以通过调大某一路音量来适当的增加这一路输入分量混音后的音量,但是如果混音输入通道较多且要关注两路以上的输入的时候,这种弥补就显得不足了.而另一方面不可能所有通道都以满负载输入,也不可能所有通道都选择满音量,所以Voice_sumi[t]的值可能远小于通道负荷.所以,一方面混音后各分量音量大幅变小,另一方面通道又没有满负荷运行,造成了浪费;为解决这两个问题,对算法进一步进行了改进,如图4.

图4 任意通道混音算法流程图

图4中,Ki是放大系数、Voice_max是软件限位值,Voice_sumi[t]和Voice_max的比较结果会触发钳位因子gi动态变化从而渐进的修正最终的Voice_sumi[t][8].

Ki、Voice_max是两个经验值,需要综合音频系统信道的带宽和各通道混音的典型输入情况确定.恰当的Ki值可以让最大混音输出值处于溢出临界状态,最大限度利用信道宽度;而Voice_max和gi的配合最大限度限制了在混音分量加入或者退出时音量的陡变.总之,按照这个算法得到的混音输出值达到了如下目的:

(1)有新的分量加入/退出混音时,不会导致混音输出值瞬间增大/减小;无论混音参与分量如何变化,最终输出的音量都将循序增加/减小,发送若干包后再趋于稳定;

(2)通过实验,选择恰当的Ki值,可以保证混音输出基本不会溢出,只有在声音陡变时可能会短时间工作在临界状态,但是也能很快回到Voice_max附近,不会产生超出指标范围的噪音.

(3)通过音量调节实现了混音权重分配.当某个输入分量被调大时,会挤占其它输入分量的信道资源,从而获得重点关注.

(4)混音算法没有造成明显的延时,实时性良好.

2.2.2 多输出通道混音组织逻辑算法的另外一个难点是系统中有多个通道需要同时输出混音,并且每个通道的混音设定是其对应的ACP/TACP自行定制的.为实现这一功能,系统为每一个输出通道维护了一张音量/权重配置表,配置表的内容根据对应输出通道的设置(来自ACP/TACP)实时更新.CPU调用任意输出通道混音算法依次轮询每张配置表,即可得到各个通道定制的混音输出值,流程如图5.

图5 多通道混音组织逻辑流程图

系统采用了运算速率高达2400MFLOPS的DSP,而我们的混音周期是毫秒级的、混音输出通道一般不会超出10个,所以技术上是可行的.系统所需要提供的主要资源就是给每一个通道维护一个音量/权重配置表.至此在新增加极少资源的情况下就可以实现“有优先级、用户可定制的机载会议系统”的预期目标.

本方案中多通道混音组织逻辑新增的代码量不超过10%,整个混音方案总代码量不超过2000行,对于开发成本高昂的C级航空软件来说本方案是简洁有效的.

机载语音通信系统有一些高优先级的提示音和告警音需要突出展现,如图6所示.来自中央告警计算机的告警音具有最高优先级,应当被实时的清晰无疑的播报出来.当有中央告警音到来(离散信号有效)时,后舱呼叫和地面呼叫被同时抑制.告警音提示音混音被分为两路,一路独占信道,以最大音量发送到机载广播;另一路作为混音输入加入到混音中,但是软件赋予这一路输入较高的权重(设整个信道权重为1,这里赋予其0.6的权重),不能被调节.当告警、提示音有输入时,各个终端听到的结果就是其它音频分量音量瞬间降低,告警音提示音混音被凸显出来,直到告警音提示音混音值为0(关断阈值).