高保真IP指挥调度系统关键技术应用
2021-07-26牛晓华袁素华
牛晓华 袁素华
关键词:高保真;指挥调度系统;关键技术
0 引言
指挥调度系统[1]是实现组织指挥、协同会商及信息沟通的专用特种通信系统,目前已经广泛应用在交通、电力、消防及应急救险等多个行业和领域,主要用于保障各相关单位及人员迅速、准确、不间断地指挥调度、业务协调及协同通信,确保任务组织实施全过程中各项指令和各项工作按计划按步骤、按流程顺利实施,确保各级组织实施指挥调度顺畅高效。
高保真IP 指挥调度系统是在继承传统话音指挥调度系统的体系架构和业务应用模式的基础上,为更好地提升调度话音业务质量,满足未来指挥调度业务需求而研制的新一代话音指挥调度系统,以群为基本使用单位,以通播扬声为基本调度功能,通过群与群之间的级连,实现上级用户对下级用户基于主叫控制方式的点到多点的通播和会议模式。
1 系统组成
高保真IP 指挥调度系统由调度主机、操作维护控制台和调度单机组成[2],系统组成如图1 所示。
调度主机是高保真IP 指挥调度系统的核心设备,由公共控制模块和业务模块组成,2 个模块以功能板卡的形态插入调度主机,其中公共控制模块内集成了会议控制、时隙交换、网络交换及会议混音功能,并通过冗余控制模块实现主、备公共控制模块的冗余热备份切换;业务模块包含实现系统业务功能的各种板卡,主要实现调度单机等终端设备的接入、用户发话电平信号采集及分发、多个调度群之间的级联和多个主机间的中继通道互联互通等。
操作维护控制台为用户提供可视化的人机交互界面,用户通过操作维护控制台提供的系统操作界面,将各种调度指令发送给调度主机,调度主机执行相应的指令,对调度单机等终端设备进行各项调度功能及话音控制,并将终端设备的当前状态返回给操作维护控制台进行反馈和集中显示。
调度单机作为用户终端设备直接面向用户使用,一方面采集模拟话音信号,经过音频编码算法转换为IP 话音包,通过IP 网络发送至调度主机。调度主机对音频解码后,送入公共控制模块混音,并将混音后的音频流经过用户接入模块编码,转换成IP 话音包发送至接收方调度单机,接收方调度单机将从网络上收到的音频解码后扬声播放,实现发送方和接收方之间的话音交互。
2 关键技术
与传统音频指挥调度系统相比,高保真IP 指挥调度系统在业务功能和性能优化的基础上,重点对话音采集、传输、混音、播放等音频处理环节进行了性能提升和优化[3],其中涉及到的关键技术主要有国产自主可控技术、高保真话音编码及大容量会议混音技术、AEC 回声消除技术和多级降噪技术[4]等。
2.1 国产自主可控技术
国产自主可控是新一代高保真IP 指挥调度系统研制建设的基本要求,高保真IP 指挥调度系统的国产自主可控技术涉及硬件和软件2 个方面。
(1)硬件自主可控
高保真IP 指挥调度系统调度主机、操作维护控制台和调度单机等硬件设备全部自主研发设计和实现,其中调度主机的公共控制模块及业务功能模块采用自主可控的机框堆叠插卡结构设计实现,由一个公共控制机框和3 个扩展机框组成,公共控制机框与扩展机框采用插槽设计,结构设计完全一致,公共控制机框插槽可插入公共控制模块板卡及业务功能模块板卡,而扩展机框插槽可扩展插入业务功能模块板卡,业务功能模块板卡可根据不同的业务需求设计成不同的硬件板卡,但板卡与机框之间的硬件接口一致,可插入机框的任一槽位使用,方便用户根据实际业务需求灵活配置相应的功能板卡。此外,高保真IP 指挥调度系统硬件设备涉及的CPU,DSP,CODEC 等核心元器件在器件选型时首选国产元器件实现国产化,其硬件原理及PCB 设计时,将CPU 模块、音频处理模块、按键模块等功能独立的模块做成可插拔子板,便于在设备上灵活安装使用。
(2)软件自主可控
高保真IP 指挥调度系统软件设计和开发研制采用自主可控的分层设计思想,软件架构主要分为操作系统层、设备驱动层、核心业务层及人机交互层,如图2 所示。层与层之间采用消息传递机制,减少层与层之间的代码耦合度,提高代码的复用性,确保软件的稳定可靠。调度主机及操作维护控制台等终端软件全部自主开发研制,整个系统的业务应用软件基于国产麒麟操作系统运行,使系統的安全性和可控性进一步提高。
2.2 高保真话音编解码及大容量会议混音技术
传统话音编解码的话音频率范围为300~3 400 Hz[5],而高保真的话音频率范围为50 Hz~7 kHz,为适应不同传输带宽的要求,高保真IP指挥调度系统选用了2 种宽频话音编码算法,分别是非压缩的256 kbps 线性PCM 编码和压缩的G.722 编码。这2种算法均采用了16 kbps的采样频率,以及16位量化标准,其中256 kbps 线性PCM 编码的数据带宽为256 kbps,G.722压缩编码的数据带宽为64 kbps。为实现高保真话音编解码,外围终端选用支持16 kbps 采样16 bit 分辨率的CODEC 器件,调度主机的公共控制模块将一个2.048 MHz 时钟细分成32 时隙,每个时隙8 位的时隙颗粒,通过时隙绑定方式实现宽频话音编解码。
大容量会议混音处理技术的关键因素在于混音算法,传统的混音算法如平均混音、对齐混音、箝位混音等,通常仅能实现小容量(≤6 方)会议混音,当会议方数超过6 时,随着混音路数的增加,将会出现噪声累加、音量突变等问题,严重影响音频质量,无法满足音频指挥调度业务使用要求。通过对传统会议混音算法进行研究分析后,发现造成会议混音噪声累加、音量突变的主要原因是混音权重因子不恒定,因此研究提出适合高保真IP 指挥调度系统的大容量会议混音算法,实现原理如下:
① 确定与混音方数无关的恒定权重因子:在音频通信中,基于中低强度信号相比于高强度信号出现的机率更高的事实,大容量混音算法采取与混音方数量无关的恒定混音权重因子,从而使会议混音后的话音更加自然流畅、无噪声,具有良好的主观听觉感受。
② 基本收缩因子取值范围调整估计:采用新的会议混音算法后,通话音量虽略微减小,但通过调整基本收缩因子取值范围后不影响声音的识别,特别是在多方(>6 方时)会议混音后,仍然能保证优良的话音质量,有效避免了会议混音后噪声累加、音量突变的问题。
大容量会议混音算法的实现流程如图3 所示,首先对进入混音的音频信号进行求和、取绝对值等一系列运算后,得到恒定混音权重因子,实现量化精度限幅,解决混音后音量突变(忽大、忽小)问题。同时,通过右移、强度限制运算,查表获取当前音频信号的收缩因子,解决混音时音频信号溢出导致的失真问题。
2.3 AEC 回声消除技术
在大容量音频会议系统中,回声是最常见,也是较难处理的问题。终端话音通过终端自带的扬声器播放后,经空气传播、建筑物及家具等室内装饰物反射,形成多径效应,并经终端自带麦克风再次进入系统,该话音经过多方混音叠加后,容易导致多方会议话音杂乱无章,甚者产生啸叫。因此,需要在调度主机、调度单机上对进入会议混音的话音进行回声消除处理。AEC 回声消除实现原理如图4所示。
下行链路延时矩阵(DL Delay Matrix)、上行链路延时矩阵(UL Delay Matrix)属于算法输出延时矩阵,用于缓冲输出信号的频域数据,并作为回声数据样本,缓冲长度决定了可处理的回声延时时长,缓冲越大可识别的回声延时更长,运算量也更大。
x( )和y( )为两端话音时域输入信号,在经过高通滤波器和分析滤波器(AFB)处理后得到多子带频域信号。此时,输入信号可与延时矩阵Delay Matrix 中的回声样本信号进行回声消除处理。AEC回声消除算法的处理过程如下:
①延时矩阵话音信号经过自适应滤波器滤波后得到估计的回声信号;
②输入信号与回声信号作差处理,得到去除回声的输出信号;
③计算估计回声与实际回声的误差,更新自适应滤波器;
④把输出信号存入DelayMatrix缓冲,用于参与下一次回声消除运算;
⑤经过回声消除的输出信号,通过综合滤波器(SFB)把多子带频域信号还原为时域信号并输出,完成一帧话音处理。
上述AEC 回声消除技术在应用时采用专用DSP 芯片实现,具有功耗低、回声收敛速度快、音质损失小的特点,能有效解决回声及啸叫问题。
2.4 多级降噪技术
环境背景噪声是干扰指挥调度系统音频音质的另一主要问题,由于环境背景噪声与应用场景密切相关,噪声音频特性多变,采用传统的音频降噪处理技术很难解决环境背景噪声的问题。通过对传统噪声消除算法及噪声消除的音频特性进行分析,高保真IP 指挥调度系统采用了基于改进型自适应滤波器设计出的噪声抑制综合处理系统,在调度主机- 用户接入模块- 调度终端的关键点嵌入相应的抑制算法模块,有效抑制环境背景噪声、会议混音叠加噪声等各种干扰噪声,提升高保真IP 指挥调度系统通话的清晰度和舒适度。
由DSP 数字信号处理器实现控制PGA的快速AGC算法和上/下行DSP 音频综合处理的相关算法的主要功能如下:
① 自动增益控制(AGC):消除拾音数字输出对声源与麦克风间相对距离的依赖性。
②下行链路解封装模块:将接收到的数据包通过解封装转化为线性PCM码流。
③ 上/ 下行链路分析滤波器组(AFB)/ 合成滤波器组(SFB):AFB 和SFB 构成一种时域与子带域(频域)间滤波器组变换对。AFB将信号从时域变换到子带域,而SFB 则将信号从子带域变换到时域。
④ 下行链路噪声抑制器(DNS):由AFB、下行核心DNS和SFB 组成的下行DNS用于环境噪声抑制。
⑤ 下行链路参考信号获取:经A_clip 、AFB 、下行核心DNS 和预加重处理而获得的信号,用作上行声学回声抵消器(AEC)的参考源。
⑥ 上行链路LMS 校正预处理:用于校正麦克风,以实现其幅值及相位上的匹配。
⑦ AEC:由线性回声抵消器(EC)和残留回声抑制器(RES)构成的AEC,用以在子带域中消除本地扬声器输出自声学路径馈入麦克风的回声。
⑧ 上行链路噪声抑制器(DNS-SNS Combo):由上行链路核心DNS、核心SNS 和噪声抑制增益组合器构成的DNS-SNSCombo模块,用来抑制运行环境中平稳和非平稳噪声,以改善发送话音音质。
⑨ 上行链路舒适噪声产生器(CNG):屏蔽在背景噪声中因残留回声抑制器模块和上行链路噪声抑制器模块处理所致而不利于话音听觉的人工品成分。
⑩状态机模块:用于估计会议系统的通话状态和回波路径是否发生变化,这些状态将用于AEC、DNS 和CNG 处理模块的有关控制。
上行链路移相模块:用来对待发送话音信号进行随机移相,以避免系统发生啸叫。
上行链路音频均衡器(AEQ):对拟发送的话音信号的频谱增益进行补偿,以消除经AEC 和DNS-SNS Combo 处理
所致的信號增益整体衰落,同时根据预设参数集(Presets)来调整频响曲线,以适应与会者的听觉偏好。
上行链路封装模块:将上行链路拟发送信号,经封装模块处理后形成适合于特定网路传输的数据包。
多级降噪技术的关键点在于降噪点选择及自适应滤波的设计,自适应滤波器能否准确、快速地识别噪声信号和正常信号,分离出正常信号发送给接收方。通过噪声抑制综合处理系统的运用,能有效解决较强背景噪声下讲话无法听清问题,提高系统在强干扰环境背景噪声下的通话效果。
3测试验证
为测试高保真IP 指挥调度系统的技术指标[6],搭建如图5所示的测试环境,通过操作维护控制台控制系统中的高保真IP 调度单机等终端设备,实现分群、分组、通播、会议、越级、屏蔽、分隔、专向等指挥调度功能。
测试表明,新一代高保真IP 指挥调度系统用户接入能力可达512门,分群、分组参数设置正常,群间级联和广域中继级联功能正常;在通播和会议2 种模式下,越级、屏蔽、分隔、强拆、强插、单呼、点名、录音、回放等各项调度功能正常;多群多用户通播和会议模式下话音音色饱满、音质清晰可懂,话音质量MOS评分可达4.8分;此外,调度单机之间的端到端话音延时小于200 ms,调度单机掉线恢复时间小于20 s;系统平均无故障时间大于3 500 h,维修时间(MTTR)小于0.5 h。
4结束语
新一代高保真IP 指挥调度系统在将话音采样和编码从8 kbps×8 bit提升到16 kbps×16 bit的同时,通过采用宽频话音编码技术、大容量会议混音技术、AEC 回声消除技术和多级降噪技术等关键技术,使得调度话音音色饱满、音质出色、保真度高、还原度好,音质效果在原来口令清晰的基础上达到了人员可辨,进一步提升了指挥调度系统话音业务质量和用户体验;此外,系统基于国产自主可控技术实现,在改善用户体验的同时,进一步确保了系统的安全性和可控性,有效满足了工程研制要求和用户使用要求,开启了指挥调度系统应用领域的新篇章。