电台音频采集管理系统设计*

2020-03-26瞿珊瑚刘宏波

通信技术 2020年2期

瞿珊瑚，刘宏波，张旭

（海军工程大学电子工程学院，湖北武汉 430033）

0 引言

随着通信技术的快速发展，各式新型通信电台相继出现。为满足各式通信电台的语音信号和报文信号的采集需求，提出一种电台音频采集管理系统总体技术方案[1]。由于电台接收信号一般为人工操作，工作人员必须长期保持高度集中的工作状态，无法保证不会出现误译、漏译的情况。因此，无论接收的话音信号还是报文信号，人工识别度与准确度都会受到影响，继而影响信息传递的可靠性。于是，设计一款电台外接的电台音频处理终端，当终端与电台相连时，通过PC端应用程序实现自动采集、记录、识别及回放接收到的音频信号，以有效提高信号接收准确率。系统中依靠处理终端对接收到的音频信号进行实时采集，并上传至数据存储服务器，最后通过网络将接收到的音频数据传至管理系统进行统一存储及处理。系统一方面可不再依靠纯人工进行收听记录，客观保证音频采集数据的真实性，提高收听信号的准确度；另一方面，引入网络架构可将不同的数据存储到服务器，在不同地区的人员可通过访问服务器对数据进行处理，实现多用户端远程管理和实时数据共享。

1 电台音频采集管理系统整体设计

1.1 系统需求分析

1.1.1 用户需求

报务人员需求。目前，电台信号接收仍采取人工值守的方式，一台电台需配备一名监听人员，无法对多台设备进行监听，且长时间处于工作状态容易出现漏听、漏记现象。借助电台音频处理终端进行自动接收及记录，使用其相应的应用程序对数据进行实时处理分析，辅助完成日常工作，可提高工作效率和准确率。

监管人员需求。报务人员的记录为主观监测，无法保证记录信息的真实有效性，而通过终端接收并实时数据上传至服务器端存储记录可对数据进行远程监管，及时调用数据信息进行数据匹配和分析。

1.1.2 功能需求

电台作为实时传递信息的手段之一，信息接收环节必须做到高效且准确。电台音频采集管理系统对多台电台接收的音频信号进行集中统一管理，其功能如图1所示，主要包括电台音频处理终端、数据服务系统和用户端3大部分。

图1 系统功能

电台音频处理终端是整个功能系统最原始的底层服务，其功能是对电台接收到的音频数据进行数据处理。数据处理包括对音频信号的采集与回放、Morse音频信号处理以及语音信号识别处理。

用户端的主要功能是用户信息管理、数据监测、数据管理以及数据上传，其中数据上传的功能是将采集到的所有数据信息同步上传至数据服务系统。

数据服务系统依托服务器可统一管理多个用户端上传的所有数据信息，再通过浏览器和客户端完成对服务器中的数据信息访问。浏览器依托互联网实现远端数据交互，客户端则依托专用网络建立连接实现前端界面数据交互。

1.2 系统总体设计方案

根据用户需求和功能需求分析，对电台音频采集管理系统的技术方案流程进行简要描述。利用设备采集音频信号，通过设备功能模块，对各种信号处理后将数据传至PC机实现数据采集，而应用程序对采集的数据进行记录、存储、显示及监测，通过用户端将数据上传至服务器，将电台接收到的音频信号数据经客户端访问进行统一管理，也可通过浏览器对服务器进行访问，实现跨平台跨系统的共享数据。电台音频采集管理系统工作原理如图2所示。

电台音频采集管理系统工作原理。

（1）电台音频处理终端是为满足通信电台音频信号采集的需求，针对各类通信电台进行接口匹配，实时电台采集语音信号，并进行数据采集和封装上报的一款设备。利用软件无线电技术，实现音频信号的采集与存储回放，保证语音的低失真度，并针对采集到的语音信号和Morse音频信号分别进行自动识别处理。

图2 电台音频采集管理系统工作原理

（2）用户端是电台音频处理终端与PC机通信的桥梁，用户通过PC端应用程序，传输及处理接收经电台音频处理终端处理后的数据，主要完成数据通信、数据记录以及数据上传等功能。

（3）数据服务系统借助网络服务器，实现对电台音频数据的存储和网络数据服务，利用客户端与浏览器访问数据并实现远程共享数据信息，同时可以将多个用户端上传的电台数据信息进行统一存储和调用处理。

访问网络数据服务采取的是C/S和B/S混合结构[2]。

基于B/S架构设计开发浏览器与服务器之间的用户系统。利用Internet网络访问浏览器是远程监测和共享数据的有效途径，用户通过浏览器向web服务器提出访问请求，并对服务器返回的结果进行显示和处理，其中返回的结果可为电台实时接收到的音频数据，也可通过回放功能调用存储的音频进行数据处理，以web方式访问服务器，采用网页嵌入播放器控制的方法实现实时在线播放。该架构主要适用于网络性能好的开放平台，信息共享度高、可维护性高、操作便捷，因此本架构仅用于监听人员远程访问web服务器对训练结果进行评估。

基于C/S架构设计开发建立在局域网专用网络中，通过专用服务器提供连接和数据交换服务，经局域网访问客户端，实现一对多电台音频采集管理，安全性更高，客户端响应速度快，实时性好。该架构适用于实时采集音频数据且用户稳定安全性要求高的环境，可应用于辅助监听人员的日常监听工作，自动接收电台音频信号，为实现电台无人值守提供了可能。

根据电台音频采集管理系统的工作原理，对系统接口连接方式进行说明。系统接口连接示意图如图3所示。电台音频处理终端的对外接口包括以太网口、音频接口、电源接口、USB接口以及耳机/话筒组接口。其中，USB接口用于传输Morse信号数据；网口1为数据上传接口，用于与服务器传输网接口点连接；网口2为系统PC机接入口，用于PC机向终端加载参数及采集数据。网口接口单元均为接收采集终端上报的音频数据、时间、位置数据以及参数信息。

图3 电台音频采集管理系统接口连接示意

2 电台音频处理终端设计

2.1 电台音频处理终端框架设计

通过对电台工作现状的分析，确定开发一款电台音频处理终端设备，其整体设计结构如图4所示。

电台音频处理终端分为音频采集单元、存储单元和控制及处理单元。其中，音频采集单元主要完成从电台接收到的音频信号的电平转换和语音编解码操作；存储单元则是存储接收到的音频信号以及处理后的信号数据，并实现回放功能；控制及处理单元包括Morse音频信号处理和语音识别两个功能性模块，将接收到的Morse音频信号数据传输给处理单元中的Morse音频信号处理模块，将音频信号转换成数字信号供PC端应用程序进行识别译码显示，接收到的语音信号则转接给语音识别模块，将语音信号自动转换成文本文件存储并记录下来。

图4 电台音频处理终端设计结构

2.2 电台音频处理终端模块结构设计

电台音频处理终端整体由软件及硬件两大部分组成，包含三大功能模块，分别为音频采集与回放、Morse音频信号处理和语音识别。根据电台音频处理终端设计原理，电台接收的音频信号经过外接设备终端处理后再传输给PC端应用程序进行接收显示，接收到的音频信号通过以太网口将数据传输给处理终端中的采集和回放模块，方便操作者再次收听确认接收到的信息是否完整。根据应用需求，对电台音频处理终端的三大功能模块结构进行设计，各个功能模块之间相互独立，具体结构如图5所示。

图5 模块结构设计

从稳定性、扩展性以及可维护性高的角度出发，将手工拍发的Morse音频信号即时处理、产生的大量音频数据长期存储和回放以及语音信号离线识别3种业务数据，以功能模块进行拆分。基于USB HID设备协议设计Morse音频信号处理模块，在原有的报务训练盒[3]的硬件基础上进行改进，并新增Morse音频信号识别电路实现Morse自动识别功能。由于Morse音频信号处理模块无法将所接收到的Morse信号进行记录回放，且语音信号无法接收记录，因此利用软件无线电平台对音频信号实现采集和回放功能。语音识别功能则是采用科大讯飞核心技术的离线识别模块[4]来实现。各个功能模块相互独立，使得单个模块故障或缺陷只影响该模块功能，而其他功能模块可正常使用。此时，只需针对该模块进行修改维护，在产品升级时仅更新功能模块，提升了整个终端设计的扩展性和可维护性。

3 电台音频处理终端功能设计

3.1 音频信号采集与回放

针对现有的电台接收采集音频信号的技术分析，选择利用软件无线电平台进行实时信号的记录收集与显示。软件无线电平台可将接收到的信号采集下来，通过接收电台的硬件实现直接下变频和A/D转换，输出的数字信号在上位机软件中进行基带的波形处理，从而完成音频信号的采集与回放，再结合设计的Morse识别模块和语音识别模块对接收到的音频信号进行分流处理。

采集和回放功能可有效提高信息接收准确度，解决了人工值守可能存在的漏听现象。由ZYNQ-7030 SoC+AD9361构建的通用软件无线平台[5]简单、易操作、扩展性强；利用湖南智领通信软件无线电教学软件（KZ-SDR-IDE）完成音频采集与回放模块设计，实现音频信号采集与回放功能，实时观测信号的频谱和时频图。

（1）采集实现流图如图6所示。“音频信源”及“文件信宿”放置工作区，编辑模块参数，完成音频信号的采集与文件存储功能。“瀑布图”“频谱仪”及“眼图”应用于对采集到的音频信号的分析处理，分别显示了采集到的音频信号在时频域、频域及时域上的数据特征。

图6 音频采集实现流图

（2）音频回放实现流图如图7所示。“音频文件信源”用于读取存储在文件夹中的音频文件；“音频信宿”用于对音频文件进行播放，即访问的文件信源输出到音频信宿（即声卡），同时利用“瀑布图”“频谱仪”及“眼图”分别对回放文件的时频、频域及时域进行特征数据显示，以便后期对数据进行分析处理。

图7 音频回放实现流图

3.2 Morse音频信号处理

Morse音频信号处理模块采取USB HID技术进行开发，设备上配置了电键、耳机以及麦克风接口，用于实现耳机、麦克风、电键和PC机之间的接口转换和数据格式转换[6]。该硬件模块采取免驱动模式使整个系统更加简洁，利用Windows系统自带的HID类驱动程序进行设备识别，建立相应的HID协议作用于PC机，控制USB设备进行数据传输通信，实现实时电键信号的采集、电报音频信号识别以及USB声卡发声。由于单片机、声卡等主要芯片都采用低功耗芯片，+5 V电源可以满足要求。该模块可以通过USB与PC机相连，实现供电。

Morse音频信号处理模块的基本设计如图8所示。利用USB HUB芯片将USB信号分为两路：一路作为USB接口芯片和单片机构成的控制电路与PC机之间通信的通道；一路作为USB声卡和PC机交换控制、音频流数据的通道。

（1）作用于控制电路的通道：USB接口芯片将接收到的数据交由单片机进行处理，其中单片机的时钟信号由晶振提供。电键的键控信号通过电键接口传递到电键预处理电路，进行消除抖动等操作后，一方面为保证电键声的实时性，直接采取控制音频信号发生器的方式，经混合放大后输入USB声卡进行发声；另一方面将预处理后的电键信号交给单片机进行实时采样，采样数据通过USB总线传给PC机进行识别处理。

（2）作用于USB声卡的通道：声音信号通过音频信号混合放大电路与电键敲击声迭加，产生的音频信号经过声卡处理后送到耳机口；从麦克风接口接入的Morse音频信号经放大后进行有效值检测，通过比较器转换成数字信号送入单片机，信号数据经USB总线传输给PC机进行处理，同时音频信号经USB声卡传输到耳机供人耳收听。

图8 Morse音频信号处理模块基本设计

3.3 语音识别

电台音频处理终端将接收到的音频信号中的语音信号数据传输至语音识别模块中进行处理，语音识别模块则是采用科大讯飞核心技术的离线识别模块XFMT101，使得终端可在离线条件下对语音信号进行识别。

语音识别的一般流程如图9所示。

图9 语音识别流程

语音识别过程[7]是将输入的语音数据送入特征提取模块，再通过语音解码模块对提取的特征数据进行解码，转换成对应的文本输出。语音解码过程则是通过调用声学模型、字典以及语音模型进行数据匹配，匹配度最高的最优路径即为最优语音识别结果。

离线识别模块XFMT101是科大讯飞推出的初级智能语音方案，同时支持语音识别、语音合成以及语音播放等多种语音功能[8]，支持UART作为通信接口，主要特点是功能丰富、接口简单，可以广泛应用于多种智能硬件领域。根据电台实际运用场景，该模块可为电台音频处理提供便捷、实用、可靠的离线语音识别解决方案。

4 结语

本文提出了一种电台音频采集管理系统总体技术方案，根据系统需求对系统进行技术方案概述，并对其核心部分电台音频处理终端框架进行设计。利用通用软件无线电平台设计音频信号采集回放功能模块，结合USB HID协议设计免驱动的Morse音频信号处理模块中的自动识别模块，实现了对Morse音频信号的自动识别，并基于科大讯飞的离线语音识别模块形成了完整的电台音频处理终端。本文设计的电台音频处理终端可适应多种电台，离线或在线对电台接收的音频信号进行处理，将各硬件功能模块与PC端应用程序相配合，利用软件无线电平台对采集的音频信号进行存储记录处理，可有效避免电台人工值守时出现漏记、听不清等问题，提高接收信息的有效性和可靠性，同时利用Morse音频信号处理模块和语音识别模块分别对采集到的Morse信号和语音信号进行自动识别，并结合人性化的PC端应用程序使得终端操作更加方便高效。