APP下载

低码率语音压缩模块的设计

2017-04-10王耀磊许国宏李强张曙光

电脑知识与技术 2017年4期

王耀磊++许国宏++李强++张曙光

摘要:为解决语音通信过程中存储空间和信号带宽的限制,实现高压缩率语音传输,设计了一种低速率语音编码模块。该模块由语音编解码专用芯片MA24126-P1,音频codec芯片TLV320AIC23,单片机以及相关接口电路构成,可实现600bps,1200bps以及2400bps三种速率下的语音编解码处理。经测试,经该模块编解码后的语音信号具有较高的清晰度、可懂度、自然度。

关键词:MA24126-P1;TLV320AIC23;低速率语音编解码

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2017)04-0247-03

Low Rate Voice Compression Modules Design

WANG Yao-Lei,XU Guo-Hong,LI Qiang,ZHANG Shu-Guang

(China Research Institude of Radio Wave Propagation, QingDao 266107, China)

Abstract:In order to solve the limitation of storage space and signal bandwidth in speech communication, a low rate speech coding module is designed to realize high compression rate voice transmission. The module consists of voice codec chip MA24126-P1, audio codec chip TLV320AIC23, mictocontroller and related interface circuit, can achieve 600bps, 1200bps and 2400bps at three rates of voice. After testing, the speech signal afer the module is compiled and decoded has high definition, intelligibility and naturalness.

Key words: MA24126-P1;TLV320AIC23;Low-rate speech codec;

1 概述

语音传输是目前最普遍的通信传输服务,尤其在短波通信中,考虑到存储空间、信道带宽的现在,可采用低速率编码技术对语音信号进行压缩,将较高码率的语音信号,压缩成较低的码率,以满足系统对存储空间以及信号带宽的要求[[1]]。本文采用国产低码率语音编解码芯片MA24126-P1,实现一种低码率语音编解码模块的设计,编码速率可在600bps、1200bps以及2400bps中灵活选择。

2 模块总体结构

设计的低码率语音压缩模块主要由语音编解码专用芯片MA24126-P1、音频codec芯片TLV320AIC23、单片机GD32F103RCT6以及相关接口电路组成,如图1所示。

语音信号经codec芯片TLV320AIC23采集后,送至语音编解码芯片MA24126-P1进行编码,并将编码结果通过串口发送给单片机,单片机利用内部DA对编码信号按FSK的方式进行调制,将调制后的信号进行相关调理并发射;同样,接收到的调制信号進行相关调理后,送至单片机内部AD进行采集,转换为数字信号,并进行FSK的解调,将解调信号发给语音编解码芯片MA24126-P1进行解码,并将解码后的结果发给TLV320AIC23芯片,进行数模转换,变成语音信号。

3 低码率语音压缩模块的具体设计

本模块由语音信号采集回放电路、信号编解码电路、控制电路、信号调理电路以及电源电路等几部分构成。

3.1 语音信号采集回放电路

语音信号采集回放电路主要由TLV320AIC23芯片及相关外围电路构成,如图2所示。TLV320AIC23是TI公司生产的一种高性能立体声音频编解码芯片,对输入和输出信号具有可编程增益调节功能。该芯片的模数转换和数模转换部件集成在芯片内部,可以在到8K到96K的频率范围内提供16bit、20bit和32bit的采样[[2]]。在本设计中,采用16bit 8K采样即可满足系统需求。

3.2 信号编解码电路

信号编解码电路可实现对语音信号的压缩或解压,即可对采集到的语音数据进行编码压缩,同时也可将压缩的语音信号进行解码还原。该电路主要由MA24126-P1芯片实现。

MA24126-P1是深圳迈可为科技有限公司自主研发的一款多码率语音编解码芯片。该算法结合了二元激励、码激励和多带激励的优点,将短时语音划分为若干子带,在每个子带中分别进行清浊音判决。在合成端,采用周期性脉冲和随机噪声的混合序列去激励语音合成滤波器,能在较低的码率下得到较高质量的再生语音[[3]]。

MA24126-P1内置片内 FLASH 和 RAM,可单芯片实现语音的实时编解码,无需外挂存储器,降低了系统设计的复杂性。MA24126-P1支持 600bps、1200bps 和2400bps 三种编码速率,速率的选择可由芯片外部管脚或软件命令进行控制。

MA24126-P1可无缝连接TLV320AIC23,上电自动对其配置,无需用户干预。采用串口与单片机连接,可通过串口实现语音用编码数据的读出和写入,且这个过程是异步、全双工的。

本设计中,将TLV320AIC23的BCLK、DIN、LRCIN、DOUT、LRCOUT、SCLK、SDIN、CS等管脚分别与MA24126-P1的对应管脚相连,即可实现对MA24126-P1对TLV320AIC23控制以及数据传输;MA24126-P1芯片上有一串口,将该串口与单片机相连[[4]],即可通过单片机实现与MA24126-P1的数据传输,并且可以控制该芯片选择不同的编解码速率、工作模式以及工作状态等。

3.3 控制电路

通信控制电路用于实现模块与上位机或调制解调器的通信,并实现对芯片的控制。该电路主要由单片机和串口芯片组成。

单片机选用北京锐鑫同创科技有限公司出品的GD32F103RCT6系列单片机,该单片机主频为108MHz,提供了出色的处理性能。片内闪存为256K,RAM为48K,集成了丰富的外部接口,并配有12位ADC和DAC[[5]]。在本设计中,利用该单片机实现对信号编解码电路的控制,并实现FSK。

3.4 FSK设计

FSK是利用载波的频率变化来传递数字信息,即幅度恒定不变的载波信号的频率随着输入码流的变化而切换(称为高音和低音,代表二进制的1 和0)[[6]]。

在本设计中利用单片机软件来实现FSK的调制与解调。首先是基带信号的产生,它也是我们要调制和解调的目标。基带信号由一连串随机的码元序列构成, 接下来要产生载波,载波就是正弦波无疑。正弦波的产生用的是单片机的DMA+DAC+TIM2。正弦波的数据用正弦波数据发生器产生,采样点数64,精度12位,保存在数组中。生成正弦波后自然是要把两个正弦波组合在一起形成FSK信号,这个组合当然不是随意组合,是要在基带信号的控制下进行。这便完成了FSK的调制。

接下来就是解调,本设计中用了两次解调才把基带信号完整复现出来。初步解调代码,用的是TIM1的输入捕获模块, 选择输入捕获是因为对于FSK信号来说,它由两个不同频率的正弦波组成,单片机默认的高电平在2V以上,低电平在0.8V以下。通过测量从上升沿到下降沿这段时间,与阈值比较大于阈值的码元即为“0”,反之则为“1”。 然而这只是我们初步解调出来的结果,由过渡带的影响,最终得到的码元序列“1”的持续时间长于码元为“0”的持续时间,信号的码速率不是设计的码率,所以我们需要进行二次解调。二次解调的关键在于定时器TIM5的同步作用。用TIM5定时为设计码率,然后开始同步,通过判断初步解调信号的码元序列,得到二次解调信号的码元。完成FSK的解调。

4 系统测试

对模块进行测试,将模块设置为自回环模式,输入同一段语音信号,利用cool edit软件录制成音頻文件并分析,依次设置编码速率为2400bps、1200bps以及600bps,得到光谱图如下图所示:

可见,在光谱图中,原始语音信号与重建后语音信号光谱结构差别较小;主观听觉测试表明经重建后的语音信号具有较高的可懂度,清晰度以及自然度。

5 结束语

本文设计的基于MA24126-P1的低码率语音压缩模块具有较高的可懂度,清晰度以及自然度,可用于对存储空间、信号带宽要求较高的语音通讯系统中,具有较为广阔的应用空间。

参考文献:

[1] 朱敏杰,王海,梁伟.一种低速率语音编解码系统设计[J]. 实验室研究与探索,2014(1):115-118.

[2] 深圳市迈可为科技有限公司.MA24126-P1语音编解码芯片数据手册[Z],2015.

[3] Texas Instruments. TLV320AIC23B Stero Audio CODEC 8 to 90kHz With Intergrated Headphone Amplifier[Z],2004.

[4] 深圳市迈可为科技有限公司. MA24126-P1连接MCU的应用说明[Z],2015.

[5] GigaDevice Semiconductor Inc .GD32F103XX ARM Cortex-M3 32-bit MCU[Z],2013.

[6] 许国宏,宋征,王耀磊.多通道2ASK/2FSK信号源的设计与实现[J]. 电脑知识与技术,2016(7):257-259.