数字对讲机中语音信号处理的研究

2011-08-11彭天伟凌朝东

通信技术 2011年10期

彭天伟，凌朝东，杨骁

(华侨大学信息科学与工程学院，福建厦门 361008)

0 引言

在对讲机技术发展的30多年历史中，模拟技术应用已非常成熟，关键器件已很可靠，能够基本满足现有客户消费群体的基本需求，可以说为多种行业的发展都作出了巨大的贡献。随着社会经济与科技的发展，许多政府部门、警察、公共安全、公用设施、医疗、消防及一些特殊部门等对移动终端又不断提出了更加专业、安全、稳定、健康、便捷的要求。

早在20世纪，国外就有人将数字技术引入对讲机行业。目前我国正在积极展开自主知识产权的数字对讲机的研发工作，以及数字对讲机协议的制定。

1 关于数字对讲机语音信号速率分析

中国信产部于2001年12月6日宣布开放民用对讲机市场，其开放的频段为409～410 MHz，共分20个频道，称为“公众频道”共20个频道，具体划分如表1。

表1 公共频带划分

每个频道的带宽为12.5 kHz,总的带宽为12.5×20=250 kHz。由于数字对讲机每个频道的带宽为12.5 kHz，所以要对语音信号进行压缩算法处理，语音信号的数据码流应该压缩到4.8 kb/s以下。

按语音编码速率不同划分为：高速率编码16～64 kb/s、中速率编码4.8～16 kb/s、低速率编码2.4～4.8 kb/s、极低速率编码即小于2.4 kb/s。应用于数字对讲机中的语音编码属于低速率编码。

2 低速率语音算法比较

近年来，低速率语音编码技术在研究思路上有了很大的发展[3]。低速率语音编码算法逐渐成熟。常见的低速率语音编码有二元激励线性预测编码（LPC，Linear Predictive Coding）、正弦激励线性预测（SELP）[5]、多带激励(MBE，Multi Band Excited)[1,6]、混合激励线性预测(MELP，Multi Excitation Linear Prediction)[2,7]等。

2.1 二元激励线性预测编码[8]

LPC[3]是最基本的低速率语音编码方法，用清/浊2个激励源来激励LPC滤波器合成语音信号。LPC-10就是二元激励线性预测编码的典型例子。

LPC-10在无噪声时合成语音质量主观测试结果如表2所示。

表2 无噪声时合成语音质量主观测试结果

由表2得出，平均就得分意见(MOS，Mean Opinion Score)仅为2.5，说明合成语音质量不能让人满意；判断韵字测试(DRT，Diagnostic Rhyme Test)为90%，说明具有比较良好的可懂性；判断满意度测试(DAM，Diagnostic Acceptability Measure)为55%，说明自然度及讲话人的确认等方面不够好。

LPC-10在无噪声时合成语音质量的客观测试平均改进巴克谱失真度(MBSD，Modified Bark Spectral Distortion)测试结果如表3所示。

表3 无噪声时合成语音质量客观测试结果

2.2 多带激励声码器[8]

MBE[1,6]对传统的二元声码器做了改进，主要引进了多带的思想。码率为4.15 Kb/s的增强型MBE声码器在无噪声时合成语音质量主观测试结果如表4所示。

表4 无噪声时合成语音质量主观测试结果

由表4得出，MOS仅为3.4合成语音质量达到通信质量；DRT为94%，说明具有比较良好的可懂性；DAM为65%，说明自然度及讲话人的确认等方面还不是很好。

IMBE声码器在无噪声时合成语音质量客观测试平均MBSD测试结果如表5所示。

表5 无噪声时合成语音质量客观测试结果

2.3 混合激励线性预测声码器[8]

MELP编码器[2,7]在传统的二元激励线性预测模型的基础上引进了多带激励、LPC-10e等算法的思想。新增了5个特点：多带混合激励、非周期脉冲、自适应谱增强、脉冲离散滤波和残差谐波谱处。能够在2.4 Kb/s速率上得到更高质量的合成语音。

MELP声码器在无噪声时合成语音质量主观测试结果如表6所示。

表6 无噪声时合成语音质量主观测试结果

由表6得出，MOS仅为3.2，说明合成语音质量达到了通信质量；DRT为94%，说明其具有比较良好的可懂性；DAM为63%，说明其自然度及讲话人的确认等方面还不是很好。

MELP声码器在无噪声时合成语音质量客观测试的平均MBSD测试结果如表7所示。

表7 无噪声时合成语音质量客观测试结果

从表3、表5和表7可以看出，噪声电平越大，其MBSD的值也越大，及噪声越强，合成语音失真就越大。

3 算法的研究与确定

通过上一节对几种度速率语音编码算法合成语音质量的比较，结合数字对讲机通信带宽的要求，拟定2.4 Kb/s的编码速率，所以采用MELP算法为数字对讲机的基本算法。

MELP声码器在经典的二元激励LPC声码器的基础上，加入了一些新的特征。这些特征使得MELP声码器与经典的LPC声码器相比可以更好的模拟人的语音，使其在低码率下的合成语音的自然度大大提高，消除了嗡嗡声、咔嚓声等不自然的声音。MELP声码器的语音质量可以在很低的码率下(2.4 kb/s)达到较好的听觉效果。

MELP编码器的码率为2.4 kb/s,帧长为22.5 ms，每帧数据用54 bit进行编码。其编码流程如图1所示。

图1 MELP编码流程

首先对语音信号进行预处理，滤除工频噪声。预处理后的信号通过1 kz的低通滤波器滤波，对滤波信号做基音分析提取基因周期；同时对与处理信号进行分带，分为5个子带，分别对各个子带做非周期标志位判断和子带清/浊音判决；采用 10阶线性预测分析预处理信号，提取线性预测系数；采用LPC逆滤波和FFT变换提取傅氏级数幅度。

提取出参数之后，对傅氏级数幅度和 LSF进行矢量量化，最后按照一定的规定对数据组帧，发送数据。如表8所示，为MELP参数量化比特分配。

表8 参数量化比特分配

根据MELP编码器框图编写程序代码在MATLAB R2010a平台上进行仿真，仿真波形，图2（横坐标的数量级为104）中采用8 Kz的采样速率采集获得语音数字信号，运用MELP算法进行分析合成。采用主观测试的方法分析仿真结果，合成语音的质量达到了通信要求，能听清楚发音和识别出说话人。

图2 MELP仿真结果

4 结语

通过前面的分析和实验结果，MELP编码器基本能实现数字对讲机通信中的语音号处理。在试验仿真时，虽然合成语音质量能达到通信质量，但是合成语音的背景噪声很大，这是在正常生活让人无法接受的。在接下来的工作应该对算法做改进。针对背景噪声大的缺点，初步计划对语音分析的基音周期[4]的提取算法、清音分析部分和语音合成时清音激励源的生成部分和清音生成处理部分做改进。

[1]崔慧娟.多带激励低速率语音压缩编码算法研究及实时实现[J].电子学报,1998,26(10)：129-132.

[2]刘宽海.MELP低比特率数字语音编码技术研究[J].信息技术,2003,27(08): 52-54.

[3]何春荣.浅析语音编码的三个发展方向[J].成都纺织高等专科学校学报,2008,25(01)：33-35.

[4]胡连锋.一种改进的强噪声背景下基音检测算法[J].通信技术,2009,42(12)：164-166.

[5]赵海军.低复杂度2400b/s声码器[J].通信技术, 2010, 43(01):121-123.

[6]王都生.多带混合激励低速率语音编码的研究[D].西安:西安电子科技大学,1998.

[7]郑鲁杰.低速率语音编码MELP算法的研究[D].成都:电子科技大学,2003.

[8]王洪.低速率语音编码[M].北京:国防工业出版社,2006: 72-172.