三种常见语音编码的性能对比
2017-04-27王鼎章小梅刘云飞
王鼎 章小梅 刘云飞
摘要:语音编码是现代语音通信系统的重要环节。与传统的PCM编码方式相比,增量调制具有节省频谱资源的突出优点。LDM、ADPCM和CVSD是三种常见的增量调制方式。该文以MATLAB Simulink平台为基础搭建了LDM、ADPCM和CVSD的编译码仿真模型,对三种编码方式不同采样率下的输出波形、抗干扰能力及可懂度进行了仿真对比。仿真表明,与其他两种编码方式相比,CVSD在低采样率下能保持更好的编码性能和可懂度,且具有一定的抗干扰能力。
关键词:语音编码;增量调制;Simulink;CVSD
中图分类号:TP274 文献标识码:A 文章编号:1009-3044(2016)29-0238-03
通信系统可分为模拟通信系统和数字通信系统两大类。如果在数字通信系统中传输模拟信号,这种传输方式被称为模拟信号的数字传输,这是现代通信的常见类型,比如在扩频通信系统或调频通信系统中传输语音。这时就需要在系统的发送端将模拟语音信号转换为数字信号,即模数转换(A/D);在接收端再将数字信号转换为模拟语音信号,即数模转换(D/A)。模数转换包含采样、量化、编码三个步骤。编码性能的好坏,直接影响语音通信系统的通信质量。编码性能的好坏与采样率、编码位数和编码算法有关。
脉冲编码调制(PCM)是最简单的一种语音编码算法,直接将量化后的采样值转化为一个k位的M进制的代码,一般采用的二进制代码。
一位二进制码只能代表两种状态,不能表示模拟信号的采样值,但一位二进制码可以表示相邻两采样值的相对大小,而相邻采样值的相对大小同样能反映模拟信号的变化规律,这就出现了另外一种编码方式,即增量调制(△M)。与PCM相比,增量调制获得更广泛应用的原因有:在PCM中,一个采样值需要多位代码表示,而在△M中只需要一位,所以△M大大降低了码元输出速率,因此在比特率较低时△M的量化信噪比高于PCM的量化信噪比;△M的抗误码性能好,能工作于误码率为10-3~10-2的信道中,而PCM通常要求信道误码率为10-6~10-4;△M的编译码器比PCM简单,更易于硬件实现。
常见的增量调制方式有线性增量调制(LDM)、脉码增量调制(DPCM)、自适应脉码增量调制(ADPCM)、连续可变斜率增量调制(CVSD)。本文重点对LDM、ADPCM和CVSD三种编码算法的性能进行对比。
1仿真模型的搭建
本文以MATLAB Simulink平台为基础搭建了验证LDM、ADPCM和CVSD编码性能的仿真模型,如图1所示。
首先选用一段无损录音作为语音信号源,利用Simulink中的From Multimedia File模块提取文件中的语音波形,并可以通过Rate Transition模块控制仿真的采样率。然后将语音信号分别送人LDM、ADPCM和CVSD编码器进行语音编码,在Trans-mission Channel中完成调制、高斯白噪声信道传输、解调,最后三路信号分别在LDM、ADPCM和CVSD译码器中完成译码和低通滤波,恢复出语音信号。为了比较分析三种编码算法的性能,将三路输出分别与原语音信号同时送入示波器模块,观察语音信号编解码前后波形的变化。
2不同采样率下三种编码的性能对比
在一个通信系统中,较高的采样率意味着较高的码元传输速率,也就意味着占用较大的传输带宽。为了提高系统的抗噪声性能,采样率越大越好;但从节省频带的角度考虑,采样率越小越好,这两者是矛盾的。综合两方面的要求,我们可以通过优化编码算法,利用尽可能低的采样率获得尽可能好的传输性能。
由于PCM的编码位数明显高于△M,因此在低信道传输速率下,PCM的性能要弱于△M,所以本文重点对LDM、ADPCM和CVSD不同采样率下的编码性能进行了仿真对比。
仿真中,采用了64kHz、32kHz、16kHz和8kHz四种采样率,分别得到解调译码的输出波形,如图2所示。每张图中自上而下依次为LDM、ADPCM和CVSD相应的输出波形,且黑色曲线为原语音波形,灰色曲线为解调译码波形。每张波形图中,灰色曲线与黑色曲线的拟合程度反映了编码性能,两条曲线越接近说明编码性能越好。
从图中可以看出,随着采样率的降低,LDM、ADPCM和CVSD的编码性能都有降低的趋势。其中,LDM在64kHz采样率时能够较好地恢复原语音波形,随着采样率的降低,性能恶化最为明显,在32kHz采样率时波形已出现明显畸变(过载失真),在16kHz采样率时波形已严重失真;ADPCM与LDM相比,性能改善明显,在16kHz采样率时波形才出现明显畸变(毛刺增多);CVSD随采样率的降低,性能恶化不明显,在8kHz采样率时波形才出现少量毛刺,且毛刺幅度较小。通过对比可以得出,CVSD在三种编码方式中性能最好,ADPCM次之,LDM性能最差。
在实际应用中,CCITT建议将32kbit/s的ADPCM作为长途传输的语音编码方式,以32kbit/s传信率传输的ADPCM信号基本能够达到以64kbit/s传信率传输的PCM话音质量。而在军事通信中,为了进一步节约信道资源,广泛采用以16kbit/s传信率传输的CVSD信号,以更低的传信率获得相近的话音质量。
3三种编码方式抗突发干扰的性能对比
前面主要讨论了不同采样率下LDM、ADPCM和CVSD三种编码的性能对比,但在实际应用中,编码方式的抗干扰性能也是话音质量的重要影响因素。为比较三种编码方式的抗干扰性能,利用Simulink中的Pulse Generator模块(如图1所示)产生周期性的脉冲干扰,观察干扰时段内灰色曲线与黑色曲线的拟合程度。
图3所示为某一脉冲干扰时段内的仿真输出波形示意图,从图中可以看出,在不同采样率条件下LDM、ADPCM和CVSD相应的输出波形都出现了不同程度的畸变,其中CVSD编码的畸变最小,且在干扰时段外能够迅速逼近原语音信号。由此可见,CVSD具有较强的抗突发干扰的能力。
4三种编码方式的音质对比
以上我们通过波形对比的方式来讨论LDM、ADPCM和CVSD的编碼性能,波形的拟合程度能一定程度上反映编码方式的性能好坏,但并不全面,因此本文又直接考察了输出信号的音质和可懂度。
利用Simulink中的To Multimedia File模块将LDM、ADPCM和CVSD译码器的输出波形分别存储到LDM_output.avi、ADP-CM_output.avi和CVSD_output.avi三个多媒体文件中,实现了语音信号的重构,如图4所示。然后就可以通过直接监听的方式比较原语音与三个已恢复语音的音质和可懂度。
通过对比发现,在64kHz采样率时,三种编码方式恢复的语音信号都有很好的音质和可懂度;在32kHz采样率时,LDM已出现杂音,可懂度明显下降,ADPCM的音质和可懂度下降不明显;在16kHz采样率时,CVSD依然保持了较好的音质和可懂度,甚至在8kHz采样率时仍然可以听懂。同时,在有突发脉冲干扰时,CVSD恢复语音信号的音质和可懂度也是最好的。
5结束语
本文以MATLAB Simulink平台为基础搭建了LDM、ADP-CM和CVSD的编译码仿真模型,对三种编码方式不同采样率下的输出波形、抗干扰能力及可懂度进行了仿真对比。仿真表明,与其他两种编码方式相比,CVSD在低采样率下能保持更好的编码性能和可懂度,且具有一定的抗干扰能力。CVSD编码以相对较低的编码速率可以获得较好的语音质量,是应用在语音通信系统中的较好的编码方式。