APP下载

语音编码在IP调度系统中的应用研究

2014-05-25杨晓东郑树强

计算机与网络 2014年6期
关键词:编码标准话音时延

杨晓东 郑树强

(太原卫星发射中心山西太原030027)

语音编码在IP调度系统中的应用研究

杨晓东 郑树强

(太原卫星发射中心山西太原030027)

IP调度系统是航天任务中重要的新型指挥系统,结合系统工作实际,简述了IP调度系统的基本组成、基本原理和语音传输过程。根据语音编码技术的基本特征,选取相关的3种主流语音编码标准G.711、G.723和G729,从编码质量、编码速率、时延和带宽占用率等方面对其在IP调度系统中的应用进行了分析和比较,总结了各自的优点和不足,为IP调度系统工程实践中的编码标准选择提供了技术依据。

语音编码 IP网络 指挥调度

1 引言

指挥调度系统是航天发射场组织指挥发射试验任务的基础性系统之一,其系统性能与运行质量直接影响着任务指挥流程的顺利进行。发射场历来都将调度系统作为重点试验设施进行发展和建设,先后经历了模拟系统和大容量数字化系统。

随着信息技术的发展,业务承载网逐步向IP化发展,多种通信业务将逐步通过IP信道进行传输。数字指挥调度系统也将适应形势发展,依托IP网络进行改造,并将逐步建设完全IP化的指挥调度系统,统一纳入到任务IP网络中进行语音信号的传输。

IP调度系统在传输方式上与其他通信业务共享IP网络的带宽,提高了信道资源的利用率。由于IP网络的开放性和标准化,以及发射场任务IP网络双路由的结构特点,IP调度系统具有更高的灵活性、扩充性和可靠性。

2 IP调度系统基本原理

IP调度系统与传统的模拟和数字调度系统相比,同样具备通播、越级、分割和屏蔽等控制功能,最主要的变化是:将语音信号的传输模式由点对点传输改变为网络传输,由基于专线电路的数字信号传输改变为基于IP网络的数据包传输。IP调度系统的基本组成如图1所示,系统主要由调度主机、网络设备(包括交换机、防火墙和路由器等)、传输设备(包括卫星通信设备和光纤通信设备等)和调度终端组成。

图1 IP调度系统基本组成图

IP调度语音信号传输的基本原理如图2所示,语音通过麦克风进入调度终端后,首先由调度终端对模拟语音信号进行抽样、量化和压缩编码,将其转换为语音数据,数字化过程可以采用多种语音压缩编码算法实现,然后把这些语音数据按TCP/IP等相关协议进行打包送到IP网络,在IP网络上再经过交换机、防火墙及路由器等网络设备和光纤通信及卫星通信等通信信道传输到目的调度终端,再把这些语音数据包串起来,经过解码解压处理后,恢复成原来的语音信号,从而达到由IP网络传输调度话音的目的[1]。

图2 IP调度系统语音传输基本原理图

3 语音编码技术分类

根据IP调度系统的基本组成和话音传输的基本原理可知,影响语音质量的主要因素是语音压缩编码算法的性能和传输网络的性能。语音压缩编码的目的是用尽可能低的编码速率获得尽可能好的合成语音质量,同时又使编码过程的计算代价尽可能小。降低编码速率的实质就是降低占用的频带宽度,而编码速率低意味着算法的复杂度增加,时延变大。在传输网络性能一定的条件下,不同的语音压缩编码算法具有不同的计算复杂度、算法时延和带宽占用率等性能指标,从而影响话音传输的质量[2]。

语音编码方法主要分为3类:波形编码、参数编码和混合编码[3]。

①波形编码方法主要是基于语音信号的波形,力图使经过编码压缩、传输和解码恢复后的合成语音信号与原始语音信号的波形误差最小。由于语音信号的全部信息都蕴含在原始波形里,所以这种方法编码后的合成语音质量非常好,且信道适应能力强。国际电报电话咨询委员会CCITT于1972年制定的G.711 64 kbps的脉冲编码调制(PCM)和ITU在1984年公布的G.721 32 kbps的自适应差分脉冲编码调制(ADPCM)都属于这一类编码器;

②参数编码是通过对语音信号特征参数进行提取及编码,通常每隔20 ms到40 ms就会从语音信号中提取和量化特征参数,最大优点是编码速率低,在理想条件下合成语音听起来和原始语音相似,但对环境噪音特别敏感,在背景噪音较大的情况下就不能再生原始波形,其合成的语音质量较差且时延值大;

③混合编码融入了波形编码和参数编码的优点,能获得自然度较高的话音,并且有着非常低的比特率,但时延较大。目前VOIP系统中使用的语音压缩编码方式大多数是基于混合编码方法的,比如G.723和G.729。

G.7XX系列语音编码标准都是基于以上3类不同的编码方法而定制的,语音编码方法的基本原理决定了每种标准的编码速率和话音质量等具体特点,也决定了每种编码标准适用于不同的应用环境。

4 语音编码技术比较

以上列举的G.711、G.723和G.729为目前较为主流的几种语音编码标准,各自有着不同的技术特点。以此3种编码技术为研究对象,比较其在IP网络环境下的语音编码性能,分析其在发射场IP调度通信网中的适用性。衡量语音编码标准技术优劣的主要指标有:编解码语音质量、编解码速率、复杂度、时延和带宽占用率等[4]。

①G.711是使用最为普遍的语音编码标准,采用波形编码方法,包括A律和u律2个变型。其数据采样率为8 KHZ,编码速率为64 kbps,由于其采用波形编码算法,具有高质量和低时延的特点,编码速率高,获得的话音质量最好,MOS等级都在4.3左右,有着适应能力强、话音质量好和抗噪抗误码能力强等特点,最大的缺点是同其他的编解码器相比,要使用大量的带宽,当其用于低带宽时,话音质量下降得非常快;

②G.723是一个双速率语音编码协议,2种速率分别是5.3 kbps和6.3 kbps,编码延迟为37.5 ms[5]。就目前而言,与ITU-T的其他编码标准相比,G.723之中G.723.1的编码速率是最低的。2种速率的编解码基本原理是一样的,只是对信号的量化方法有差别,2种速率下都能获得很好的语音质量,MOS值约为3.8。ITU建议其应用于低速率多媒体服务中话音或其他音频信号的压缩,优点在于仅需要很窄的语音带宽便可具有较高的语音质量,缺点在于编码时延达到37.5 ms;

③G.729协议能够实现很高的话音质量和很低的算法时延,可将经过采样的64 kbps话音以几乎不失真的质量压缩至8 kbps,合成语音和原始语音之间的误差很小,总的算法时延为15 ms,而且在有随机比特误码、帧丢失和多次转接等情况下仍然具有很好的稳定性,特别是这种编码方式在一定的背景噪声下仍然可以保持较好的语音质量。

3种语音编码标准的具体性能指标对比如表1所示[6]。

表1 编码标准指标比较

采用MOS分值法评价编码语音质量,可以看出,3种编码方式的听音质量都比较高,其中,G.711与G.729的语音编码质量最好。从编码速率来看,G.723的比特率最低,G.729的编码速率仅高于G.723,G.711的编码速率远远高于G.729和G. 723。

编解码的复杂度与语音编码的质量有着密切的关系,在同样的码率下,采用复杂的算法将能获得更好的语音质量,但对硬件的计算能力要求也更高。由表1可知,在复杂度方面,G.723相对G.729较优,G.711最佳。增加算法复杂度可以提高语音的质量,但同时也带来了编解码的时延,在实时语音通信中对通信质量有着很大的影响。在编解码时延方面G.711时延最小,G.729较G.723为优。

在IP调度系统中,语音编码是把话音转换成数据方式来传输,传输协议中包含了RTP和UDP,与IP一起成为一个完整的语音协议。在Ipv4里,IP包占20 Bytes,UDP包占8 Bytes,RTP包头占12 Bytes,则包头共占40 Bytes,此外,以太网占14 Bytes,在每秒20 ms的语音负荷的情况下,以G.729编码为例,实际要传输的字节数为:20+8+12+20+14=74 Bytes;传输速度应为:74 Bytes/20 ms=29.6 kbps;而在相同的环境下,G.711编码却需要85.6 kbps的带宽。

表2 编码算法带宽占用率比较

3种编码算法的带宽占用率比较如表2所示[7]。

根据带宽占用率比较的结果,G.723的压缩比最大,最节省带宽,G.729次之,G.711的压缩比最低,对带宽的要求最高。

3种编码技术从编码质量、编码速率、编解码复杂度、编解码时延和带宽占用率等这几个方面综合比较,可以得出以下结论:

①G.711的编码质量最好,编码复杂度最低,编码时延最小,但对带宽的要求最高;

②G.723的编码质量次于G.711和G.729,编码复杂度较高,时延值也较大,但最节省带宽资源;

③G.729的编码质量较好,时延值也较小,均介于G.711和G.723之间,对带宽的要求也较小。

在带宽资源足够丰富的情况下,选择G.711可以获得最佳的调度语音质量;如果带宽资源较为紧张,并可以接受一定程度的话音质量损失,可以选择G.723;如果不能接受较大的话音质量损失和一定的通话时延,而带宽资源又不是足够富裕,则可以选择G.729。从话音质量和通信成本等多方面综合考虑,3种编码技术中,G.729为最佳编码方案。

5 结束语

根据以上的分析和比较,3种编码技术在语音质量、编码速率、时延大小和带宽占用率等方面有着各自的优点或不足,不能绝对的评价一种技术的优劣。在具体的工程实践中,应该根据通信的指标要求和IP网络环境的实际情况等因素综合考虑,选择适用的编码技术。

[1]牛晓华,高山.VoIP语音压缩技术在IP指挥调度系统中的应用[J].数据通信,2011(5):44.

[2]韩纪庆,张磊,郑铁然.语音信号处理[M].北京:清华大学出版社,2004.

[3]杨会彩,樊延虎.几种低速率语音编码算法分析[J].延安大学学报(自然科学版),2009,28(1):44-46.

[4]徐作庭,李来胜.多媒体通信[M].北京:人民邮电出版社,2011.

[5]鞠鸣.VoIP中语音压缩编码技术的研究与性能分析[J].江苏通信技术,2007,23(2):36-37.

[6]李娜,王中元,胡瑞敏.数字语音编码技术和标准介绍[J].中国新通信(技术版),2007(13):39-43.

[7]唐峰.数字音频压缩技术研究[J].中国传媒科技,2008(5):43.

Research on Application of Speech Coding in IP Command Dispatching System

YANG Xiao-dong,ZHENG Shu-qiang
(Taiyuan Satellite Launch Center,Taiyuan Shanxi 030027,China)

The IP command dispatching system is a new important command system for space mission.Combined with practical system operation,this paper summarizes the basic composition,basic principle and voice transmission process of IP command dispatching system.Based on the basic characteristics of speech coding technology,such three kinds of mainstream speech coding standards as G.711, G.723 and G729 are selected,the applications of these standards in IP command dispatching system are analyzed and compared from such aspects of coding quality,coding rate,delay and bandwidth occupation,and their advantages and disadvantages are summarized,which provides the technical basis for coding standard selection in the engineering practice of IP command dispatching system.

speech coding;IP network;command dispatching

TP305

A

1008-1739(2014)06-61-3

定稿日期:2014-02-26

猜你喜欢

编码标准话音时延
国家医保局发布《关于贯彻执行15项医疗保障信息业务编码标准的通知》
高校标准化主数据平台建设与应用
基于GCC-nearest时延估计的室内声源定位
基于改进二次相关算法的TDOA时延估计
话音叠加中实时混音算法的FPGA实现
高保真压缩技术的商用价值
FRFT在水声信道时延频移联合估计中的应用
基于分段CEEMD降噪的时延估计研究
铁路工程信息模型分类和编码标准研究
IP语音报头压缩设计与实现