战场网络环境下的VoIP技术研究
2011-03-06王亚,肖强,陈亮
王 亚,肖 强,陈 亮
(解放军理工大学 通信工程学院,江苏 南京 210007)
0 引言
现代战争中,各个军种之间的通信比以往任何时候都要重要和频繁,而最常用最直接的通信手段就是语音通信。随着战术互联网等军用网络技术的迅速发展,军用VoIP[1]技术成为近年来语音处理与通信领域的一个研究热点。与传统的电路交换的语音通信系统相比,VoIP具有抗干扰性强、保密性好、易于集成、成本低廉等特点,能够适应复杂的战场环境,实现更加灵活和便捷的通信。
VoIP是一种对延时和延时抖动非常敏感的实时业务,而战场无线分组网络由于信道的广播特性、动态拓扑和设备资源有限,很难为语音传输提供实时性服务和保障语音的服务质量。因而如何保证语音在分组网络中的服务质量是当前该领域研究的难点课题之一。
1 VoIP概述
VoIP是建立在网络技术上的数字化、分组化的语音传输技术,其基本原理是:采用数字化处理技术对模拟语音信号进行压缩编码和打包,然后将语音包经过IP网络传送到接收端,再次进行数字信号处理后,通过终端播放出来,从而实现端到端的双向通信模型。
VoIP利用分组网络的“存储—转发”方式进行传输,与传统电话相比,VoIP有一个致命的缺点,就是语音质量无法得到保证。这是因为IP网最初设计的目的是为传输数据,采用的是面向无连接的“尽力而为”的传输体制。在战场环境下,信道的带宽有限且信道受环境变化的影响较大,使IP网络特有的延时、丢包、抖动等现象尤为严重,如何消除这些因素的影响,保证语音的传输质量,是军用VoIP技术首需解决的问题。
2 战场环境下VoIP语音质量的影响因素
以战场无线网络环境为例,信道状况受作战环境影响,数据传输的带宽窄,速率低,稳定性较差,基于分组交换的IP网络中的VoIP系统的延时、抖动、丢包等问题更加明显,使得用户听到的话音会出现语音畸变和频繁断话等现象。战场环境下VoIP的应用面临的主要困难有以下方面。
2.1 丢包
丢包是指语音包没有及时到达接收端而被丢弃。在语音传输过程中,为了提高传输效率,保证数据流的实时性,采用的是无连接的UDP传输方式,这就使得丢包现象无法避免。当载有声音的数据包所在的路径拥塞时,路由器开始弃包。虽然包丢失并不一定意味着包永远不会到达目的地,对于IP语音通信,到达目的地太迟以致无用的包和包丢失一样,都会被接收端抛弃。在IP网络上实时传输语音,用户对延时比较敏感,但对一定数量的丢包可以接受。图1为不同丢包率下语音质量的变化图,纵轴为语音的平均意见(MOS)得分,横轴为随机丢包率,选用两种语音编码器iLBC和G.729A,延时设定为小于100 ms的固定值。
图1 丢包对语音质量的影响
从图1可以看出:丢包率在5%以下时,丢包对语音质量影响较小且变化不大,当丢包率大于10%以后,随着丢包率增大,语音质量迅速下降;丢包率相同时,iLBC比G.729A的MOS分高,丢包率增大时,iLBC的语音质量下降较慢,说明不同编码器的抗丢包能力不同。
2.2 网络延时与抖动
延时是指从发出声音到听到声音的时间间隔,与语音编码压缩和语音分组在网络上传输的不确定性有关。延时是直接影响语音质量的主要因素,过长的延时会导致讲话人的声音产生重叠和回声,更长延时甚至会使讲话者的交谈无法进行。图2为实验得到的不同丢包率和延时组合下传输语音的平均意见(MOS)得分。
图2 延时和丢包对语音质量的共同影响(Encoder:G.711)
从图2可以看出,MOS分对应延时的变化曲线在丢包率分别为0%、1%、3%、5%时都相互平行,说明丢包与延时对语音质量的影响是相互独立的;当延时处于0~150 ms时,其对语音质量的影响较小,且对语音的损伤可视为固定值,当延时超过200 ms时,随着延时的增加,语音质量急剧下降。
变动的延时称为抖动。由于每个语音包传输路径不同,每条路径的长短和数据流量各不相同,造成了包到达接收端的时间有所不同(即抖动),抖动将在发音之间产生随机中断。当网络负载大时会造成极大的延时和延时抖动。当延时抖动大于某个上限时,称为延迟突变,此时接收端大量丢包的情况就会发生。
在战场无线IP网络还不稳定,信道特性变化较快的战场环境下,可能突发的剧烈抖动将会严重影响通信系统的性能,给VoIP在战场环境下的应用造成了很大的局限性。
3 VoIP中的语音编码
语音编码是VolP的基础,好的语音编码技术可以通过占用较小的带宽来传输优质的话音,特别是在网络环境较差的情况下,这种优势尤其明显。
优秀的VoIP编码技术应具有语音编码动态转换功能,即网络拥塞时自动由高码速转换为低码速,网络条件较好时自动由低码速转换到高码速以提高语音质量。实际选择编码算法时应综合考虑各种因素。此外语音编码器是在IP电话中产生延时的一个重要因素。
目前适用于VoIP的语音编码主要有国际电信联盟远程通信标准化组(ITU-T)定义G.729、G.723/G.723.1等。在开放源代码的语音编解码算法中,Speex[2]和iLBC[3]也很适合在IP电话中应用。表1列出了当前各种IP语音编码算法及其指标。
表1 几种语音编码算法性能比较
表1对当前流行的语音编码算法的各项指标进行了分析和比较,从表中可以看出,语音压缩率越高的编码算法对CPU的计算能力的要求越高,每帧编码的延迟越长,同时其MOS得分也逐渐降低,因此在实际的军用VoIP系统开发中,要对算法的延迟、带宽占用和MOS值进行权衡,系统的实现要根据当前网络的带宽利用率及语音质量的要求来进行自适应的语音编码算法的选择。
4 VoIP中语音质量的提高
4.1 丢包处理
丢包处理技术是用来恢复或隐藏当前丢包时所造成的损失的相关技术。目前这些技术可以分为两类:①是基于发端采用的措施,需要接收端的共同参与才能实现,称之为丢包恢复技术;②是基于接收端的措施,不涉及发送端,称之为丢包隐藏。它们都能够在一定程度上提高IP语音质量。
(1)丢包恢复技术
基于发送端的丢包恢复技术在发送端增加数据冗余度,再在接收端将丢失的原始数据恢复出来。这种技术运算相对复杂,同时会增加网络带宽和时延。目前的丢包恢复技术主要有:向前纠错技术、交织技术、低比特率冗余编码、分类处理等。
在战场环境下,网络带宽有限且信道特性易受环境变化的影响,不能将有冗余恢复技术作为处理丢包的主要手段,因为这样会增加额外的带宽和时延,容易造成网络拥塞。但是,在不影响通信系统整体性能的条件下,可以在发端适当进行冗余编码,以减少收端丢包时造成的损失。
(2)丢包隐藏技术
[4]。基于收端的丢包隐藏技术不需要发端的参与,一般只需在接收端增加一个处理单元即可,数据包流中无任何冗余信息,由于其不消耗网络带宽,且时延较小,因而在语音实时传输中应用广泛。无冗余度方法在本质上是在接收端对丢包附近相关数据包经过一定优化算法处理来估算丢失的数据包。这些算法根据人的生理特点,对丢包后的语音信号进行修复,以达到“欺骗”人耳朵的目的,而有冗余度方法往往不考虑人的生理特点,因而一些优秀的无冗余度算法比有冗余度算法有更好的改善音质的能力。图3描述了一种典型的丢包隐藏过程。
图3 丢包隐藏一般过程
目前,iLBC编码中的丢包补偿机制是一种在民用VoIP中应用效果较好的丢包隐藏算法。但在连续多帧丢包或丢包率大于10%的情况下,其还原语音的能力有限,达不到军事语音通信的要求。在战场IP网络环境下,信道恶化的情况时有发生,此时的丢包隐藏算法,要能够在高丢包率和连续多帧丢包等情况下保证一定的语音质量。
4.2 抗抖动缓冲
抖动是IP网络的普遍问题,是不可避免的,只能控制在一定范围内。IP网络中大的延时抖动会使得接收端对语音信号的重建变得非常复杂。为了补偿抖动,VoIP的接收端都会在播放之前,对接收到的包进行缓冲,即在接收方设定一个缓冲区,配合RTP协议,通过一定的缓冲时间对乱序的包进行排队和控制。
自适应缓冲可以根据接收缓冲区中的数据包或RTCP提供的参考数据来衡量网络状况,在每一个话音段的开始阶段调整缓冲区大小以适应网络状况的变化。当网络状况好、抖动较小时,减小缓冲时间,以减少总体延时,反之则增加缓冲时间,以增加延时为代价来减少丢包。一种好的自适应缓冲播放算法应该能够在缓冲延时最小化的同时使丢包最小化。
目前,自适应的缓冲算法可以分为两类:一类是基于话音段内(Intra-talkspurt)[5]调整的算法,一类是基于静音段修正话音段整体(Inter-talkspurt)[6]调整的算法。基于话音段内调整的算法利用语音包播放时间修正技术(如WSOLA)或者改变语音播放速度,在各个话音段内部进行缓冲时间的自适应修改。基于静音段修正话音段整体调整的算法以话音段为单位来调整缓冲大小,即同一话音段采用相同大小的缓冲,而不同话音段之间缓冲大小可调。
战场环境下,信道随环境变化快,网络延迟抖动剧烈的情况时有发生,此时的抗抖动缓冲策略要能对突发的延迟高峰迅速地作出反应,并可以有效地吸收抖动并保持较佳的语音质量。适合战场环境的高效快速的自适应缓冲算法是VoIP应用到军事语音通信的必然需求。
5 结语
目前,VoIP已广泛地应用于全球的IP互联环境,由于战场环境对语音通信的特殊要求,其在军事上的应用还非常有限。这里重点分析了VoIP在战场网络环境下应用的局限,并提出了语音编码、丢包处理、自适应缓冲等一系列提高传输语音质量的方案,为VoIP在军事语音通信中的研究和应用提供了参考。
参考文献
[1] 魏迎春,高电波,王利群.VoIP网络电话技术及其应用[J].通信技术,2003(12):47-50.
[2] 穆捷,李敬,唐昆.Speex语音编码算法实现与优化[J].通信技术,2009,42(10):186-188.
[3] 郭廷廷,李敬.ILBC编码算法及其在VOIP中的应用[J].电子技术应用,2006(07):119-121.
[4] LEE M, ZITOUNI I, ZHOU Q R.Prediction-based Packet Loss Concealment for Voice over IP:a Statistical N-gramapproach[C].USA:IEEE,2004:2308-2312.
[5] SANGHYUN Chi,WOMACK B F.QoS-based Optimal Adaptive Playout-buffer Scheduling Using the Packet Arrival Distribution[C].[s.l.]: Military Communications Conference,2009: 1-5.
[6] JOSÉ B.ARAGÃO JR, GUILHERME A B.Novel Approaches for Online Playout Delay Prediction in VoIP Applications Using Time Series Models[J].Computers & Electrical Engineering, 2010,36(03):536-544.