VoLTE语音质量的端到端在线评估方法
2018-05-04黄昭文
黄昭文
(中国移动通信集团广东有限公司,广东 广州 510000)
1 引言
VoLTE网络的实现需要得到PS、CS、IMS域众多网元的支撑,业务流程经过多个网络接口,其服务质量取决于端到端各环节的质量。由于VoLTE的本质是通过分组域提供语音服务,其与传统的面向电路交换的语音业务在业务特征、QoS需求、资源需求等方面存在较大差异,常用的电路域语音评估方法已不能很好地反映VoLTE网络质量。为了保障网络质量,有必要进一步研究语音评估方法,以适应VoLTE业务发展的需要。
针对上述情况,本文提出结合信令、业务特征进行VoLTE语音质量在线评估方法,可准确评估VoLTE语音质量,并进一步定位影响质量的关键原因。
2 VoLTE语音质量的常用评估方法
ITU-T定义了一系列规范用于评估语音质量。ITU-T P.800[1]提出了平均意见分(MOS)评估方法,依靠评听者意见对通信系统性能做出判决,可直接反映用户的观点,其MOS分值是一种广泛使用的主观评价方法,但是由于该方法人工成本较高,评估结果容易受主观因素影响,难以在实际生产中组织开展规模测试。针对主观评价方法的不足,后续相继提出了ITU-T P.862(PESQ)[2-3]和ITU-T P.863(POLQA)[4]评估方法,这些方法是参考语音评价算法,原理是通过网络发送一个语音参考信号,在网络的接收端比较样本信号和接收到的信号质量,进而估算网络的语音质量。这些方法的评估效果与特定的编码方式有较强的相关关系。
随着IP网络的逐渐普及,人们发现基于语音波形的评估模型不能反应IP网络的问题,如网络传输中的时延、抖动和丢包等情况。因此,ITU-G.107[5-6]提出了E-Model评估方法,它是一种基于IP网络分析语音质量的模型,能够反映时延、抖动和丢包等数据网络特有的问题对用户感觉造成的影响,其核心思想是将语音传输过程中的若干因素对话音的负面影响综合为参数R,用以评估话音的主观质量。R和语音MOS值存在可逆的映射关系[7]。E-Model的优点是参数(时延、抖动、丢包率)获取简单,可满足全网窄带、宽带语音实时评估需求;缺点是参数并非基于语音本身,只能评估外在的显性问题,评估准确度较难把控。
现有语音质量评估方法并不能全部满足VoLTE网络保障需求,体现在以下方面:
(1)现有方法所统计的是单一用户在整个会话的质量,这虽然有助于掌握采样用户的体验,但是不能反映整体网络性能;
(2)现有方法是面向用户端的体验进行评估的,其结果难以做为定位和解决问题的依据;
(3)现有方法对参与评估的通话样本有较高的要求,包括对通话时长、通话终端、通话场景等都有约束,对于不满足评估条件的通话样本会给出波动较大的分值。
由于VoLTE网络基于无线、IP、信令等多种网络技术,用户在使用过程中的行为特征也是千差万别,这在一定程度上限制了现有方法的应用。因此,为了提高网络质量和服务能力,有必要结合VoLTE网络特点研究更通用的语音质量评估方法。
3 VoLTE语音质量端到端在线评估方法
VoLTE业务特征既包括了传统的话音属性,也具有VoIP的IP网络特征,典型的VoLTE通话协议交互过程如表1所示。从终端侧分析,其数据包主要由三种类型的通信协议构成:SIP,RTCP和RTP。其中SIP协议用于VoLTE通话接续,RTCP用于统计传输质量,RTP用于传输实际的语音数据。
表1 VoLTE通话过程的典型信令流程
从表1可以看出,SIP协议在接续过程中提供了呼叫控制的关键信息,可用于统计接续时长和成功率等指标,当通话过程中发生网络错误时,如表中第30、31行,可以通过SIP状态代码503进一步解析原因;RTCP协议在通话过程中周期发送,其内容包括收发数据包数量、丢包数、时延、抖动等统计信息;RTP消息则反映语音真实质量。关于这三种协议的具体消息格式解释,可以参考文献[8]-[10],在此不一一赘述。
由于这三种协议包含了VoLTE通话过程在IMS、PS、CS域的关键信息,如能综合这三种协议消息进行语音质量评估,将会给出更全面和准确的结果。因此,本文建立了一种VoLTE语音质量评估与定位方法,即EVQ(Evaluation of VoLTE Voice Quality,VoLTE语音质量评估),系统框架如图1所示:
图1 EVQ系统架构
EVQ算法包括以下9个步骤:
除三个“三分之一”的升级路径外,杨三可还补充概括道,在从传统制造业向中高端制造和生产服务业的升级过程中,瓮福还将实现三个“二”的转型。即实现“产业+资本”的双轮驱动;实现供给端和市场端的两端协同发力;实现“化工+肥料”的双产业驱动。
(1)SIP统计:通过SIP信令,统计会话的接续时长、振铃时长、接通率、注册成功率,统计通话过程中异常事件的初始消息发送接口和地域信息;
(2)RTCP统计:通过RTCP消息,统计通话过程中丢包、时延、抖动、重传等计数器;
(3)RTP统计:统计话音质量MOS信息;
(4)问题汇总矩阵:收集通话过程中的异常事件及相关接口、通信协议、通信网元、主被叫IP地址、消息状态码、无线接口消息、终端属性信息,对语音质量从丢包、时延、抖动、成功率等维度进行评估计算;
(5)聚类分析:分别对可能影响通话质量的因素进行聚类分析,挖掘定位影响质量的主要因素;
(6)IMS域定位:对IMS域相关网元和接口进行问题定位分析;
(7)EPC域定位:对EPC/PS域相关网元和接口进行问题定位分析;
(8)无线域定位:对无线域相关网元和接口进行问题定位分析;
为了检查EVQ的评估效果,本文通过VoLTE专用测试终端进行了10 000次自动拨打测试,统计拨打测试过程中的SIP、RTCP、RTP消息和计数器,基于这些数据评估VoLTE网络的质量并定位相关问题。图2和图3展现了拨打测试的上下行丢包数指标。可以看出,大部分拨测的丢包数为0,可以满足通话要求;但也存在少量丢包数达到100或以上的情况,在这些场景中,语音质量下降,客户感知出现话音模糊、断续等现象。
图2 拨测下行丢包数统计
图3 拨测上行丢包数
为了定位原因,表2通过EVQ算法对图中丢包数为100的三次通话过程进一步分析。这三次通话过程虽然都出现了100个丢包,但是其具体表现是不一样的。图4是这三个过程的累积丢包曲线,图5是差分检测丢包曲线。
表2 VoLTE通话过程的典型信令流程
图4 累积丢包曲线
图5 差分检测丢包曲线
通过差分检测丢包曲线,可以直接观察到发生丢包的具体时刻。结合SIP、RTCP在这些时刻的统计信息,可以回溯出产生丢包的具体网元接口和无线接口信息,后续通过聚类分析可以挖掘出发生丢包现象较高的网元,进而通过网络调整优化解决问题,如表3所示。
4 与传统方法的对比
对比传统的语音质量评估方法,EVQ方法在以下几个方面具有优势:
(1)EVQ综合多个接口数据统计VoLTE的语音质量,既支持常用的MOS、IP MOS评估,也可以通过分析接口信令定位影响端到端质量的原因,EVQ统计结果可以做为网络优化的依据;
(2)区别于其他评估方法需要对整个会话进行通话后评估,EVQ的统计是基于实时数据进行计算的,因此有助于网络实时保障;
(3)EVQ的统计数据来源基于网络协议所提供的计数器,不需要进行复杂的模拟语音信号的处理,因此不仅是针对个体评估,更可以在设备侧实现面向网络整体的统计分析,这对于网络运营而言是非常重要的;
(4)EVQ可以快速捕捉网络质量的变化,并对异常情况产生告警提示。这个特点更加适用于移动通信的场景;
(5)在多接口关联方面,EVQ可以根据分析定位的需要接入更多网络接口,进而提高分析的准确性和有效性。
5 问题与挑战
由于VoLTE业务发展非常迅速,单一网元节点的连接数已超过千万,因此为了全面应用EVQ方法,需要网络设备提供高速的信令分析与关联能力,否则将会造成统计分析时延过长或者数据丢失的情况。在具体实现方式上,既可以把EVQ算法嵌入在网元设备的性能统计模块中,也可以通过OMC平台以网管功能的模块加载。
VoLTE不仅能够为网络用户提供高清语音服务,同时还能提供高清视频服务。为了评估高清视频的质量,需要分别对语音数据流和视频数据流进行质量评估,并对两者的同步性能进行分析,为此,EVQ需引入视频专用计数器,也要进一步调整算法以实现对多个数据流的关联统计分析。
6 结束语
VoLTE网络语音质量评估是一个复杂的问题,既要求考虑网络传输质量对客户感知的影响,也要求考虑用户主观感受情况。本文从网络保障的角度出发,提出了结合信令、业务特征进行VoLTE语音质量的在线评估方法,具有可扩展性、灵活性、易用性等特点。经测试对比,EVQ对VoLTE网络的语音质量评估能力更适应网络运营需要。在此基础上,下一步的研究重点是实现对VoLTE高清视频的质量评估,完善对海量评估数据的挖掘算法,及时准确地发现VoLTE网络的问题。
表3 EVQ问题定位与优化措施
参考文献:
[1]ITU-T P.800. Methods for subjective determination of transmission quality[S]. 1996.
[2]ITU-T P.862. Perceptual evaluation of speech quality(PESQ): An objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs[S]. 2001.
[3]ITU-T P.862.2. Wideband extension to Recommendation P.862 for the assessment of wideband telephone networks and speech codecs[S]. 2005.
[4]ITU-T P.863. Perceptual objective listening quality assessment[S]. 2014.
[5]ITU-T Rec. G.107. The E-Model, a computational model for use in transmission planning[S]. 1998.
[6]ITU-T P.834.1. Extension of the methodology for the derivation of equipment impairment factors from instrumental models for wideband speech codecs[S].2014.
[7]张泽明,胡磊,任久春,等. 基于E-Model的VoIP语音质量研究[J]. 计算机工程, 2009(2): 278-280.
[8]RFC 3550 RTP. A Transport Protocol for Real-Time Applications[R]. 2003.
[9]RFC 3261 SIP. Session Initiation Protocol[R]. 2002.
[10]RFC 3605. Real Time Control Protocol (RTCP) attribute in Session Description Protocol (SDP)[R]. 2003. ★