VoLTE视频电话质量标准化研究及指标设计
2016-07-07李宝磊周俊任晓华中国移动通信集团设计院有限公司北京100080
李宝磊,周俊,任晓华(中国移动通信集团设计院有限公司,北京 100080)
VoLTE视频电话质量标准化研究及指标设计
李宝磊,周俊,任晓华
(中国移动通信集团设计院有限公司,北京 100080)
摘 要随着VoLTE网络的建设和高清视频电话的商用,如何对LTE视频通话质量进行评估成为难点。本文对VoLTE视频电话相关协议基础和背景知识进行介绍,研究影响视频通话业务的关键因素和质量评估方法,并结合信令和RTP/RTCP解码制定视频电话业务评估指标体系,应用于中国移动自动路测系统。
关键词VoLTE;视频电话;感知;评估;指标
1 引言
随着LTE网络建设的进一步完善和VoLTE的逐渐商用,声图并茂的视频通话业务将成为4G时代人们重要的社交方式之一。在中国移动《VoLTE技术白皮书》发展愿景中明确提出:VoLTE提供高质量音视频业务,支持高清语音(WB-AMR编解码)和高清视频(至少支持H.264 720P@30fps编解码),提供更丰富的业务体验。但相比于业内成熟的语音评估算法标准POLQA(Perceptual Objective Listening Quality Analysis,感知客观语音质量评估)视频电话质量评估受到用户主观感情、网络损伤、实现复杂度等多种因素的影响,目前业内尚未有统一的标准化方案,国际标准组织ITU只给出了一系列建议算法,如基于有参考的PEVQ、基于网络传输参数的ITU-T P.1201和P.1202等。本文首先研究了视频电话的底层传输协议及影响质量因素,并对当前厂家的主流算法进行研究,结合应用于集团路测的复杂度和精确度,设计质量评估指标体系。为后续大规模测试和指标分析提供技术方案储备。
2 VoLTE视频电话标准协议和业务因素分析
2.1RTP/RTCP协议
RTP(Real-time Transport Protocol,实时传输协议),在多播或单播的网络服务上,提供端对端的网络传输功能,目的是提供时间信息并实现流(Streaming)同步,适合应用程序传输实时数据,如音频、视频或者仿真数据。RTP数据分组重要的字段有: 负载类型(PT)、 通知接收端传输的媒体类型(语音/视频H.264/MPEG-4等),接收端调用不同的编解码器;序列号(Sequence Number):每发送一个RTP分组,序列号加1,接收端可以据此监测分组损和重建分组序列。序列号初始值随机,起加密作用;时间标志(Timestamp):同步和抖动计算。RTP本身只保证实时数据的传输,并不能为按顺序传送数据分组提供可靠的传送机制,也不提供流量控制或拥塞控制,它依靠RTCP提供这些服务。
RTCP(Real time Transport Control Protocol,RTP控制协议),负责管理传输质量,在当前应用进程之间交换控制信息,进行流量控制和拥塞控制服务。在RTP会话期间,各参与者周期性地传送RTCP分组,分组中含有已发送的数据分组的数量、丢失的数据分组的数量等统计资料,服务器可以利用这些信息动态地改变传输速率和载荷类型。RTP和RTCP配合使用使得数据传输的有效性和可靠性提高。RTCP数据分组重要的字段有:NTP时间标志:绝对时间,系统时间;RTP时间标志:相对时间,RTP前后分组的相对时间;分组丢失抖动等指标:进行同步和抖动等值的计算,包括:源识别符、分组丢失率(Fraction Lost)、累计分组丢失数(Cumulative Number of Packet Lost)、到达间隔抖动(Interval Jitter)、上一SR(Sender Report)报文时间标志、自上一SR的时间延时等。
VoLTE语音和视频按照协议需要QCI=1和QCI=2的承载,分别按照不同的时延和传输等要求进行建立。当视频电话建立一个RTP会话时,确定一对目的传输地址。目的传输地址由一个网络地址和一对端口组成,两个端口一个给RTP分组,一个给RTCP分组,使得RTP/RTCP数据能够正确发送。RTP数据发向偶数的UDP端口,而对应的控制信号RTCP数据发向相邻的奇数UDP端口(偶数的UDP端口+ 1),这样就构成一个UDP端口对。音视频数据分组经过封装后,分别通过不同的端口进行传输。
2.2影响视频业务的关键因素
影响VoLTE视频电话业务的关键因素有三类:时延、抖动、分组丢失率。端到端的时延可分为两部分:固定时延和可变时延。固定时延包括由编解码器引起的时延和分组封装时延,可变时延包括:承载网上的传输、节点排队、服务器处理和去抖动处理等;抖动的影响因素一般和网络拥塞有关,数据分组在各节点缓存时间较长导致。分组丢失对视频电话质量影响最大,原因主要为:IP传输过程中的误码和不能保障业务带宽造成的拥塞,导致分组丢失率上升。
抖动:到达时刻抖动J表示接收机相对发射机的分组时延差,该值等于两个分组相对传输时间的差值。若Si是分组i以RTP时间标志单位发送时刻值的RTP时间标志,Ri是到达时刻值,对于两个分组i和j,D可以表达为:
实测发现,抖动大于500 ms是不可接受的,而抖动达到300 ms时,是可以接受的,此时为了消除抖动会引起较大的时延,综合时延对话音质量的影响来考虑,要求抖动小于80 ms。
分组丢失:通过计算接收分组数量和发送分组数量的比率得到,当分组丢失小于5%时,基本可以接受。大于10%无法接受。要求传输分组丢失率小于5%。
时延:通过计算发、收分组时间差得到,150 ms以下可以接受,大于400 ms不可接受。
另外,码流速率的不同也会造成视频质量的差异,典型的MPEG-2视频流,标准分辨率为720×486,根据相应的计算公式可以得到PSNR和码流速率之间的关系,不同类型的编码类型有压缩效率,从经验上来看,ITU-T H.263比H.261有高一倍的压缩效率,H.264 比MPEG-2有超过60%的效率提高。所以在相同的码流速率情况下,H.264要比MPEG-2有更好的视频质量(VoLTE要求语音编码必选AMR,其他编码方式可选;视频编码必选H.264,其他编码方式可选)。
3 视频通话质量评估方法
一般来说,视频质量评估分为主观评估和客观评估,前者凭借感知者主观感受对视频质量进行评价打分,后者根据传输模型给出量化指标,借以衡量视频质量。其中客观评估根据是否加入原始参考视频样本又分为有参考评估、缩减参考评估和无参考评估。
3.1主观质量评估
顾名思义,主观质量评估即采用人工主观评价的方法,在一个受控的环境中连续观看一系列测试样本,然后按照制定好的评分等级(一般采用五分制)对视频序列进行评分,最后求得MOS(Mean Opinion Score,平均分)。主观质量评估的优点是评价比较准确,最接近用户感知。缺点是花费昂贵,难以实现自动路测要求的实时性,导致实时视频电话通信的评估很难实现。
3.2客观质量评估
客观质量评估根据评估模型来自动计算视频通话质量,提取的传输参数如时延、抖动、分组丢失,以及人类视觉感知特性等,对劣化信号进行客观评估。国际电信联盟所属的VQEG(Video Quality Experts Group,视频质量专家组)提出根据原始参考视频需要的程度,客观质量评估可以分为三大类:有参考评估、缩减参考评估和无参考评估。有参考评估通过比较劣化视频和原始参考视频,得到劣化信号质量,如PSNR(Peak Signal to Noise Ratio,峰值信噪比)算法、PEVQ算法、思博伦Chromatic相机捕捉算法等。缩减参考评估是指在原始参考视频和劣化视频上分别进行某些运算,通过分析得到的统计数据进行质量评估。无参考评估不需要原始参考视频,只对劣化视频进行评估。
其中无参考评测方法由于不需要参考原始视频,而且信号评估较为准确,实现方法简单。因此在移动通信的终端接收质量评价中更为适用。近年来,无参考视频客观质量评价方法得到业界很大的关注。
3.3无参考评估方法—VQmon
VQmon算法是一种典型的无参考评估算法,业内具有较高的知名度,其原理是对接收到的语音和视频信号分别评估,最后对整体质量进行计算(如同步、音视频质量等)。语音评估借鉴了ITU-T G.107(E-model)的语音测量方法,将网络的噪音、延时、抖动、编码特性等损伤因素灵活加入后进行评估。视频评估通过搭建模块检测传输后关键帧、分组丢失和场景等变化,对视频质量进行评估。
语音评估基于E-Model算法最终计算R值,取值范围从0~100。R值的计算从没有网络和设备的损伤影响开始,此时语音质量是最好,R=R0。R0是无网络延时和设备损伤因素的信噪比。R值的基本计算公式如下:
其中: IS是与语音信号传输同步的损伤,Id是语音信号传输时延后的损伤,Ie由设备引入的损伤如编解码器,A是优势因素,一般设置为0。
由公式知:语音质量(R值)计算是通过先估计一个连接的信噪比(R0),然后从中减去网络损伤(IS,Id,Ie),最后再用呼叫者对语音质量的期望(A)进行补偿后得到,每一个都需要考虑各种各样的实际网络损伤因素,通过非常复杂的数学计算得到。
VQmon的视频评估模型如图1所示。
图1 VQmon视频评估模块
相关模块功能如表1所示。
表1 视频评估模块功能
VQmon算法可以输出如表2所示音频视频指标。综上所述,该视频质量评价算法的主要特性如下:(1) 采用逐帧分析模式准确评价视频、语音和多媒体业务的MOS值,可以实时得到平均和抽样时间段内的MOS值;平均MOS_V值从视频开始播放/用户加入多播组中到结束/用户离开计算。抽样时间内的MOS_V值取决于抽样间隔,该值反映的是在抽样间隔内的视频质量,也即当前视频质量分数,与之前的视频质量无关。
表2 音视频指标定义
(2) 支持RTP,MPEG-TS,MPEG-2,MPEG-4 和H.264等多种编码方式。
(3) 采用数据分组头信息模式实时分析扰乱以及加密的媒体流质量。
(4) 自动检测图片组GoP结构、速率和帧信息。
(5) 全面的数据帧层面分析,包括I、P、B帧,I帧间隔等,采用基于媒体帧丢失分析模式的评价方式,并可以对视频场景进行分析以得到视频内容的种类和特性。
4 视频电话业务评估指标设计
考虑到实现难度和自动路测实时上报MOS的要求,综合各厂家目前倾向的算法,采用无参考评估方法。由于RTP/RTCP数据分组有严格的同步机制,因此暂不考虑对同步进行评估(同步性能更多考验终端对数据分组的处理能力)。VoLTE视频通话业务评估指标可以分为如图2所示的资源类、质量类和KPI 3类。资源占用类主要考察视频通话业务的资源占用情况,质量类主要考察MOS和传输速率,KPI指标考察视频通话的建立、掉线以及时延等指标,更贴近用户感知。
图2 视频通话质量评估指标体系
表3 视频通话关键指标算法
VoLTE视频通话的业务指标定义需要参照视频电话信令流程和RTP/RTCP协议RFC3550中的相关字段进行,详细算法的准确性需要现场验证并修正。近期正在进行视频测试log信令的抓取和RTP/RTCP分组解码字段的校验,预计将很快应用于中国移动自动路测系统。视频通话业务关键指标定义如表3所示。
5 总结
目前应用于外场测试的标准主要有两种:基于P.120X系列标准,选用无参考算法,基于IP流和网络传输参数对视频进行评估,这是大部分厂商采用的算法。也有部分厂商采用有参考对比算法,但实现较为复杂。视频电话业务质量的评估需要考虑方案的实时性、复杂性和可行性,标准的制定既要反应用户真实感知,又能直观反应视频通话网络质量。因此基于人眼的视觉特性,通过网络传输参数映射用户感知的方法将会是视频电话质量评估的主流。VoLTE业务组正在进行相关解码和技术评估工作,为VoLTE即将商用的视频电话评估做准备。
News
VoLTEVideo telephony service quality evaluation and index design
LI Bao-lei, ZHOU Jun, REN Xiao-hua
(China Mobile Group Design Institute Co., Ltd., Beijing 100080, China)
AbstractWith the construction ofVoLTE networks and high-defi nitionVideo telephony application, how to assess the quality of LTEVideo call becomes more important. This article introduces theVoLTEVideo telephony related protocols and background knowledge, and studys the key factors and quality assessment method affecting theVideo call service. Then combines the signaling and decodes RTP / RTCP to developVideo telephony service evaluation system. It will be used in China Mobile automatically drive test systems.
KeywordsVoLTE;Video call; perceive; evaluate; index
中图分类号TN929.5
文献标识码A
文章编号1008-5599(2016)05-0034-05
收稿日期:2015-10-10