移动多媒体广播压缩域视频质量客观评价*
2010-03-14姜秀华
宋 睿,姜秀华,史 惠
(中国传媒大学 信息工程学院,北京 100024)
1 引言
由于移动多媒体广播传输带宽较窄,需要对视频信号进行高倍数压缩编码,因此图像质量将会产生较大的损伤。为满足人们的观看需求及传输信道带宽要求,移动多媒体的视频质量评价显得越来越重要。量化处理等图像压缩过程是导致质量下降的主要因素,而在压缩域中可以直接提取量化参数等图像编码参数[1],因此压缩域中进行视频质量评价具有较低的复杂性及较高的评价性能,并且可以边解码边评价图像质量,具有较高的实际应用价值。
在移动多媒体广播中广泛采用的是H.264[2]视频压缩标准,笔者主要研究基于H.264压缩域的视频图像质量的客观评价方法[3],从H.264编解码程序中提取能够代表图像质量的特征参数,通过参数拟合对当前视频码流的图像质量进行客观评价,并与PSNR全参考评价值进行比较。
2 H.264特征提取参量分析
主要分析与视频图像质量相关的两个重要参数:量化参数(QP)以及编码跳过的宏块数(num_skip)。在视频图像编码中,量化(Quantization)[4]处理往往与各种变换过程结合以达到去除图像空间冗余度的目的。量化过程的优劣直接影响图像编码质量,H.264采用标量量化技术,将每个图像样点编码映射成较小的数值。一般标量量化器的原理为
式中:y为输入样本点编码,QP为量化步长,FQ为y的量化值,round()为取整函数(其输出为与输入实数最近的整数)。在量化和反量化过程中,量化步长QP决定量化器的编码压缩率及图像精度。编码器根据图像值实际动态范围自动改变QP值,在编码长度和图像精度之间折中,达到整体最佳效果。
除量化参数外,另一个在编码过程中与图像质量息息相关的参数为编码跳过的宏块数。当图像采用帧间预测编码时,H.264允许在图像平坦的区域使用“跳跃”块,“跳跃”块本身不携带任何数据,解码器通过周围已重建的宏块数据来恢复“跳跃”块。因此,对于编码跳过的宏块数来说,跳过的宏块数越多,不需要编码的宏块变多,则编码后码率越小,相应质量变得更差。
经分析,量化参数和编码跳过的宏块数都会不同程度地反映在压缩过程中对视频质量的损伤。因此笔者以这2个参量作为研究对象,从压缩程序中将其提取出来,以最佳线性拟合后的函数作为客观评价模型。
3 H.264特征提取过程
在解码端首先将H.264视频码流分割成多个NAL单元,然后对分割出来的每个NAL单元进行解码,解出各种类型的片后对片(Slice)进行解码。实现该解码端参考程序主函数的框架如图1所示。函数decode_one_frame()[5]是主函数中的核心函数,套用一次循环将H.264序列解码。decode_one_frame()函数循环执行以下3个函数:读一个片 read_new_slice(),解一个片 decode_slice()和退出当前图像exit_picture(),如图2所示。
图1 解码器主函数执行流程图
图2 decode_one_frame函数执行图
解码器通过调用exit_picture()函数完成对图像的解码,错误隐藏以及将解码后的图像存入解码缓冲区。当运行到exit_picture()函数时,片级信息已经完全解码出来,因此在该函数中添加提取量化参数值的算法,就能输出量化参数QP。
对于编码跳过的宏块数的提取算法则应在宏块层,在 decode_slice()函数中包括初始化宏块 start_macroblock()、读入宏块 read_one_macroblock()和解宏块decode_one_macroblock()。 其中,read_one_macroblock()中读入了宏块的基本信息,包括所要提取的编码跳过的宏块数。对mb_skip_run[6]的提取方法是:定义1个全局变量num_skip,每当读取1个宏块的信息时,就把mb_skip_run赋值给num_skip,使其进行累加,最后得到的num_skip就是整个序列编码跳过的宏块数。
4 测试序列与实验结果分析
采用的测试序列如表1所示,对300 kbit/s,350 kbit/s,400 kbit/s,450 kbit/s这4个不同码率的3个测试序列进行了相应的测试。其中,“游艇”、“动画”作为拟合序列,“独轮车”作为测试序列。
表1 测试序列说明
PSNR[6]值由受损序列和原始参考序列计算得出,属于全参考客观评价方法,可以较好地比较原始图像与受损图像之间的差别,因此,将PSNR值作为评价标准进行相关性比较。
利用Microsoft Excel中的LINEST函数用对 “游艇”序列和“动画”序列的量化参数QP值以及编码跳过的宏块数num_skip与相应的PSNR值进行线性拟合,得出客观评价函数
利用该函数求得“独轮车”、“游艇”和“动画”3个序列客观评价值,并与相应的PSNR值进行比较,如图3所示。“独轮车”,“游艇”和“动画”这3个序列的特征值基本分布在一条直线上,由Microsoft Excel中的CORREL函数算得该评价系统的客观评价值与PSNR值的相关性达99.33%,说明该客观评价算法值与全参考PSNR值具有较强的相关性。
图3 3个序列测试客观评价值和PSNR的关系
5 小结
针对移动多媒体广播的视频格式,提出基于H.264压缩域的视频客观评价算法,在解压过程中提取与受损视频图像相关的参数,根据这些编码参数来客观评价视频图像质量。由测试结果可知,该算法的客观质量评价值与PSNR全参考值有很强的相关性,且计算速度快,适用于移动多媒体广播视频质量的实时评测。
[1]MICHALR, CATALINAC,OLIVIAN,etal.Contentbased video quality estimation for H.264/AVC video streaming[C]//Proc.IEEEWireless Communications&Networking Conference.Kowloon:IEEE Press,2007:1040-1044.
[2]姜秀华,张永辉.数字电视广播原理及应用[M].北京:人民邮电出版社,2007.
[3]史惠,孟放,姜秀华.基于H.264码流的高清视频质量评价算法[J].电视技术,2009,33(11):113-116.
[4]毕厚杰.新一代视频压缩编码标准——H.264/AVC[M].北京:人民邮电出版社,2005.
[5]中华视频网.关于 decode_on_frame()函数[EB/OL].[2009-11-01].http://bbs.chinavideo.org/forumdisplay.php?fid=29.
[6]ATUL P,XUEMIN C,AJAY L.Video coding using the H.264/MPEG-4 AVC compression standard[J].Signal Processing:Image Communication,2004,19:793-849.