APP下载

基于AdaBoost人脸检测的改进FGS视频编码

2010-08-10郑夜星林其伟

电视技术 2010年2期
关键词:单环感兴趣人脸

郑夜星,林其伟

(华侨大学 信息科学与工程学院,福建 泉州 362021)

1 引言

随着移动通信的快速发展,移动多媒体成为移动通信发展的新热点,第三代移动通信(3G)标准的制订使得通过无线信道传输视频信息成为可能。可分级视频编码(Fine Granular Scalable,FGS)可以很好地解决由于网络的异构性带来的带宽波动而引起的图像质量问题。但是,FGS获得的所有这些特性都是以牺牲编码效率为代价的,为了提高FGS编码效率,笔者提出一种新的算法,在增强层中引入一种快速的AdaBoost[1]人脸检测算法,快速准确地定位出视频的感兴趣区域,通过提升位平面,优先传输感兴趣区域(ROI),改善视频的主观视觉效果。在基本层引入基于增强层的单环FGS[2],有效提高了FGS的编码效率,而且实现了较好的ROI效果。

2 基于AdaBoost的FGS编码

2.1 AdaBoost算法[1]

AdaBoost是一种分类器算法,是由Y.Freund[1]等人在1995年提出的。其核心思想是针对同一个训练集训练不同的分类器 (弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。算法流程图如图1所示。通过AdaBoost快速人脸检测算法,能够准确定位出人脸的个数和人脸在视频帧中的位置,以便在后期的编码端能够优先编码,进行位平面提升,从而改善视频的主观质量。

图1 AdaBoost算法流程图

2.2 基于AdaBoost的FGS编码

通过上述AdaBoost快速人脸检测算法,定位出人脸区域,并把它作为感兴趣区域,引入到FGS视频编码器当中。基于AdaBoost的FGS视频编码方式能充分利用人的视觉特性,与其他感兴趣区域算法相比,具有自适应选择,不易受到由于复杂背景、光线等条件的影响等优点。但由于AdaBoost人脸检测本身复杂度较高,引入FGS后,加大整体的复杂度,编码时间也变长。

3 基于AdaBoost的单环FGS编码

AdaBoost人脸检测算法仅仅针对图像的感兴趣区域来提高图像的主观质量,没有从根本上提高FGS的编码效率[3-4],针对这一缺点,笔者把基于AdaBoost的FGS与单环的FGS相结合,即把提高视频的主观质量与客观质量相结合。考虑到AdaBoost的FGS编码复杂度较高,本文采用复杂度最低的单环FGS,即把使用质量更高的扩张基本层图像(基本层+增强层)作为基本层的参考,通过提高基本层运动补偿的效率来降低基本层残差图像的能量,提高基本层的编码效率。对于增强层,由于基本层残差图像能量的下降,残差图像量化前后的差值的能量也减小了,也就是说增强层需要编码的源信息能量降低了,故增强层的编码效率相应也得到提高。但该方法在比特率较低的情况下会产生预测漂移,故采用了根据网络带宽的动态调整来重建高质量参考所使用位平面个数的方法。其基本原理图如图2所示。

图2 基于AdaBoost的单环FGS原理图

4 分析与比较

之前有人提出了基于肤色的人脸区域FGS编码[3]和基于H.264的自适应选择增强FGS视频编码[4],虽然也达到了自适应的效果,但误检率较高,极易受到易受复杂背景、光线等条件影响。本文的方法引入了快速高效的AdaBoost人脸检测,大大提高了检测率,同时,将感兴趣区域提升与单环算法相结合,更好地提高了视频的客观质量与主观质量。

5 实验结果

为了测试两种算法的效果,进行了仿真实验。实验中选择了Carphone和Foreman QCIF序列,基本层码率都为60 Kbit/s。增强层码率范围为60~240 Kbit/s,熵编码方法为CABAC,不考虑B帧,编码帧类型为IPPP…,编码30帧,帧率为30帧/秒(f/s),允许率失真优化宏块模式判决,量化参数为38。使用重建图像序列亮度分量的平均峰值信噪比 (PSNRY)作为视频质量的客观评价标准。实验分析中对采用AdaBoost人脸选择提升算法的FGS所定义的ROI区域与整体区域进行了比较。

实验一:采用基于AdaBoost的FGS编码,结果如图3所示。

图3 Foreman与Carphone选择区域与整体区域PSNR的比较

由图3可以看出,采用基于AdaBoost人脸检测FGS视频编码方法,人脸区域明显比整体区域PSNR值高,平均高出了5 dB,而且增强层码率越高,PSNR值差距也越大。这说明了在码率一定的情况下,人脸区域得到了选择增强,当码流截断时,能优先保证人脸部分的图像质量。但感兴趣区域PSNR的提高在一定程度上降低了整体的效率,因此引入了单环算法。

实验二:基于AdaBoost的单环FGS编码,结果如表1所示。PSNRe表示增强层的PSNR值,PSNRch表示选择区域的PSNR值,t表示平均每帧编码时间。

由表1可以看出,若只进行单环算法,增强层上提高0.3~0.6 dB,而基于AdaBoost的单环FGS编码算法,基本层提高较少,增强层提高0.1~0.2 dB,选择区域提高0.1~0.3 dB,整个视频质量有所提高。这说明单环算法能在一定程度上提高FGS的编码效率,但又由于在编码中提升了感兴趣区域的位平面,导致整体编码效率降低,因此引入单环后,各层上没有很大程度的提高。而实验中两种算法的平均每帧的编码时间相近,这表明在第一种算法中引入单环并没有增加编码的复杂度,同时能提高编码的整体效率。

6 结论

综上所述,将AdaBoost的快速人脸检测引入FGS,能够快速有效地定位出人脸,通过对人脸区域的位平面提升,优先传输感兴趣区域,很大程度上提高了感兴趣区域的PSNR值,提高视频的主观效果,但在一定程度上减低了整体效率。通过引入单环算法,在几乎不增加编码时间的前提下提高了编码的整体效率。实验证明该方法对人脸视频序列,能自适应地提高重建视频的主观质量,能提高FGS编码效率,对特定领域有一定的适用性。

[1]FREUND Y,SCHAPIRE R E.A decision-theoretic generalization of on-line learning and an application to boosting[EB/OL].[2009-10-25].http://www.ee.columbia.edu/~sfchang/course/svia-F03/papers/freund 95decisiontheoretic-adaboost.pdf.

[2]MIHAELA V D S,HAYDER R.Double-loop motion compensation fine granular scalablity[EB/OL].[2009-10-20].http://www.freepatentsonline.com/EP1323316.html.

[3]周孝,林其伟.基于人脸特征的自适应选择增强FGS视频编码[J].电视技术,2008,32(8):23-25.

[4]YOO W H,CHA J H,JEONG W S,et al.A new selection method for H.264-based selective fine granular scalable video coding[EB/OL].[2009-10-20].http://www.google.cn/search?hl=zh-CN&newwindow=1&q=H.264+Based+Fine+Granular+Scalable+Video+Coding&btnG=Google+%E6%90%9C%E7%B4%A2&aq=f&oq=.

猜你喜欢

单环感兴趣人脸
响应面法优化开发单环刺螠罐头食品
有特点的人脸
pH、氨氮和亚硝酸盐对单环刺螠稚螠耗氧率和排氨率的影响
一起学画人脸
更 正
三国漫——人脸解锁
“单环学习”与“双环学习”
这样的智能厨房台面,你会感兴趣吗?
长得象人脸的十种动物
一类具(拟-)Baer性的特殊Morita Context环