基于灰度直方图的场景转换的检测算法*
2010-08-10徐文臣陈前斌
徐文臣,陈前斌
(重庆邮电大学 通信与信息工程学院,重庆 400065)
1 引言
一部完整的视频节目序列一般不会由单一的场景构成。H.264标准中采用了预测编码算法,在基于同一个场景时,其中的物体变化较小,能有效进行预测;但在不同场景间,差异可能变得很大,即场景的转换将破坏相邻两帧之间的相关性,后一个场景帧如果继续依靠前一个场景帧来进行预测编码,会导致压缩后图像质量下降和编码资源浪费,这就需要进行场景转换检测并作相应处理,来提高编码效率和编码质量。
视频场景转换主要包括突变、消融和淡入淡出等类型[1]。目前主要的场景转换检测方法有基于块匹配检测、基于边缘轮廓检测和基于灰度直方图检测等[2-6]。基于灰度直方图的方法是通过对比当前帧与参考帧的灰度直方图来进行检测的。单一场景下两帧灰度值差异较小,而当灰度值发生突变时,就说明可能有场景转换。灰度直方图法在检测时间与准确性上都能取得较好的结果,并且简单易实现,在实际应用中比较常见[7]。笔者也采用灰度直方图方法对场景转换进行检测。
2 灰度直方图算法分析
视频场景转换检测一般可采用YUV模型,便于对场景切换点进行准确判断。由于色度分量U和V的直方图分布很窄,通常只采用图像亮度分量Y的直方图作为寻找镜头切换的依据。
2.1 灰度法的特点与不足
某视频序列中第n帧和第n+1帧中所有像素点的灰度差值计算公式为
式中:fn(i,j)和 fn+1(i,j)为第 n 和第 n+1 帧中像素(i,j)的灰度值,fd(i,j)为两帧对应点(i,j)的灰度差。 则相邻两帧之间的总帧差为
式中:M,N为图像的长度和宽度。同一个场景中相邻两帧对对应点的灰度差值总和fd较小,而不同场景fd较大。当fd大于某个阈值时,可判断出镜头发生切变。该方法原理简单,便于实现,对简单的视频具有良好的突变检测效果。
灰度法的不足在于:对场景内物体运动、光线条件的剧烈变化很敏感,易导致误检,降低了算法的检测精度。
2.2 直方图的特点和不足
直方图可以反映一幅图像的灰度或者颜色分布情况,也可判断出图像之间的相似度,并以此来判断是否有场景转换。当发生场景转换时,前后两帧的直方图往往会发生明显变化。
较常用的直方图有以下几种:
1)直接使用直方图差值的绝对值来计算前后两帧之间的差值。第n帧和第n+1帧的帧间差[4]为
式中:N为图像的颜色等级数,Hn(i)为第n帧图像彩色直方图中颜色值为i的像素的总数。
2)采用 χ2检测方法[8],目的是为了强化出场景突变发生时的差异。
该方法不仅可以有效降低物体运动所造成的影响,而且可以突显突变的特性。
3)局部区域直方图的方法,将一帧分为16个小的区域,分别和下一帧对应区域比较差异,并且为了防止区域内因物体移动所造成误差太大而引起的误判,在由16个区域差值中取较小的8个差值计算平均,作为两帧间的平均差值。再通过实验得到一个阈值,如果平均差值超过阈值,则判断发生了场景转换[8]。
4)带权值直方图
在图像中,某些颜色分量所占比重很大,在计算帧间差时此颜色分量就应赋予较大的权值。因此有了带权直方图
式中:α,β,γ分别代表图像中红、绿及蓝色分量对应的颜色直方图的权值。
直方图反映的是图像整体的颜色分布,不考虑像素的位置信息,因此它对场景内物体的运动并不敏感,在一定程度上克服了灰度法的缺点。但它只是相对于图像整体颜色信息的一种描述,并没有表示出颜色的位置信息,即两副完全无关的图像也可能拥有完全相同的直方图信息,这种情况出现时,就无法有效检测出场景转换。
综合对灰度法和直方图法分析可知,灰度差和直方图在利用图像的特征方面具有一定的互补性,因此需要对两种方法进行综合考虑制定算法。
3 基于灰度直方图的改进算法
笔者采用归一化的灰度直方图来对相邻两帧进行比较。该算法计算视频序列中所有视频帧的灰度直方图,进行归一化处理后,再采用了双阈值进行比较。算法设置2个阈值T1和T2(T1 第n帧与前一帧各像素点灰度值的绝对差值之和为 式中:H(i,j,n)表示第 n 帧的中(i,j)处的灰度值。 对 H(n)进行归一化处理得 式中:分母表示该帧前面所有帧的灰度值的均值。当判断发生了场景转换时,从转换后的第一帧开始n就重新计数,即Hl(n)表示在同一个场景中的归一化值。 式中:G(l)表示相隔为l帧的累积帧差。 当 Hl(n) 当检测出场景转换后,把转换后的第一帧设置为初始帧,重新统计该场景的灰度差值的和,直到检测出下一个场景转换。在本算法中,T1设为1.3,T2设为2.3,能得到比较好的检测效果。 对实验结果采用两个通用的检测效率衡量指标[5,8]进行分析 实验结果如表1所示。可见,当片段中场景转换很快并且是在几乎同样昏暗的背景下发生时,比较难以检测;当图像中的物体有较剧烈运动时可能会造成误判。此外,均取得了较好的效果。 表1 实验结果统计 笔者在没有增加太多算法复杂度的情况下,提出了基于灰度直方图的场景转换检测算法,结合双阈值来进行检测场景转换,并且通过实验取得了比较满意的准确率和查全率,为以后对视频序列的分析和处理打下了基础。与其他算法相比,该算法复杂度较低,易于实现,在检测中能达到一般的视频检测要求。但该算法仍无法解决闪光效果引起的误差及目标运动较大的问题,尚需深入研究,以进一步提高检测的精准度。 [1]纪志胜,周军.基于模型的视频渐变镜头检测方法[J].电视技术,2009,33(1):88-90. [2]LIENHART R W.Reliable transition detection in videos:a survey and practitioner′s guide[J].International Journal of Image and Graphics(IJIG),2001,1(3):469-486. [3]LUPATINI G,SARACENO C,LEONARDI R.Scene break detection:a comparison[C]//SILBERSCHATZ A.Proc.Eighth Int.Workshop on Continuous Media Databases and Applications.Florida:IEEE Press,1998:34-41. [4]朱曦,林行刚.视频镜头时域分割方法的研究[J].计算机学报,2004,27(8):1027-1035. [5]江伟,刘群,吴渝.与纹理和直方图特征相融合的镜头边界检测方法[J].重庆邮电大学学报:自然科学版,2009(1):100-104. [6]刘玲玲,张云翔.基于压缩域的场景变换检测[J].电视技术,2003(4):13-14. [7]CHOWDHURY M U,RAHMAN R,SANA J,et al.Fast scene change detection based histogram[C]//IEEE/ACIS International Conference on Computer and Information Science,2007.[S.l.]:IEEE Press,2007:229-233. [8]NAGASAKA A,TANAKA Y.Automatic video indexing and full-video search for object appearances[C]//Proc.the IFIPTC2/WG 2.6 Second Working Conference on Visual Database Systems II.Amsterdam,The Netherlands:North-Holland Publishing Co.,1991:113-127. [9]朱兴全,薛向阳,吴立德.一种自动门限选取的视频shot分割方法[J].计算机研究与发展,2000,37(1):80-85. [10]周艺华,曹元大,张洪欣.一种通用的渐变镜头检测方法[J].计算机应用研究, 2006,23(2):250.4 实验结果
5 小结