一种基于分块HSI直方图的镜头检测算法
2017-08-24范柏超朱涛
范柏超+朱涛
DOI:10.16660/j.cnki.1674-098X.2017.14.118
摘 要:为了解决目前基于阈值的镜头检测算法存在鲁棒性差的问题,该文提出了一种基于分块颜色直方图的镜头检测算法,计算连续多帧分块HSI直方图差的均值作为帧间差异度,采用自适应的阈值选择策略,最后,在检测流程中加入了对渐变过渡帧数的限制,实现了镜头检测。实验证明,该算法具有很好的检测精度。
关键词:镜头检测 分块颜色直方图 自适应阈值
中图分类号:TP391 文献标识码:A 文章编号:1674-098X(2017)05(b)-0118-02
镜头检测是基于内容视频检索的前提和基础,具有很强的实际意义[1]。镜头检测同时也是个复杂的系统问题,属于模式识别的范畴。镜头检测主要包括突变检测和渐变检测两种,目前,学者在该领域的研究主要分为两个方面。
文献[2-3]通过提取图像帧中目标特征来实现镜头检测。其中,文献[2]利用图像分割技术提取特定目标的边缘纹理特征,获得镜头边界,文献[3]利用SIFT算法进一步改进了精度。该算法尽管精度高,但是计算工作量大,很难满足视频分析实时性要求。
文献[4-5]采用了基于阈值的检测算法,通过与阈值比较,实现突变和渐变的镜头检测。文献[4]使用的阈值是预先设定的,而文献[5]对不同的视频逐段求取对应的灰度直方图差值,以其平均值作为阈值基准,具有更好的适应性和检测效果,但它应用的c2直方图求取机制,会造成帧数较长的渐变被漏检。
上述两种算法比较,基于阈值的镜头检测算法简单快速,应用效果较好。但是目前该算法采用灰度直方图做差来计算帧间差异度,这造成该算法鲁棒性较差,首先,尽管使用灰度直方图能够很好地满足镜头检测速度的要求,但该方法忽略了帧的颜色信息;其次,采用整帧直方图做差的形式,丢掉了镜头帧的内容空间分布信息。为了解决上述问题,该文采用的算法,计算连续多帧图像分块HSI颜色直方图差的均值作为帧间差异度,使用自适应的阈值选择策略且在算法检测结构上加入了对渐变过渡帧数的限制。
1 帧间差异度的计算
由于图像分块处理能够体现图像的空间分布特性,而HSI颜色模型更符合人类的感知特性,所以该文采用HSI分块颜色直方图做差求平均作为帧间差异度计算方法。为了兼顾算法检测速度与检测准确率,该文将图像纵向和横向均匀分为3×3,共9个子块。
为了计算帧间差异度,首先需要将各帧从RGB空间转换为HSI空间中然后统计相邻两帧的各对应分块的颜色直方图。前者颜色空间的转换可以采用式子(1)到(3)计算得到,为了减少计算量,后者选取文献采用的颜色直方图统计办法,该方法将HSI的3个空间按8,3,3等级非分均量化,最后统计得到72个颜色区间的一维直方图的形式。如果采用Hij表示第i帧第j个子块的颜色直方图,那么其与第i+1帧对应子块颜色直方图差异度Dij就可以通过下式来计算得到。
(1)
在实际分析中发现,当镜头局部内容变动时经常引起分块圖像上个别块直方图产生了较大的改变,这也导致了其整帧的帧间差异度变化和镜头转换相似。所以,为了减少这种情况给检测带来的误检率,该文并不是简单地以9个分块的平均值作为两帧的帧间差异度,而是首先对9个子块的差异度排序,然后去除其中最大值求平均值作为两帧的帧间差异度Di。这种处理策略很好地减少了虚假镜头的检入。
2 算法结构
考虑到不同视频的帧内容变化强度是不同的,所以该文选取在各个检测点周围N帧的帧间差异度均值作为基准设置镜头检测的高低阈值。具体做法是,若当前检测帧后n帧(该文n取500)的帧间差异度平均值为T,则令高阈值为Th=Kh×T,低阈值为Tl=Kl×T,Th和Tl为比例常数(该文取Kh=4,Kl=1.5)。这样选取的阈值就可以准确地反应帧间内容的变化。当检测得到的潜在渐变镜头转换累积帧数超过60帧时,认为该渐变是虚假的,采用这种做法一定程度上提高了镜头检测的精度。图1为该文改进后的双阈值镜头检测算法结构,其中N为潜在渐变镜头转换的累积帧数,DN为当前帧与前面第N个帧的帧间差异度,Di为当前帧与前面相邻帧的帧间差异度。
3 实验分析
为了检验本算法的检测效果,该文进行了大量的实验测试,并与文献[4]、文献[5]中的镜头检测算法进行了比较。实验环境是VC++6.0,实验中的视频均来自2010年CCTV-5转播的多场法网和澳网网球比赛视频片段,采用查全率和查准率对算法作为评价,其中查全率(Recall,R)和查准率(Precision,P)定义分别为:
(2)
检测结果和检测均值见表1。从表1中可以看出,该文提出的算法对于镜头突变与渐变检测具有很好的效果,其中查准率相对于其他两种算法要高,这是因为当发生在镜头内运动员频繁移动或遮挡时,文献[4]和文献[5]很容易错检为渐变镜头,而该文采用的帧间差异度计算方法一定程度上减少这种误检的发生,另外,该文算法对渐变镜头累积帧帧数进行了限制,这也是该文算法查准率优于前两种算法的原因之一。
4 结语
视频数据是非结构化数据,镜头检测是视频数据结构化提取镜头的关键技术。阈值比较镜头检测算法具有较好的应用效果,但是鲁棒性较差。为此,该文采用了一种分块颜色直方图做差,忽略最大值求平均的帧间差异度计算方法,很好地弥补了原有阈值镜头检测算法对突变与渐变检测的不足。
参考文献
[1] 潘忠平.新闻视频镜头检测GT方法的并行化研究和实现[D].长沙:国防科学技术大学,2014.
[2] Cooper M,Liu T,Rieffel E.Video segmentation via temporal pattern classification[J].Multimedia,2007,9(3):610-618.
[3] 杨世沛,陈杰,周莉,等.一种基于SIFT的图像特征匹配方法[J].电子测量技术,2014,37(6):50-53.
[4] Zhang HJ,Kankanhalli A,Smoliar S W.Automatic partitioning of full motion video[J].Multimedia System,1993,1(1):10-28.
[5] Wang JY,Luo W.A self-adapting dual threshold method for video shot transition detection[A].Networking, Sensing and Control[C].Nan jing, China,2008.