基于分区灰度投影稳像的运动目标检测算法
2013-04-29肖进胜单姗姗等
肖进胜 单姗姗等
摘要:针对视频监控系统中,复杂环境引起摄像机抖动,造成运动目标检测不准确的问题,提出了一种基于分区灰度投影稳像的运动目标检测算法.首先对每帧图像进行分区,利用分区灰度投影算法对图像各分区的运动矢量进行准确提取和相关性分析,进行抖动判断,并对抖动帧进行运动补偿.然后利用高斯混合背景建模算法进行运动目标提取.最后对目标提取结果进行形态学处理,以进一步提高目标提取的精度.实验结果表明,本文算法较好地消除了场景中运动目标对运动矢量计算的干扰,实现了在摄像机抖动视频场景中的运动目标的准确检测和提取,大大降低了抖动视频目标检测的虚警率.
关键词:高斯混合模型;灰度投影;视频抖动;目标检测
中图分类号:TP391 文献标识码:A
基于序列图像的运动目标检测是智能视频监控等领域的重要研究内容.背景减除法是最常用的一种运动目标检测方法.参数化的背景建模方法通常假设单个像素的潜在概率密度函数是高斯或者高斯混合函数[1-3].Stauffer等[4]提出了一种自适应的背景减除方法,用于解决运动分割问题,此方法可以达到可靠实时的户外跟踪效果.Zivkovic等[5]对混合高斯模型进行了较大改进.文献[6]联合使用局部二元组特征(LBP)和色彩在RGB空间的光学不变特性下,提出了一种鲁棒的多层背景减除方法,对有伪随机闪烁的背景像素等场景很有效.文献[7]引入特征子空间学习和多特征子空间的方法,对高斯混合模型进行了一些改进.文献[8]针对彩色视频序列给出一种基于混合高斯模型的背景减除算法,该算法效率和资源都达到了较好的效果.
本文针对复杂环境引起摄像机抖动,造成运动目标检测不准确的问题,提出将视频稳像和高斯背景建模相结合来解决该问题.同时考虑到全局抖动和对象局部运动的差异性,提出基于分区灰度图像稳像的高斯背景建模算法.算法在运动检测之前对视频根据分区运动矢量统计情况进行抖动预判断,给出分区抖动判断机制.对判断为抖动的帧进行稳像处理,提高运动目标检测准确性.同时加入形态学后处理,改善目标完整性,通过与其他算法对比,表明本文算法背景建模效果明显得到改善.
湖南大学学报(自然科学版)2013年
第6期肖进胜等:基于分区灰度投影稳像的运动目标检测算法
1背景建模和视频稳像方法
背景建模主要目的是把视频图像中所有像素归为背景或者运动前景两类,然后对分类结果进行后处理,得到最终的检测结果.视频稳像中的运动估计算法有灰度投影法、块匹配算法、代表点匹配算法和特征匹配算法等[9],每种算法都是根据具体的应用场合所提出的,有不同的应用条件.考虑到摄像机的抖动是一种全局运动,块匹配和点匹配等算法计算量大,而采用灰度投影法,其计算量小.本文在灰度投影法基础上提出基于分区灰度投影算法,提高稳像精度.
1.1高斯混合背景建模算法流程
由Stauffer等[4]提出的高斯混合模型 (Gaussian Mixture Model,GMM)是目前最常用的背景建模方法之一,能够很好地适应场景的缓慢变化,因此受到国内外的广泛关注.由K个高斯成分组成的高斯混合模型表示像素在时间域上的概率分布模型,即图像中像素j的高斯混合模型描述了其特征值xj在时间域上的概率分布.根据每个高斯成分的权重与其标准差之比排序后,取前Bj个高斯成分作为背景的分布,Bj根据下式计算:
阈值T度量了背景高斯成分在像素的整个概率分布中所占的最小比例.
混合高斯模型具有较好的背景建模处理能力,可以较好地提取快速移动的物体并能很好的去除随机噪声.但是对于视频中有光照突变现象,室外的阴影检测,以及本文重点介绍的摄像头抖动问题的处理效果不够理想.
1.2灰度投影算法
投影法是利用图像灰度变化规律来确定图像的运动矢量,计算图像的灰度投影曲线做一次相关运算,不必对图像上的每一点做相关运算,因此计算量小.投影法通常分为灰度映射、投影滤波和矢量提取3个步骤.
灰度映射:当前帧图像经过预处理以后,投影成为2个独立的一维波形,其投影公式为:
,粗体虚线方框的尺寸和当前帧的投影区域相同,当计算垂直投影相关曲线时,沿着图1(a)中填充为左斜线区域,从左(xv, y)所对应的列的位置)至右移动粗体虚线方框至粗体方框的右端与参考帧的右端重合;当计算水平投影相关曲线时,沿着图中填充为右斜线区域,从上至下移动粗体方框至粗体方框的下端和参考帧下端重合.利用公式(6)分别计算行和列相关曲线的谷值,确定当前帧相对于参考帧的运动矢量.
2分区灰度投影稳像的高斯背景建模
考虑摄像头抖动的高斯混合背景建模方法是基于像素模型建立的,在建模之前需要对视频进行稳像,减小前景误检的概率.本文采用分区灰度投影算法进行稳像.
2.1背景建模
由于视频抖动的随机性,高斯混合模型无法很好地处理抖动的视频,因此,在高斯建模之前对抖动视频进行稳像处理很有必要.具体背景建模流程如图2所示,其中加粗框代表本文算法提出的分区灰度投影算法涉及的位置.
首先读取起始帧并初始化参考帧灰度投影值和模型参数,如模型个数、新模型的初始化/最大/最小方差、阴影检测标志、初始学习率α、背景门限和帧计数器等.其次读入下一帧作为初始状态,计算当前帧的灰度投影值和当前帧与参考帧投影的相关曲线,并进行抖动预判断和相应的稳像处理.然后根据需要更新参考帧,将稳像处理后的图像作为高斯模型匹配更新输入,为每个像素添加一个新模型,权重为1,均值为当前像素值,方差为初始方差.第2帧之后,先进行抖动预判断和相应的稳像处理,根据需要更新参考帧,将稳像处理后的图像作为输入图像,更新每一个点的模型权重、方差和均值.之后进行前景和背景像素的判定,进行形态学处理来消除噪点并使目标更完整.
本文的算法改进主要体现在2个部分:第1部分为图2粗体黑框突出的几个模块,计算抖动参考帧投影值、抖动预判断及稳像处理和更新参考帧等模块;第2部分为模型匹配更新的形态后处理部分.
2.2稳像处理
针对在1.2节中提到的灰度投影算法无法处理含有较大运动目标的场景,本文提出分区灰度投影算法,加入抖动预判断,只对需要的视频进行稳像处理.具体过程如下:
首先判断当前帧是否为起始帧,如果是,则根据分区情况利用公式(4)和(5)分别计算该帧的水平和垂直灰度投影值,作为参考帧的灰度投影.
投影区域大小和分区数的选取是投影拟合算法的关键之一.区域太大或者分区数过少,不能保证区域内图像点的运动具有一致性(这里不考虑图像旋转等造成对运动计算的影响).区域太小或者分区数过多,区域内图像灰度变化等级减小,相关运算时得到的相关量不足以反映实际图像的相关程度.在实际实现时,可以兼顾稳像的速度和精度,根据图像大小和目标在场景中的分布情况进行选择.本文算法采用图像大小为384×288,算法中参考帧去掉图像左右或上下边缘的32像素值分别作为水平和垂直投影区域;当前帧去掉四周边缘的32像素值后平均分成N个子投影区域;如果图像有明显的孤立目标或者灰度变化较大的区域,在选取投影区域时,应尽量包含这些目标和区域.本文算法分4个区,参考帧投影区域如图3所示.
由于参考帧灰度投影值的计算次数要少于当前帧,为了减少计算量,在计算相关曲线时,用上下或者左右移动当前帧各子区的灰度投影曲线来计算相关值.
从第2帧开始,利用公式(4)和(5)分别计算每个分区的投影曲线;利用公式(6)计算当前帧每个分区行列与参考帧相应的相关曲线,得到每个分区的区运动矢量,分别记为Vi(i=1,2,3,4).当前帧的投影区域如图4所示.
根据每个分区运动矢量统计情况进行抖动预判断.记n为4个区块运动矢量为0的个数,当满足以下3个条件中的任何一个时,认为当前帧是非抖动帧.
X代表阈值,即当任意2个分区的运动矢量差别均大于某个阈值时,则认为场景中有运动目标而不是抖动帧.若当前帧为抖动帧,则需要判定当前帧的运动矢量,并对当前帧进行运动补偿;否则不对输入帧做处理.
本文将投影区域分成4个区进行投影计算,得到4个水平偏移量和4个垂直偏移量,若存在运动目标,则会影响背景偏移量的计算.这里设置一个合理的阈值,取阈值范围内的偏移量进行平均作为最终的偏移量.当块偏移量大于8个像素值时,认为存在前景运动目标,在计算帧偏移量时舍弃该块偏移量.具体判定当前帧的帧运动矢量步骤如下:
3)根据行、列的运动矢量,确定当前帧的偏移量,进行运动补偿.
在稳像过程中,参考帧的选择也很重要.若均以起始帧作为参考帧,则当摄像机偏离了原来的位置振动时,就会导致当前帧和参考帧的运动矢量很大,稳像准确度降低.若所有帧均以前一帧作为参考帧,则会得到抖动的背景,没有达到稳像的效果.本算法采用每隔一定帧数(比如可以选为10)更新参考帧,但如果这一帧判决时得到的运动矢量太大,则取下一帧做参考帧.这样的选择兼顾稳像的速度和准确度.
2.3形态学后处理
经过以上工作,提取的运动目标中仍存在噪点及部分空洞现象,为了提高目标完整性,在高斯模型匹配更新后,本文加入了形态学后处理部分.
3实验结果与结论
为验证本文算法稳像效果的有效性,将本文算法与现有的3种算法进行比较.实验环境:硬件平台为intel CoreTM i3 CPU@2.93 GHz,2.93 GHz,4 GB内存的PC机,软件平台为VS2005,操作系统为Windows XP,OpenCV2.3.1.
图6为本文对改进的高斯混合模型[5]加入形态学处理后的算法与原算法效果的比较.由图6可知,高斯混合模型仍存在部分空洞及噪点现象,本文算法加上形态学处理后,可以很好地消除噪点,改善了目标完整性.
图7(a),(d)分别为静止场景中运动目标徘徊的原图和摄像头抖动的监控场景某1帧的原图;图7(b),(e)和7(c),(f)分别为2个序列中不加入抖动
判断与加入抖动判断的处理效果.从图7中可以看出,对于对象徘徊和背景抖动的视频,进行了抖动预判断和稳像处理后,误判率大大降低,效果明显好于没有抖动预判断和稳像处理的高斯背景模型效果.
接下来的4组实验数据来源于IEEE Workshop on Change Detection in conjunction with CVPR 2012的网站上的数据集中的camera jitter.该数据集伴随有大幅度的摄像头抖动.图8(a)为原图,其中sidewalk是人行道的一段序列,badminton是羽毛球场的一段序列,traffic是高速公路上的一段序列,内有大目标的快速移动,boulevard是林荫道上的一段视频序列.图8(b),(c),(d)和(e)分别代表对不同序列采用改进的MOG算法[5]、基于LBP的运动目标检测算法[6]、普通灰度投影算法和本文提出的算法的实验结果.
从图8中可以看出,改进的MOG算法的误检率稍低,但是在目标检测完整性方面最差;基于LBP的运动目标检测算法由于使用了互双边滤波器来对检测出的前景进行平滑,因此目标完整性很好,但是其误检率水平不稳定;普通的灰度投影算法在MOG算法和LBP算法中取折衷;本文算法在目标完整性和降低误检率方面表现得很好.本文提出分区投影判决的思想,通过对多个子块的综合分析,剔除含有前景运动目标的子块,消除由于运动目标而引起的运动矢量误检的影响,从而提高稳像精度,并对高斯混合模型加入了形态学后处理,进一步提高了目标检测完整性.
由表1可知,本文算法的F值均高于普通的灰度投影算法,本文算法的正检率高于文中对比的3种算法.由于MOG算法没有进行稳像、后处理等步骤,速度较本文速度快,但效果也较差.本文算法速度高于其他2种算法,效果也是4种算法中最好的.
4结语
针对现有混合高斯模型不能很好地处理抖动视频的问题,提出了一种分区灰度投影算法,该算法在普通灰度投影算法基础上进行改进,提出抖动预判断机制,克服了普通灰度投影算法只能得到全局运动矢量的缺陷,在建模进行形态学处理后,提高了目标检测完整性.实验证明,本文算法在速度和正检率上均优于对比算法.此外,利用分区投影算法,通过比较连续两帧的亮度变化情况,还可以很好地解决背景建模中光照突变场景的问题.
参考文献
[1]PICCARDI M. Background subtraction techniques: a review [C]//IEEE International Conference on Systems, Man and Cybernetics. Netherlands,2004,4: 3099 -3104.
[2]ROWE S,BLAKE A,HERRERO S,et al. Background subtraction techniques: systematic evaluation and comparative analysis [J]. Advanced Concepts for Intelligent Vision Systems, 2009, 5807: 33-42.
[3]BRUTZER S,HOFERLIN B,HEIDEMANN G.Evaluation of background subtraction techniques for video surveillance [C]//IEEE Conference on Computer Vision and Pattern Recognition,2011:1937-1944.
[4]STAUFFER C,GRIMSON W E L.Learning patterns of activity using realtime tracking[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2000, 22 (8): 747-757.
[5]ZIVKOVIC Z, VAN DE HEIIDEN F.Efficient adaptive density estimation per image pixel for the task of background subtraction[J].Pattern Recognition Letters, 2006, 27:773-780.
[6]YAO J,ODOBEZ J M.Fast human detection from video using covariance features[C]// The Eighth International Workshop on Visual Surveillance, Marseille,2008.
[7]DONG Y,DESOUZA G N.Adaptive learning of multisubspace for foreground detection under illumination changes[J].Computer Vision and Image Understanding, 2011, 115(1):31-49.
[8]SUHR J K, JUNG H G, LI G,et al. Mixture of gaussiansbased background subtraction for bayerpattern image sequences[J].IEEE Transactions on Circuits and Systems for Video Technology, 2011, 21(3):365-370.
[9]汪小勇,李奇,徐之海,等. 用于实时数字稳像的灰度投影算法研究[J].光子学报, 2006,35(8): 1268-1269.
WANG Xiaoyong, LI Qi, XU Zhihai,et al.Realtime digital image stabilization system based on gray projection algorithm[J]. Acta Photonica Sinica,2006, 35(8): 1268-1269.(In Chinese)