基于对比度分析及矢量匹配的混合高斯模型*
2012-02-28刘忠杰赵娜娜宋小波
黄 榜,刘忠杰,王 敏,赵娜娜,宋小波
(常州先进制造技术研究所 机器视觉实验室,江苏 常州 213164)
背景建模是基于视觉应用的一个重要模块,如智能交通、视频监控及行为识别等。运动目标检测的一般方法是将当前图像与根据历史数据训练出的背景模型进行分析比较,进而将前景图像与背景图像分离开来。目前,背景建模的一个难点就是训练背景模型时背景并不是一成不变的,而是不稳定的。这些波动可能是飘落的树叶、随风飘动的旗帜、荡漾的水波、变化的灯光及闪烁的显示器等。即使背景是静态的,摄像头的抖动及信号噪音也会带来不稳定的因素。不仅如此,阴影及瞬间的光照变化也是较为重要的问题。除此之外,实时性也是一个重要的指标。
大部分背景建模方法是基于像素的。高斯分布是背景建模的一种常用方法。因为背景不稳定,仅仅使用单高斯模型是不够的,STAUFFER C和GRIMSON W对每个像素点使用K个高斯分布进行描述,提出了混合高斯模型MoG(Mixture of Gaussians)[1-2]。混合高斯模型利用K-均值近似法[3]替代了期望最大化EM(Expectation-Maximization)方法。该方法后来被不断改进和拓展。例如,HARVILLE M等使用YUV颜色编码方式并利用立体相机加入了图像的深度信息替代了RGB三原色颜色表示方法[4]。LEE D S提出了一个高效的MoG训练算法[5],描述如下:
对于一幅图像I,首先对其进行高斯平滑处理,得到图像 S:
这里 p是(x,y)处的一个像素,*是卷积运算,G(p,σ)是方差为σ2的高斯函数。
首先将图像分割为若干图像块,然后对各图像块Bc建立一个描述元,显然,最为直接的方法就是对Bc中的图像强度进行采样,作为一个模板,然后使用归一化相关算法进行模板匹配,但是这种方法对噪声较为敏感。
1 图像块反差描述元的定义
本文采用一种稳定的描述元计算方法,避免了梯度运算。其描述元的建立基于如下定义的反差值:其中,p是 Bc中的一个像素,pc是由 Bc的 4个中心像素的均值估计出来的,并不存在于Bc中,使用反差值意味着对光线变化不敏感。反差值计算示意图如图1所示。
与SIFT算法类似,将每个图像块分成4个区域,然后利用每个四分之一区域的对比值来建立描述元。由于在每个四分之一区域里同时存在正数和负数,若直接将它们相加将会衰减该区域的元素特征,因此这里将正反差和负反差进行独立计算。若定义Qi为第i个四分之一区域,则 Qi关于 Pc的正反差PCHQi(pc)定义如下:
这里PQi是 Qi中具有正反差值的像素个数,i=0,1,2,3。同样,定义Qi关于 Pc的负反差 NCHQi(pc)如下:
这里NQi是Qi中具有负反差值的像素个数,i=0,1,2,3。至此,可以用一个8维矢量定义图像块Bc的反差描述元如下:
以上反差描述元的建立是针对灰度图像而言的,多数情况下,这种方法实现起来迅速有效,但是对于有些图像却是不适合的。如颜色相差很大亮度却很接近,在这种情况下,利用灰度图像对前景目标进行识别是不容易做到的。因此,需要将本方法拓展到彩色图像目标识别中。
令 a∈{R,G,B},b∈{R,G,B}分别为 p和 pc的 3个颜色通道,关于Pc的正负反差定义如下:
其中,i=0,1,2,3,Ca,b(p,pc)是 p的 a通道与 pc的 b通道之间的反差值。
显然,数对(a,b)有9种对比方式,这就预示着图像块Bc的反差描述元CHT(pc)是一个 72维矢量,为了提高算法的效率,将(a,b)限定为:
这样,CHT(pc)就降为一个48维矢量,即 CHT(pc)∈R48。
2 基于反差描述元的混合高斯模型
混合高斯模型是目前背景建模最为成功的方法之一,它使用K个高斯分布来表征图像所有像素的特性,在新一帧图像获得后更新混合高斯模型,用当前图像中的每个像素点与混合高斯模型匹配,如果成功匹配,则将该点判定为背景点,反之为前景点。
本文首先令n个图像块的反差描述元为{X1,X2,…,Xn},然后用K个高斯分布进行建模。当前矢量Xn+1被识别为背景的概率为:
若K个高斯分布都不匹配,则用一个均值为Xn+1的高斯分布替代概率最小的概率分布,并将其初始化为一个较大的方差和较低的权值。若与其中一个高斯分布相匹配,则此高斯分布均值和方差更新如下:
其中 α,β 为学习率,且 α=βη(Xn|μn,i,σn,i),匹配的分布对应Mn+1=1,不匹配的分布对应Mn+1=0。
最后根据ω/σ的值对所有高斯分布进行降序排列,取前B个高斯分布以权值联合生成背景如下:
其中,T是判别数据是否为背景的下限,如果当前观测图像块Xn+1与前B个高斯分布相匹配,将其判断为背景,否则将其判断为前景。
3 实验结果与分析
图2(a)为从原始视频序列中截取的9帧图像,图2(b)为使用本文基于反差描述元的混合高斯模型背景建模识别效果。本文所取的视频右方是一片风中摇曳的树木,从图 2(b)可以明显看出,在速度为 20 S/s的情况下,改进的背景建模方法有效地滤除了干扰,基本无残留的像素点,前景轮廓比较清晰,几乎没有拖影现象,达到了较好的前景识别效果。最后对检测到的前景进行了实时跟踪,并对其运动轨迹进行了实时描述。最终的检测效果如图 2(c)。
针对经典的混合高斯背景建模算法鲁棒性较差且背景建模实时性不足的缺点,本文提出了一种改进方法,其进行了两点改进,首先将图像矢量化,即将图像分成若干块,对每一块图像进行高斯背景建模,其次基于图像块的反差描述元进行匹配,降低了环境光等的干扰。经实验取得了良好的效果。
[1]FRIEDMAN N,RUSSELL S.Image segmentation in video sequences: A probabilistic approach[C].Proceedings of the 13th Annual Conference on Uncertainty in Artificial Intelligence,1997:175-181.
[2]STAUFFER C,GRIMSON W.Adaptive background mixture models for real time tracking[C].Proceedings of IEEE Conference on Computer Vision and Pattern Recognition,1999:246-252.
[3]Sun Tong,NEUVO Y.Detail-preserving median based filters in image processing[J].Pattern Recognition Letters,1994,15(4):341-347.
[4]HARVILLE M.A framework for high-level feedback to adaptive,per-pixel,mixture-of-Gaussian background models[C].Proceedings of European Conference on Computer Vision,2002:543-560.
[5]LEE D S.Effective gaussian mixture learning for video background subtraction[J].IEEE Transactions on Pattern Anal.Mach.Intell.2005,27(5):827-832.