高斯核密度估计的背景建模运动目标检测

2017-03-23燕莎，潘永

探测与控制学报 2017年1期

关键词：高斯像素背景

燕莎，潘永

(1.西安理工大学，陕西西安 710082；2.西安热工研究院有限公司，陕西西安 710054)

高斯核密度估计的背景建模运动目标检测

燕莎1，潘永2

(1.西安理工大学，陕西西安 710082；2.西安热工研究院有限公司，陕西西安 710054)

针对视频图像中光照的渐变和突变等引起的动态背景和图像前景中运动目标(物体)存在阴影等问题，提出了高斯核密度估计的背景建模运动目标检测方法。实验结果表明，该方法采用了非参数密度估计理论，像素特征的概率分布不需要预先假设，同时估计出来的像素特征的概率密度函数更符合真实的背景像素的概率分布，能够处理多样性的动态背景场景，具有较强的背景适应能力，能够准确地提取运动目标，从而有效检测出视频图像中的运动目标。

背景建模；目标检测；混合高斯模型；背景减法；核密度估计

0 引言

利用视频中的序列图像进行视频场景背景的重建，是目前在运动目标检测、跟踪、目标识别以及目标分析等领域中需要解决的一个重要的基础性问题，视频场景中背景重建质量的优劣，直接影响后期工作的进一步开展。

近年来学者们先后提出各种背景建模方法，其中主流的背景建模算法有平均背景建模(Average Background Model，ABM)[1]、混合高斯模型(Mixture of Gaussian，MoG)[2]、Kalman滤波背景模型(Kalman Filter Background Model，KFBM)[3]以及非参数化背景模型(Nonparametric Background Model，NBM)[4]等，其基本原理都是通过对较长时间的序列图像中像素值分布规律的分析，利用统计学的相关理论，分割出前景运动目标和相对静止的背景。

目前在背景建模研究领域，仍然存在以下几方面的难点[5]，需要学者们共同努力研究解决：1)视频中光照的渐变和突变问题；2)动态背景问题；3)运动目标(物体)的阴影问题；4)视频本身的噪声影响问题等。

上述主流的背景建模算法中，平均背景建模方法计算量小，算法效率高，但重建的背景存在“拖影”的现象；混合高斯模型方法建模的背景图像比较理想，但是算法的计算量大，运行效率低，不能应用于实时的视频处理系统，该方法同时对光照的变化比较敏感，容易受到图像噪声的影响，只适应于室内背景图像的重建；Kalman滤波背景模型是利用当前帧图像的前若干帧图像进行背景重建，算法效率高，但是不能对相对移动缓慢的背景物体重建背景图像；非参数化背景模型采用Mean Shift这一经典的模式识别过程，通过迭代计算，能够在数据的密度分布中找到最近位置的点，最终重建视频背景，该方法的计算量也是比较可观，运行效率不高。本文针对上述问题，提出了高斯核密度估计的背景建模运动目标检测方法。

1 核密度估计原理

核密度估计方法出现于20世纪50～60年代，是目前最有效的无参密度估计方法。核密度估计方法跟直方图统计技术有相似之处，对一组采样数据，按照相等的区间划分成若干份，每份称作一个“条块(bin)”，根据bin把数据分成不同的组，而每个bin的概率值是每组中数据出现的个数与总样本数的比值。核密度估计相对于直方图理论增加了一个用来平滑数据的核函数[6]。

定义：设X是一个d维的欧氏空间，此空间上的函数定义域到值域的映射为：X×X→R，如果以下形式的函数

K(x)=K(‖x‖2)=K(xT·x)

(1)

一般来说，核函数都具有一些基本的数学特性：对称性和局部有限支撑性。局部有限支撑性是指函数的定义域超过一定区间范围时，函数值为0，同时在一维空间里核函数Kh(x)还满足如下变换：

(2)

式(2)中，h为核函数Kh(x)的带宽。

下面对有关核密度估计的原理进行简单介绍。

给定一维空间上一组数据点的集合S={xi}(i=1,2,…,n)，其未知的概率密度函数为f(x)，取核函数为Kh(x)，则在x点处的密度可以按下式计算。

(3)

式(3)中，x是核函数的中心点。

在核密度估计方法中，采样点真实状态的估计值是以该点为中心的所有核函数的平均叠加，图1是核密度估计原理的示意，其中图上虚线是高斯核函数，一共有9个，实线是核函数的平均叠加组合，即密度函数的估计(横轴、纵轴没有实际含义)。从图上可以看到，核密度方法能够估计密度函数是多峰分布的情况。

2 核密度估计背景建模

2.1 高斯核函数背景建模

根据前文的核密度估计思想，拟使用高斯核函数形式的核密度估计方法对背景建模。其方法为：

令x1,x2,…,xN为某像素在最近前N帧中的灰度值，xt为该像素在当前t时刻的像素值，则该像素的概率密度函数用下式的一组高斯核函数的线性组合进行估计：

(4)

公式(4)实质上是用高斯核函数在样值点x1,x2,…,xN作内插形成的连续函数。根据概率密度函数p(xt)，则背景模型和前景运动目标用下式来判定：

(5)

其中，T为阈值，Mt(x,y)中0表示背景点，1为前景运动物体点。

2.2 背景样本采集及更新

核估计算法在应用到实际场景中时，首先需要得到待估计对象的一个训练样本集。本文采用A.Elgammal等人的做法[7]，利用像素的灰度值来表示采样集空间。

令It(x,y)代表t时刻的图像中(x,y)处的像素值，每间隔n(通常设置为3)帧的两帧图像做差分运算，根据差分结果的取舍，从而得到背景图像的样本集：

(t=1,2,…,N)

(6)

式(6)中，Tb为样本选取阈值。在这里帧差绝对值大于阈值的点不用于密度估计，其原因是视频图像序列往往包含前景运动物体，如果所有像素点都作为背景的样本集，必将运动物体区域作为背景像素点计算进去，从而产生误判。

一般说来，随着时间的推进，背景重建模型需要及时进行更新，以便快速反映运动场景的变化。本文核密度估计背景模型的更新，主要利用样本空间的更新来实现，即把视频序列的前m×n帧去掉，然后加入相同帧数的后续新的图像序列，最后由式(6)计算新加入的样本，利用前文公式(5)得到背景模型的更新。

3 实验结果与分析

3.1 仿真实验结果

采用新加坡南洋理工大学计算机系的图像数据集作为测试对象，利用Matlab 2009b进行实验仿真，对标准数据库中的视频片段进行建模提取背景，进一步实现运动目标的检测与识别。图2是混合高斯背景建模和本文提出的核密度估计背景建模的实验效果对比。

实验使用的第1个序列为室内的走廊休息室，场景中有变化的光照影响，分辨率为160×128像素；第2个序列为一个购物中心的大厅，包含随机走动的人群，场景中同样有变化的光照影响，分辨率为320×256像素；第3个序列为校园中的一段人行道，背景包含随风摆动的树木，分辨率为160×128像素；第4个序列为喷泉场景，前景有行人走过，分辨率为160×128像素。

图2中第一列为原始视频中的某一帧图像，第二列是混合高斯建模后生成的相应帧背景，第三列是核密度估计建模后生成的相应帧背景。

图3是利用图2重建后的背景进行差分法检测出的运动目标，第二列是混合高斯建模后利用背景差分法提取的运动目标，第三列是核密度估计建模后利用背景差分法提取的运动目标。

3.2 实验结果分析

分析3.1节的仿真实验，可以看出，基于混合高斯原理的背景建模，容易受图像中的白噪声(例如微风摆动的树叶、有微小波纹的湖面等)的干扰，从图3中分析可以看出第2和第3个图像序列检测出的运动目标，都同时存在一定的“残影”。在第4个图像序列中，利用混合高斯背景检测出的目标出现了较大“空洞”。而本文的核密度估计背景建模方法较之前者，建模生成的背景在后续背景减法目标检测中，虽然也有一定的“空洞”，但是具有良好的检测效果和一定的抗干扰性，适应性强，如图3中第3列所示。

3.3 检测结果比较

运动目标检测结果的好坏评判，主要分为主观评判和客观评判两类评判标准。主观评判主要从视觉上进行对比，如3.1节的仿真实验结果。而客观评判可以从算法的时间复杂度(即效能)和误检率及识别率等方面进行对比。

3.3.1 平均处理速度对比

背景建模以及运动目标检测在Intel i5-3470 CPU，主频3.2 GHz，内存配置4 GB的32位windows操作系统的PC机上，利用Matlab 2009b工具进行仿真实验，以建模时每秒钟处理的帧频数来衡量算法的处理速度。如表1所示是两种背景建模算法在处理上述4个视频图像时的平均运行时间(帧数/秒)。

表1 两种算法的时间复杂度对比

3.3.2 检测性能对比

准确率(Precision)、检测率(Recall)和综合评价指标(F-Measure，也称作F-Score)F值是学者们在运动目标检测中常用的性能评价指标[8]，其定义如下公式所示。

(11)

(12)

(13)

其中，tp(true positives)代表正确检测为前景点的像素个数；fp(false positives)代表错误检测为前景点的像素个数；fn(false negatives)代表错误检测为背景点的像素个数。表2给出了前述4种图像序列在两种算法下的检测性能。

表2 两种算法的检测性能评价

从表2可以看出，本文提出的核密度估计算法在绝大多数情况下表现出较好的目标检测性能，其能有效处理间歇运动、微风摆动的树叶以及阴影等复杂背景情况。

4 结论

本文提出了高斯核密度估计的背景建模运动目标检测方法。该方法采用了非参数密度估计理论，像素特征的概率分布不需要预先假设，同时估计出来的像素特征的概率密度函数更符合真实的背景像素的概率分布，因此能够处理多样性的动态背景场景，适应性较强。实验结果表明，该方法建模生成的背景图像，相对于参数化的混合高斯背景建模实验结果，图像中噪声相对少些，结合背景差分目标检测，最终计算出的目标比较清晰，连通性较好，因此能够准确地提取运动目标，具有很好的检测效果，唯一不足就是不能满足实时性的目标检测要求，今后会做进一步的研究与改进。

[1]ZhengYi,FanLiangzhong.Movingobjectdetectionbasedonrunningaveragebackgroundandtemporaldifference[C]//IntelligentSystemsandKnowledgeEngineering(ISKE)InternationalConference.US:IEEE, 2010: 270-272.

[2]SUOP,WANGYJ.AnimprovedadaptivebackgroundmodelingalgorithmbasedonGaussianMixtureModel[C]//9thInternationalConferenceonSignalProcessing.Beijing:IEEE, 2008: 1436-1439.

[3]HeShan,GuanQing,XuSheng,etal.ImprovingmixtureGaussianbackgroundmodelbyintegratingtraceinformationobtainedfromKalmanfilter[C]//Communications,CircuitsandSystems(ICCCAS).Chengdu:IEEE, 2010:378-382.

[4]LiuYZ，YaoHX，GaoW,etal.Nonparametricbackgroundgeneration[J].JournalofVisualCommunicationandImageRepresentation(JVCR), 2007, 18(3):255.

[5]BrutzerSebastian,HöferlinBenjamin,HeidemannGunther.EvaluationofBackgroundSubtractionTechniquesforVideoSurveillance[C]//ComputerVisionandPatternRecognition(CVPR).US:IEEE, 2011: 1937-1944.

[6]汪廷华，陈峻婷.核函数的选择研究综述[J].计算机工程与设计,2012,33(3):25-28.

[7]ElgammalA,HarwoodD,DavisL.Non-parametricmodelforbackgroundsubtraction[C]//Proceedingsof6thEuropeanConferenceonComputerVision.Dublin,Ireland, 2000: 751-767.

[8]MaddalenaL,PetrosinoA.Aself-organizingapproachtobackgroundsubtractionforvisualsurveillanceapplications[J].IEEETransactionsonImageProcessing, 2008,17(7):1168-1117.

Moving Target Detection based on Gauss Kernel DensityEstimation Background Modeling

YAN Sha1，PAN Yong2

(1.Xi’an University of Technology, Xi’an 710082 China； 2.Xi’an Thermal Power Research Institute Co., Ltd. Xi’an 710054, China)

The modeling for motion background due to illumination changes and sudden changes or shadow is the key in the motion target (object) detection field. A method based on kernel density estimation theory for background image reconstruction was presented in this paper. Experimental results showed that, by using non-parametric density estimation, the probability distribution of pixel features do not need to assume in advance, calculating the probability density function by the above method ,and it was much close to real probability distribution of background image pixels. The proposed method could be effectively build background for the variety cases of background changes in videos, the algorithm was robust and could accurately extract motion target (object) with the background difference method.

background modeling; target detection; mixture of Gaussian; background subtraction; kernel density estimation

2016-09-27

燕莎(1975—),女，陕西西安人, 硕士，讲师,研究方向：电子信息技术。E-mail:2017004618@qq.com。

TP391

1008-1194(2017)01-0076-04