APP下载

一种改进反馈机制的PBAS运动目标检测算法

2017-03-02张泽斌袁哓兵

电子设计工程 2017年3期
关键词:像素点前景背景

张泽斌,袁哓兵

(1.中国科学院上海微系统与信息技术研究所 上海200050;2.中国科学院上海微系统与信息技术研究所微系统技术国防科技重点实验室,上海200050;3.上海科技大学 上海20000)

一种改进反馈机制的PBAS运动目标检测算法

张泽斌1,3,袁哓兵1,2

(1.中国科学院上海微系统与信息技术研究所 上海200050;2.中国科学院上海微系统与信息技术研究所微系统技术国防科技重点实验室,上海200050;3.上海科技大学 上海20000)

为了提高PBAS算法在不同动态背景场景时的适应能力,本文在原始PBAS算法的基础上提出了一种自适应多通道建模与分割闪烁点反馈的运动目标检测方法。该算法综合考虑多通道的信息,自适应调节各个通道的判别阈值以及权重;在不增加新特征的情况下,利用分割闪烁点统计信息反馈调整算法参数,减少错误判别结果。实验结果表明,该算法在动态背景场景下具有原PBAS更好的适应能力,在大多数应用场景能提高更好的分割结果。

运动目标检测;背景建模;PBAS;动态背景

分析和理解视频序列是当前计算机视觉的重点研究邻域。通常,运动目标检测在自动视觉监控系统中起着基石的作用,同时它也是运动捕获、活动分析等应用的基础。运动目标检测的基本操作就是将称为前景的运动目标与称为背景的稳定信息分离开来。理想状况下,简单的运动目标检测算法可以从静态稳定的背景中提取出运动的物体,然而绝大多数运动目标检测的应用场景并不局限在室内静态的环境,复杂多变的室外场景成为运动目标检测算法的最大挑战。

近年来,随着计算机处理能力的提高,各种在动态背景下运动目标检测的算法相继提出。仅以背景建模为中心的算法就可以分类为:高级混合模型、模糊模型、判决与混合子空间学习模型、鲁棒子空间模型和稀疏模型等。文献[1]使用Student-t混合模型来替代高斯混合模型,而Student-t混合模型因为有比GMM更多的重尾属性,所以对噪声更具有鲁棒性。文献[2]提出了一种非参数区域模型(KDE)和参数化逐像素模型(GMM)的混合模型来近似背景颜色分布。文献[3]提出一种低秩表达下异常值检测的方式,同时估计了异常值支持和低秩矩阵。ViBe算法[4]是非参数模型算法中较为成功的一种算法,它使用随机策略来保证模型样本具有平滑指数衰减生命周期。PBAS算法[5]在ViBe算法的基础上,为每个像素点分布设立单独的判别阈值和学习率,且利用反馈机制提高模型的适应能力。然而PBAS算法在应对高度动态背景时,原有的策略并不能产生较好的前景分割结果。

文中针对动态背景条件下运动目标检测存在的问题,提出了一种改进反馈机制的PBAS目标检测算法。通过为不同颜色通道设立不同的判别阈值,在阈值更新时独立更新各个通道,提高了算法对背景环境的建模能力;通过引入分割闪烁反馈机制,将提取前景的闪烁程度直接作用于判别阈值的调节过程中,增强了PBAS算法在复杂动态背景下的适应能力。

1 PBAS运动目标检测算法

PBAS算法使用了与Vibe算法等相类似的非参数背景建模机制,将一系列最近观察到的像素值集作为背景模型。将用于前景判别的阈值和背景更新的学习参数作为每个像素点的状态变量,并且根据背景变化动态地控制这两个状态值。

如图1所示,PBAS算法有几个基本部件组成,包括前背景决策、背景模型更新、决策阈值更新和背景学习率更新等模块。根据每个像素位置对应的判决阈值R(xi),决策模块通过比较当前帧I(xi)与背景模型B(xi)来判别前背景。学习率T(xi)控制着背景模型的更新速度,学习率以及判决阈值在背景更新的过程中,不断进行反馈调整。

图1 PBAS算法总体结构

1.1 分割决策

背景分割的最终目的是得到一个二分类决策,将输入图像与背景模型比较,判断像素点是否属于前景。在PBAS算法中,背景模型是由N个最近观察到的像素值组成:

如果像素点xi的像素值I(xi)与在背景模型B(xi)的N个值中有至少#min个距离在R(xi)内,则该像素点被判断为背景点,否则为前景点。因此前景分割掩模计算式为:

在式(2)中,F=1表示前景。整个判决过程涉及到两个参数:1)判决阈值R(xi),每个像素单独拥有一个且会动态更新;和2)最小数量要求#min,是全局固定值。

1.2 背景模型更新

考虑到背景环境的变化,目标检测算法中更新背景模型部分十分重要。PBAS算法采用了选择性更新的策略,即只有被判别为背景的像素点才能用来更新背景模型。背景模型更新的过程为:随机均匀选择一个索引k∈1…N,相对应的背景模型值Bk(xi)被当前像素值I(xi)替换。在学习率参数T(xi)的控制下,即使当前像素点被判决为背景点,仍然只有1/T(xi)的概率会进行更新操作。

PBAS算法以1/T(xi)的概率用同样的方式对邻域像素点进行背景更新,即用当前邻域像素值V(yi)更新邻域像素点的背景模型中的Bk(yi)。参数T(xi)决定了背景更新的快慢,T(xi)越大,存在背景模型中的值保留的时间越长,T(xi)越小,背景模型中的值被替换的速度越快。

1.3 决策阈值更新

在视频序列中,可能会存在高度动态的背景区域,也有可能存在几乎不变的区域。理想情况下,对于高度动态的区域,门限R(xi)应该增大到不将背景判别为前景;对于静态区域,门限R(xi)应该足够小,提高前景检测的灵敏度。PBAS算法引入了一个对背景动态进行量化估计的一个指标,从而可以根据这个指标进行动态调整门限R(xi)。

首先,在保留背景模型的同时,PBAS算法还创建了用来保存最小决策距离一个序列D(xi)={D1(xi),…,DN(xi)}。每当背景模型中Bk(xi)更新,当前观察到的最小距离 dmin(xi)=minkdist(I(xi),Bk(xi))就被写入这个序列中:Dk(xi)←dmin(xi)。最小决策距离的历史记录就可以通过这样创建。取这些值的平均作为衡量背景动态程度的指标。

PBAS算法采取的判决阈值动态调整方式为:

其中,Rinc/dec,Rscale是固定参数。

1.4 学习率更新

无论像素点被判断为前景还是背景,随着时间推移,都会被判决为背景。而融入背景模型的速度由参数T(xi)决定。为了缓解这个问题,PBAS算法为T(xi)引入了动态调制机制,使得当像素点属于背景时,背景学习概率增加;当像素点属于前景时,背景学习概率减小。

PBAS算法假设处于高度动态区域的像素点很容易被判决为前景,所以T(xi)调整的力度可以根据动态程度估计值自适应。T(xi)的更新式为:

其中Tinc,Tdec是固定参数。PBAS算法规定Tlower<T<Tupper,从而使得背景学习率保持在一个合理范围内。

2 改进反馈机制的PBAS算法

2.1 多通道判别阈值的自适应机制

对于有RGB三通道的彩色视频,原始PBAS算法的操作是:分离多个通道,对各个通道做独立的前景提取算法,得到各个通道的前景分割图后,再使用逻辑或组合3个通道的结果,即。这种处理方式虽然能够在最终分割前景时融合多个通道的信息,但是这些信息无法为分割决策、背景更新和参数更新提供帮助。

在彩色视频中,综合考虑多通道的信息往往能更容易区分运动目标和动态的背景,使用多通道的背景模型也具有更好的背景建模能力。

文中结合彩色视频特点和PBAS的算法结构,提出了一种多通道判别阈值的自适应机制。

图2 改进的PBAS算法总体结构

如图2所示,改进的多通道判决阈值方法为RGB3个通道皆设立了和状态量,其中RX(xi)是通道X的判别阈值,是通道X当前最小决策距离,为通道X最小决策距离的平均值。

RX(xi)的更新方式为:

前景分割决策方式更改为:

该改进点的一个重要优势在于它在一定程度上可以自适应地调整不同通道在判别前景时占有的决策权重。如式(5)所示,每个通道的阈值会随着这个通道的背景拟合程度改变,若X通道背景情况复杂,则对于X通道的判别阈值就会扩大,X通道上鉴别前景的能力就会相应地减弱。

2.2 利用分割闪烁的判别阈值反馈机制

分割闪烁指的是算法得到的前景分割图中,同一像素点频繁地改变它的判别结果。

通常情况下,使用更好的特征表示和更合理的背景模型可以显著提高运动目标检测的效果,但是对于复杂的动态场景,再好的方法也难以避免提取前景的闪烁情况。

文献[6]提出了一种利用分割闪烁情况反馈调节决策阈值以及背景模型更新率的方法,但是它针对的是由LBSP特征带来的分割决策闪烁。PBAS使用的梯度幅度特征在抗噪声方面比LBSP特征效果要差,因此更容易带来闪烁情况。闪烁情况和最小决策距离一样具有反映背景复杂程度的作用,但是它比后者更能反映背景的动态变化程度。将分割闪烁情况加入PBAS算法的反馈,有助于了提高算法在复杂运动背景环境下的适应能力。

定义分割闪烁因子为:

其中 Xt(xi)=Ft(xi)xor Ft-1(xi),vincr和 vdect为固定参数,Ft(xi)和Ft-1(xi)是本次与上次像素点xi的判别结果。限制v的最小值为0.1。由式8可知,若像素点xi的分割结果经常处于闪烁状态,则其对应的v(xi)就会增长,反之,v(xi)会减少。

改变决策阈值更新方式为:

由式9可知,分割闪烁因子v(xi)越大,决策阈值增大的幅度越大,减小的幅度越小,有助于算法对复杂动态背景的快速适应。

分割闪烁点也经常发生在运动目标的边界,将这些点考虑在闪烁因子内,容易将运动目标的边界埋没在背景中。因此实际处理时,先去掉经过后处理后得到的前景及其边界邻近区域内的闪烁点,再计算闪烁因子。

3 实验结果与分析

为了合理评估对PBAS算法改进带来的性能上的改变,文中使用CDW-2014[16]提供的一组动态背景环境下拍摄的视频集作为测试集,如图3所示,场景涉及河面、行道树、人工喷泉等常见的动态背景元素,运动目标包括快艇、帆船、独木舟、汽车和行人等。

图3 CDW-2014动态背景测试集

原PBAS算法完全依据文献[5]实现,且所有参数与文献中保持一致。改进版PBAS算法参数设置如下:

算法性能的定量评估使用CDW所使用的方法,指标包括:Recall,FPR,FNR,Precision,FMeasure,其中以FMeasure为主要评价指标。其计算方式为:

所有代码均使用OpenCV实现,实验结果如下:

通过比对实验结果,可以发现本文算法在大多数场景下优于原PBAS算法,且在这个数据集上,总体Fmeasure得分比原PBAS算法提升了26%。文中算法在保持不错的召回率的同时,还能有相对较高的准确率,这主要得益于多通道判别阈值的引入,使得背景模型能够被有限的背景样本拟合。由于测试集中存在较多的动态背景元素,原PBAS整体上有较大的误真率,文中算法加入分割闪烁点的反馈处理,自动地削弱动态背景的影响,显著地减少了误真率。

如图4所示,fall序列中存在的主要干扰是风引起的剧烈的树叶晃动。自然风很少具有稳定的周期性,这给背景建模带来很大的挑战。能否快速的抑制突然产生的干扰,是考验一个算法性能的重要标准。原PBAS算法依靠背景样本更新和阈值逐渐扩大的方法,来应对这一干扰,然而每次阈值的扩大幅度只能是原阈值的一个相对量,所以无法快速地抑制这一类型的干扰。改进的PBAS算法每次阈值更新的幅度取决于当前分割点的闪烁情况,所以能快速的抑制干扰区域。图4中,本文算法分割结果与原PBAS算法相比,减少了背景树叶的干扰,效果较为明显。

表1 动态背景视频序列实验结果对比

图4 fall序列第1 512帧分割结果对比

图5 overpass序列第2 438帧分割结果对比

图5中展示的场景同时包括水波、树叶这些干扰,本文算法分割结果能有效地处理去除干扰和保持运动目标分割完整性两者的权衡。

4 结 论

文中针对PBAS算法在处理动态背景场景时的不足,对原始PBAS算法做出了两点改进。改变原始PBAS单通道背景建模为具有独立阈值的多通道背景建模,自适应调整不同通道在分割决策中起的权重,提高了背景模型对实际场景的建模能力。在判别阈值反馈中加入分割闪烁点信息,利用统计的闪烁点信息调整判别阈值,加快算法对动态背景的适应速度。通过实验对比,改进的PBAS比原始PBAS算法在应对动态背景场景时更具有适应性,更能有效地得到较好的分割结果。

[1]Mukherjee D,JonathanWu Q M.Real-time video segmentation using student'st nixture model[J]. Procedia Computer Science,2012,10:153-160.

[2]Ding J,Li M,Huang K,et al.Modeling complex scenes for accurate moving objects segmentation[C] //Computer Vision-ACCV 2010.Springer Berlin Heidelberg,2010:82-94.

[3]Zhou X,Yang C,Yu W.Moving object detection by detecting contiguous outliers in the low-rank representation[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2013,35(3): 597-610.

[4]Barnich O,Van Droogenbroeck M.ViBe:a powerful random technique to estimate the background in video sequences[C]//Acoustics,Speechand Signal Processing,2009.ICASSP 2009.IEEE International Conference on.IEEE,2009:945-948.

[5]Hofmann M,Tiefenbacher P,Rigoll G.Background segmentation with feedback:The pixel-based adaptive segmenter[C]//Computer Vision and Pattern Recognition Workshops (CVPRW),2012 IEEE Computer Society Conference on.IEEE,2012:38-43.

[6]St-Charles P L,Bilodeau G A,Bergevin R.Subsense:A universal change detection method with local adaptive sensitivity [J].Image Processing, IEEE Transactions on,2015,24(1):359-373.

[7]Elgammal A.Background subtraction:Theory and practice [J].Synthesis Lectures on Computer Vision,2014,5(1):1-83.

[8]Bouwmans T.Traditional and recent approaches in background modeling for foreground detection:An overview [J].Computer Science Review 2014 11: 31-66.

[9]Juan L,Dengbiao J,Bo L,et al.A nonparametric approach to foreground detection in dynamic backgrounds[J].Communications,China,2015,12(2):32-39.

[10]Elgammal A,Harwood D,Davis L.Non-parametric model for background subtraction[M]//Computer Vision-ECCV 2000.Springer Berlin Heidelberg, 2000:751-767.

[11]Sobral A,Bouwmans T.BGS Library:a library framework for algorithm’s evaluation in foreground/background segmentation [J].handbook on" Background Modeling and Foreground Detection for Video Surveillance",Chapter 23,2014.

[12]Bilodeau G A,Jodoin J P,Saunier N.Change detection in feature space using localbinary similarity patterns[C]//Computer and Robot Vision(CRV),2013 International Conference on.IEEE, 2013:106-112.

[13]Chan K L.Detection of foreground in dynamic scene via two-step background subtraction[J].MachineVisionandApplications,2015,26(6):723-740.

[14]Matsuyama T,Ohya T,Habe H.Background subtraction for nonstationary scenes [C]//4th Asian Conference on Computer Vision,2000:622-667.

[15]Elgammal A,Duraiswami R,Davis L S.Efficient non-parametric adaptive color modeling using fast gauss transform[C]//Computer Vision and Pattern Recognition,2001.CVPR 2001.Proceedings of the 2001 IEEE ComputerSocietyConferenceon. IEEE,2001,2:563-570.

[16]Goyette N,Jodoin P M,Porikli F,et al.Changedetection.net:A new change detection benchmark dataset[C]//Computer Vision and Pattern Recognition Workshops(CVPRW),2012 IEEE Computer Society Conference on.IEEE,2012:1-8.

An improved PBAS algorithm for dynamic background

ZHANG Ze-bin1,3,YUAN Xiao-bing1,2
(1.Shanghai Institute of Microsystem and Information Technology,CAS,Shanghai 200050,China;2.Key Laboratory of National Defense for Science and Technology on Microsystem,Shanghai Institute of Microsystem And Information Technology,CAS,Shanghai 200050,China;3.Shanghai Tech University,Shanghai 200000,China)

To improve the adaptability of PBAS algorithm to various dynamic background,this paper proposed a variant which uses adaptive multi-channel background modeling and feedback of local segmentation noise levels.The proposed algorithm takes information of multi-channel into consideration and adjust each channel's decision threshold and weight adaptively.The proposed algorithm uses statistical information of segmentation noise to adjust parameters without addition of new features,which made error rate further less.Experimental results showed that the proposed algorithm has a much better adaptability when used in dynamic backgrounds and it can provide a more accurate segmentation.

motion detection;background modeling;PBAS;dynamic background

TN391.4

:A

:1674-6236(2017)03-0035-06

2016-01-23稿件编号:201601216

张泽斌(1990—),男,浙江新昌人,硕士。研究方向:无线传感器网络。

猜你喜欢

像素点前景背景
“新四化”背景下汽车NVH的发展趋势
我国旅游房地产开发前景的探讨
基于局部相似性的特征匹配筛选算法
《论持久战》的写作背景
四种作物 北方种植有前景
离岸央票:需求与前景
基于5×5邻域像素点相关性的划痕修复算法
基于canvas的前端数据加密
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割
晚清外语翻译人才培养的背景