一种无监督视频行人检测与估计算法
2012-11-26宣晓刚刘伟峰
宣晓刚,刘伟峰
(杭州电子科技大学自动化学院系统科学与控制工程研究所,浙江杭州310018)
0 引言
行人检测与估计在智能交通中具有广泛的应用,并且在公共安全方面都有着广泛的用途。基于视频的行人检测与估计问题可以归为两点:背景消减,行人的特征提取方法。主要的研究方法有:相邻帧间差分法是在连续的图像序列中,从差分图像上检测运动变化区域,对连续两帧视频图像进行相减得根据变化区域的灰度信息恢复原来的运动目标[1]。光流法根据光流法获得特征光流后,应将其分割成代表不同目标的类[2]。根据同一目标上的点的光流近似,不同目标上的点的光流不同,以及同一目标上的点的分布具有一定的规律的特点,可以采用最小相似性规则的聚类分析算法,进行聚类分析从而得到运动物体。背景差分法在当前的应用开发中比较常用[3],它的原理是:首先提取场景中的背景图像,然后把当前帧与背景图像做差分[4],本文对得到的差分图像进行灰度化,之后可以得到比较完整的运动目标。
1 背景及其问题描述
假设Ii(x,y)表示第i帧视频图像象素点为(x,y)位置的象素灰度值,视频背景图像定义为视频中对象固定不变的场景物体和目标,而视频前景可以看作为由移动目标构成的图像,假设背景图像为Bi(x,y),那么前景图像Mi(x,y)可以简单表示为:
即一幅图像由前景图像和背景图像组成,本文主要是对前景运动目标感兴趣。
2 行人检测
2.1 多帧图像平均法获取背景图像
利用运动目标运行一段时间的序列图像进行平均而得到背景图像,计算表达式为:
B(x,y)表示背景图像,Ii(x,y)表示第 i帧序列图像在象素点(x,y)的灰度值,N表示帧数。
2.2 背景消减法
使用前面取出的背景图像,将所要处理的前景图像各象素值减去对应背景图像的象素点的灰度值[5,6],取值范围为0至255。设定合适阈值。当差值大于阈值时置为0,全小于阈值时置为255。用表示实时实际图像,B(x,y)表示背景图像,他们之间的偏差为Mi(x,y),T为阈值,表示为[7]:
经过两帧之间逐象素地相减,在理想的情况下,会出现不等于0的点的位置即行人区域和等于0的点的位置即背景区域[8]。
3 行人估计方法
3.1 有限混合模型与BIC信息准则
有限混合模型是一种混合统计的建模工具,混合模型研究的问题可以归类为两点[9]:混合成份个数估计,混合模型参数估计,本文采用高斯混合模型方法,它可表示为:
式中,z={zi},i=1,…,n表示观测数据,θ是参数集,表示如下几个参数:高斯混合权重Π1,…,Πm,高斯均值μ1,…,μm和高斯协方差阵P1,…,Pm。本文目的是从观测数据中估计权重,均值和协方差3类混合参数。
由于行人个数位置,这意味着混合分布个数m是未知的,为此,引入贝叶斯信息准则来估计高斯混合分布元个数,该准则可表示为:
式中,m是分布元个数,L(.)是参数似然函数。学习过程用Gibss采用算法[9]。
3.3 行人检测与估计方法
通过背景消减获得的提取行人图像,然后应用文献9提出的无监督学习算法,采用matlab程序算法,调整权重,进行无监督学习。然后根据以下两个判断是否为人形:
(1)权重Π是否大于阈值权重,若小于,则判定为干扰,舍去;
(2)学习后椭圆形长轴和短轴的比值,是否在所定义的范围内,并且计算长轴与Y方向(纵向)夹角,判断该角是否小于定义的阈值范围。
4 实验验证
本文采用的一段850帧的视频场景如图1所示,每帧图像的大小为720×576象素点的大小,背景有建筑物、自然植物;场景中有行人和其他移动车辆行驶,场景有行人走过,行人个数是随时间变化的。
图1 仿真场景
首先获取背景图像,采用图像帧的背景学习算法,获得的背景图像如图2所示,可以看出,背景图像和真实的背景图像非常接近,选择第713帧图像作为待检图像如图3所示,采用背景消减方法获得的前景行人图像如图4所示。
采用本文的检测方法检测行人个数,对图4学习的结果如图5所示,由于干扰点的影响,要从中检测出行人个数,首先需要排除这些干扰点的影响,混合模型的个数一般选择行人个数的2倍以上;并且由于行人个数未知(也就是混合分布元个数未知),为此,混合分布元的个数从2到6变化,相应的BIC指标变化如图6所示,采用BIC估计混合分布元的个数,当混合模型个数为6时,BIC准则取值最小,不同分布元个数时的150步迭代学习过程如图7所示,从大约从第20个迭代步开始稳定,并且混合模型个数为6时的BIC准则最小。
3类行人检测数据如表1所示,即权重,长短轴角度,长短轴比检测行人,根据经验值检测阈值分别如下:权重阈值W=0.01,长短轴夹角阈值85~95°,长短轴比阈值10~25,可以看出,判断出的行人个数为3个,行人的位置可以用高斯分布的均值来代替。
表1 行人参数混合参数检测表
5 结束语
本文研究了基于是视频的行人检测与估计方法,首先提取背景图像,采用背景消减的算法,提取前景图像;最后采用基于混合模型学习算法的检测统计对图像进行车辆检测和车辆数统计。
[1] 王卫锋,王锟,郝志峰.基于视频的车流量统计算法[J].科学技术与工程,2011,11(17):4 080-4 087.
[2] 施家栋,王建中,王红茹.基于光流的人体运动实时检测方法[J].北京理工大学报,2008,28(9):794-797.
[3] 赵冠华,冯晓毅,王虎,等.结合对称差分法和背景减法的目标检测方法[J].计算机工程与应用,2010,46(3):145-147.
[4] 周西汉,刘勃,周荷琴.一种基于对称差分和背景消减的运动检测方法[J].计算机仿真,2005,22(4):117-123.
[5] 胡燕,嵇启春,李智杰,等.视频监控中背景的提取和更新算法[J].计算技术与自动化,2009,29(1):142-144.
[6] 连晓峰,张弢,戴军,等.基于视频流的运动人体检测方法研究[J].北京工商大学学报(自然科学版),2009,7(6):40-44.
[7] 朱矿军,张海珍,曲孝利.一种基于视频虚拟检测线的交通流参数检测方法[J].城市交通,2006,4(3):70-73.
[8] 陈冬良,杨东勇.基于全方位视觉的运动目标检测与定位方法[J].计算机仿真,2010,27(10):223-229.
[9] 刘伟峰,杨爱兰.基于BIC准则和Gibbs采样的有限混合模型无监督学习算法[J].电子学报,2011,39(1):134-139.