APP下载

基于SIFT算法的人群密集检测应用研究

2022-12-08谢光敏向蓓蓓古荣龙

现代计算机 2022年19期
关键词:关键点金字塔直方图

郭 妍,谢光敏,向蓓蓓,古荣龙,王 磊

(四川水利职业技术学院,成都 610039)

0 引言

随着经济持续稳定的发展,生活水平的日益提高,城市公共场所作为经济文化的主要载体承担着各种各样的活动,而随着人口密度的增大以及人们对生活质量追求的提高,每一次的活动都会伴随着人群的聚集。近年来,人口聚集的场所突发事件时有发生,每一次的突发事件不仅造成了人们的恐慌,也伴随着经济的损失和一系列的安全问题。其实大多时候人群聚集而引发事故发生进而导致重大的后果并不是事故自身的问题,而是因为人群过于密集,事发时慌乱拥挤造成的。从目前社会的整体情况来说,我国的社会形势已经基本保持在一个稳定的状态。但在经济蓬勃发展的今天,由于人们对物质文化需求的增多,各种人群聚集的活动也逐渐增加。而公共场所作为承担着各种活动的重要载体,突发事件发生的可能性也比较大。

2014年的12月31日晚,这本来是一个令人激动的跨年之夜,很多游客市民聚集在上海外滩准备迎接新年的到来,但因有人失衡摔倒接连诱发多人摔倒、叠压,致使拥挤踩踏事件发生,最终导致36 人遇难,49 人负伤[1]。因此,为了防止类似事件的发生,降低其概率,对人群密集的检测是非常有必要的。

1 SIFT算法简介

SIFT 算法,即尺度不变特征变换算法,它可以用于检测与描述影像局部特征,找到空间尺度上的特征点,并提取其位置、尺度、旋转不变量。辨识物体可以通过描述与检测局部影像特征起到作用[2]。SIFT 特征与图像的尺寸和旋转无关,它是基于物体上的一些局部外观兴趣点的,对光线、噪声以及些微视角变化也有较高的容忍度。它们因为以上特征而呈现高度显著的特点并相对容易获得,而且能够较容易且很少错误地识别基数庞大的特征数据库中的对象。

在不同的尺度空间上找到特征点,并获得其方向是SIFT 算法的实质。它通过高斯模糊来达到尺度空间的获取。因此,特征点的提取筛选资源从高斯金字塔产生的差分高斯空间中的局部特征点获得。

2 方案介绍

2.1 提取人群特征点

提取人群特征点,需要先提取出能较好反映出人物事件的特征,可以成为影响后期人群密集检测的重要因素。即待检测图像读入内存并进行图像预处理之后,进行背景差分,提取图像的人群特征,对提取后的图像采用SIFT 算法建立差分金字塔图像[3],进行极值检测。最后通过关键点精确定位生成人群特征点,根据视频图像中人群的特征点数目判断人群是否密集。算法流程如图1所示。

图1 算法流程图

2.2 图像预处理

通过图像预处理去掉原始图像所夹杂的一些不相干信息,可以提高我们所需的有用信息的可检测性且尽可能精简数据,以此达到特征提取的目的[3]。目前常见的图像预处理技术包括彩色图像的灰度化、直方图均衡化、图像的二值化处理和形态学处理等。

其中图像灰度化处理[3]是将彩色图像转化成为灰度图像。彩色图像中的每个像素的颜色是由红(R)、绿(G)、蓝(B)三个分量决定,而每个分量有255个值(0~255),经计算,一个像素点约有1600多万(256*256*256)色。而灰度图像是红(R)、绿(G)、蓝(B)特殊的彩色图像,一个像素点的取值范围为0~255。因此,数字图像处理中,通常将图像进行灰度化处理以减少计算量。图像的灰度化处理过程可用下列公式表示:

其中WR、WG、WB分别为R、G、B 的权值。研究表明,人眼对颜色的敏感度由高到低依次为绿、红、蓝。因此若想取得较好的结果,取WG>WR>WB时的权值较合理。

2.3 背景差分

背景差分法[4]又称背景减法,它的原理是将当前帧与背景图像进行差分从而得到运动目标区域。背景差分法将视频帧图像视为两个部分,即前景和背景。它最初需要选取一幅图像当作背景,而且这幅图像中不能含有运动前景。这种方法能够更好地识别和提取目标。由于摄像头和背景的固定性,采用背景差法可以简单、快速地提取出前景图像,即用每一帧图像减去背景图像,便可得到我们所需的前景图像。它可以在背景平稳时达到良好的检测效果,并且视频中静止的目标也可以被检测到。

在不考虑噪声n(x,y,t)的影响下,可以将运动目标m(x,y,t)与背景图像b(x,y,t)组成的图像称为视频帧图像I(x,y,t):

由式(2)并不能够得到真正的运动目标,而是由运动目标区域与噪声所组成的差分图像d(x,y,t),即:

对其进行进一步处理后,可得到运动目标:

其中,T代表阈值。样本图像和经背景差法处理后的图像分别如图2和图3所示。

图2 样本图像

图3 背景差法处理后的图像

2.4 建立差分金字塔

SIFT 为获得连续变化的尺度,采用高斯金字塔来构建尺度空间。尺度空间上的极值点可以在计算获得金字塔后被检测[5]。尺度规范的算子(Laplacion of Gaussian)被Tony Lindeberg 说明具备真正的尺度不变性。高斯差分金字塔类似算子被Lowe 用来对稳固的特征点在尺度空间中进行检测。对原始图像进行不停降阶采样后会获得相应的有差别的图像,将其由大到小、由下至上排列组成塔状模型,这就是图像的金字塔模型[6]。通常情况下,金字塔的第一层是原始图像,金字塔层数为,每层(一张图像对应一层)是每次降采样后获得的新图像。图像的最初尺寸以及塔顶图像的尺寸一起决定了金字塔的层数,层数的计算公式如下:

其中,原始图像的尺寸用M,N表示,t为塔顶图像的最小维数的对数值。

本方案在现实中进行极值检测[7]时,需先建立高斯差分金字塔,其通过用高斯金字塔每组中相邻的上下两层图像作差而产生。经过同一组内DOG 各相邻两层图像之间的对比,由DOG 空间的局部极值点组成的关键点可以获得初步检测。本文中DOG 函数的极值点的检测要求每一个像素点与它全部邻近的点作对比,观察结果是高于还是低于它的图像域和尺度域的邻近点。将中间的检测点与具有和其相同尺度的8 个邻近点以及与它相邻尺度中对应的9 × 2个点进行对比,以确保尺度空间和二维图像空间中的极值点都可以被检测到。

图4 DOG空间极值检测

2.5 生成人群关键点

本文结合特征点邻域像素的梯度方向分布特性,指定方向参数[6]给每个特征点,以此让其在图像发生改变时不会发生变化。在对关键点进行运算后,邻域内像素的梯度和方向通过直方图来表示。该梯度直方图以每柱10°的区间将0~360°的方向范畴平均分成36 个柱(bins)。如图5所示,关键点的主方向即直方图的峰值对应的方向。

图5 关键点方向直方图

在获得关键点邻域的像素梯度分布特征信息之后便可明确关键点主方向[8]。一个特征点处邻域梯度的方向由方向直方图的峰值代表,该关键点的主方向即是图中最大值对应的方向。本文将该关键点的辅方向定义为高于主方向峰值80%的方向。为了向其提供稳定性,每个关键点都可以存在多个辅方向。本文在实际处理时,将其复制成多份。这些复制后的关键点将被赋予该点的多方向。而为了获得更加准确的方向角度值,要对离散的梯度直方图进行插值拟合处理[9]。生成关键点后的检测效果如图6所示。

图6 检测效果图

2.6 输出检测结果

在生成关键点后,统计所生成的关键点数目i,将生成的关键点数目i与预先设定的中间值c做比较。如果i≥c,则待检测样本判断为密集人群,反之则为稀疏人群。

本文所采取的运行的待检测视频帧图像来源于PETS 2009 视频数据库中的视频序列P2 和P3,背景原图来自于该视频数据库中视频序列P1。这些相关图像序列均是分辨率为768×576的24 位JPG 图像。根据算法比对,相同场景下具有不同人群密集程度的视频序列图像对其进行相应的实验检测,检测结果如图7所示。

图7 相同场景下不同人群密集程度

根据检测结果,分别对这两种情况下的人群图像进行讨论分析,检测结果如表1所示。

表1 对图7中不同人群图像的检测对比

针对不同场景下的不同人群图像,也分别对它们进行相应的SIFT 提取特征点的检测,检测结果如图8所示。

图8 不同场景下不同人群密集程度

根据检测结果,分别对这两种情况下的人群图像进行讨论分析,检测结果如表2所示。

表2 对图8中不同人群图像的检测对比

3 结语

随着城市和经济的全球化发展,人口密度的增加而带来的各种经济、安全问题已经成为当今社会所无法避免的现实问题。因此对人群是否密集的检测显得尤为重要。本文重点研究了SIFT 提取特征算法。通过软件测试检验,SIFT 针对不同人群密集程度的图像进行特征点提取,都能够很好地将图像人群区域的特征点检测出来。

猜你喜欢

关键点金字塔直方图
“金字塔”
符合差分隐私的流数据统计直方图发布
聚焦金属关键点
肉兔育肥抓好七个关键点
Great Vacation Places
海上有座“金字塔”
用直方图控制画面影调
神秘金字塔
中考频数分布直方图题型展示
基于空间变换和直方图均衡的彩色图像增强方法