APP下载

基于图像感知哈希的行人跟踪算法

2016-12-19方正涛陈临强

电子科技 2016年11期
关键词:搜索算法菱形哈希

方正涛,陈临强

(杭州电子科技大学 图形图像研究所,浙江 杭州 310018)



基于图像感知哈希的行人跟踪算法

方正涛,陈临强

(杭州电子科技大学 图形图像研究所,浙江 杭州 310018)

针对传统目标跟踪算法计算复杂度高,在发生遮挡、形状改变时,运动目标丢失的问题,提出了将图像感知哈希算法应用于目标跟踪问题上,并针对行人这一特定目标进行了改进。按照行人的特征,将其分成若干区域,给不同区域分配不同权重,计算跟踪目标的感知哈希值,计算待测区域的哈希值,选择合适的待测区域作为目标区域。该算法与MeanShift算法相比,能更好地处理目标遮挡,不易产生目标丢失,且具有较低的复杂度。

感知哈希算法;目标跟踪;遮挡;目标丢失;MeanShift

运动目标跟踪是视频监控系统中必不可少的一部分,其主要目的是对选定或检测出的目标区域进行跟踪。基于匹配的目标跟踪技术通过前后帧之间的特征匹配实现目标的定位,需要在帧与帧之间传递目标信息[1],Mean-shift算法[2]是目前常用的基于匹配的目标跟踪算法,该算法属于核密度估计法[3],使用特征空间样本点计算其密度函数值,再计算距离度量颜色模型之间的相似度,通过一个迭代的步骤,在搜索范围内得到目标的位置。其缺点是在旋转和尺度变化的条件下效果较差。此外,还有基于SIFT[4],HOG[5]特征的跟踪算法,基于学习的特征跟踪算法,如Viola等[6]提出的基于“AdaBoost+Haar”的行人检测方法。本文提出了基于图像感知哈希算法(Perceptual Hash Algorithm,PHA)的目标跟踪算法,图像感知哈希算法多用在处理相似图像的问题上,本文对该算法进行改进,将其应用在行人目标跟踪上,与其他算法相比,降低了计算的复杂度,同时提高了跟踪的稳定性。

1 感知哈希算法

2001年,Ton Kalker首次在一篇关于数字水印的综述文章中提出了感知哈希算法[7],他通过“感知”这个词汇来强调感知哈希算法关注的是感知的相似性。感知哈希算法是哈希算法的一个分支,其是一种基于认知心理学的信息加工理论[8],由多媒体数据集到多媒体感知摘要集的一类单向映射,通过将具有相同感知内容和信息的多媒体数据压缩成唯一的一段数字摘要,并满足感知安全性要求。

根据感知哈希的特性,其可将数据量较大的对象映射成为长度较小的一系列比特位,且感知相近的对象会被映射成相近的哈希值。利用感知哈希的这些特性,可将其利用到相似图像匹配和目标跟踪上。并感知哈希函数拥有感知鲁棒性,感知内容相近或相似的媒体对象应该得到相同或相近的感知哈希值[9]。

如式(1)所示,记感知哈希函数为PH。由对象I生成的函数值h称为感知哈希值

h=PH(I)

(1)

对于哈希值的比较,两个对象的感知距离pd可使用各种距离计算方法PM得到

pdi,j=PM(hi,hj)

(2)

其中,hi和hj分别表示两个对象的图像感知哈希值。感知距离可采用传统的计算距离的方式得到,比如计算汉明距离或欧式距离。

2 行人跟踪算法

提出的基于感知哈希算法的人体目标跟踪算法利用图像感知哈希技术,采用菱形搜索算法和距离匹配算法,获取目标信息。本文算法流程如图1所示。

图1 行人跟踪流程图

图像进行感知哈希算法的计算流程,步骤如下:

步骤 1 选择需要跟踪的行人目标;

步骤 2 按照行人的特征,将人分成几个部分,如图2所示。

图2 区域分割及权重示意图

矩形方框中的数字代表该矩形哈希值的权重

(3)

其中,h代表该矩形模版总的哈希值;Wi为第i块小矩形的权重。

步骤 3 对每个小矩形分别进行感知哈希计算。

感知哈希计算过程:(1)缩小尺寸。将每个小矩形区域缩小到32×32。这样做的目的是简化了DCT的计算,减少不同尺寸图片带来的差异;(2)简化色彩。将彩色RGB图像转化成单色调的灰度图像,再次简化计算量;(3)计算DCT。计算灰度图像的DCT变换,得到32×32的DCT矩阵;(4)缩小DCT。DCT的结果是32×32大小的矩阵,但只需左上角的8×8的矩阵;(5)计算平均值。计算所有64个值的平均值AVG;(6)计算哈希值。根据8×8的DCT矩阵,依次进行计算,将≥AVG的部分记为”1”,

将最后得到的二进制组合在一起,就构成了一个64位的哈希值。图3展示了图像感知哈希算法的计算过程。

图3 哈希生成算法示意图

步骤 4 将6个小矩形的哈希值都计算出来后,带入式(3),便可得到该矩形框的感知哈希值;

步骤 5 采用菱形区域搜索算法,对符合条件的区域计算感知哈希值,并计算与目标区域的汉明距离;

菱形搜索算法[10]使用了两种搜索模板,分别是大菱形搜索模板(Large Diamond Search Pattern, LDSP) 和小菱形搜索模板(Small Diamond Search Pattern, SDSP)。首先使用固定尺寸的 LDSP 进行迭代搜索,即使某一步的搜索误导了搜索方向,LDSP 的迭代过程仍有可能找回正确方向;最后,采用与LDSP搜索位互补的SDSP精确搜索位置,使菱形搜索算法算法趋近于全局最优。另外,LDSP有较强的相关性,在迭代时仅需计算3或5个新的搜索位,减少了不小的计算量。

步骤 6 选择最小的汉明距离,与阈值进行比较,小于阈值则更新目标区域。根据实际测试结果,阈值设置为20时,效果较好。

3 实验结果

使用提出的算法,设计了视频行人跟踪系统,采用VS2013作为系统开发工具,Opencv开源库作为辅助图像处理工具,在Intel(R) Xeon(R) 3.2 GHzCPU ,4GB RAM的PC上完成目标跟踪。文中选择了2个视频,视频1是单人,背景有汽车作为干扰物;视频2是多人,有行人遮挡和花草干扰。实验结果如图4和图5所示,视频左上角红色字代表当前图像所在帧数,跟踪目标被红色矩形圈住。由实验结果可知,当有其他物体干扰时,针对行人的改进的图像感知哈希算法,在目标跟踪中效果更好。在图4中,第21帧时,由于汽车的影响,MeanShift算法发生目标丢失,而本文算法仍能正常跟踪到目标。在图5中,第200和第250帧中,MeanShift算法跟踪效果不理想,跟踪目标发生偏移、丢失现象,而图像感知哈希算法仍能正常跟踪到目标。

图4 本文算法和MeanShift算法对视频1的结果对比

图5 本文算法和MeanShift算法对视频2的结果对比

4 结束语

针对行人跟踪过程中出现的问题,本文提出了一种基于感知哈希算法的改进行人跟踪算法,该算法通过提取带跟踪的行人区域的感知哈希值,结合菱形区域搜索算法,设定一定的阈值,对行人目标进行跟踪。实验结果表明,该算法实现简单,跟踪准确,在发生遮挡和干扰物时,效果明显优于传统的MeanShift算法。

[1] 蔡荣太,吴元昊,王明佳,等.视频目标跟踪算法综述[J].电视技术,2010,34(12):135-138,142.

[2] 王宇.基于Mean Shift的序列图像手势跟踪算法[J].电视技术,2010,34(6):97-99.

[3] Comaniciu D,Ramesh V,Meer P.Real-time tracking of non-rigid objects using meanshift[C].Los Alamitos,CA:Proceeding of IEEE Conf on Computer Vision and Pattern Recognition,IEEE Computer Society,2000.

[4] Battiato S,Gallo G,Puglisi G,et al.SIFT features tracking for video stabilization[C].Modena,Italy:Proceedings of the 14th International Conference on Image Analysis and Processing,IEEE,2007.

[5] 曾波波,王贵锦,林行刚.基于颜色自相似度特征的实时行人检测[J].清华大学学报:自然科学版,2012(4):571-574.

[6] Viola P,Jones M.Robust real-time face detection[J].International Journal of Computer Vision,2004,57(2):137-154.

[7] 张慧.图像感知哈希测评基准及算法研究[D].哈尔滨:哈尔滨工业大学,2009.

[8] 安坤.基于感知哈希算法的商标图像的检索[D].杭州:浙江理工大学,2014.

[9] 牛夏牧,焦玉华.感知哈希综述[J].电子学报,2008,36(7):1405-1411.

[10]孙秀娟,杨德运,侯迎坤.一种改进的菱形搜索算法[J].图学学报,2013,34(4):41-45.

Pedestrian Tracking Algorithm Based on Perceptual Hash Algorithm

FANG Zhengtao, CHEN Linqiang

(Institute of Graphics and Image, Hangzhou Dianzi University, Hangzhou 310018, China)

Traditional target tracking algorithms suffer high computational complexity, occlusion, shape change, and loss of target motion. The image perceptual hash algorithm is used in target tracking and improved for the special target of pedestrians. First pedestrians are divided according to their characteristics into several regions that are assigned different weights. The perceptual hash value of the tracking target is calculated, and the diamond search algorithm is used to calculate the area of the hash value of the unknown. Finally the suitable area is chosen to be tested as the target region. This algorithm has better continuity of target occlusion and tracking than the MeanShift algorithm.

perceptual hash; target tracking; occlusion; target loss; MeanShift

2016- 01- 19

方正涛(1991-),男,硕士研究生。研究方向:数字图像处理。陈临强(1963-),男,硕士,教授,硕士生导师。研究方向:计算机图形学等。

10.16180/j.cnki.issn1007-7820.2016.11.032

TP

A

猜你喜欢

搜索算法菱形哈希
改进的菱形解相位法在相位展开中的应用
改进的和声搜索算法求解凸二次规划及线性规划
基于OpenCV与均值哈希算法的人脸相似识别系统
基于维度分解的哈希多维快速流分类算法
基于汽车接力的潮流转移快速搜索算法
基于逐维改进的自适应步长布谷鸟搜索算法
基于跳点搜索算法的网格地图寻路
基于同态哈希函数的云数据完整性验证算法
一种基于Bigram二级哈希的中文索引结构
菱形数独2则