基于优化TLD模型的数字视频监控方法研究
2016-10-11孟思明广州中大数字家庭工程技术研究中心有限公司
孟思明 广州中大数字家庭工程技术研究中心有限公司
基于优化TLD模型的数字视频监控方法研究
孟思明 广州中大数字家庭工程技术研究中心有限公司
优化TLD模型;数字视频监控;改进Mean-shift算法;运动目标跟踪
运动目标跟踪是整个数字视频监控体系的一个重要环节,其跟踪模型一方面应具有高效的鲁棒性,即能够在各种各样的场景背景下使用,且能对应用场景具有较好的抗干扰能力。另一方面该跟踪模型应具有较高的时效性,即能够满足运动目标的快速跟踪,对于高速运动的物体依然具有较好的跟踪能力。本文将针对TLD跟踪模型进行如下的研究及优化。
1.标准TLD模型
目前适合长时间跟踪的主流跟踪算法TLD (Tracking-Learning-Detection) 模 型 是Kalal等人[1]于2010年提出的,由跟踪器、检测器、学习器等三部分组成,其最大特点是将传统的检测算法与跟踪算法通过学习器结合在一起,使模型的跟踪器与检测器能实现在线更新,实现对目标的长期跟踪。然而,其跟踪器使用的是光流法预测,在跟踪过程中容易因光照变化、目标被遮掩及出现相似目标而导致跟踪丢失。
2.TLD模型的优化
为弥补标准TLD算法模型的缺陷,本文提出将其跟踪器进行优化,以具有计算速度快及一定抗遮掩能力的Mean-shift算法为基础,将改进的Mean-shift算法融合到标准TLD模型跟踪器中,提高其跟踪器的跟踪效果,进而提高模型的抗遮掩能力及对相似目标的辨别能力。其优化角度如下。
用改进Mean-shift算法得到的预测窗口与标准TLD跟踪器得到的预测窗口进行耦合处理,从而增强跟踪模型的抗遮掩能力。其中分别对标准TLD模型的跟踪器得到的区域与改进Mean-shift算法预测得到的区域进行相似度比较,当TLD跟踪框的巴氏系数较高时,将TLD输出的目标中心位置作为改进Mean-shift算法的迭代起始点。当TLD跟踪框的巴氏系数较低时,将上一帧中的目标框的中心位置作为改进Mean-shift跟踪算法的迭代起始点。通过合理地设置改进Mean-shift算法的迭代起始点,以提升TLD追踪算法的抗遮拦跟踪能力。
同时,为了避免图像目标背景出现相似目标导致的检测器长时间跟踪过程产生累计误差,将用改进Mean-shift算法预测得到的目标区域及标准TLD模型跟踪器得到的预测区域同时与上一帧的目标模型进行巴氏系数阈值判断。当改进Mean-shift算法得到的巴氏系数与TLD模型得到的巴氏系数均大于各自设定的阈值,则以较大阈值的作为模型的跟踪结果。当只有改进Mean-shift算法得到的巴氏系数阈值大于设定阈值,则直接以改进Mean-shift算法得到的目标区域为模型的跟踪结果。当两者均小于各自设定的阈值时,表明跟踪失败。当跟踪失败时,立即使用检测器重新初始化目标,避免检测器引入错误正样本导致积累误差。
3.实验分析及结果对比
为了充分对比跟踪效果的差异,本文将标准TLD模型和优化TLD模型应用在相同的视频序列[1] 的跟踪过程中。其中,对Motocross视频跟踪结果如图1所示,可以看出当目标出现比较明显的相似对象时,标准TLD模型会得到错误的跟踪结果,而优化后的TLD模型由于设定了巴氏系数的对比,虽然TLD模型得到了一个目标巴氏系数,但由于相似物与目标之间还是存在一定的差距,因此综合起来改进Mean-shift算法得到巴氏系数要比TLD模型得到的要大,故最终以改进Mean-shift算法得到的跟踪结果为准。
图1 视频中相似目标出现时标准TLD模型(上)、优化后模型(下)跟踪结果
基于标准TLD和优化TLD模型对各视频的跟踪结果见下表1,结果表明优化后TLD模型在跟踪成功率上均有所提高,其中对Motocross视频跟踪效果提升尤为显著。
表1 基于标准TLD及优化TLD模型的各视频目标跟踪成功率
4.总结
通过对数字视频监控方法中比较主流的TLD目标跟踪算法的分析,针对标准模型在跟踪过程中目标受遮掩及相似目标出现时容易导致跟踪失败的不足,提出用一种改进Meanshift算法对标准TLD跟踪器进行优化,并通过实验验证了优化后TLD目标跟踪模型在抗性上有较大提升,说明本文方法能满足数字视频监控系统较高的性能要求。
[1] Kalal Z., Matas J.and Mikolajczyk K.,Tracking-Learning-Detection, IEEE Transctions on Pattern Analysis and Machine Intelligence, 6(1), 2010
[2] Yizong Cheng, Meanshift,Mode Seeking, and Clustering,IEEETransactions on Pattern Analysis and Machine Intelligence (S0162-8828), 17(8), 1995, 790~799
[3] 田莘,基于MeanShift算法的目标跟踪问题研究,西安科技大学,2010
孟思明(1976.-),女(汉族),博士,主要研究方向:数字家庭技术,计算机图像处理等。
随着各行各业对数字视频监控系统中目标跟踪的实时性、准确性和稳定性要求的不断提高,我们除了提升系统的硬件配置外,最为关键且有效的方法就是优化现有的跟踪算法,使之具有更好的鲁棒性和稳定性,能够应对更复杂的跟踪情况。本文针对目前比较主流跟踪算法TLD模型进行研究,并对其原有的光流法跟踪器进行优化,弥补标准TLD模型在长时间数字视频中运动目标出现局部遮掩及出现相似目标时跟踪结果不理想的缺陷。