基于深度学习目标检测与跟踪技术探讨
2020-04-27赵年年
赵年年,郭 翔
跟踪算法是计算机视觉领域中的重要研究内容,随着卷积神经网络和滤波等新兴技术的出现与融合,提高了整体研究水平。在深度学习技术背景下,跟踪算法的应用范围得到了进一步扩展,包括人流量分析、医疗图像、异常行为识别、智能控制、人机交互等方面,文章就此针对目标检测跟踪技术进行了系统研究。
1 目标检测和跟踪
1.1 目标检测
当下,跟踪算法和检测算法相比,在检测实时性上还存在较大的不足之处,为此在跟踪领域中应用相应的检测方法能够进一步提高跟踪算法速度。
从当下实际发展状况分析,大部分物质检测方法都是以水平检测方法为主将目标置信度较高的区域,但因为水平框对于各种不规则的形状目标而言,并不适用于各种方向。为此检测边界框内覆盖了各种和真正目标没有任何联系的区域,影响了检测性能。针对该种问题,文章以最小的目标边界框划分方法为基础,尽量降低边界框范围中的各种影响因素,从而提高后期场景跟踪过程中的应用效率。
1.2 目标跟踪
跟踪任务即在某视频序列初始帧位置和目标区域范围给定的条件下,对后续帧中的目标位置和范围进行准确预测。在将初始化目标框输入后,还会于下一帧内出现各种候选框,并对各种候选框的突出特征进行合理提取,随后为候选框进行科学评分,便在评分中选出最高得分的候选框,将其当成预测目标,或结合多种预测值进行融合获得最优预测目标[1]。
目标跟踪具体可以分成五种研究内容:第一是选取运动模型,并在相关运动模型的基础上生成各种候选样本。第二是提取运动特征,即将某些特征当成主要特征。第三是集成调优方法,即将多种决策有机融合起来,从而获得一种优质决策结果。
2 算法的优化创新
2.1 数据集准备
通常情况下,创建出来的学习网络层次较多,为此其中也包含多种学习参数,针对该种现象,需要保证训练样本的充足性,从而能够有效预防出现拟合现象。此次实验主要是以有限数据集为目标,通过随机扩展数据方法,结合现有数据集,把数据集内的人放置于各种背景当中,并通过仿射变换,具体如下面公示所示,对目标的倾斜角度合理矫正过来,不但能够促进数据集的有效扩充,同时还能够避免扭曲、复杂背景下出现错检和漏检等问题。结合通用行人检测相关数据库对检测模型实施训练检验[2]。
2.2 在线跟踪
跟踪部分主要利用TLD 框架,把跟踪划分为几种不同的模块[3]。第一部分是优化后的光流法跟踪装置,其主要负责对检测装置检测目标进行跟踪,结合光流特征,利用下面公式确定下一帧中目标跟踪位置。第二部分属于检测部分,即前面所应用的离线训练模型和检测装置可以通过实施在线微调进一步提升模型整体精度,同时该部分主要是在跟踪视野内负责检测目标,随后联系相应的跟踪位置,对跟踪器进行合理矫正,结合最优结果获得目标最终实时位置。第三部分属于在线学习模块,该模块中主要是通过8维空间,将某一时刻中的目标状态刻画出来,而这八位空间便是目标中心坐标,估测目标速度、高度值、长宽比。具体公式如下:
2.3 模型压缩
在实施训练中,结束大模型的训练工作后,利用CONFIG 文件能够发现权值较小的一边,并将其彻底去除,随后继续训练模型。让部分边共用相同权值,使其能够满足缩减参数的个数要求。假设相邻两层属于处于全连接模式,每层中的节点个数是1000个,则两层便有1000×1000=100万个权重参数。把一百万个权值当成聚类,结合各类均值替代该类中的各个权值大小,而同一类中的多个边可以共享相同权值,并利用量化处理措施缩减模型大小,神经网络模型相关参数主要是通过长度为32bit 的浮点型数进行表示,但其实无需维持如此高的精度,比如通过0到255表示32个bit 原本所代表的精度,通过精度牺牲降低权值占用空间[4]。
经过反复的模型压缩操作后,模型大小程度也从原来的30M 减少到6M,进一步缩减了模型空间,为嵌入式设备稳定运行提供了更多便利。
3 实践应用
此次主要把目标检测和跟踪技术放置于公交车系统中对乘客流量进行实时统计。
结合通用数据集训练模型对人体目标进行准确识别,对测试集与训练集进行合理划分,继续扩展训练集,XML 文件数据将目标识别图片类型有效裁剪出来,并按照9比1的比例对测试集与训练集进行合理划分,在裁剪的过程中,还需要针对训练集图实施扩增,合理统计训练集图片具体尺寸,掌握三通道平均值。结合RGB 三通道最终平均值对图像实施灰化度处理,从而帮助我们对各种干扰因素进行有效处理,提升整体召回率和准确率[5]。
因为对乘客流量进行检测的过程中,只需要对有效范围中的目标人体进行检测跟踪即可,所以在线预训练的过程中仅需要区分人与背景目标的检测模型即可。实施在线跟踪的过程中,利用学习模块对模型进行微调,具体如图1所示。
图1 在线微调数据LOSS实况
学习系统能够在多种候选框内利用跟踪器对位置评分,计算得到置信度,并将那些低评分的候选框彻底删除,将最高测评分结果的候选框当成ID下一刻的实时位置目标,即对ID 初始位置进行跟踪,在脱离有效范围后,ID 的TRACKER 便失去效用,依次循环,从而能够实时在线跟踪系统中所呈现出来的公交车流动人数,为公交司机和交通人员进行资源配置提供可靠的参考依据[6]。最后通过测试,能够发现视频设备中所嵌入的模型能够达到每秒42帧的监测速度,具体如图2所示。
4 结语
综上所述,本文通过相关检验最终实现了通过匹配跟踪目标和检测结果,实现多个目标同时跟踪的目的,有效降低复杂环境下的跟错和跟丢问题,不但可以促进嵌入式设备运行速度的有效提升,同时还能够达到在线准确实时跟踪目标的目的。