基于单目视觉的运动目标跟踪方法
2017-10-30朱汉华赵嵩郢李京书
朱汉华,赵嵩郢, 李京书, 崔 玫
(1.武汉理工大学 能源与动力工程学院,武汉 430033;2.海军工程大学 管理工程系,武汉 430033;3.中国舰船研究设计中心,武汉 430064)
基于单目视觉的运动目标跟踪方法
朱汉华1,赵嵩郢1, 李京书2, 崔 玫3
(1.武汉理工大学 能源与动力工程学院,武汉 430033;2.海军工程大学 管理工程系,武汉 430033;3.中国舰船研究设计中心,武汉 430064)
受目标跟踪和目标测量中存在的问题及感知规避的实际应用情况影响,当目标周围环境发生大的变化时,邻近背景样本无法近似表示目标的变化,而固定样本的字典无法处理目标形状变化时的情况。对此,提出一种自适应的字典更新方法来实现稳定的目标跟踪,通过仿真试验对所提出方法的精确度和可行性进行验证。
目标跟踪;稀疏特征;非线性观测器;自适应
无人机在实际飞行过程中不仅会遇到静止障碍物,还有可能遇到鸟类、协同飞行的其他无人机或有人机等运动障碍物。随着无人机协同技术成为研究热点,感知规避技术成为亟待解决的问题,而对运动目标进行测量定位则是感知规避的基础和保障。[1-3]
当前基于单目视觉的静止目标定位方法[4-5]已相对完善,这里对运动目标的定位方法进行研究。由于目标在世界坐标系中的位置随着时间的变化而变化,且变化的快慢受目标的速度和姿态等因素影响,因此对运动目标的研究相比静止目标更具挑战性。[6-8]这里将无人机飞行过程中遇到的运动目标分为目标跟踪和目标测量2部分进行研究。
针对目标跟踪和目标测量中存在的问题及感知规避的实际应用情况,首先在采样过程中通过增加邻近背景样本来扩展目标的形状样本,解决跟踪时目标遮挡及形状变化的问题;然后通过采用LC-KSVD的方法对采样样本进行学习得到稀疏字典,进而得到目标的稀疏特征;最后利用稀疏特征选择算法实现目标跟踪。当目标周围的环境发生大的变化时,邻近背景样本无法近似表示目标的变化,而固定样本的字典无法处理目标形状变化时的情况。对此,提出一种自适应的字典更新方法来实现稳定的目标跟踪。利用得到的目标的稀疏特征信息,结合目标的动力学模型,设计一种基于RISE的非线性观测器,从而实现对目标的速度及深度信息的估计。同时,通过仿真试验对所提出方法的精确度和可行性进行验证。
1 目标跟踪
在传统的信号表示理论中,一般通过一组正交基函数的线性组合进行信号表示,但图像等复杂信号有时并不能用一组正交基线性表示。1996年,OLSHAUESEN等人受人类视觉皮层神经元响应的稀疏性启发,提出一种针对自然图像信号的有效表示方法(即稀疏表示)。稀疏表示是指通过少量原子,以一种简洁、稀疏的形式揭示信号的内在结构,其在本质上是一种线性逼近的过程。信号分解就是从过完备字典中选取最佳线性组合的若干原子进行信号表示。由于字典具有超完备性,因此每个信号都会有多种表示方法,其中最稀疏的表示方法最简洁,可描述为
y=Φa
(1)
式(1)中:Φ∈Rl×K为过完备字典;y∈Rl×1为信号;a∈RK×1为待求的系数。
2 测量模型
2.1目标与摄像机的相对运动模型
(2)
式(2)中含有2个未知量,为方便后面的计算,用状态变量y(t)=[y1(t),y2(t),y3(t)]T代替m(t),即
(3)
图1 目标与摄像机的相对运动模型
y(t)中的前2部分与m(t)相同,且可通过图像空间中的帧坐标p(t)=[u,v,1]T得到。
p=Acm
(4)
式(4)中:Ac∈R3×3为摄像机的标定矩阵,可通过摄像机标定的方法得到。由式(4)可知,m(t)可由p和Ac得到,即通过式(4)可求得y(t)的前2部分。y(t)中的最后一项与x3(t)有关,即与摄像机与特征点之间的相对位置有关,因此对y(t)进行估计可得到距离信息。为方便后面的推导计算,需假设:
2) 摄像机的线性速度vc(t)与目标的速度vp(t)是连续变化且有界的。
特征点在运动摄像机观测下的动力学方程为
(5)
将式(3)与式(5)相结合,目标的运动学方程可表示为
(6)
(7)
Ψd=[vc,ω,vp]T
(8)
由上述分析可知,y1和y2是可测量的,而y3的精确值无法通过视觉传感器获得,且目标的速度向量vp未知。因此,式(6)中可测的输入量(2个)少于未知量(3个)。对于不可测量的量y3,虽然无法获得精确值,但可估计出其比例因子,即
(9)
(10)
(11)
(12)
(13)
2.2对目标深度和速度估计的非线性观测器设计
2.2.1对目标深度估计的非线性观测器设计
(14)
(15)
(16)
(17)
(18)
结合式(17)和式(18)即可求得滤波跟踪的动态误差方程,即
(19)
式(16)和式(17)表示的非线性观测器的性质可用以下定理描述。
(20)
(21)
证明:构造李雅普诺夫函数为
高校是我国培养创新型人才的主要阵地,其教学理念、教学方法及教学体制都会影响大学生的成长和发展。思想政治教育是高校教学的重点内容,是提高学生创新能力和综合素质的有效途径,有利于学生健全人格的塑造,帮助学生树立正确的价值观,促进学生的全面发展,基层党建是开展高校思想政治教育的主要部门,充分发挥基层党建的教学价值,是现代基层党建工作的重要职责。
(22)
将式(19)代入到式(22)中可得
(23)
(24)
(25)
(26)
2.2.2对目标速度估计的非线性观测器设计
由于式(27)中的未知参数y3/d3和y3是线性的,对未知项的估计会产生未知参数的估计,因此式(27)可表示为
(31)
(32)
(33)
(34)
(35)
(36)
3 跟踪试验
在MATLAB环境下进行仿真试验,设置α1=0.7和α2=0.3分别控制与第一帧目标及前一帧目标的相关度,标记约束项的系数α设为4,分类误差项的系数设为2,搜索窗口的大小根据视频中的目标设置。r=2,迭代次数设置为30进行仿真试验。
对于稀疏字典,最小重构误差不是检验字典的唯一标准,同时还有识别检测能力。试验中采用文献[10]给出的比较方法,将LC-KSVD的学习方法与K-SVD的学习方法在这2方面进行对比试验。试验结果见图2和图3,其中,正样本是围绕目标在半径r范围内进行的采样,负样本是在r~2r内进行等数量的随机采样,且字典中所用样本均是在第一帧图像中采集的。
图2 重构误差图3 识别检测能力
图4为未更新的中心定位误差与更新的中心定位误差对比。由图4可知,从170~200帧,未更新的跟踪方法的中心定位误差迅速增大,而更新的跟踪方法定位误差却减小。可见,当背景发生较大变化时,采用更新的字典学习方法可有效提高定位精度。
图4 未更新的中心定位误差与更新的中心定位误差对比
图5为不同算法对存在遮挡时的目标定位对比,其中上面矩形框表示本文算法的跟踪结果,下面矩形框表示文献[11]的跟踪结果。显然,本文所提算法对目标遮挡时的跟踪定位效果更好。
图5 不同算法对存在遮挡时的目标定位对比
4 结束语
本文针对无人机避障中的环境感知系统部分,利用单目视觉实现对运动目标的跟踪测量。通过在目标模板和琐碎模板组成的模板集中引入邻近背景模板,实现对目标部分形变的近似表示,提出一种稀疏特征选择算法和一种学习字典的更新方法。通过仿真试验验证该算法可有效实现目标跟踪。
[1] CLARK M,KERN Z,PRAZENICA R J.A Vision-Based Proportional Navigation Guidance Law for UAS Sense and Avoid [C].AIAA Guidance,Navigation,and Control Conference,2015.
[2] WALLACE L,LUCIEER A,WATSON C S.Evaluating Tree Detection and Segmentation Routines on Very High Resolution UAV LiDAR Data [J].IEEE Transactions on Geoscience & Remote Sensing,2014,52(12):7619-7628.
[3] FASANO G,ACCARDO D,TIRRI A E,et al.Morphological Filtering and Target Tracking for Vision-Based UAS Sense and Avoid [C].2014 International Conference on Unmanned Aircraft Systems.IEEE,2014.
[4] LIN Jingyu,JI Xiangyang,XU Wenli,et al.Absolute Depth Estimation from a Single Defocused Image [J].IEEE Transactions on Image Processing,2013,22(11):4545-4550.
[5] SALIH Y,MALIK A S,MAY Z.Depth Estimation Using Monocular Cues from Single Image [C].National Postgraduate Conference.IEEE,2011:1-4.
[6] MEI H,KANADE T.Reconstruction of a Scene with Multiple Linearly Moving Objects[J].International Journal of Computer Vision,2004,59(3):285-300.
[7] ZHANG Z,CONLY C,ATHITSOS V.Evaluating Depth-Based Computer Vision Methods for Fall Detection Under Occlusions [M].Berlin: Springer International Publishing,2014:196-207.
[8] GIRISH C,JOHNSON E N,DANIEL M,et al.GPS-Denied Indoor and Outdoor Monocular Vision Aided Navigation and Control of Unmanned Aircraft [J].Journal of Field Robotics,2013,30(3):415-438.
[9] HU G,AIKEN D,GUPTA S,et al.Lyapunov-Based Range Identification For Paracatadioptric Systems [J].IEEE Transactions on Automatic Control,2008,53(7):1775-1781.
[10] WU H,LI G,LUO X.Weighted Attentional Blocks for Probabilistic Object Tracking[J].Visual Computer,2014,30(2):229-243.
[11] WANG D,LU H,YANG M H.Online Object Tracking with Sparse Prototypes[J].IEEE Transactions on Image Processing,2012,22(1):314-325.
MonocularVision-BasedMovingObjectTracking
ZHUHanhua1,ZHAOSongying1,LIJingshu2,CUIMei3
(1.Wuhan University of Technology,Wuhan 430033,China; 2.Department of Managenent Engineering,College of Naval Engineering,Wuhan 430033,China; 3.China Ship Design Institute,Wuhan 430064,China )
When tracking a target in practical environment,if the environment surrounding the target changes significantly,the adjacent background samples will be invalid in approximating the movement of the target.A fixed sample dictionary can not handle the shape changes of the target which may happen in such situations either.An adaptive dictionary updating method is proposed to achieve the stability of target tracking.The accuracy and feasibility of the proposed method is verified through simulation tests.
target tracking; sparse characteristic; nonlinear observer; adaptive tracking
TP391.41; U675.7
A
2017-02-24
国家级大学生创新创业训练计划基金(20161049705008)
朱汉华(1968—),男,湖北武汉人,教授,博士,研究方向为船舶工业。E-mail:1208581923@qq.com
赵嵩郢(1996—),男,湖北武汉人,学士,研究方向为信号处理。E-mail:15872427429@163.com
1000-4653(2017)02-0001-05