视觉捕捉技术在摄像技术的应用
2015-05-30章明星
章明星
本文在对人体运动跟踪方法及视觉运动捕捉技术难点进行分析的基础上,提出了精确度更高的视觉捕捉系统设计方案,能够取得良好的效果。
目前,在人体运动分析领域和摄像领域,视觉捕捉技术有着十分广泛的应用范围,是当前研究的热点课题之一。在视觉捕捉系统的支持下,该技术能够对运动中的物体进行跟踪定位,从而获得其三维运动轨迹,并通过数字解析过程,实现对运动过程的捕捉。运用视觉捕捉技术,能够对物体的运动特诊进行准确把握,得出其在三维空间内特定参数,从而了解到精确的运动状况。在以计算机图形学为理论基础的同时,在空间内设置多个相关技术设备,用于对运动物体的跟踪,最终以图形的形式,将运动状况加以记录,所得到的运动信息较为不容易失真,因而在摄像技术中能够有良好的应用前景。
人体运动跟踪方法
为了完成人体运动分析,首先要做到科学的跟踪定位,对于连续的图像帧,互相之间应具备相匹配的特征,主要包括运动方向、速度、形态及方位等,这样才能获得完整的运动数据。在运动跟踪的方案设计上,应用较广泛的数学模型有动态贝叶斯网络,卡尔曼滤波,以及粒子滤波等方法。由于跟踪定位的对象各不相同,根据其各自的特征,可分别采用模型跟踪方法,区域跟踪方法,活动轮廓线跟踪方法,特征跟踪方法等[1]。 如果使用模型跟踪法,在人体运动目标的表达上,传统的处理手段有三种,即图模型、二维模型以及三维模型;如果使用区域跟踪方法,则需考虑整体跟踪和局部跟踪的不同;如果使用活动轮廓线跟踪方法,在运动目标的表达上,主要手段为封闭的曲线范围,随着目标的移动变化,这一封闭的曲线范围可进行自动更新。在最新的范围曲线跟踪算法当中,首先确定空间(x,y,t),然后构造一个曲面,并对初始曲线进行设置,此时曲线应为水平方向,得到关于该曲线的能量函数,包围移动体区域,此时运动目标的运动变化,能够反映到能量函数的曲线上,当运动目标区达到最小时,函数曲线将靠近运动目标区,实现对运动目标的跟踪定位;如果使用特征跟踪法,首先应完成特征提取,然后再进行特征匹配,从静态图像当中,可提取相应的人体特征,而在序列图像之间,可对这些特征进行匹配,实现完整的跟踪过程。
视觉运动捕捉技术难点
目前,视觉运动捕捉技术的应用仍然存在较多的难点,尽管视觉捕捉技术的研究工作始终热度不减,对视频运动的分析也越来越深入,但从取得的开发成果来观察,由于多种客观因素的作用,在掌握人体运动数据的过程中,整个过程依然十分复杂,操作在难度上还是具有一定的挑战性。其中,最主要的难点在于,人体作为运动跟踪的目标,其本身具有较强的复杂性,运动所涉及的要素也较多,因而在自摄像到成像的整个过程当中,极易造成原有信息的丢失。在研究阶段,研究人员遇到的研究瓶颈则主要有:第一,人体构造的柔性特征,与此同时人体的运动状况也属于非刚性运动;第二,高维表达问题,,对运动过程进行跟踪时,需对运动中的各要素进行仿真模拟,应如何精确再现人体的运动过程,即如何构建人体模型;第三,在视频中,由于运动状况与理论中的理想状态有很大不同,人体极有可能被附近环境掩盖,或自本身存在遮挡部分,这种情况下就无法获得完整的人体运动数据,破坏跟踪定位的精准度,从而给模型的重建造成困难;第四,在从三维到二维的投影过程中,往往会导致深度歧义,对三维的运动目标进行投影,所得到的二维图像并不能完全再现原有的运动状况,许多深度信息将会丢失[2]。如果使用单个摄像机进行摄像,这一问题的严重性尤为明显,根据这种情况下所得到的视频,试图完成运动三维信息的推导,往往失真程度极高。对于这类问题的解决,通常采取逆向的研究方法,通过多种技术手段,将复杂的问题简化,或者在先验知识的指导下,尽量圆满地解决这一问题。
视觉捕捉系统设计探讨
在本次研究中,为了提高跟踪定位的精确度,将选择杆状模型用来模拟人体骨架,同时为了便于完成视觉处理,还将使用HSI色彩模型。通过关节点的运用,可连接形成人体模型,从而得到更适用于数学处理的刚体集合,每一个刚体,都可利用不同的线段加以描述,通过这样的模型转换,原本复杂的运动将大大简化,以骨架运动的形式进入建模和分析阶段。在整个人体模型中,共包含18个关节点,为了便于研究,本文中称其为特征点。在不同的特征点之间,所构成的线段即代表刚体。这样一来,无论在任何时间点,都不会导致形变。同时,由于这些线段代表的是人体骨架,因此可通过解剖学理论,了解到互相间的大小比例关系,将难点顺利转化为先验知识。在模型选用上,虽然RGB有更加广泛的应用,且易于硬件实现。但如果光照强度发生变化,同样一种颜色,所得到的RGB值差别显著,造成色彩信息的失真。但在视觉捕捉技术的应用领域,由于色彩信息的醒目性,常常将其作为跟踪的特征信息,因而需避免亮度的干扰,此时HSI模型的适用性更强[3]。在HSI模型中,其中H表示色调,S表示饱和度,I表示亮度。
在本次研究中,将采用Kalman 滤波与Camshift 相结合的跟踪算法,能够综合二者的优势。通过对运动图像的观察,可对目标物体的方位进行测定,在每一帧图像中,可获得其相应的位置信息数据,这样就可还原人体的完整运动轨迹。在获知前期人体位置信息数据的情况下,可利用Kalman 滤波,对本帧图像进行预测,得出目标出现的大概位置,然后再使用Camshift算法使信息精确化,即在可能出现的区域当中,得到目标的准确位置。要完成精确度较高的视觉运动捕捉过程,可遵循以下步骤:首先,最好使用多个摄像机,得到视频数据流;其次,通过二维跟踪技术,对特征点进行准确计算,从而得出二维运动序列;最后,利用摄像机,对运动目标进行标定,实现三维重建,完成整个视觉运动捕捉过程。
在整个视觉捕捉系统当中,共包括四个不同模块,分别为视频采集、跟踪定位、模型重建以及显示,这四个模块分别具备不同的功能。
视频采集模块。可使用普通的摄像头,对人体运动的整个过程进行拍摄,得到运动的初始视频。在人体的关节部位,分别使用不同的颜色进行标记,以示区分,标记时应注意所使用的颜色应与背景色彩相异,使标记色块成为其他任意三种颜色的区域。对于视频的背景特征,可不做特殊要求。
跟踪模块。通过预测机制,尽量避免运动目标被附近环境掩盖的现象,对模型及运动目标的特征进行研究和分析,使用Kalman进行预测的同时,结合
Camshift算法的使用,以色彩信息为标识特征,进行信息跟踪。针对各帧图像,对其色块中心数据进行提取,建立图像坐标,此时就可得到色块运动序列,获知关节点的运动特征。
重建模块。完成二维图像坐标后,接下来向三维坐标进行映射。在完成摄像机标定之后,可根据人体生理约束,利用摄像机成像原理,对二维数据进行映射,使其在三维空间得以重建。
显示模块。通过OpenGL ,可用来代表特征点的三维坐标,这样就可利用更加精确的数据,实现人体运动的视觉捕捉过程。
为了对本次研究的可行性进行验证,使用普通摄像头,对手臂的运动轨迹进行拍摄。在OpenGL 中,手臂的三维模型得以建立,通过200帧以上的跟踪定位,多数情况下,误差可控制在一个像素以内,取得了理想的试验结果。
综上所述,可知在视觉捕捉技术的应用领域逐渐扩大的发展趋势中,为了更好实现其跟踪及再现的功能,技术本身的精确性、可靠性等仍有较大的可提升空间,面临的技术挑战仍然较多。本文通过对视觉捕捉技术在摄像技术的应用进行深入的探究和分析,指出了视觉捕捉技术的优势及发展困境。本文对人体运动跟踪方法进行了较为详尽的说明,分别介绍了模型跟踪方法,区域跟踪方法,活动轮廓线跟踪方法,特征跟踪方法,阐述了视觉运动捕捉技术难点,并在此基础上,提出了视觉捕捉系统设计方案。
(作者单位:苏州工艺美术职业技术学院)