双目立体视觉的概念与分析
2014-04-29王青伟
摘 要:双目立体视觉是在对人类视觉系统研究的基础上,通过双目图像的处理来获取物体三维几何信息,其结果表现为深度图,再经过进一步处理得到三维空间中的物体信息的方法。双目立体视觉的研究具有重要的应用价值,包括机器人的自主导航、工业检测、视觉监控以及车辆辅助驾驶系统等。随着计算机硬件的高速发展,基于双目立体视觉的应用越来越多地呈现在人们面前。
关键词:双目立体视觉,立体匹配,相机标定
中图分类号:N04;O43;TP3 文献标识码:A 文章编号:1673-8578(2014)S1-0070-03
The Concept and Analysis of Binocular Stereo Vision
WANG Qingwei
Abstract:Binocular stereo vision is one method which can obtain the 3D information by processing two images from the cameras. The 3D information is presented by depth image. The stereo vision system can be used in auto navigation, industrial detection, visual surveillance, and drive assistance system. With the rapid evolution of hardware, binocular vision based application will become more and more popular.
Keywords: binocular stereo vision, stereo matching, camera calibration
收稿日期:2014-06-28
作者简介:王青伟(1977—),女,辽宁本溪人,博士,实审审查员,从事自动控制领域的专利审查。通信方式:wangqingwei@sipo.gov.cn。
一 双目立体视觉的概念
计算机视觉中的一个重要的问题是计算摄像机到物体之间的距离,实现方法之一是模仿生物的眼睛,即双目立体视觉。双目立体视觉是指双眼互相重叠下而产生视觉[1]。研究人员付出了很多努力来研究我们的视觉系统,希望能够有一天创造一个人工视觉系统。人的视觉系统具有巨大的动态感光范围,能够自适应地发现场景里的细节。双目视觉在视觉系统下是一系列复杂的生理及视觉心理过程,这种机制一直在下意识地发生作用。当人们试图观察面前的物体时,看到的是平面、图画或者照片,但是视觉感知机制却会自动获得三维信息。这种机制能够帮助我们理解世界并完成生活中的各种任务。
由于人的双眼之间有瞳距,当用眼睛观察世界时,会在左右眼的视网膜上生成有一定差别又基本相似的图像[2]。同一个物体在左右眼所成图像上坐标位置的差别称之为视差。根据视差的不同,大脑会将左右眼得到的两幅图像的差异进行整合,从而能得到人眼到物体的精准距离。人的双眼的瞳距在60毫米到70毫米左右,能够对100米内的场景进行很好的三维重建。
双目立体视觉测量时基于三角法原理来获取三维信息,一般用两个摄像机来组成双目立体视觉测量系统,用视差理论来实现三维测量[3]。如图1所示为双目立体成像原理。
图1 双目立体成像原理
两摄像机的投影中心连线的距离,即两个相机的基线距离为b,三维空间中一个点A(X,Y,Z)在左右相机的成像面上的图像坐标分别为al(ul,vl)和ar(ur, vr),两个成像点的X坐标差即为视差,由此可计算出点A在摄像机坐标系下的三维坐标。
二 双目立体视觉的系统及特点
完整的立体视觉系统由多个模块组成,通常包含图像采集模块、摄像机标定模块、立体匹配模块和三维重建模块。
图像采集模块的主要目的是获取数字图像,双目立体视觉系统采集双目图像,还有其他多目系统会采集多目图像。图像获取的方式有很多种,主要由具体的应用场景决定。在采集图像时还要考虑光照、场景特点及采集设备的性能。
摄像机标定模块主要目的是对系统中的两个相机进行标定,建立相机成像的几何模型,从而确定真实空间中物体上的某点的几何位置和图像中对应点之间的关系。相机标定结果的精度和算法的稳定性会对相机结果的准确性产生直接的影响。标定模块包括单个相机的标定和双目相机的标定。单个相机的标定主要是获取相机的畸变和内参参数。得到单个相机的参数后,接下来就是对双目相机进行标定,计算出两个相机在当前位置下的相互参数。标定完成后就可以去观测世界。
立体匹配模块主要目的是将三维空间中的一点在左右相机的对应点找出来,从而达到计算视差而获取三维世界的距离。图像匹配是双目立体视觉中最重要也是最难的一个问题,也一直是研究的焦点。同一物体在两个相机成像面上的成像会有不同程度的变形,而且成像还会受到场景光照、摄像机系统的噪声和其特性、目标对象的表面特性等因素的影响,要想获得精确的匹配十分不易。匹配方法有区域匹配、特征匹配和全局匹配。
在完成上述双目相机的标定和图像匹配后就可以对被测量物体进行三维信息恢复。通过空间中一点和两个图像中的对应坐标及相机参数矩阵,可以求解出该点的世界坐标,来达到三维重建的目的。
双目立体视觉系统具有系统结构简单、成本低、精度适中、高效等特点,而且具有很强的扩展能力,可以较容易地扩展到多个相机。双目立体相机还由于其体积不大,方便于在各种场合布置,还具有不易损坏,连续工作时间长等特点。
三 双目立体视觉的应用现状
双目立体视觉的主要功能是获取目标物体的三维信息以及准确的距离信息。基于此功能,双目立体相机在导航、视觉监控、工业检测、虚拟现实、汽车辅助驾驶系统等方面有广阔的应用前景。
双目视觉导航系统当前主要应用在机器人系统中,在机器人上安装双目摄像头,获取机器人前面障碍物的位置,得出该障碍物的三维坐标值,并把该三维坐标输入到机器人控制系统,机器人就可以实现智能地避障了。
双目立体视觉在视觉监控方面也获得了越来越广泛的应用。由于双目立体视觉可以获得物体的三维几何信息,因此可以有效避免光线、阴影等干扰因素,提高智能监控的准确度。基于立体视觉技术的监控,因为可以获得监控目标的三维信息、姿态及目标周围空间的距离信息,因此可以适应复杂的监控环境。
四 结 语
双目立体视觉是计算机视觉领域一个重要的课题,经过几十年的研究,取得了显著的成果,技术也越来越成熟。随着硬件处理能力的增强,立体视觉的应用会越来越广泛地出现在人们日常生活中。
参考文献
[1] 艾海舟.关于双目立体视觉的研究[D]. 北京:清华大学计算机系,1988:121.
[2] 张广军.机器视觉[M].北京:科学出版社有限责任公司,2005:273.
[3] 徐敏,周中伟.一种双目立体视觉运动目标跟踪定位方法[J].制造业自动化,2013,35(9):69—72.