基于机器视觉的三维重建技术研究进展
2020-08-04汤哲君
汤哲君
摘要:本文主要介绍基于机器视觉的三维重建技术的主要方法、技术及应用,对单目视觉、双目视觉、三目视觉和四目视觉的三维重建技术进行对比分析,总结了基于机器视觉的三维重建技术在工程应用中存在的问题、面临的挑战和研究方向,希望对该领域有一个比较全面的把握。
关键词:机器视觉;特征匹配;三维重建
中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2020)05-0063-01
0引言
无论是在计算机辅助几何设计方向、计算机图形学、亦或是计算机动画制作和数字媒体创作等领域的研究中,物体三维重建是它们的共性科学问题,同时也是引领发展的核心技术。基于机器视觉三维重建技术的基本原理简单来说就是针对—个标的物,通过多个不同的视角所获取的图像,应用相关三角测量原理计算出标的物的位置偏差,从而获得该标的物的空间三维信息。当我们将二维图像所获得的坐标点与三维空间的特征点的空间位置相匹配,就可以实现标的物的三维重建。可以快速对标的物进行三维重建而不受限于其具体形状便是三维重建技术的优点,通过该技术,可以实现全自动或半自动建模。
1机器视觉系统
一个完整的立体视觉系统包含摄像机标定、图像获取、特征提取、图像校正、立体匹配、三维重建六个步骤。
摄像机标定就是为了得到实验中摄像机的内外参数,而使用标定板对各个摄像机分别进行标定。特征提取主要是提取图像的边缘信息。常用的边缘提取的方法有SIFT、sobel边缘检测算子、Laplasian算和基于小波变换的图像边缘提取方法。基于平面的图像校正方法是最常用的图像校正方法,除此之外还有基于外极线的图像校正方法。三维重建技术的关键、同时也是最艰巨的研究热点是立体匹配算法,所使用算法的精度可以直接决定三维测量的准确性。常用的立体匹配算法主要包括特征匹配算法、相位匹配算法和区域匹配算法。常用的图像三维重建技术有主动三维重建和被动三维重建两种。使用三维扫描仪重建标的物就是主动方法的代表,被动方法则指基于机器视觉技术获取二维图像进行三维重建方法。
2单目视觉的三维重建技术
单目视觉方法是指在三维重建实验中使用单台摄像机进操作。常用单目视觉的三维重建方法分为以下六种。第一种是明暗度法,用一个非线性偏微分方程来表示二维图像中每个像素点明暗度和对应的三维点的法向、反射率以及光照方向之间关系。第二种是光度立体视觉法,是对明暗度法进行了改进。第三种是纹理法,最早由Wiktin提出。第四种是轮廓法,最早由Marrtin等学者提出。第五种是调焦法。第六种是运动法,即基于运动的建模,是通过在多幅还没有进行标定图像中检测匹配特征点集,再使用数值方法得到三维信息的一种方法。
3多目视觉的三维重建技术
3.1双目视觉的三维重建技术
双目视觉,我们也会称之为双目立体视觉,是最常用的立体视觉实现方式之一,同时也是最接近于人类视觉的三维数据恢复方式。而在另一方面,双目立体视觉也是计算机被动测距方法中我们现在接触到的最重要的也是应用最广泛的距离感知技术。当已知两台摄像机之间的相对位置关系时,希望通过两台摄像机所采集到的图像恢复出一个标的物体的三维空间信息,以此来恢复且重建该标的物体的空间位置和三维形状,这就是基于人眼视差的双目立体视觉工作原理。双目视觉在图像处理、三维建模、物理科学和物体参数提取等领域中占有重要的地位,可见,双目视觉是三维建模技术发展的一个重要方向。
3.2三日视觉的三维重建技术
三目重建系统寻求的是建立在透视投影的可靠基础之上的三元匹配。因其重建数据正确率高、构造简单等优势,三目立体视觉被广泛应用于机器人视觉导航和环境三维感知等场合。比起单目与双目立体视觉,三目立体视觉可以解决诸如特殊结构的景物、对方向平行于核线匹配出现歧义、遮挡严重、能重建的空间点减少等问题。
3.3四目视觉的三维重建技术
相对于双目视觉和三目视觉,国内外对于四目视觉的研究还比较少,国内对于四目视觉的研究大多集中于历史文化遗产的保护方面,对于工业生产以及实际应用方面的研究还较少。显然四目视觉的研究处于方兴未艾的阶段,对于工业、农业生产无损检测方面有很大前景。
4比较与分析
无论是单目视觉还是多目视觉,在图像重建过程中各有自己的应用优、缺点。虽然相对于单目视觉而言,多目视觉,无论是在结构还是重建时间、成本方面都有优势,但是受限于重建局限条件和重建效果的影响,在实际应用过程中,多目立体视觉的使用是大大多于单目立体视觉。基于研究的现状,目前在图像三维重建过程中所面临的主要问题和挑战是:(1)对于相机标定算法的研究。如何行之有效的快速进行摄像机的标定直接决定着后期重建进程。张氏标定法是目前应用最广泛的标定方法,然而内参矩阵和外参矩阵的求解与确定是一个难点,为求解内参与外参需要不断变换相机与标定板之间的位置获取行之有效的数据,工作量大而繁琐。实验室环境下和工业环境中的不同外在影响是否会对标定结果产生影响亦是一个问题。(2)特征提取。在不同光照强度、不同的物体、不同的室内、外环境下摄像机采取的图像信息会有一定程度的差异,对于静止物体、运动物体、刚性物体和非刚性物体特征点的提取各有各的特点,如何去除由于拍摄运动物体而产生的拖影,去除图像中噪声,提取有效的物体特征信息同样是一个研究的方向,只有提取出有效的特征信息才能进行下步工作。(3)匹配与重建。立体视觉的精度不仅依赖于景物的深度,还取决于摄像机之间的距离,即基线。通常来说,基线越长精度越好,然而当基线长度增加时,图像之间的透视形变也越来越大,从而给利用相似度进行匹配带来了困难;另一方面,当基线减小时,匹配精度也会变差,对于均匀分布、模式重复的景物难以匹配。
针对以上这些问题,基于机器视觉的三维重建方法的相关研究可以从以下几个方面展开:(1)相关算法的改进与优化。从实际情况出发,对各种算法进行优化,使之更加符合真突情况,提高运算与工作效率,提高准确性。(2)重建对象。在三维重建应用研究中,主要对象都是静态物体,很少有对动态物体进行研究,因此,对于运动物体的三维重建也将是未来研究的方向之一。(3)四目视觉。国内对于四目视觉的研究还较少,仅有的几项研究集中于文物保护方面,因此向其他领域扩展亦是后期研究的方向之一。(4)针对大规模场景的三维重建。如何使用卫星或航拍图片对自然地形和城市景观等大规模场景的三维场景进行快速准确的重建,也是一个非常有价值的研究方向。(5)医学领域的应用。虽然国内外对于三维重建在医学上已经有了一定的应用,但是应用范围还较小,因此在将三维重建技术应用于医学亦是一个很好的研究方向。(6)识别与应用。国内对于通过三维重建后的图像对所重建物体进行筛选分类虽然已经取得了一定成果,但是无论是效率还是准确性、自动化程度上还有一定的缺陷,此方向的研究還有很大提升空间。
5结语
基于机器视觉的三维重建技术研究正处于发展延伸阶段,但是各种方法距离实际应用还有一段距离,各种应用需求还没有达到预期效果。因此,在未来很长的一段时问内,还需要在这—领域科研人员做更加深入细致的研究。