基于计算机视觉的深度估计方法
2018-08-07刘海艳陆映峰
刘海艳 陆映峰
摘 要:社会经济体系在利用机械进行生产的过程中,对于机械的识别、追踪与测算能力有着较高的要求,为了进一步提升机械的服务能力,满足实际生产活动中的使用需求。计算工作者以计算机视觉作为研究核心,将摄像机与计算机为基本框架,在机械当中模拟出人类的视觉功能,完成识别、追踪与测算等一系列工作。文章以计算机视觉作为研究中心,从多个维度出发,对深度估算的方法进行优化,以期为后续技术研究与应用工作的开展准备条件。
关键词:计算机视觉 深度估计 双目视觉 单目视觉
中图分类号:TP391 文献标识码:A 文章编号:1672-3791(2018)02(a)-0037-02
计算机视觉要求相关技术体系运行过程中,能够从景物的二维图像中获取三维立体结构与景物的基本属性,并在这一过程中,对一幅或者多幅图像中的信息进行获取,这一过程称之为深度估计。在进行深度估计的过程中,为了提升估计结果的准确性,普遍使用主动视觉与被动视觉两种方式,主动视觉与被动视觉是根据成像光源的差异来进行区分的,主动视觉是被测量的物体可以发出可控光束,而后对光束进行获取,形成最终的影像。被动视觉不需要可控光源也可以进行成像操作,因此应用性相较于主动视觉技术要更为广泛,操作性更强。基于这种情况,文章将计算机被动视觉深度估计方法作为主要的研究对象,从多个维度出发,以现有的技术为条件,对计算机视觉深度估计的方法进行优化与发展。
1 被动视觉原理分析
被动视觉作为被动传感器技术体系的重要分支,涵盖了双目立体视觉、运动视觉、描影视觉与聚焦法等集中不同的技术类型,由于被动视觉不要求测量物体本身具有发光属性,因此具有较强的实用性。现阶段被动视觉被广泛应用于距离测量与3D景物恢复工作之中,借助于自身的技术优势,被动视觉可以使用多台摄像机对同一目标的两幅照片进行视差计算形成计算深度,通过这种方式最大程度地提升了被动视觉测量的科学性与准确性。但是从实际情况来看,被动视觉所使用的双目立体视觉、运动视觉、描影视觉等操作模式,虽然满足了部分计算机视觉技术应用工作的客观要求,但是受到多种因素的影响,被动视觉技术的应用效果受到制约,难以发挥被动视觉的技术优势[1]。对被动视觉原理的全面分析,帮助技术人员进一步理清被动视觉估计的核心诉求,为后续计算机视觉深度估计活动的开展创造了良好的外部环境,为后续计算机视觉技术体系的完善与发展提供了必要的技术支持。
2 深度估计在计算机视觉中实现所遵循的原则
计算机视觉深度估计活动的有序开展,不仅需要技术人员对于计算机视觉深度估计的重难点进行明晰,还需要从原则框架的角度出发,对自身工作进行梳理,以期完善计算机视觉深度估计工作实施的途径与手段,构建起科学高效的计算机视觉深度估计的全新模式。
2.1 计算机视觉深度估计要遵循科学性的原则。
计算机视觉深度估计体系的构建,要充分体现科学性的原则,只有从科学的角度对计算机视觉深度估计活动的主要流程、计算机视觉深度估计的基本要求以及计算机视觉深度估计的重难点进行细致而全面的考量,才能够最大限度地保证乡村小学音乐教学课体系实践操作模式满足切实满足使用要求,只有在科学精神、科学手段、科学理念的指导下,技术人员才能够以现有的教学资源为基础,构建计算机视觉深度估计新体系。
2.2 计算机视觉深度估计必须要遵循实用性的原则。
由于计算机视觉深度估计的内容多样,操作环节较多。为了适应这一现实状况,计算机视觉深度估计的相关操作之中,就要尽可能地增加计算机视觉深度估计方案的容错率,减少外部环境对计算机视觉深度估计活动的影响[2]。降低操作的难度,使得在较短时间内,进行批量操作,保证各个环节之中计算机视觉深度估计的顺利开展。
3 深度估计在计算机视觉中实现的途径与方法
深度估计在计算机视觉中的实现是一个全方位的过程,技术人员需要明确被动视觉的技术原理,以科学性原则、实用性原则为基本框架。采取针对性的技术手段,构建起计算机深度估计的有效方法,确保计算机视觉体系的有序构建。
3.1 立体视觉技术的优化
双目立体视觉是人类获取距离信息的主要方法,其主要用于解决二维投影图像进行三维结构的转化,在这一体系下,为了实现距离获取的准确性,需要在不同的位置进行不同数量摄像机的设置、移动或者旋转,通过这种方式来进行图像的获取,并通过数学算法对多幅图片的视差进行计算,并在此基础上形成三维坐标[3]。具体原理如图1所示。
在获取信息的过程中,双目立体视觉技术的视差与相机测量的深度成反比例管理,因此,只有在近距离测量的过程中,测量数据才具有可参考性,一旦测量距离超过一定的限度,测量数据的准确性难以得到保证。为了应对上述情况,发挥双目立体视觉技术在深度估计中的重要性,技术人员需要在科学性原则的框架体系下,分析双目立体视觉技术的各个环节,借助于计算机技术将相机建模、特征提取、图像匹配与深度计算进行高度整合,充分发挥计算机在数据获取、信息处理与三维坐标构建中的积极作用,通过计算机强大的计算能力,对双目立体视觉获取的坐标进行纠偏,防止坐标体系计算过程中出现错误,实现计算机被动视觉的三维重建,促进计算机视觉技术的健康快速发展。
3.2 运动视觉在计算机视觉中的实现
运动视觉借助于被测对象与摄像设备之间的相对运动,构建起三维表面信息体系。运动视觉以因分子分解的运动估算结构为框架,研究不同时间段内运动变化场景中,物体形状、位置与运动信息的获取。在运动视觉进行三维信息获取的过程中,需要技术人员从两个维度入手,一个维度在于通过对多幅图片进行抽取特点,建立起对应的位置关系,另一个維度在于根据不同点之间的位置关系进行函数关系的推定,形成物体的结构表述与运动特性。为了进一步发挥运动是觉得技术优势,技术人员可以在实用性原则的基础上,全面分析运动视觉的基本环节,从对运动视觉技术操作的冗余环节入手,不断进行技术流程的优化,在此基础上,将数学算法融入到计算机视觉之中,形成数学表达形式,z=(Δx+XΔz)/[X(r31X+r32Y-r33)+(r11X+r12Y-r13)],其中,z为计算机视觉深度;Δx为测量物体的运动矢量变化;X、Y、r分别为被测算物体的三维坐标,通过构建起科学的数学表达式,技术人员可以准确便捷的进行运动视觉数据信息的计算,发挥运动视觉估计方法的技术优势。
4 结语
计算机视觉深度估计方法在实践中的应用,需要技术人员从现阶段技术发展的实际出发,将被动视觉作为研究核心,明确被动视觉的技术原理。在此基础上,以科学性原则、实用性原则为基本框架,以现有的技术手段为引导,将双目立体视觉技术与运动视觉技术为突破口,借助于数学表达式的形式,形成深度估计运行模式,发挥深度估计方法的技术优势,实现计算机视觉体系的合理化构建,确保相关技术操作的有序开展。
参考文献
[1] 秦彤.基于单幅散焦图像的深度估计算法的研究[J].合肥工业大学,2014.
[2] 薛松,王文剑.基于高斯-柯西混合模型的单幅散焦图像深度恢复方法[J].计算机科学,2017,44(1):32-36.
[3] 袁红星,吴少群,安鹏,等.对象引导的单幅散焦图像深度提取方法[J].电子学报,2014,42(10):2009-2015.