APP下载

计算机视觉中的深度估计分析

2021-02-24安泽宇

信息记录材料 2021年1期
关键词:深度图差分边缘

安泽宇

(西南大学电子信息工程学院 重庆 400700)

1 引言

计算机视觉要求技术体系运行时,通过景物二维图像中得到三维立体结构和景物基本属性,在此过程中得到一副或多幅图像信息,此过程就是深度估计。在实现深度估计过程中,为了使估计结果精准性得到提高,一般都是利用被动视觉和主动视觉两种,其是以成像光源差异区分。主动视觉为被测量物体发出可控光束并且获取,构成最终影响;被动视觉并不需要可控光源就能够成像操作,所以应用比较广泛,具有较强的操作性[1]。以此,本文就将计算机被动视觉深度估计方法作为研究对象,通过多维度出发,将现有技术作为条件分析计算机视觉深度估计方法。

2 计算机视觉中深度估计的原则

有序开展计算机视觉估计活动,要求技术人员明确计算机视觉深度估计,基于原则框架梳理自身工作,对计算机视觉深度估计工作的实施手段与途径进行完善,创建有效计算机视觉深度估计模式。

2.1 科学性

创建计算机深度估计体系,要充分展现科学性原则,通过科学角度分析计算机视觉深度估计活动流程、要求和重点、难点,使技术人员通过现有技术手段,创建计算机视觉深度估计全新体系。

2.2 实用性

因为计算机视觉深度估计具有多样化内容,并且具有大量操作环节。为了满足此情况,提高计算机视觉深度估计操作容错率,降低外部环境对计算机视觉深度估计活动影响。使操作难度得到降低,在短时间内开展批量操作,保证各环节计算机视觉深度估计能够顺利开展[2]。

3 计算机视觉深度估计方法

3.1 立体视觉

双目立体视觉(DFS)指的是人类得到距离信息的主要方法,为被动式视觉方法。此方法能够对如何使用二维投影图像恢复三维景物进行分析,也就是通过不同位置摄像机旋转、移动拍摄同幅场景,对两幅图像中空间点视差进行计算,以立体视觉得到此点三维坐标值。例题视觉指的是目标点在不同摄像机平面中成像点的位置差异,图1为双目立体视觉成像系统结构。

图1 双目立体视觉成像系统结构

x轴为左右摄像机成像平面中心连线,y轴和x轴垂直,z 轴为光轴。在图像1 与2 平面中心设置原点,两个相机透镜中心点距离为B。空间被测目标点p 坐标为(x,y,z),点P 在两个图像中坐标为(x1,y1)、(x2,y2),同个目标点两幅图像位置不同。假设相机焦距为f,那么此目标点在两幅图像中立体视觉差为d,得到距离目标。图像之间立体视差反比于相机测量深度,表示此方法在近距离的时候测量精准,远距离测量过程中无法保证测量精度。双目立体视觉成像系统主要包括深度计算、图像匹配、特征提取、相机建模和图像差值运算,测量过程为:

其一,通过图像1 或者图像2 寻找某特征点。

其二,寻找此特征点在图像1 或者图像2 中的匹配点,使其作为立体匹配。

其三,以上述点对匹配关系,对匹配点在摄像机坐标系中空间三维坐标进行计算。

其四,在第三步中计算匹配点三维坐标,所以其他点要利用差值法得到,实现三维重建。

立体匹配问题为双目视觉测量主要难点,国内外相关研究人员对其方面开展了大量的研究,并且提出了相应匹配算法开展实验验证。比如兼容性约束、外极限约束、连续性约束、唯一性约束等约束条件,使匹配搜索范围缩小,对正确对应关系进行确定。

3.2 运动视觉

运动视觉技术指的是使用相机和被测对象的相对运动恢复三维表面信息技术,运动视觉是将因子分解作为基础的运动估计结构(SFM),研究不同时间段变化场景的图像,将景物的位置、运动、形状等信息进行提取。主要步骤包括:

其一,提取不同时刻相邻两幅或者多幅图像的特征,并且创建对应关系。

其二,以特征点的函数关系,对物体运动与结构进行计算。图2 为运动视觉成像系统。

图2 运动视觉成像系统

常见运动视觉估计主要包括光流法、差分技术、基于块的运动分析技术等,本文对运动视觉估计差分技术进行分析。差分技术指的是图像空间域中运动估计技术,包括累积差分图像分析与差分图像分析。

3.2.1 差分图像分析

差分图像分析指的是对比两帧图像对应像素点灰度值,对相邻两帧图像变化进行检测的方法。在此方法中,帧f(x,y,j)和帧f(x,y,k)的变化利用二值差分图像DPjkf(x,y)进行表示:

公式中的T 指的是阈值,差分图像中为1 的像素点为物体运动或者光照变化结果。但是差分图像分析在使用过程中存在局限性,所以很少直接使用。

3.2.2 累积差分图像分析

累积差分图像分析(ADP)能够使差分图像分析过程中的局限性得到解决,主要思想为利用图像序列变化的分析,对小位移或者缓慢运动物体进行检测。此方法能够精准检测缓慢运动、微小运动物体,还能够对物体移动速度方向、大小、尺寸大小进行估计。累计差分图像包括一阶、二阶累积差分图像。

一阶累积差分图像的构成为:将图像序列中的每帧图像和参考图像进行对比,在差值比某个阈值要大的时候,在累积差分图像中加1。图像序列第一帧为参考图像,假如累积差分图像的初始值为0,第k 帧图像中差分图像为:

二阶差分图像为:对应第n 帧(n=0,1,...,N)的二阶差分图像处于(x,y)时候的值为1,说明此位置中第n-1 帧与第n 帧的一阶差分图像FADP 的符号不同。

利用差分技术对运动检测的主要优势就是简单,但是差分技术会受到噪声污染。改变摄像机、照明的位置和摄像机电子噪声都会出现错误数据。所以,差分技术在二维运动图像全局性粗略处理中使用,在场景活动区域中转移解释注意力,利用差分图像特征对场景中事件粗略信息提取。

3.3 单视点图像深度信息提取算法

通过深度图对图像三维场景深度关系表示,深度图是指被划分为256 个不同层次灰度图,利用字节表示像素,和观察者距离最远的表示为0,距离最近的表示为255。深度图详见图3,将原本的物体真实深度朝着深度关系转变。

图3 深度图

单视点图像像素点深度变化具备方向性,也就是深度根据某指定方向有规律地改变,并且大部分图像为线性变化,能够通过深度变化的方向对图像进行分配。单视点图像先验假设深度变化模型是通过深度梯度假设实现,创建深度梯度模式根据相应场景中几何特性信息进行检测。以不同场景表示,深度梯度创建模式以深度梯度变化划分成为:从左到右增加、从右到左增加、从上到下增加、从下到上增加、从左下到右下增加、从右上到左下增加、从右下到左上增加、从左上到右下增加。

根据人眼的视觉特点,在二维图像感知三维信息的时候,大部分都是通过图像物体的深度特征展示,比如阴影、遮挡、高度信息、大小信息等。所以在对单视点图像深度信息进行提取时,通过隐含深度特性图像特征能够得出深度线索。以提取的边缘轮廓信息的物体轮廓对深度图边缘进行表示,展现图像各个物体独立性与相邻性,图像物体边缘能够对应物体深度轮廓。图像深度关系的增加方式为从下侧到上侧,这个时候轮廓线分割比与区域指定初始值都是相互对应的。通过边缘轮廓信息分割图像区域,首先对每个区域指定深度值的分配进行假设,之后得到整幅图像深度图。

在实际使用过程中,二维图像深度图一般应用到从下侧到上侧在深度梯度中增加,也就是图像下部分区域在三维场景中映射的最近距离观察者也是最近,从下到上逐渐过渡,图像上部分区域映射到三维场景和人员距离最短的地方。通过分析高层次图像,和观察者距离最近的包括大地、湖面等,距离最远的为天空,满足从下到上深度逐渐增加的深度梯度模型。在对图像物体深度信息进行表示的时候,如果同个物体在场景中开展从近到远的排列,物体存在深度关系。为不同物体赋予指定初始深度值。以从下侧到上侧深度增加的深度梯度模型,物体底部深度值也就是物体覆盖区域深度值。所以,在对图像物体轮廓提取之后,根据物体轮廓最底端的深度初始值作为分配深度值,利用图像底端进行搜索,得到轮廓后对深度检验,然后赋予轮廓底端相应深度值,生成图像深度图。

以此可以看出来,能够通过高度深度线索实现输入图像边缘检测之后,在边缘图中以边缘幅度信息Elt 成为边缘跟踪约束:

并且添加平滑约束Es 与弹性约束Ee 跟踪强边缘,对轮廓图进行提取。通过深度假设深度分配轮廓图,利用递归深度滤波器全局优化深度图,得出单视点图像深度图。还能够以区域相似性对图像物体边缘信息进行提取,图像划分成为4*4 的像素块,假设像素块中像素深度一样,将像素块中颜色平均值作为其灰度,相邻像素块之间差异利用求解像素块平均值差的绝对值得出:

公式中的Mran(a)指的是像素块a 的颜色平均值,Diff(a,b)指的是像素块a 与b 的差异,使其表示a 与b 的相似性。如果Diff(a,b)值越小,说明两个像素块的相似性比较高,边缘可能性比较小;相反,具有较大的边缘可能性,以此推断物体边缘信息。然后通过图论分割方法将图像抽象化无向图,其中的阶段对应图像中的像素块,通过像素块差异Diff(a,b)表示边权重,以此生成图像区域最小生成树,将图像分割问题朝着无向图节点划分的问题进行转变,每个区域中的节点边权重值比较低,区域之间节点和大权重值对应,以此连通性将大权重值边去除,将子集区域创建连通图,以边缘信息实现图像分割。

基于物体边缘轮廓分割图像,利用对深度梯度检验赋予不同区域的深度信息,能够得出场景深度图。如果图像中具有不明显的特性信息,深度要通过下侧到上侧进行增加,创建梯度构件模式,具有相同的分割区域深度值,分割区域深度分配的方法为:

公式中的|Wrl|+|Wud|=1,利用Wrl 和Wud 符号与大小的调整,深度分配公式能够在不同深度梯度模式中使用。

4 结语

计算机视觉深度估计方法在实践中使用,要求技术人员根据目前技术发展实际,使被动视觉作为研究重点,对被动视觉技术原理进行明确。将实用性、科学性的原则作为基本框架,根据现有技术作为突破口形成深度估计运行模式,将其优势充分发挥出来,合理化创建计算机视觉体系,保证技术操作能够有序的开展。

猜你喜欢

深度图差分边缘
RLW-KdV方程的紧致有限差分格式
一种基于WMF-ACA的深度图像修复算法
数列与差分
基于深度图的3D-HEVC鲁棒视频水印算法
一张图看懂边缘计算
一种基于局部直方图匹配的深度编码滤波算法
叠加速度谱在钻孔稀少地区资料解释中的应用
基于差分隐私的大数据隐私保护
相对差分单项测距△DOR
在边缘寻找自我