基于双目视觉的三维场景图像表面重建算法
2024-03-01杨力
杨 力
(广州华立学院,广东 广州 511325)
0 引言
三维图像与平面图像有着本质区别,前者同时具有高度、宽度与纵深,而后者只有高度和宽度。对于视觉相机来说,平面图像只能传达简单的信息,而三维图像所能传达的内容更加复杂,图像区域中景观节点的表现层次也更加立体。图像重建就是利用数字化方法处理物体外部测量数据,从而获得三维物体形状信息的技术手段[1]。视觉相机作为重建图像所必需的设备元件,其对于像素信息的采集能力决定了重建后图像的视觉表现效果。随着计算机视觉技术的不断发展,三维场景图像的表面重建成为了一个热门的研究领域。特殊景物环境中,如果外界因素影响了视觉相机所采集到的像素信息的清晰度水平,那么复原后图像的视觉表现效果也无法达到实际需求标准。因此,在视觉处理过程中,保障视觉相机对像素信息的采集能力也是提升重建后图像基础像素水平的必要条件。
当前已有相关领域研究学者对三维场景图像表面重建算法做出了研究。刘翔宇等人通过改进贪婪投影三角化算法的方式重建三维场景图像[2]。首先利用体像素网格滤波算法完成对像素点云信息的采样;然后按照移动最小二乘计算原则,对视觉相机识别到的像素点云信息进行平滑重采样处理,且采样过程中,使用八叉树结构代替传统KD 树结构,实施对近邻域范围内像素点的深度搜索;最后根据点云法线所在位置估算投影三角形,从而完成对三维图像的重建。
宋力争等人则提出一种基于深度学习的三维重建思想,利用深度学习模型判断每个像素点的异方差水平,并在patch⁃match 算法的支持下,收集与三维像素对象相关的先验信息,从而在计算像素点异方差不确定度水平的同时,调整视觉搜索区域,完成对三维图像的重建[3]。然而在特殊的景物环境中,像素信息无法保持完全均匀的分布状态,这就使得图像的整体视觉表现效果较差。改进贪婪投影三角化算法和深度学习模型在面对当前情况时,并不能使重建后图像的像素色度恢复至均匀状态,故而其重建能力也就达不到实际需求标准。
针对上述问题,本文设计一种新型的三维场景图像表面重建算法。首先,确定视觉相机的内参、外参标记结果,通过极线校正双目图像的处理方式,完成基于双目视觉的三维场景图像标定;然后,求解像素代价聚合条件,根据像素节点的三维视差推导图像表面的重建表达式,完成基于双目视觉的三维场景图像表面重建算法的设计。实验结果表明,双目视觉技术作用下,三维场景图像的像素色度呈现出较为均匀的分布状态,符合提升图像视觉表现效果的实际应用需求。
1 基于双目视觉的三维场景图像标定
基于双目视觉技术标定三维场景图像,就是根据相机内参、相机外参指标的取值,完成对双目图像的极线校正处理。
1.1 相机内参
相机内参是指双目视觉相机在获取三维场景图像时,画面内场景像素的构图参数[4],其取值影响像素色度的分布情况。在对三维场景图像进行表面重建时,相机内参的取值决定了双目视觉相机对于场景内像素节点参量的捕获能力。
通常情况下,为满足精准重建的处理需求,设置相机内参时,应将三维场景图像规划成多个等大小但不相互覆盖的独立像素区域[5]。
定义三维场景图像中的单位像素区域,其计算公式为:
式中:ΔE表示图像画面内场景像素的单位数量;δ表示三维场景图像的构图参数;表示视觉像素的水平色度特征;表示视觉像素的竖直色度特征。
双目视觉相机内参的计算公式为:
式中:β表示图像画面内场景像素的标记系数;χ表示内参系数记录值;α表示双目视觉相机对于图像画面内场景像素的捕获参数。
1.2 相机外参
相机外参是指双目视觉相机在获取三维场景图像时,存在于图像之中但却不包含在场景画面内的像素构图参数。相机外参的取值决定了双目视觉相机对于场景外像素节点参量的捕获能力[6]。在三维场景图像之中,场景外像素节点的数量远小于场景内像素节点,因此双目视觉相机必须先定义相机内参,再定义相机外参。
双目视觉相机外参的计算公式如下:
式中:ε表示画面场景外的像素标记系数;表示外参系数记录值;表示双目视觉相机对于图像画面外场景像素的捕获参数;ϕ表示画面场景外的像素构图系数。
1.3 三维场景图像的双目极线校正
双目极线校正消除了三维场景图像中的像素误差,利用极线约束条件,描述了像素点与表面像素连线之间的对应关系,从而使得双目视觉相机在极线两侧都能找到与目标像素对应的重建图像节点[7]。完成双目极线校正后,极线两侧三维场景图像能够保持完全对称的存在状态。
在三维场景图像中,随机选取n个像素点对象,其取值满足如下条件:
联立式(2)~式(4),可将三维场景图像的双目极线校正表达式定义为:
式中:U表示目标像素;φ表示像素节点校正参数;O表示双目极线偏转系数。
1.4 三维场景图像标定
标定三维场景图像就是根据双目视觉原则,标记符合重建标准的节点对象,再定义唯一的数值映射条件,将这些像素节点关联起来[8]。利用公式(5)推导出基于双目视觉的三维场景图像标定表达式,如下:
式中:γ表示基于双目视觉原则的像素对象取样参数;λ表示三维场景图像中已取样像素对象的标记系数;表示像素对象的数值映射特征。为按照双目视觉原则完成对三维场景图像的标定,建立像素对象的数值映射关系时,还必须保证像素节点取样值的唯一性。
2 面向标定对象的三维场景图像表面重建算法
通过三维场景图像标定能够确定摄像机的内部参数和外部参数,从而提供更可靠的摄像机投影模型,并且能够校正双目极线,以消除三维场景图像中的像素误差,提高三维重建的准确性和稳定性。
三维场景图像表面重建算法的设计包含像素代价聚合、像素节点三维视差计算、重建表达式求解等三个处理环节,本章节将针对其具体设计方法展开研究。
2.1 像素代价聚合
按照双目视觉原则,在图像区域内进行像素代价聚合处理,可以将画面内、画面外的像素信息聚合在一起,从而准确计算出三维场景图像中像素代价的平均值[9]。以像素代价聚合条件为基础,完成对三维场景图像表面的重建,能够拉近局部像素信息与非核心区域内像素信息的相关性,避免重建图像中出现空白区域。
对于像素代价聚合条件的求解参考如下公式:
式中:κ表示三维场景图像中局部像素信息提取参数;s表示非核心区域内像素信息的提取参数;表示像素代价估算特征。
2.2 像素节点三维视差
像素节点三维视差从误差估算值角度评价了三维场景图像表面重建算法的应用能力。双目视觉机制规定像素节点的三维视差值越大,重建后三维场景图像中对应节点出现偏离的可能性就越小,也就是重建后图像的误差水平越低[10]。所谓三维视差就是指水平、竖直、空间三个维度上的像素信息视觉效果差值。由于双目视觉相机采集像素节点时,映射光线与标准坐标轴方向必然存在一定的夹角,所以图像的重建也必须考虑光线夹角问题。
设g1表示水平方向上的视觉像素信息分量;ϖ表示水平方向上的映射光线夹角;g2表示竖直方向上的视觉像素信息分量;θ表示竖直方向上的映射光线夹角;g3表示空间方向上的视觉像素信息分量;ϑ表示空间方向上的映射光线夹角;联立公式(7)可将基于双目视觉的像素节点三维视差表示为:
2.3 三维场景图像的表面重建表达式
利用双目视觉技术完成三维场景图像的表面重建,像素节点必须均匀分布在场景物体表面,且同一区域内,像素节点之间不可以存在相互覆盖的情况。
利用式(8)可将三维场景图像的表面重建表达式表示为:
式中:f表示三维节点像素的恢复参数;μ表示像素节点在三维场景物体表面的分布系数;h表示基于双目视觉技术所提取的三维场景图像重建特征;表示单位图像区域内的像素信息累积均值。
3 实例分析
为证明基于双目视觉的三维场景图像表面重建算法的有效性,以文献[2]提出的改进贪婪投影三角化算法的三维重建方法、文献[3]提出的基于深度学习的三维重建方法作为对比方法,验证三种方法的实用差异性,对比实验设计如下。
3.1 实验条件
实验选取某城市建筑施工区域,基地横向长度9.5 km、纵向长度2.7 km,工程区域内存在多个大小不一的地下基坑,以建筑物现场场景图像的像素信息作为实验对象。将视觉相机捕捉到的场景图像输入处理软件之中,并按照对应性原则将图像场景信息与像素节点关联起来,具体对应关系如图1 所示。
图1 场景图像中的像素对应关系
本次实验随机选取6 个像素单元作为目标重建节点,且这些像素节点存在于不同的图像区域之中,不存在相互重叠的情况。
3.2 实验方法步骤
像素色度均匀程度影响重建后图像的视觉表现效果,在三维场景图像中,只有保障像素色度的均匀分布状态,才能够增强重建后图像的视觉表现效果。
本次实验通过分析三维场景图像的像素色度均匀程度来判断重建后图像的视觉表现效果。本次实验的具体执行流程如下:
1)对图1 中的像素节点进行编号,并确定像素节点所处的具体图像区域。
2)应用基于双目视觉的三维场景图像表面重建算法对所选像素节点进行重建处理,并分别记录重建后各个节点处的像素色度水平,所得结果为实验组变量。
3)应用改进贪婪投影三角化算法的三维重建方法对所选像素节点进行重建处理,并分别记录重建后各个节点处的像素色度水平,所得结果为A 对照组变量。
4)应用基于深度学习的三维重建方法对所选像素节点进行重建处理,并分别记录重建后各个节点处的像素色度水平,所得结果为B 对照组变量。
5)根据像素色度记录值,总结实验规律。
3.3 实验结果分析
对图1 重建,获取三种方法的三维场景图像表面重建图像,如图2 所示。
图2 三维场景图像表面重建图像
分析图2 可知:实验组三维场景图像表面重建后,图像清晰度较高,像素色度均匀分布,提升了图像视觉表现效果;而A 对照组、B 对照组的三维场景图像表面重建效果较差,重建后的图像较模糊。
图3 反映了重建后各个节点处的像素色度水平。
图3 三维场景图像表面重建后的像素色度水平
分析图3 可知:实验组像素色度最大值为501 PPI,最小值为209 PPI,二者差值为292 PPI;A 对照组像素色度最大值为593 PPI,最小值为10 PPI,二者差值为583 PPI,高于实验组差值水平;B 对照组像素色度最大值为674 PPI,最小值为48 PPI,二者差值为626 PPI,也高于实验组差值水平。
4 结语
本文设计一种三维场景图像表面重建算法,在双目视觉技术的支持下,完成对图像信息的标定,联合像素代价聚合条件,定义具体的三维场景图像表面重建表达式。实用性方面,基于双目视觉的三维场景图像表面重建算法可以保障三维场景图像的像素色度呈现出较为均匀的分布状态,在解决由像素色度不均匀造成的图像视觉表现效果较差方面,具有较强的实用性。