基于嵌入式平台近景物体视觉测距系统的研究
2023-08-19郭哲
郭哲
(陕西中医药大学基础医学院,陕西 咸阳 712046)
近年来,机器人在智能生产领域发挥了重要作用,但目前而言,机器人智能化水平不高,尤其在复杂环境下机器人的适应力差、灵活度低。机器人执行任务首要面对的是近景物体,近景物体往往是阻碍其执行任务的障碍物或是机器人操作的目标物体,因此,获取机器人近景物体的位置信息对机器人智能操控至关重要。
工业领域通常采用雷达测距、超声波测距、激光测距、红外测距等方式获取目标物体位置[1-4],该类测量方式也统称为被动式测量法,其在实际测量中受外界信号的干扰较大,然而视觉测量是一种主动式测量方式,其测量时不需要向目标物体发送任何信号,信号测量范围宽、成本低[5-6]。
据统计,人类感知世界获取的信息约80%是通过人眼获得[7],对于机器人而言,通过视觉传感器测量可获取机器人周围目标的三维信息。由于视觉测量涉及图像预处理、投影变换等大量复杂的数据信息计算,使得目前大多数视觉测距系统均基于PC 架构实现,便携性、机动性受到很大的限制。为了提高视觉测量的灵活性和实用性,目前经常使用的视觉测距系统由前端采集系统和后端处理系统构成,但视频数据传输中受限于网络稳定性和带宽的影响,使得这种工作模式下系统的使用受到很大影响,且效率低下。基于移动平台的近景目标视觉测距系统模拟人眼感知三维世界原理,分析出近景目标物体相对位置,可提高机器人智能性。
1 系统总体设计
通过机器人信息采集端的摄像头采集视频图像,分析处理左右摄像头同一视角范围内的图像,利用几何学原理建立特征点间联系,重投影得出图像特征点的三维点云,分析三维点云信息,自主测得近景物体的深度。
该近景目标物体视觉测距系统的系统结构图如图1 所示,系统结构由硬件和软件两部分构成,驱动程序驱动左右摄像头采集视频图像,经Tiny6410 开发板分析处理,得出视角区域三维点云,图像应用程序利用生成的三维点云,分析得出近景目标物体深度信息。
图1 系统结构图
2 视觉测距原理
2.1 相机成像模型
摄像头采集图像原理和人类眼睛获取景物原理类似,其成像模型可简化为小孔成像模型,光线通过透镜照射到感光芯片,感光芯片捕获光信号并将其转化为数字图像信号[8-10]。相机成像模型如图2所示,P(x,y,z)为空间中目标点,经透镜投影到成像仪上的图像坐标为p(xc,yc)。相机的成像过程可理解为成像点在像素坐标系、图像坐标系、相机坐标系、世界坐标系四个坐标系间相互变换,像素坐标系坐标原点在图像平面左上角,u、v轴分别与图像坐标系U、V轴平行;以图像中心o作为图像坐标系坐标原点,U、V轴分别与X、Y轴平行;以摄像头光心O作为相机坐标系的坐标原点,与光轴重合的射线作为Z轴,XOZ平面与成像平面垂直;以Ow为世界坐标系坐标原点,取方向与光轴方向相反且与光轴平行的射线为Zw轴;这四个坐标系两两依次建立联系,便可建立世界坐标系与相机坐标系中同一特征点间的联系。
图2 相机成像模型
依据相机模型,可以经平移、旋转等变换建立世界坐标系和像素坐标系的关系为:
其中,R为目标点绕X、Y、Z轴三个方向上旋转矩阵的乘积,T为目标点在X、Y、Z轴上平移向量,表示为T=[t1t2t3]T,R、T统称为相机的外参数;M为内参数矩阵,由相机焦距f及相机感光芯片的中心相对于光轴的偏移校正参数组成。把已知大小的棋盘作为标定靶,提取特征点标定相机,通过已知特征点的坐标利用高斯消元法,便可得到相机内外参数。
2.2 视觉测量原理
视觉测量的基本原理为可以简化理解为三角测量法[11-14],三角测量法的原理图如图3 所示。相机的光轴平行且像素行对准,O1和Or分别为左右投影中心,左右两个相机的焦距f1和fr相同,左右图像中主点c1和cr的坐标值一致,特征点X在两个图像平面上的投影点为x1和xr,x1和xr在各自像素坐标系中水平位移分别为x1和xr,该特征点左右图像中视差为d=x1-xr。设f为相机的焦距,利用相似三角形原理,可推出物体离摄像头镜头的距离Z的值如式(2)所示:
图3 三角测量法原理图
通过已知大小的棋盘,利用图像特征点和像素特征点间关系我们求得相机焦距f,以及左右相机相对于世界坐标系的平移矩阵(Tl、Tr)和旋转矩阵(Rl、Rr),利用求得参数建立同一特征点与左右相机间的关系:
通过相同特征点与左右相机中的目标特征点的关系,可以得出左右相机相同特征点间关系为:
因此可以得出相同特征点在左右相机间转换的平移矩阵T和旋转矩阵R为:
2.3 重投影测距
根据相机成像原理,利用矩阵变换建立标定靶特征点和二维图像点关系,通过已知的标定靶特征点坐标(xw,yw,zw)和图像特征点(xs,ys)可推出相机的固有参数矩阵;获得相机参数后,利用二维图像特征点坐标(xs,ys)和同一特征点不同视角视差d可反推获得特征点的世界坐标系中坐标(xw,yw,zw)。依据特征点世界坐标系中的坐标,利用勾股定理便可得出特征点的距离为:
当求得特征点距离后,依次遍历比较两个特征点的距离大小,取最小值为Dmin,用Dmin依次与其他特征点距离相比较,将值小者赋给Dmin,依次遍历完所有特征点后便可得近目标物体的距离及坐标。
3 实验验证
3.1 总体架构
鉴于Tiny6410 处理平台具有高性能、易携带等优势[15-16],以Tiny6410 为处理器搭建一套视觉测量系统,通过QT 图像库为前端提供交互控制界面,利用Linux 系统下的v4l2 接口为系统采集视频图像,同时基于OpenCV 视觉库分析处理采集的图像信息。
测量工作主要分为以下三个阶段:
1)相机标定:通过给定大小的棋盘求解相机的内外参数。
2)生成三维点云:匹配左右图像特征点,将相同特征点的图像坐标通过重投影的方式转化为三维坐标点云。
3)近景物体测量定位:分析已生成的三维点云,依次遍历视角区域内所有特征点,测得近景物体的距离。
3.2 相机标定
采用等大的交叉黑白格棋盘标定摄像头,传统标定方式多采用捕捉多张不同视角棋盘图像标定摄像头,未对棋盘采集面积的屏占比做要求,该类标定方式部分畸变区域缺少有效的校正特征点,导致存在校正盲区,影响相机畸变的校正准确度[17]。该算法标定时采用投影屏占比极大化原则,具有如下优点:使得棋盘图像在视角区域的屏占比最大,同时单位面积采集图像中存在分布较为均匀的校正特征点,可保证视角区域特征点均匀分布,提高标定精度,进而获得准确度更高的畸变系数。这种相机标定方式能提高摄像头标定精度,改善图像畸变,进一步校正畸变图像,提升左右图像匹配率。
采集一帧棋盘图像后,通过直方图均衡化、灰度化等预处理方式增强图像的对比度,进而增强图像的视觉效果,提高捕捉特征点效率[18]。每采集一帧图像后,捕捉图像角点,并统计角点数量,若角点数量达到阈值,使用连线连接每行角点,同时将角点像素坐标依次写入像素坐标矩阵,相机标定采集的角点图如图4 所示。为了提高标定精度,调整棋盘的角度,依次采集不同视角的棋盘图像,直至采集到阈值数量的棋盘图像。
图4 相机标定效果图
当采集指定阈值数量的图像后,利用二维图像特征点与三维世界特征点的关系建立方程组,通过高斯消元法依次求得摄像头固有参数,同时将获得的参数存于XML 数据库文件。
两个相机标定结果如表1 所示。
表1 相机标定参数
表1 数据显示两个摄像头具有相同的焦距、不同的主点,主点坐标分别为(168,106)、(165,107),大小为320×240 图片的图像中心坐标为(160,120),表明主点和成像仪的中心有一定误差,为校正畸变,坐标转换时需添加这一部分偏移量。
3.3 生成三维点云
利用相机模型,使用矩阵变换建立棋盘特征点世界坐标和二维图像特征点像素坐标联系,求解方程组获得摄像头固有参数矩阵,当获得摄像头参数矩阵后,使用参数矩阵组成的投影矩阵和同一特征点不同视角的视差反推重投影,即可获得特征点的三维坐标。相同视角范围内的特征点三维坐标点云如图5 所示。
图5 三维点云
图像经过重投影,可得到其特征点世界坐标系中x、y、z值,大小为320×240 的图像可得到一个320×240 大小的三通道矩阵,每个通道分别存放特征点的x、y、z值,生成的三维信息按特征点坐标顺序依次存入坐标矩阵生成三维点云,该矩阵为物体的深度、大小等信息的分析测量提供依据。
3.4 近景物体测量
近景物体往往是机器人的目标物体或者是阻碍其执行操作的障碍物,机器人自主执行操作时必须首先捕获近景物体的位置,获取近景物体的位置大小信息是机器人执行操作的首要步骤。依据视觉测量生成三维点云信息,依次遍历所有特征点的坐标信息,最终测得近景物体的距离。利用该视觉系统测量目标物体,同时通过软尺进行测量对比验证,通过对不同远近的目标物体进行多次实验测量,两种测量方式的实验对比结果如表2 所示。
表2 近景物体测量
由于在实际操作过程中,软尺存在一定的使用误差,摄像头光学畸变、标定误差等因素也会影响视觉测量的精度,但通过实验分析显示软尺测量和视觉测量测量结果相对误差较小,近景物体视觉测量具有较高的准确率。
4 结论
提出一种基于Tiny6410 嵌入式平台的近景物体视觉测距技术,该技术以黑白交叉的棋盘为标定物标定相机,利用标定得出的相机参数重投影图像得出特征点三维点云,依据特征点三维点云得出距离,遍历每个特征点的距离,测得近景物体的距离,该方法操作性强、精度高,同时系统具有很好的适应性,可广泛应用于基于移动开发的自主机器人、汽车导航等领域,具有一定应用价值。