APP下载

基于仿人机器人的视觉技术探析

2021-04-04陈浩天

信息记录材料 2021年5期
关键词:单目高尔夫球颜色

陈浩天

(徐州工程学院信息工程学院 江苏 徐州 221000)

1 引言

人工智能作为当今最热门的技术,活跃在全球各个领域。在诞生之初,麦卡锡就提出人工智能的关键因素应该是创造一个可以完全单独解决复杂问题的智能系统。机器人技术的发展在这一理念的指导下日趋成熟。如今,各种类型的机器人不仅可以模仿和还原人类的一些活动,帮助人类完成一些简单易做的枯燥工作,甚至可以在一些特定领域执行一些危险性高的精密工作。可以说,机器人的蓬勃发展代表着我们已经走到了下一次工业革命的大门。

然而,随着任务量的增加和应用领域的迅速扩展,对仿人机器人感知能力的要求也越来越高。与人获取信息的途径类似,视觉技术是机器人获取信息至关重要的感官。对不同领域特定图像识别任务的研究决定了机器人工作质量的上限。在此背景下,本文以软银NAO机器人在中国机器人技能大赛高尔夫比赛中的任务为背景,分析了NAO图像识别的相关技术。

2 仿人机器人NAO视觉系统

NAO机器人是法国研制的一种人形机器人。NAO拥有25个自由度,动作灵活。它还配有一个惯性导航仪装置,在移动时十分平稳,并可随时确定自己的位置[1]。因为其出色的工业设计水平和极高自由度的二次开发接口,是目前非常主流的高校教学科研类人机器人平台。

NAO机器人通过头部的两个高清摄像头检测环境信息,920万像素,30帧/秒的图像分辨率。在NAO视觉系统运行过程中,两个摄像头各司其职,一般不会同时运行。下方摄像头用于更近距离的视觉识别,上方摄像头用于更长时间的扫描。NAO两摄像头视野夹角为四十度,系统可以根据两个摄像机的视场和得到的视觉环境计算出目标与NAO的相对坐标。

3 仿人机器人相关视觉技术

3.1 视觉信息特征分类

用于图像模式识别的特征大致可归纳为:(1)颜色或灰度的统计特征;(2)纹理、边缘特征;(3)代数特征;(4)变换系数特征或滤波器系数特征[2]。针对NAO的实际算法设计和使用场景,本文主要讨论前两者。

在二十世纪八十年代,一些学者创造性地发明了用直方图的形式来表示颜色模型。其原理是对于颜色特征,进行对应特征向量的变换,进而表现为直方图的形式,一直沿用至今。

形状特征也是机器人视觉信息处理过程中不可缺少的特征,在机器人视觉信息处理中有着广泛的应用。在大多数图像目标识别的任务中,因为形状信息对识别结果有着更至关重要的影响,所以和颜色特征相比,形状特征层次更高。形状特征可以分为两部分进行研究和讨论。一种是轮廓特征,主流是傅里叶描述子方法。二是地域特征,常见的是不变矩法。

3.2 图像分割

在图像处理中,我们往往需要根据特征处理的具体情况对图像进行分割,这使得我们的视觉信息处理更加高效和准确。这里我们主要讨论两种方法:基于像素的和基于边缘的。

当我们面对图片中相邻像素点灰度值差异较小,但整个图片的像素值分布比较离散的情况时,直方图是一个很好的工具,这属于基于像素的图像分割范畴。当我们要分割这类图像时,可以根据像素直方图的极高值和极低值分别选择和分割目标。这种方法也叫按激素聚类法。常用的方法有K-MEANS和C-means。聚类分析方法有些简单易行,但缺点是聚类数的统计不容易准确,在目标平移和旋转时干扰较大。这属于基于像素的图像分割。

而对于基于边缘的方法,是从灰度图片分析演化而来的,之后为了对只从灰度图片分割做补充,出现了距量保持法分割子块等技术。

3.3 视觉信息处理算法

3.3.1 OpenCV相关算法

OpenCV(open source computer vision library) 诞生于Intel研究中心,是一个开放源码的计算机视觉库[3]。于1999年出现,在高校计算机视觉相关科研领域和工业应用领域被广泛应用。不管是图像、视频还是信号的分析处理任务,其都能很有效的应用。

3.3.2 基于Hough变换的轮廓提取

Hough变换在图像的边缘检测领域内是应用非常广泛且高效的算法。这种算法的核心即把目标空间中的坐标变换到参数空间中,对应参照的某一曲线或曲面。因此,拥有一样的参数特征的点,在这一交换过程后,会在对应的参数空间中产生交集。基于此,评估在交点处的累计程度以此来获得所需的特征曲线的检测数据。Hough可以随着参量性质的改变,变换成数种不同的图形,包括基础图形——直线、椭圆以及进阶图形——双曲线、抛物线等[4]。在此过程中,为了优化变换效率,提高变换的精度,我们可以采取计算概率的方法,采用分层迭代的思想,并将级联的方法加入进去,从而达到这一目的。

3.3.3 颜色空间之间的转换

空间模型相对于一个物体来说,是指存在于三维空间中的一个子集,这个子集包含了颜色领域中所有的颜色,与此同时,这个子集还有一个要求,那就是子集本身必须是可见光子集。由于颜色模型的用途主要是代指颜色域中的一个特定色彩,并且可见光子集包括了任何一个颜色域,因此通过推断我们可以判定,所有的可见光不能同时被纳入颜色模型之中。此外,虽然相当一部分的显示装置都是基于三原色这一原理基础的,连带普通的图形学说都是采用RGB的模型,但是因为从作用联系上来说,三原色与色彩明度、色调等其他颜色参数并没有本质上的关联,所以并不采用RGB模型作为颜色模型。

在三原色当中,绿色和蓝色是十分接近的,通常情况下只能采取调整亮度的方法进行两者的相互转化。当三个自变量中的两个具有十分高的相似度,这就意味着通过改变自变量的参数的方式获取相对应的应变量数值的操作将会变得较为复杂。除此之外,在三原色模型学说提出之初,每个颜色之间的设定本就不够严密完善,颜色与颜色之间的每项数值都不能很明确地用距离来表现。基于以上列举的两个原因,我们将采用HSV模型代替RGB颜色模型的方式来进行算法的执行。

HSV是利用色调H、饱和度S和亮度V这三个色彩的基本属性来确定颜色的。它对应一个倒立的六棱锥,六棱锥的顶部V=1,它包含RGB颜色模型中R=1,G=1和B=1的三个面,颜色最亮[5]。

4 目标定位的实现

根据现有的视觉测距技术,我们可以将信息感知的总体分为下述两种,分别是以单目视觉为基础和立体视觉为基础的距离测量方式。常规来说,只有使用立体视觉的系统才可以获得对象环境的三维空间环境。但由于立体视觉技术的系统计算量庞大,难以运用到实际操作中去,相较之下,基于单目视觉的测量技术在结构和成本等方面来讲都优于前者,并且它所对应的摄像机标定的计算方法也更易方便操作。不仅如此,后者还可以免去立体视觉的一些弊端,举个例子,立体视觉在现实场景运用中,其视觉范围较小,三维立体的匹配也有较大的难度挑战。在一系列对比下,单目视觉的测距技术显得实用性很强。在此情况下,单目视觉应用于现实生活中的智能车辆与可自行移动的机器人的视觉系统中,以此来实现识别与追踪所规定的目标。

在我们谈及视觉信息分析领域时,对于单目视觉无疑有两个最重要的处理方式,第一是帧内的,第二则是帧与帧之间的。在计算机执行具体任务的时候,两种方法通常是混合使用的。

在NAO执行高尔夫任务时,主要基于单目比例缩放的几何相似算法进行定位。即当目标坐标都在一个面上的时候,目标与这个面平行,并且与摄像头系统的光轴相垂直。基于基础光学理论,目标此时与图像信息中的图像具有相似的属性,根据计算得到的倍数,即可得到目标的实际坐标位置。在实际的高尔夫球击打任务中,因为投影在图片上显示出来是圆形,即当NAO在寻球任务阶段中只要发现了高尔夫球,不管球在哪个相对位置上,都可以沿着球圆心向着视线中线作一个垂直面,高尔夫球被侦测到的轮廓可以理解为这个垂直面在现实中与高尔夫球的相切面。以此思路继续,我们可以算出侦测点与球的距离,进而求得NAO需要前进的方向与水平距离,相关信息可以用于后续运动控制的决策。

5 视觉技术应用展望

在实际任务执行过程中,发现视觉处理的效果上依然存在三方面的明显不足:一是在光线变化下颜色识别不准确,在应用中体现的即是识别不到红色高尔夫球或是被别的红色物体如红色地标杆干扰;二是静态视觉识别与动态活动控制的矛盾,即当NAO静态识别出高尔夫球的相对位置并且规划出路径之后,有时会因为机器人电机过热,行走姿态出现偏差引起单步步幅过大,停止位置太近导致下一次寻球工作无法进行,球完全无法出现在NAO视野范围内;还有的时候会因为NAO行进过程不够笔直导致停止位置与预期到达位置偏差太大,球无法进入预设好的视野范围,最终无法进入击球环节。三是当坐标计算偏角太大时,机器人的位置计算会出现较大误差。这些误差主要由于双足机器人的先天缺陷导致,即预设的长距离运动误差较大。克服这个问题主流的方法是将动态实时视觉反馈机制与步幅控制结合来进一步优化,绕过对机器人进行长距离的运动规划,实现精度提高。

6 结语

综上所述,本文在机器人NAO视觉系统的基础上,基于NAO在执行打高尔夫球任务时的技术特点,从NAO的基础硬件分析,到其涉及的相关计算机视觉技术,最后介绍了目标定位实现的思路与不足。

猜你喜欢

单目高尔夫球颜色
Lonsdale Links高尔夫球俱乐部
一种单目相机/三轴陀螺仪/里程计紧组合导航算法
迷你高尔夫球比赛
基于单目视觉的仓储物流机器人定位方法探讨
高尔夫球
单目SLAM直线匹配增强平面发现方法
基于CAD模型的单目六自由度位姿测量
特殊颜色的水