一种仿人足球机器人视觉系统环境特征获取与识别方法

2013-08-13王亚东雷国华于燕飞许宪东

黑龙江工程学院学报 2013年2期

王亚东，雷国华，安波，于燕飞，许宪东

（黑龙江工程学院计算机科学与技术学院，黑龙江哈尔滨150050）

环境感知是仿人机器人系统进行决策的前提和基础。不同于传统的轮式机器人所具有的超声传感器、激光测距仪、视觉传感器等多种传感器。在当前的仿人机器人足球比赛中，通常只具有单目或双目视觉传感器。目前仿人足球机器人视觉系统的主要难题集中在以下两个方面：一方面是图像的彩色分割，常用的是阈值法和查找表法。比赛环境通常是一个已知的结构化环境，所有待识别的目标都用规范化颜色标识，因此，研究较多的是基于颜色特征来分割图像，应用比较多的有RGB、YUV和HIS三种颜色模型［1－4］。另一方面要对物体根据各自的特征进行识别，在足球机器人比赛环境中，场地内的球门、球、标识柱、场地线以及双方机器人是需要识别的特征。在仿人机器人竞赛中，机器人一般以固定的时间间隔拍照，对所获得图像序列进行处理，获得周边的环境信息，如球、机器人和门框等，进而根据所获得的球的颜色或其它信息进行运动决策。但是，由于机器人摄像头所观察的区域不能覆盖前方整个比赛区域，造成机器人无法获得正确决策所需的信息。因此，在机器人比赛中，如何获得完整的前方信息是关键。由于在一定点所获图像一般只是其前方一部分区域，但是机器人在该点可以左右转动头部，获得两侧的信息，显然这些照片通常是有交叉的，本文提出通过图像拼接技术获得完整的前方图像。

图像拼接技术就是将多张有重叠的图像拼合成一个大的图像的技术［5－7］。其基本思想是找到2幅图像的重叠部分，通过去除重叠区域拼接成1幅图像。图像拼接常可以分成图像配准和图像融合。配准的目的是根据几何运动模型，将图像注册到同一个坐标系中。融合则是将配准后的图像合成为1张大的拼接图像。目前应用比较多的是基于特征的图像匹配方法。基于特征的方法实现过程大致要经过特征查找、匹配和运动关系求解3个过程。其主要有基于Harris特征检测器、尺度不变特征检测（SIFT）算法等。

1 仿人机器人的图像拼接技术基本原理

本文提出基于图像拼接技术的仿人机器人赛场环境特征提取方法，其基本流程如图1所示。

图1 算法流程

1.1 SIFT特征点的提取

Lowe［8］总结了现有的基于不变量技术的特征检测方法，提出了SIFT算子，SIFT特征匹配算法包括SIFT特征的生成（从多幅待匹配图像中提取出对尺度缩放、旋转、亮度变化无关的特征向量）和SIFT特征向量的匹配2个阶段。本文采用SIFT算子进行拼接，基本过程如下：提取机器人A所获得的图像A与机器人B所获得的图像B的SIFT特征，生成SIFT特征，描述其特征检测基本思想：尺度空间极值检测，以初步确定关键点位置和所在尺度。1幅图像在不同尺度下的尺度空间定义为图像I（x，y）与高斯核G（x，y，σ）的卷积：

其中：L为图像的尺度空间，（x，y）为图像的像素坐标，σ为尺度坐标。在图像二维平面空间和DoG尺度空间中同时检测局部极值作为特征点，从而使特征具备良好的独特性和稳定性。DoG算子定义为两个不同尺度的高斯核的差分，是归一化LoG（Laplacian－of－Gaussian）算子的近似。DoG 算子表示为

即在图像尺度空间内遍历所有的点，并且判断其与邻域内点的大小关系，如果该点的值大于或小于邻域所有点的值，则该点为候选特征点。通过拟和三维二次函数以精确确定关键点的位置和尺度，同时去除低对比度的关键点和不稳定的边缘响应点（因为DoG算子会产生较强的边缘响应），以增强匹配稳定性、提高抗噪声能力。

1.2 用图像A和图像B的特征构建K－D树，采用最近邻优先搜索进行搜索匹配

所谓的特征点匹配本质上是一个通过距离函数（如欧式距离）在高维矢量之间进行相似性检索的问题。最近邻搜索的基本原理：给定一个多维空间R，R中的一个向量为一个样本点。R中样本点所构成的有限集合称为样本集。对于给定样本集E以及一个样本点d，d′为d的最近邻点是指对于任何样本点d′∈E满足：

式中：di是向量d的第i个分量。

具体过程如下：对参考图像A的SIFT特征点建立K－D树。对待配图像B的每个SIFT特征点feather＿node，采用最邻近点搜索算法找到最邻近点feather＿node1和次邻近点feather＿node2。采用近似最近邻优先搜索进行搜索匹配，通过计算feather＿node与feather＿node1和feather＿node2的距离进行匹配。

基于K维树的SIFT特征点的匹配算法：

输入：图像1的128维向量SIFT特征点集合

图像2的128维向量SIFT特征点集合

输出：匹配的SIFT特征点对的匹配链表

1）构建K维树；

2）初始化匹配链表为空；

3）对在图像2特征点中的每一个SIFT特征点

调用最近邻优先搜索进行查找匹配点

返回最邻近点feather＿node1和次邻近点feather＿node2

Then

将（feather＿node1，feather＿node）添加到匹配链表

由上述方法得到的匹配点有误差点的存在，可称之为伪匹配点。

1.3 RANSAC剔除误点，计算单应性矩阵，进行拼接

随机采样一致（Random Sample Consensus，RANSAC）算法［9］，是一种从样本中准确拟合数学模型的算法，包括去除噪声点（外点）和留下有效值。该算法假设符合数学模型的数据点是内点，不符合的是外点。采用RANSAC剔除误点的过程如下：

1）随机从3种得到的伪匹配点中选择4对匹配点，计算变换矩阵H；

2）计算每对伪匹配点与H的距离d；

3）设定距离阈值，若内点距离小于阈值T，则为内点，并在内点域上重新估计H；

4）重复以上随机采样n次，直到获得最大的内点集合；依此集合估计拼接所需图像变换矩阵。

确定图像的拼接位置之后，简单地叠加处理会造成在图像叠加区域出现与周围明显的区别。因此，这里采用双线性插值方法对图像进行进一步的融合处理。

1.4 对拼接所得图像采用Canny算法获得边界等信息

迄今有许多边缘检测算法，如Laplace算法、Sobel算法、Robert算法、LOG算法以及Canny算法等。Canny算子具有很好的边缘检测性能，其具有信噪比大和检测精度高的优点，被广泛应用，因此，本文选用Canny算法［10］提取边缘。

采用Canny算子边缘检测的基本步骤如下：

1）采用高斯滤波器对图像进行平滑处理。

2）计算图像的梯度和方向。

3）采用非极大值抑制，获得细化边缘。

4）通过双阈值算法检测和连接边缘。

2 实验与分析

实验中采用小型仿人机器人MOS2007，其所携带的摄像头功能有限，采用单目摄像头，能够观察的范围较小，在实际的比赛中，很难准确地获得环境信息，从而识别定位目标球与守门员。实验中机器人决策前在球门前方获取环境图，再将头部摄像头旋转30°后获得另一幅图。实验结果如图2～6所示，其中图2和图3为所获原始图像，图4为提取图像匹配特征点示意图，图5和图6为拼接后图像及进行Canny特征提取后效果。

图6 Canny处理后图像

3 结束语

可以看出，采用基于SIFT的图像拼接方法可以较好地获得环境图像的特征，而Canny算法能够较好地获得赛场环境（球门，跑道）的直线特征，相对于传统的单一通过颜色方法进行目标识别要更为直观和准确。这种方法的缺点是SIFT特征点的提取与处理要花费较多的时间，且如果赛场环境较单一（如只用颜色标定球门等，角点等信息较少），则效率较低。

［1］陈凤东，洪炳熔，朱莹.基于HIS颜色空间的多机器人识别研究［J］.哈尔滨工业大学学报，2004，36（7）：928－930.

［2］白力勇，黄鸿，赵增荣.基于RoboCup中型组足球机器人视觉图像识别的一种快速算法［J］.自动化理论、技术与应用，2006，3（10）：347－351.

［3］李动恒，张泽峰，陈小平，等.基于图象分割的机器人视觉系统的设计与实现［J］.小型微型计算机系统，2003，24（2）.

［4］杨红颖，吴俊峰，于永健，等.一种基于HSV空间的彩色边缘图像检索方法［J］.中国图象图形学报，2008，6（10）.

［5］钟力，胡晓峰.重叠图像拼接算法［J］.中国图像图形学报，1998，3（5）：365－369.

［6］王玉珍.边缘重叠图像拼接中的特征块选取［J］.西北师范大学学报：自然科学版，2002，38（1）：38－40.

［7］支玲玲，葛庆平，姬照中.边缘颜色匹配算法在计算机拼图中的应用［J］.计算机工程与设计，2010（16）.

［8］Lowe D G.Distinctive image features from scale－invariant keypoints［J］.Internatioal Journal of Computer Vision，2004，60（2）：91－110.

［9］周剑军，欧阳宁，张彤，等.基于RANSAC的图像拼接方法［J］.计算机工程与设计，2009，30（4）：5692－5693.

［10］王植，贺赛先.一种基于Canny理论的自适应边缘检测方法［J］.中国图象图形学报，2004，9（8）.