基于深度学习的智能机器人自主跟随算法研究
2022-07-23龚波涛汪孔屏张雷
龚波涛,汪孔屏,张雷
(国网上海市电力公司工程建设咨询分公司,上海 200120)
随着信息社会的不断发展和人民生活水平的日益提高,人们对于智能化服务设备的要求也越来越高[1]。目前,智能机器人已逐渐成为日常生活中较为常见的智能化设备,无论是在公共服务、医疗保健、居家保洁等领域均有广泛的应用[2-3],但对于环境具有感知、决策和适应能力的自主式智能机器人是当前研究的难点。
自主式智能机器人的自主跟随算法,是保证其完成指定任务的关键所在。现有的自主跟随算法大多只能按既定路径跟踪和执行任务,对于程序未涉及或突发的情境无法进行处理。此外,也存在部分算法具备一定的自主学习能力,但跟踪精度与效率难以满足现代生活对于机器人智能化的要求[4-5]。
针对上述问题,该文提出了一种基于深度学习的智能机器人自主跟随算法。利用搭建的智能机器人平台获取目标信息,并采用深度学习算法分析目标位置信息。从而能够主动识别并学习外界环境的变化,高精度、高效率地完成多场景的自主跟随任务处理。
1 自主跟随智能机器人的设计
自主跟随机器人需要跟随目标进行移动,目前机器人的移动方式主要分为履带式、步行足式、轮式[6]。其中轮式移动机器人具有较好的运动能力,简单的筒式机械结构使其适用性更为广泛。因此,该文研究的智能机器人采用轮式结构[7]。
1.1 智能机器人的机械结构
轮式智能机器人按车轮数目可以划分成单轮、双轮、H 轮、四轮,其中H 轮和四轮的稳定性较为理想[8]。自主跟随智能机器人的功能目标在于跟随与载物,因此采用四轮结构。其包括了两个支撑轮和两个独立驱动轮,通过差速驱动的方式,实现机器人的转向。
机器人的底盘盒设为圆形,以便更优地完成转弯等运动。并在底盘盒中放置电池、电机驱动器安装跟随控制系统,这些配置具有一定的重量,在一定程度上保证了运动的平稳性。同时在底盘盒上通过支撑杆衔接一个托盘,可用于放置物品。支撑杆的长度是0.8 m,便于搭载目标识别器件,如云台和摄像机。驱动轮轴上安装有减速器与编码器,可通过平键连接。
1.2 几何建模
为了便于描述机器人的运动,对其进行几何建模,机器人的瞬时旋转中心和回转半径定义为G和R。机器人的方向由垂直于前轮轴的主轴给出,且之间的角度φ为方向角。机器人的二维平面模型,如图1 所示。
图1 机器人二维平面模型
假设机器人的运动是纯平移与纯匀速旋转,则智能机器人有两种类型的运动:笛卡尔坐标系直线运动和圆形运动。数学模型公式,如下所示。
直线运动方程:
圆周运动方程:
式(1)、(2)中,φ为机器人轴的方向角,rw为车轮半径,N为运动周期,ωg为回转角速度,ωr为车轮的角速度,s为采样期间的旋转步长。
从而可以推导出机器人的运动状态与车轮速度的关系为:
式(3)中,2L为两轮轴之间的长度,v1、v2分别是两轮的速度。
2 提出的自主跟随算法
智能机器人基于摄像头获取目标的信息,并利用深度学习分析目标位置信息,从而完成目标自主跟随。
2.1 深度自编码
深度学习(Deep Learning,DL)的核心在于通过增加抽象级别学习数据的表示,而在更高层次上的抽象表示均通过在较低层次上的不抽象表示来完成定义[9-10]。这种分层学习过程较为强大,因为DL允许系统直接从原始数据中理解和学习复杂的表示,使其在众多学科中广泛应用[11]。目前,已有的DL结构包括深度神经网络、卷积神经网络、深度自编码器、深度玻尔兹曼机、深度信念网络、深度残差网络等[12-13]。
深度自编码(Deep Autoencoder,DA)是通过堆叠多个自动编码器而获得的,这些自动编码器是数据驱动的无监督模型。并将输入量自动投影到较输入量更小的维空间以降低数据维度,其结构如图2 所示。在自动编码器中,输入/输出层使用等量的单位,而隐藏层使用较少的单位。非线性/线性变换体现在隐藏层单元中,并将给定输入编码转为更小的维度[14]。虽然DA 需要一个预训练阶段,且存在部分消失错误,但因其数据压缩能力较强,并拥有多种变形结构,例如去噪自动编码器、稀疏自动编码器、变分自动编码器等,目前已获得了广泛应用[15]。
图2 DA的结构
当用于多模式学习时,完全连接的自编码器和DA的一个局限性均忽略了多维图像结构[16]。这样,输出不仅与普通大小的输入有关,且还引入了部分参数,这些参数使得每个特征均跨越了整个视界。为此,该文通过引入卷积自编码(Convolution Autoencoder,CA)实现了权重在输入中的实时共享,从而保留空间局部性。
设输入数据是Z={z1,z2,…,zn},滤波器映射定义成H={h1,h2,…,hm},数据深度是D,滤波器的尺寸是( 2k+1,2k+1,n)。通过卷积运算获得m个数据深度是D的激活映射,其数学表达式为:
式中,α是非线性的,滤波器映射所对应的数据为p∈{1,…,m}。
上述激活映射即为数据Z的低维度编码描述。采用Max-pooling 处理方式完成输入数据大小的下采样,且经过两层隐含层传输这一激活特征映射,并将其投影至d维的公共子空间。
此外,在解码环节中采用反卷积,以将数据重新投影至原始空间。其与常规卷积一致,只是加大了输入数据的维数。最终,CA 中输入数据的重建由输入数据最小化与重构数据间的损失共同实现。即数学描述式为:
2.2 基于CA的智能机器人自主跟随算法
基于CA 学习模型提出了机器人自主跟随算法,其流程如图3 所示。
图3 基于CA的自主跟随算法流程
智能机器人首先接收目标坐标,已知其(O,X,Y)坐标系中的实际位置。然后基于摄像头数据掌握环境和周围障碍物情况,估计下一步要执行的动作。机器人通过该文算法获取最优化的跟随位置,并参照已有参数计算出距离信息,设定参考跟随距离。在此基础上,对比经过深度学习算法得到的实际距离值与设定阈值之间的大小关系。若实际距离值超过设定阈值,则机器人加快跟进;若实际距离值低于设定阈值,则机器人减慢跟随速度。
3 实验结果与分析
实验在Google Colab 上进行,内存为12 GB,CPU为Intel(R)Xeon(R)2.30 GHz。在CA 网络中,批大小设置为256,epoch 数设为25,并使用Adam 优化算法进行参数训练。实验中智能机器人云台上搭载的摄像头分辨率为2 048×2 048,各像素点转换成距离后约为6 mm。
3.1 跟随准确性分析
在目标与智能机器人上分别人为设置一个记号,通过Motive 光学捕获软件实现记号的不间断跟踪,则摄像机获得的每一帧记号即是目标与智能机器人的运行轨迹点。利用Matlab 处理这些轨迹点,从而获得目标与跟随机器人的轨迹曲线,如图4 所示。其采用中心位置平均误差(Center Location Average Error,CLAE)作为评价指标,从而表示跟随目标的中心位置与手工标定的准确位置之间的平均误差。
图4 智能机器人的自主跟随轨迹
由图中可以看出,图像轨迹与物体运动图像仍存在偏差。此外,从CLAE 曲线可以看出完成直线运动时,智能机器人与跟随目标的轨迹几乎重叠,像素差值的最大值为5.2,转换为等效距离约为5.2 cm。同样,当智能机器人跟着目标人物完成曲线运动时,两者轨迹的重叠程度不如直线运动,但像素差值的最大值为22,转换为等效距离约23 cm。综合来看,机器人能够在复杂的环境下实现稳定的自主跟随。
3.2 不同算法对比分析
为了论证所提出算法的跟随性能,将与文献[5]、文献[8]、文献[10]进行对比分析,跟随结果的准确率,如表1 所示。其中,考虑了有目标遮挡与无目标遮挡两种情况。
表1 跟随准确性对比分析
从表1 中可以看出,无论是有目标遮挡还是无目标遮挡,智能机器人采用CA 深度学习的自主跟随算法的准确率均保持在85%以上。由于无遮挡,目标清晰且分析过程简单,因此跟随准确率高达91.36%。文献[5]融合多传感器信息,实现了机器人的自主跟随定位以及躲避障碍,但缺乏高效的处理算法,因此跟随准确率不佳。尤其是在有目标遮挡的情况下,准确率仅为78.14%。文献[8]利用A*算法和人工势场法进行机器人的路径规划,但未考虑遮挡等复杂情况。同样,文献[10]基于蚁群算法增强智能感知,虽然能够快速寻得目标,但在复杂环境中容易出现目标丢失,因此跟随准确率为84.12%,仍有待提升。
4 结束语
跟随机器人具有广阔的应用场景,但目前能够完成高精度自主跟随的机器人技术尚未成熟。为此,提出了一种基于深度学习的智能机器人自主跟随算法,并设计了自主跟随智能机器人的机械结构。利用CA 算法处理云台获取的目标位置信息,并结合机器人运动模型完成准确的目标跟随。此外,基于搭建的智能机器人平台进行实验结果表明,所提出的算法能够实现直线与曲线运动的高精度跟随。并在无目标遮挡场景中的跟随准确率最高达91.36%,达到了预期目标。
文中所提出的算法仅实现了智能机器人的自主跟随,对于遇到障碍物情况下的路径规划未展开研究。因此接下来的工作中,将重点探究避障及路径规划算法。