基于粒子群联盟的机器人多目标搜索路径控制
2023-09-20张红强
吴 琼,张红强
(1. 广东理工学院电气与电子工程学院,广东 肇庆 526100;2. 湖南科技大学信息与电气工程学院,湖南 湘潭 411100)
1 引言
多机器人协调是当前机器人技术的一个重要发展方向。群机器人系统是一种典型的分布式智能群体,主要是由多个机器人组成,它们是功能相同且结构简单的个体,具有个体感知和交互能力,系统在使用过程中可出现多种不同智能行为,例如学习以及协作等,被用来解决多种多样的智能问题。群机器人多目标搜索目标的研究在资源勘探以及军事反恐等方面均具有比较广阔的发展前景。对机器人的环境适应性、环境感知、自主控制也提出了更高要求。群机器人目标搜索策略主要结合了机器人自动化以及最优搜索策略[1-2],随着机器人智能化要求的不断提升,有关群机器人协作搜索目标仍然是一个难点问题,所以研究群机器人多目标搜索路径协同控制具有十分重要的研究意义。
宫金良等人[3]将机器人团体最优效能作为目标实行任务分配操作,确保不同机器人的工作量,结合实际环境构建对应的模型,设定搜索路径规则,实现协同控制。何昕杰等人[4]优先构建改进响应阈值多目标任务分配模型,同时将二维拓展式微粒群的群机器人协调控制算法引入到三维群无人机上,将其和改进的三维扩展式微粒群算法相结合,完成群机器人并行式搜索。张方方等人[5]通过栅格地图构建生物启发神经网络描述动态搜索环境,同时使用差分进化算法求解,完成多机器人目标搜索。但以上方法忽略了机器人群在搜索多个目标时的任务分工问题,虽然能够完成目标协同搜索,但是其效率仍需进一步提升。
在上述几种方法的基础上,提出一种基于粒子群联盟的机器人多目标搜索路径控制方法。为提高机器人群体在搜索目标时的效率,构建粒子群联盟,合理化任务分工。基于此,采用自适应动态窗口避障优化效果,最终输出最为理想的实现多目标搜索路径协同控制结果。经过详细的实验对比分析可知,所提方法可以更好完成多目标搜索路径协同控制。
2 方法
2.1 群机器人多任务分工
在非结构动态化环境中,需要将多目标搜索划分成多个子任务,并将其分配给不同的机器人,同时展开并优化处理,全面提升系统的综合工作效率。
由于机器人自带传感器检测能力具有一定的限制性,可以将任务激励概念进一步拓展。不仅可以有效检测目标外的信号,同时还可以完成邻域通信处理,全面扩大自身认知范围。由于搜索对象、主体和搜索环境全部呈动态化,所以对应的任务机也是呈现动态化变化。机器人对目标信号的直接检测和间接感知示意图如图1所示。
图1 机器人对目标信号的直接检测和间接感知示意图
通过图1能够准确检测出对应的目标信号[6-7],得到目标的感知信息,将全部类型的任务集合合并,构建机器人的个性化任务集。任务集构建完成之后,采用元任务的类型和激励信号共同完成降幂排序处理,对排序结果动态维护。在上述操作基础上,在任务集中可以自动选取一个元任务,将任务对应的目标设定意向目标。个性化任务集为空集时,对应的机器人不能参与并处理后续的任务。只有转换为漫游机器人,并对其展开协同搜索,最终实现目标的认知,实时更新自身任务集,使其处于非空状态。
不同的机器人在分配任务时,结合自身需求设定任务,并且可以在备选目标中选择最佳意向目标。利用降幂顺序,可以将部分元任务选择为备选任务。模型的输入为激励强度,经过计算得到响应概率。通过以上操作环节,可以全面提升评估效率,简化评估环节。
机器人需要参加的任务数量是通过评估获得的。当群机器人中的单一机器人确定各自的意向目标之后,需要搜索和目标意向相同的机器人,将其整合处理,构建子群联盟,同时对其展开协同搜索[8-9],获取最终的意向目标集合,如式(1)所示:
(1)
式中,R代表意向目标集合;rmn代表子集合。
通过群体智能方法的相关需求,在群机器人完成感知处理后,主要采用系统的交互功能选择需要规定的任务。由于群机器人是随机分布的,所以在多目标搜索的过程中,还需要额外完成目标的评估和定位等相关操作。在完成目标信号检测之后,需要将其设定为适应值,并且通过适应值判断机器人所在位置的好坏。
对任务实际分工处理的过程中,大部分机器人更加倾向于选择优先权比较高,激励强度比较大的目标,将其设定为意向目标,但是这样会造成大量机器人被占用。为确保上述问题得到有效解决,需要在分工过程中加入闭环调节机制,有效避免空间配置资源失衡问题的产生。另外,还需要处理机器人的资源配置;评估不同类型资源的配置水平,将得到结果作为负反馈,同时展开退盟等相关操作,确保机器人可以自由在不同子群内动态迁移。
如果机器人非因子群联盟的规模相对较大时,则说明此时存在扰动,需要将缩小被放弃的目标作为激励强度,确保其在后续操作过程中可以有效屏蔽相关任务列表集,直至任务列表中排列第一的目标和剩余目标两者之间差值较大,则说明扰动现象得到有效消除。采用式(2)给出激励缩小算子:
Linwer=minwerhinwer
(2)
式中,Linwer代表完成缩小处理后获取的激励强度;minwer代表缩小因子;hinwer代表可缩小的激励强度取值范围。
当全部信号完成缩小处理后,会在固定的时间内对相同目标持续搜索。缩小处理后的激励函数会变为灰度。当机器人离开检测区域选择目标时,扰动发生的概率会减少。信号恢复算子可以表示为式(3)的形式:
Lxyz=urLinwerexp(minwer-hinwer)
(3)
式中,Lxyz代表信号恢复阶段的激励强度;ur代表激励强度缩小所用的总时长。
在研究范围内,需要结合检测目标设定群机器人的临界检测范围。由于机器人在运动过程中是十分随机的,所以获取的目标信号会大概率丢失。所以在此需要引入目标痕迹机制,在同时对多个目标展开搜索时,根据上述任务分工结果构建组建多个子群联盟U(t),如式(4)所示:
(4)
式中,u(t)mn代表子群联盟子集。
利用已知的各个子群,对已经确定的目标协同搜索,并对全部任务展开动态分工处理,详细的计算式为:
(5)
式中,Mk(t)代表任务动态分工处理结果;Nmax代表最大子群。
2.2 搜索路径协同控制
为了有效避免机器人在应用SOM算法时出现振荡或者悬停现象,引入一种包含锁定机制的SOM神经网络[10-11]。通过自适应动态窗口调整机器人的运行速度,对SOM中获取的神经元以及相邻神经元权重更新处理能够有效避免机器人出现速度跳跃,及时躲避障碍物。对于给定的输入神经元而言,在竞争神经元获胜之后,需要计算其和输入之间的欧式距离,详细的计算式如下:
(6)
式中,F(i,j)代表第i个输入神经元和第j个竞争元两者之间的欧式距离;mi代表第i个神经元的坐标位置;nj代表第j竞争元的坐标位置。
在迭代的过程中,需要优先得到获胜机器人以及邻居权重,则获胜者和邻居两者之间的邻域函数可以表示为式(7)的形式:
(7)
式中,g(nj,α)代表邻域函数;e代表常数。
在获取机器人和对应邻域神经元后,将其向输入任务点所在坐标位置移动,其中对应的更新规则可以表示为以下形式:
(8)
如果群机器人的内部安装测距传感器,则机器人可以在固定范围内获取障碍物的准确坐标位置[12],设定机器人和障碍物两者之间的安全距离为D(i,j),设定线速度的取值为自适应动态权重β(u,v),则有:
(9)
式中,βmax和βmin分别代表最大和最小权重值;dist(i,j)代表目标到障碍物的最小距离。
在自适应动态窗口法中,需要改进目标函数,如式(10)所示:
P(u,v)=β(u,v)(α·heading(u,v)+
(10)
式中,P(u,v)代表经过改进处理后得到的目标函数;α代表目标函数的分量值;heading(u,v)代表方位角评估函数。
通过式(11)给出目标函数最大速度取值S(u,v):
S(u,v)=arg max{P(u,v)}
(11)
结合上述分析,复杂环境下群机器人多目标搜索[13]路径协同控制操作流程图如图2所示。
图2 群机器人多目标搜索路径协同控制流程图
通过采用自适应动态窗口[14-15]更新各个机器人自组织映射神经网络竞争神经元的权重,有效躲避障碍物,对群机器人运动轨迹优化处理,最终完成协同控制G(u,v,z),具体的计算式如下所示:
(12)
3 仿真研究
为了验证基于粒子群联盟的机器人多目标搜索路径控制方法的有效性,在matlab平台上展开若干组实验测试,在仿真过程中,需要设定实验参数,如表1所示:
表1 实验参数设定
在复杂环境下,需要充分考虑不同类型障碍物,设定障碍物数量,仿真目标搜索过程,如图3所示。
图3 研究方法下机器人多目标搜索结果
分析图3(a)可知,全部机器人均位于测试区域的左下角。图3(b)可知,机器人可以探测到目标信号1,并且可以
信息传递给所有机器人。由图3(c)可知,机器人可以探测到目标信号1、2、4和5。由图3(d)可知,机器人可以躲避各个类型的障碍物。由图3(e)可知,在步数为250时,机器人可以准确感知全部目标,同时还能够躲避障碍物,最终实现全部目标搜索,完成群机器人多目标搜索路径协同控制。
4 结束语
研究一种基于粒子群联盟的机器人多目标搜索路径控制方法。根据所设计实验验证了所提方法可以感知全部目标信号,同时还能够精准躲避障碍物,更好完成协同控制。在后续的工作,可以考虑在三维环境中展开动态目标搜索,对现有方法进一步完善。