APP下载

融合随机反向学习蜜獾算法的无人机三维路径规划

2023-11-08文昌盛贾鹤鸣饶洪华王琢苏媛媛

武夷学院学报 2023年9期
关键词:计算公式代价适应度

文昌盛,贾鹤鸣,饶洪华,王琢,苏媛媛

(三明学院 信息工程学院,福建 三明 365004)

随着科学技术的发展,无人机技术日趋成熟并被广泛应用于各种任务[1-2],如航空摄影、测绘、救援、运输等。无人机的三维路径规划是无人机执行任务和躲避障碍威胁的关键。无人机的三维路径首先需要满足约束条件,然后根据代价函数计算适应度值,最后得到优化后的三维路径。

国内众多学者对于无人机路径规划问题已有了广泛的研究,常见的方法有A* 算法[3]、人工势场法[4]、Dijkstra 算法[5]、蚁群算法[6]等。其中A*算法的精度高,寻优效果好,但只在二维路径规划问题上有较大效果,运用于三维路径规划得到的路径不平滑且躲避障碍物的能力较差;人工势场法的算法简单、较为实用,但全局性较差,容易陷入局部最优,并且当目标点旁有障碍时,斥力大于引力,会找不到路径;Dijkstra 算法的优点在于收敛速度快,寻优效果好,一定能找到最短路径,但缺点在于算法复杂性较高,需要遍历所有节点才能找到最短路径;蚁群算法在搜索范围小时收敛速度快、寻优效果好,但随着搜索范围的增大,搜索时间会增加且精度会降低。

群智能优化算法[7-8]是处理无人机三维路径问题的有效方法之一,其中蜜獾算法(HBA)[9]模拟了蜜獾挖洞和寻找蜂蜜的动态搜索行为,结构简单,收敛速度快,具有广泛且良好的应用前景。但对于复杂的无人机三维路径规划问题,HBA 依旧容易陷入局部最优,仍有一定改进的空间。因此本文提出了一种融合随机反向学习的蜜獾算法(ROBLHBA),给蜜獾算法加入随机反向学习策略,增加了种群的丰富度,提高了算法的全局能力。

此外,由于无人机三维路径规划是一个较为复杂的工程问题,需要考虑众多因素,本文参考了文献[10]的代价函数,考虑路径代价和威胁代价,将路径规划问题转化为优化求解问题。为了评估算法的性能,本文对比了原始蜜獾算法与6 种有代表性的群智能优化算法,并通过6 种不同场景验证ROBLHBA 的性能。仿真实验表明,采用ROBLHBA 进行无人机三维路径规划,能有效提升路径的有效性和精确度,有效验证了ROBLHBA 在无人机三维路径规划问题上的实用性和可行性。

1 数学模型

参考文献[10],给出如下的无人机三维路径规划的数学模型。

1.1 路径代价

为实现无人机的高效飞行,无人机的三维路径必须在基础地形上实现最优化,其路径代价函数可定义为:

其中:Wi为无人机的飞行路径,包括n 个路径节点,每个路径点的坐标为Pi,j=(xi,j,yi,j,zi,j),i 表示第i 架无人机,j 表示第j 个路径节点,表示相邻两个路径节点之间的距离。

1.2 威胁代价

无人机不仅需要在基础地形找到最优路径,还需要考虑躲避威胁障碍,并且与障碍物保持一定的距离。设K 为所有威胁障碍的集合,假设威胁障碍为圆柱体,其投影的圆心坐标为Ck,Rk为投影的半径,dk为无人机到Ck的距离。在威胁物的周围有一圈危险区域,在危险区域内容易产生碰撞,危险区域的直径为R+S。设D 表示无人机的直径,通过考虑D 和S,威胁代价函数的计算公式如下:

D 由无人机的大小决定,S 由众多因素决定,如果无人机在相对安全的环境中飞行,S 只有几十米,如果无人机的飞行环境恶劣且信号差,S 可能会有几百米。当无人机在威胁区域之外的地方飞行时,威胁代价为0;当无人机途径危险区域时,距离中心Ck越近,威胁代价越大;当无人机途径碰撞区域或碰到威胁障碍时,威胁代价为正无穷。

1.3 总代价函数

总成本函数的计算公式如下:

式中:bk为权重系数,F1(Xi)和F2(Xi)分别表示路劲代价和威胁代价。

2 蜜獾算法

蜜罐优化算法是由Hashim 等于2022 年提出的一种元启发式优化算法,该算法通过模拟蜜獾的觅食行为实现对复杂问题的寻优。蜜獾有两种方式寻找食物,即挖掘模式和采蜜模式,蜜獾会随机采取一种方式寻找食物。

2.1 初始化种群

初始化蜜獾种群位置的计算公式如下:

式中:Xi表示第i 只蜜獾的位置,lbi和ubi分别是搜素空间的下界和上界,r 为0 到1 的随机数。

2.2 定义气味强度和密度因子

气味强度与蜜獾的密集程度和蜜獾与猎物的距离有关,气味强度越大,蜜獾运动速度越快,其计算公式如下:

式中:r1是0 到1 之间的随机数,S 表示源强度或集中强度,di表示蜜獾与猎物之间的距离,Xprey为猎物的位置。

密度因子α 控制随时间变化的随机性,以确保从勘探到开发的平稳过渡。其计算公式如下:

式中:C 为2,t 为当前迭代次数,tmax为最大迭代次数。

2.3 挖掘阶段

蜜獾在挖掘阶段的行动轨迹类似心形,其计算公式如下:

式中:Xnew为蜜獾的新位置,F 用来改变搜索方向,防止算法陷入局部最优,通过式(11)定义,β 是蜜獾获取食物的能力(大于1,默认值为6),r2、r3、r4、r5为0 到1之间的随机数。

2.4 采蜜阶段

采蜜阶段蜜獾会跟着蜂蜜的指引到达蜂巢,其计算公式如下:

式中:r6为0 到1 之间的随机数。

3 改进蜜獾算法的无人机三维路径规划

原始蜜獾算法有两种更新位置的公式,寻优能力强,但面对复杂的无人机三维路径规划问题,依旧容易陷入局部最优,出现早熟收敛现象。为了进一步提高算法的性能,在挖掘阶段和采蜜阶段后加入随机反向学习。

3.1 随机反向学习策略

反向学习策略是由Tizhoosh 等提出的一种优化策略[11],其思想为通过当前解生成反向解,将反向解与当前解对比,择优进入下一代循环。其公式如下:

由于反向解与当前解之间的距离为定值,缺乏一定的随机性,Long 等[12]提出一种改进的反向学策略——随机反向学习,扩大算法的搜索范围,增加了种群的多样性。如图1 所示,X 为任意当前解,其生成的反向随机解是不固定的,进一步增强了种群的丰富度。其计算公式如下:

图1 随机解和它的反向解Fig.1 Arbitrary solution and its inverse random solution

式中:Xrand为随机反向解,r7为0 到1 之间的随机数。

3.2 改进蜜獾算法的无人机三维路径规划的实现

3.2.1 编码方式

将每条路径都编码成一组向量,每个向量都记录了无人机相邻两个路径点之间的飞行情况用极坐标表示。则无人机的飞行路径集合Ωi可表示如下:

式中:dim 为路径节点的个数,β 为幅度,Ψ 为俯仰角,φ 为偏航角。

3.2.2 将球面坐标转换成平面直角坐标

通过上述公式更新得到路径向量集Ωi,并将Ωi转换成空间直角坐标系中的飞行路径Wi,每个路径点Pi,j=(xi,j,yi,j,zi,j)通过以下公式计算:

3.2.3 无人机三维路径规划的具体步骤

步骤一:初始化地形、威胁障碍和相关参数;

步骤二:使用公式(5)初始化种群,并将其编码成Ωi;

步骤三:使用公式(6)和公式(9)更新气味强度和密度因子;

步骤四:使用公式(10)进行挖掘阶段或者使用公式(12)进行采蜜阶段;

步骤五:使用公式(14)生成随机反向解,对比当前解选择最优解;

步骤六:使用公式(4)适应度值;

步骤七:判断是否到达最大迭代次数,如果没有到达最大迭代次数,则回到步骤三,反之则结束循环;

步骤八:使用公式(16)—公式(18)将球面坐标转换成平面直角坐标,并输出最优路径。

算法实现的流程图如图2 所示。

图2 基于ROBLHBA 的无人机三维路径规划的流程图Fig.2 Flow chart of UAV 3D path planning based on ROBLHBA

4 仿真实验与分析

实验均在主频为2.50 GHz 的11th Gen Intel(R)Core(TM)i7-11700 处理器,16 GB 内存,操作系统为64位Windows11 的电脑上使用MATLAB2021a 完成。同时采用了三明部分地区的地形作为实验的测试地图。

4.1 多种优化算法的参数设置

为保证本次实验测试的公平性,算法的迭代次数为tmax=500,个体数量N=20,维度dim=10,无人机的起点Pstart=(40,50,150),终点Pend=(850,750,80)。本次实验选取了蜜獾算法(honey badger algorithm,HBA),野马优化算法(wild horse optimizer,WHO)[13],鱼优化算法(remora optimization algorithm,ROA)[14],分组教学优化算法(group teaching optimization algorithm,GTOA)[15],鲸鱼优化算法(whale optimization algorithm,WOA)[16],哈里斯鹰优化算法(harris hawks optimization,HHO)[17]和天鹰优化算法(aquila optimizer,AO)[18]作为对比算法,算法的参数设置如表1 所示,其中GTOA 算法无调节参数。

表1 各个算法的参数设置Tab.1 Parameter setting of each algorithm

4.2 多种算法的仿真对比结果

为展示ROBLHBA 在无人机三维路径规划问题上的优势,表2 给出了多种算法运行10 次的统计数据,其中Best 表示最优的适应度值,Mean 表示平均适应度值,Std 表示适应度值标准差。从表2 中可以看出,ROBLHBA 得到了最好的最优适应度值、平均适应度值和适应度标准差,相较于原算法HBA 有一定的提升;WHO 算法得到的最优适应度值与ROBLHBA相近,虽然标准差明显优于ROBLHBA,但是平均适应度值与ROBLHBA 依旧有较大差距;GTOA、HHO 算法和AO 算法的适应度标准差明显优于ROBLHBA,但是最优适应度值和平均适应度值与ROBLHBA 差距依旧很大;ROA 和WOA 得到的最优适应度值、平均适应度值和适应度标准差都与ROBLHBA 有较大的差距。通过表2 数据可知,ROBLHBA 在无人机三维路径规划问题上有较强的收敛能力和鲁棒性。

表2 各个算法的最优值、均值和方差Tab.2 Optimal value,mean value and variance of each algorithm

图3 及图4 分别为多种算法在同一场景下运行的立体图和俯视图。从图4 中可以看出,HBA、WHO算法、HHO 算法、ROA 和AO 算法求得的飞行路径偏离较远;ROBLHBA 和GTOA、WOA 得到的飞行路径相近,但进一步观察图3 可以看出,ROBLHBA 的路径相对平缓,GTOA 和WOA 得到的飞行路径变化幅度大相对曲折,在实际中不适合作为飞行路径。

图3 多种算法在同一场景下运行的立体图Fig.3 Stereogram of multiple algorithms running in the same scene

图4 多种算法在同一场景下运行的俯视图Fig.4 Stereogram of multiple algorithms running in the same scene top view of multiple algorithms running in the same scene

图3、图4 可以大致看出ROBLHBA 求得了最优的飞行路径,但不明确,图5 给出了不同算法在同一场景下运行的适应度收敛曲线图。不难看出,HBA、HHO 算法、AO 算法和ROA 在迭代中难以收敛,无法得到最优路径。WOA、GTOA 和WHO 算法虽然有一定收敛能力,但与ROBLHBA 相比依旧有所不足。

图5 多种算法在同一场景下运行的适应度值收敛曲线图Fig.5 Fitness value convergence curve of multiple algorithms running in the same scenario

4.3 ROBLHBA 在不同场景中的运行结果

图6 到图10 为ROBLHBA 在五个不同场景下求得的无人机三维路径的立体图和俯视图。图6 及图7的威胁区域较少,地形较为简单,图8-图10 的威胁区域较多,地形较为复杂。可以看出,ROBLHBA 在简单地形和复杂地形中都能找到最优路径,明显优于原始HBA。

图6 ROBLHBA 在场景一下的运行结果Fig.6 Running results of ROBLHBA in scenario 1

图7 ROBLHBA 在场景二下的运行结果Fig.7 Running results of ROBLHBA in scenario 2

图8 ROBLHBA 在场景三下的运行结果Fig.8 Running results of ROBLHBA in scenario 3

图9 ROBLHBA 在场景四下的运行结果Fig.9 Running results of ROBLHBA in scenario 4

图10 ROBLHBA 在场景五下的运行结果Fig.10 Running results of ROBLHBA in scenario 5

5 总结

提出一种改进蜜獾算法的无人机三维路径规划方法,在原始蜜獾算法的基础上,加入了反向学习策略,提升了算法的收敛能力和鲁棒性。在构建模型时,选择路径代价和与威胁代价作为无人机三维路径规划的代价函数,使实验结果更加真实。仿真表明ROBLHBA 在无人机三维路径规划问题上优于其他对比算法,后续将进一步调整算法的参数,提升算法在无人机三维路径规划上的性能。

猜你喜欢

计算公式代价适应度
改进的自适应复制、交叉和突变遗传算法
电机温升计算公式的推导和应用
2019离职补偿金计算公式一览表
爱的代价
代价
基于空调导风板成型工艺的Kriging模型适应度研究
成熟的代价
采用初等代数推导路基计算公式的探讨
关于节能评估中n值计算公式及修正
少数民族大学生文化适应度调查