基于自适应蜣螂算法的无人机三维路径规划方法
2024-07-17远翔宇杨风暴杨童瑶
摘 要:山区地势具有陡峭、沟深壑大的环境特点,导致基于启发式算法的山区无人机路径规划速度慢、质量差,针对该问题提出了基于自适应动作策略蜣螂算法的路径规划方法。以路径长度、飞行安全性以及路径平滑度构建路径规划目标函数;在蜣螂算法中引入种群相似性动作变异策略和反向学习策略,平衡局部优化和全局优化能力;通过对比麻雀算法、蜣螂算法和灰狼算法在12 个基准函数上的算法性能,结果表明所提方法具有更快的收敛速度、不易陷入局部最优。山区路径规划仿真实验表明,所提方法比蜣螂算法的路径规划质量提高了37. 66% 。
关键词:路径规划;蜣螂算法;反向学习;自适应动作策略
中图分类号:TP242;TP18 文献标志码:A 开放科学(资源服务)标识码(OSID):
文章编号:1003-3106(2024)04-0928-09
0 引言
山区地形的复杂性、起伏高差较大和交通不便等特点常常导致部分区域难以通过传统方式进行探测、巡视和物资配送等工作,而无人机凭借其机动灵活的优势在山区得到广泛应用,因此在山区复杂环境下,高质量、快速地规划飞行路径对提高无人机任务效率具有重要意义[1-2]。
面向无人机三维路径规划问题,许多学者基于启发式算法展开了丰富的研究。蔺文轩等[3]针对三维路径规划问题,在粒子群算法中引入分组优化策略,并在小组粒子优化时采取模拟退火操作,有效避免了陷入局部最优和收敛慢的缺点。苏菲[4]在传统蝙蝠算法中引入黄金正弦算法,对最优个体进行全维和单维搜索,提高了收敛速度。黄鹤等[5]在飞蛾扑火算法中引入交叉算子和高斯变异算子,增强了全局搜索能力并提高了算法寻优精度。巫茜等[6]提出了改进信息素更新规则的蚁群算法并引入航迹导航因子,一定程度上克服了山区影响,避免路径陷入局部最优。郭启程等[7]在鲸鱼优化算法中加入莱维飞行进行随机扰动,并引入信息交流机制平衡搜索能力,提高收敛精度和速度。Zeng 等[8]基于距离动态邻域设计粒子群算法速度更新机制并与差分进化算法进行融合以缓解过早收敛,增强搜索能力。段建民等[9]将遗传算法和改进的人工势场模型结合并行搜索,利用人工势场法优化遗传算法全局路径,增强跳出局部最优的能力。许诺[10]将粒子群算法与遗传算法结合,设置动态惯性权重并引入步长因子平衡局部和全局搜索。
上述方法在一定程度上提升了规划路径的质量和算法的收敛速度,但是面向山区陡峭地势的复杂环境,仍存在路径规划效果差的问题。因此,本文分析无人机运动约束条件和路径规划要求,构建了山区环境中三维路径规划问题模型;结合蜣螂算法位置更新策略多的优势,引入反向学习策略和种群相似性变异策略,提出自适应变异蜣螂算法(AdaptiveMutation Dung Beetle Algorithm,AMDBO)使得在进行山区路径规划时蜣螂能自适应地选择动作,从而有效跳出局部最优,获得高质量路径。
1 无人机三维路径规划目标函数
无人机三维路径规划问题属于优化问题,本文从路径长度、路径平滑度和飞行安全度方面构建路径规划目标函数。
① 路径长度
路径长度是判断路径质量的重要依据,路径长度越短,越有利于无人机节省能耗[11]。因此路径长度为:
式中:n 为航迹点数目,(xi,yi,zi)为第i 个航迹点的位置。
② 路径平滑度
规划路径应尽量减少大角度偏航和高度的突变,需要保持路径平滑。由于山区陡峭、落差大的地形特点,无人机在山区飞行需要飞行路径满足自身最大爬升角和爬升率的要求[12]。li 表示2 个航迹点之间的距离,式(2)和式(3)分别表示偏转角φi 和俯仰角i,路径平滑度成本函数定义为式(4)。
③ 飞行安全性
路径规划中的路径还必须要确保无人机的安全运行,因此引入飞行安全性能够引导无人机躲避环境中的障碍物[13]。如图1 所示,空域内存在中心坐标为Ok,半径为Rk 的障碍物k,无人机的飞行节点与障碍物的垂线距离dk 应该大于安全距离阈值S,即无人机必须限定在阴影之外的区域飞行,才能确保飞行的安全,飞行安全性的计算如下:
对上述各类成本函数进行加权综合,构成多目标路径规划问题的目标函数F:
F = ω1 Fl + ω2 Fe + ω3 Fs , (6)
式中:Fl、Fe、Fs 依次为上述3 种代价函数,ω1 、ω2 、ω3 分别为路径长度、航迹平滑度和飞行安全性的权重系数。目标函数值越小代表路径质量就越好。
2 蜣螂优化算法
2. 1 原始蜣螂算法
蜣螂优化算法(Dung Beetle Optimizer Algorithm,DBO)是一种新颖的群体智能算法,通过模拟蜣螂的滚球、繁殖、觅食和偷窃4 个动作行为进行位置更新和优化,每种策略侧重的方向有所不同[14]。蜣螂算法的多样化位置更新策略可以更加全面地探索搜索空间,在实际应用中能够有效地解决复杂的搜索和优化问题。
① 滚球行为
蜣螂滚球行为分为有障碍模式和无障碍模式。当无障碍时,光源的强度会影响蜣螂的位置,蜣螂在滚球行为过程中位置更新如式(7)所示;当遇到障碍物无法前进时,通过使用切线函数来模拟跳舞行为,位置更新如式(8)所示。
xt+1i = xti+ λ·k·xt-1i + b· xti- xworst , (7)
xt+1i = xti+ tan(θ) xti- xt-1i , (8)
式中:xti为t 次迭代时第i 个个体的位置,λ 模拟自然因素随机取-1 或1,k 为[0,1]的随机偏转系数,b为随机系数,xworst 为最差个体位置。
② 繁殖行为
利用边界选择策略来模拟蜣螂产卵的安全区域,如式(9)所示;确定产卵区域后,雏球的位置随产卵区域进行动态变化,如式(10)所示。
式中:xlbest 为局部最优解,R = 1- t/tmax,tmax 为最大迭代次数,t 为当前迭代次数;Lb 为下界,Ub 为上界,b1 、b2 为2 个D 维独立随机向量。
③ 觅食行为
觅食区域同样利用边界选择策略来动态模拟,如式(11)所示。觅食蜣螂会在局部范围内进行觅食行为,蜣螂的位置更新如式(12)所示。
式中:xgbest 为全局最优解,C1 为服从正态分布的D维随机向量,C2 为[0,1]的D 维随机向量。
④ 偷窃行为
最佳食物来源则是最适合竞争食物的地方,偷窃蜣螂的位置更新如下:
xt+1i = xgbest + S × g × ( xti- xgbest + xti- xlbest ),(13)
式中:S 为常数,g 为服从正态分布的D 维随机向量。
从4 种个体行为的位置更新公式可知,只有滚球行为在算法各时期都具有较好的全局搜索能力;觅食行为在自身位置附近根据动态上下界范围进行搜索,动态上下界会越来越小,使得觅食行为随着迭代次数的增加从全局搜索变为局部搜索;繁殖行为和偷窃行为则是在最佳个体的附近根据动态上下界范围进行局部搜索。
2. 2 自适应蜣螂算法
2. 2. 1 混沌序列初始化种群
在处理复杂的优化问题时,原始蜣螂算法采用随机生成种群的方法进行种群初始化,可能会导致种群多样性低、种群分布不均匀和快速收敛到局部最优解等问题。Tent 混沌映射可以生成均匀遍布解空间和相关性较强的初始种群[15],因此本文引入Tent 混沌映射作为改善蜣螂算法初始化种群多样性的方法,从而提高智能算法的求解精度和收敛速度。Tent 混沌映射公式如下所示:
对x0 赋初值,经过循环迭代,可以得到[0,1]的随机序列,该序列具有良好的统计特性,通常用于生成算法的初解,以增加物种的多样性。当控制参数α =0. 45 时,初始总体(一维)分布如图2 所示。
蜣螂种群初始化过程如下:先随机生成一个[0,1]的D 维向量作为初始混沌序列;然后将D 维向量的每一维数值依次带入式(14)计算生成一个新的D 维向量作为第2 个混沌序列,重复上述步骤,直到生成N 个混沌序列;最后将全部混沌序列映射到种群个体的取值范围内,生成Tent 混沌初始化蜣螂种群。
2. 2. 2 自适应的蜣螂行为变异策略
针对原始蜣螂算法4 种动作行为的分配比例不均匀,且每个个体只能进行一种动作行为,可能会导致对解空间的搜索不充分或收敛速度慢的问题,本文提出了基于种群相似性的蜣螂动作变异策略和反向学习策略。
① 基于种群相似性的蜣螂动作变异策略
为了使每个蜣螂都能执行4 种动作行为,本文用迭代次数模拟时间变化,每隔M 次迭代进行一次蜣螂的动作变异,将当前动作行为变异为下一种行为策略。本文利用余弦相似度来衡量种群相似性,种群多样性表示如下:
当Diver 大于0. 5 时,种群多样性过低,可能会陷入局部最优,而滚球蜣螂和觅食蜣螂的数量决定了算法对解空间的探索能力和收敛速度。因此将执行繁殖和觅食行为的个体变异为执行滚球行为的个体,增强算法的全局搜索能力以增强物种多样性,找到新的最佳个体或达到变异个体迭代阈值Tmax 后将变异个体重新恢复为原来的行为个体继续搜索。
② 反向学习策略
由于繁殖和偷窃行为的全局搜索能力会随着迭代次数的增加而下降,而反向学习策略[16]的思想主要是通过生成当前可行解的反向解,并将反向解与原解进行适应度比较选出更好的解,本文利用反向学习策略增强繁殖和偷窃行为的全局搜索能力:
式中:xtr 为反向解,lb 和ub 为D 维向量表示每一维的下界和上界,rand()为D 维随机向量,xti为当前可行解。
综上所述,AMDBO 算法流程如图3 所示。
3 仿真实验与分析
本文的仿真实验分为两部分:① 在CEC2017中选择具有不同特征的基准函数[17],对比不同算法最优解的搜索速度和搜索质量,验证AMDBO 算法的收敛性能、是否具备跳出局部最优的能力;② 构建山区路径规划环境,对比不同算法路径搜索速度和路径质量,验证AMDBO 算法在复杂山区环境是否仍具有较快的收敛速度和寻优能力。
3. 1 基于多样性基准函数的算法性能分析
为了验证AMDBO 算法的寻优性能,本文选取DBO、改进灰狼算法(Improved Grey Wolf OptimizerAlgorithm,IGWO)和麻雀搜索算法(Sparrow SearchAlgorithm,SSA)在CEC2017 中的12 个具有不同特征的基准函数上进行算法性能的对比分析。其中,选择5 个单峰基准函数(F1 ~ F5 )分析各算法的单目标求解能力,选择4 个多峰基准函数(F6 ~ F9 )和3 个混合基准函数(F10 ~ F12 )分析算法能否跳出局部最优。测试函数具体信息如表1 所示。
为了提高测试结果的可靠性,降低启发式算法随机性的影响,本文将所有算法的种群大小和迭代次数分别设置为30 和500,对每个基准函数都运行30 次[18],得到30 次独立运行下的最优值(该最优值指的是本次运行下取得的目标函数最优值),并统计出平均值(Mean)、最佳值(Best)和标准差(Std),统计对象为30 次独立运行下的最优值结果。平均值表现的是算法对该目标函数的平均的优化能力;最佳值表现的是30 次算法运行中对目标函数的最佳优化效果;标准差表现的是算法在该目标函数上优化能力的稳定性。4 种优化算法对12 个基准函数的测试结果对比如表2 所示。
在5 个单峰基准函数(F1 ~ F5 )测试中,AMDBO在F1 ~ F4 基准函数上的Mean、Std 和Best 均优于其他3 种算法。对比F5 基准函数下Mean、Std 和Best的具体数值比较可知:DBO 的Best 比AMDBO 的Best仅高57. 76% ,但是AMDBO 的Mean、Std 分别比DBO的值高了73. 80% 和109. 52% 。综合F1 ~ F5 的整体表现,AMDBO 的整体性能优于其他3 种算法。
在4 个多峰基准函数(F6 ~ F9 )测试中,AMDBO的Mean 和Best 均获得了第一且精度高于DBO 和IGWO;AMDBO 的Std 除了在F6 上略低于SSA,在其他多峰基准函数上都远远优于IGWO 和DBO。
在3 个混合基准函数(F10 ~ F12 )的测试中,4 种算法的Best 均能取得理论最优解;AMDBO 的Mean和Std 在F10 和F11 上略低于IGWO,但也都优于SSA 和DBO;在混合基准函数F12 上,4 种算法都能得到理论最优的Mean 和Best,但AMDBO 的Std 优于其他3 种算法。虽然其他算法的Mean 和Best 都能达到理论最优值,但是AMDBO 的收敛速度更快、迭代次数更少。图4(j)~ 图4(l)为混合基准函数(F10 ~ F12 )测试的收敛曲线,AMDBO 的收敛速度仅次于SSA,优于DBO 和IGWO。
综合上述测试,在3 类基准函数上AMDBO 的Mean 和Best 大部分优于其他3 种算法;在收敛到相同精度的结果时,AMDBO 所用的迭代次数也更低。DBO 性能略差于AMDBO,但是大部分测试结果相比SSA 和IGWO 较优或齐平。
3. 2 面向山区三维路径规划分析。
读取某一山区环境的数字高程模型地图,该地区最大高度落差超过2 km,地势起伏剧烈分布沟壑众多,在该地形中随机生成环境扰动如图5 所示(粉色圆柱)。设置无人机的起点和终点分别为(10,90,1. 115)和(130,10,1. 367),单位为km。由3. 1 中的算法性能实验可知DBO 与SSA、IGWO 相比,性能更优,因此路径规划实验中选取DBO 与AMDBO 进行对比。算法中种群个体数量统一为30,最大迭代次数为500。基于AMDBO 和DBO 生成的路径如图5 和图6 所示,图中,线路1 为AMDBO 算法路径规划结果,线路2 为DBO 算法路径规划结果。
对比DBO 和AMDBO 的飞行路径可以看出,原始DBO 在进行迭代时陷入了局部最优,且飞行路径长没有规避环境扰动,飞行高度低没有保障离地安全高度;而AMDBO 算法的飞行路径平滑,有效规避了环境扰动并且保障了与障碍物之间的距离和离地安全高度。
目标函数收敛曲线如图7 所示。可以看出,原始DBO 的收敛较慢,在250 次迭代之后逐渐开始收敛。本文算法在开始时能够快速地持续搜索,在200 次迭代之后逐渐收敛,且收敛值低于DBO,结果表明DBO 在迭代次数达到95 和150 时都陷入了局部最优,验证了AMDBO 具备跳出局部最优的能力。
综合各类表现看,本文算法具有更快的收敛速度且能快速跳出局部最优解,能够在山区复杂环境中规划出较高质量的路径。
4 结束语
受山区环境影响,基于启发式算法的路径规划易陷入局部最优且收敛速度慢,本文在蜣螂算法进行初始化时引入混沌初始化使得种群分布更均匀,有效提高了种群多样性;构建了种群相似性动作变异策略和反向学习策略,平衡局部优化和全局优化能力。对基于多个基准函数的寻优能力进行对比分析,结果表明AMDBO 相比DBO、SSA、IGWO 具有更好的求解速度和精度;山区环境中的路径规划结果表明AMDBO 比DBO 收敛更快,能较快地跳出局部最优,路径质量更高。下一步研究将考虑如何提升山区多目标点的路径规划质量。
参考文献
[1] 路晶,史宇,张书畅,等. 无人机航迹规划算法综述[J]. 航空计算技术,2022,52(4):131-134.
[2] 雷耀麟,丁文锐,李雅,等. 群体智能支撑的无人机群航路规划应用综述[J]. 无线电工程,2023,53 (7):1509-1519.
[3] 蔺文轩,谢文俊,张鹏,等. 基于分组优化改进粒子群算法的无人机三维路径规划[J]. 火力与指挥控制,2023,48(1):20-25.
[4] 苏菲. 基于改进蝙蝠算法的无人机三维路径规划[J].无线电工程,2022,52(12):2229-2236.
[5] 黄鹤,吴琨,王会峰,等. 基于改进飞蛾扑火算法的无人机低空突防路径规划[J]. 中国惯性技术学报,2021,29(2):256-263.
[6] 巫茜,黄浩,曾青,等. 改进ACO 算法的UAV 航迹规划在山区物流配送中的应用研究[J]. 重庆理工大学学报(自然科学),2022,36(10):185-191.
[7] 郭启程,杜晓玉,张延宇,等. 基于改进鲸鱼算法的无人机三维路径规划[J]. 计算机科学,2021,48 (12):304-311.
[8] ZENG N Y,WANG Z D,LIU W B,et al. A Dynamic Neighborhoodbased Switching Particle Swarm Optimization Algorithm [J]. IEEE Transactions on Cybernetics,2022,52(9):9290-9301.
[9] 段建民,陈强龙. 基于改进人工势场-遗传算法的路径规划算法研究[J]. 国外电子测量技术,2019,38(3):19-24.
[10] 许诺. 基于改进PSO 算法的UAV 三维路径规划研究[J]. 电子测量技术,2022,45(2):78-83.
[11] 陈明强,李奇峰,冯树娟,等. 基于改进粒子群算法的无人机三维航迹规划[J]. 无线电工程,2023,53(2):394-400.
[12] 许乐,赵文龙. 基于新型灰狼优化算法的无人机航迹规划[J]. 电子测量技术,2022,45(5):55-61.
[13] 赵棣宇,郑宾,殷云华,等. 改进粒子群算法的UAV 突防路径规划[J]. 电光与控制,2023,30(4):12-16.
[14] XUE J K,SHEN B. Dung Beetle Optimizer:A New Meta-heuristic Algorithm for Global Optimization[J]Supercom-put,2023,79:7305-7336.
[15] 宋立业,胡朋举. 改进SSA 在三维路径规划中的应用[J]. 传感器与微系统,2022,41(3):158-160.
[16] 冯增喜,何鑫,崔巍,等. 混合随机反向学习和高斯变异的混沌松鼠搜索算法[J]. 计算机集成制造系统,2023,29(2):604-615.
[17] 舒聪. 面向无人机航迹规划的改进麻雀搜索算法及应用[D]. 广州:广州大学,2022.
[18] 欧阳城添,唐风,朱东林. 融合禁忌搜索的SSA 算法及其路径规划的应用[J]. 电子测量技术,2022,45(22):32-40.
作者简介
远翔宇 男,(1999—),硕士研究生。主要研究方向:路径规划、目标分配。
杨风暴 男,(1968—),博士,教授。主要研究方向:信息融合、不确定信息推理。
杨童瑶 女,(1997—),博士研究生。主要研究方向:威胁评估、意图估计与态势预测。