无人艇避碰技术研究综述*
2022-03-17姜登耀苑明哲刘继海
姜登耀 苑明哲 刘继海 段 勇
(1.沈阳工业大学信息科学与工程学院 沈阳 110870)(2.广州工业智能研究院 广州 510000)(3.广州工业智能研究院院士专家工作站 广州 510000)
1 引言
无人艇(Unmanned Surface Vehicle,USV)是一种具有环境感知、自主航行能力,并能够自主完成相应任务的小型海上平台。因其具有可执行更长时间、更危险的任务,维护成本低、人员安全性高,重量轻、体积小,机动性和可部署性强等优势,近年来被广泛的应用于海上科学考察、海上搜救和水质监测等领域。根据赛迪顾问的研究显示,2018年、2019年及2020年我国民用无人艇市场规模分别为1.3亿元、2.0亿元和3.3亿元。预计至2023年,我国民用无人艇市场规模约为32.2亿元,市场前景广阔。
由于USV所处的任务环境十分复杂,不仅包含静态障碍物,同时受海面浪流、其他动态障碍物的影响,避碰成为影响USV自主航行的关键技术因素。其已经成为业界的主要研究热点之一,但大多数综述论文尚未对USV避碰技术进行系统性的介绍,因此有必要对USV避碰技术的不同部分进行系统的论述,将不同部分之间建立联系,分析现有技术的优劣,以推动理论向实际应用的转换。文章将从USV环境感知、路径规划和航向控制三个部分对所采用的算法和方法进行归纳总结,并对USV避碰技术未来发展方向提出展望。
2 环境感知
环境感知能力是USV实现避碰、自主执行任务的前提和基础。USV的环境感知方式主要包括主动式感知、被动式感知和融合式感知三种。主动式感知是传感器主动向外界发送探测信号并接收返回信号进行感知的方式,其主要包括毫米波雷达感知技术[1~3]、激光雷达感知技术[4~6];被动式感知是通过传感器被动接收外界信号进行感知的方式,其主要包括视觉相机感知技术[7~12]和全景视觉感知技术[13~16]等;信息融合感知技术[17~20]是利用多个传感器获取的关于对象和环境全面、完整信息,并在一定的准则下加以自动分析和综合,从而产生对观测对象的一致性认知和决策的信息处理过程。它能够综合利用多传感器信息源的不同特点,多方位地获得相关事物的信息,增强数据可信度,提高感知的可靠性和精度,是当前研究热点。
2.1 主动式感知
2.1.1 毫米波雷达感知技术
毫米波雷达是工作在毫米波(30GHz~300GHz频域、波长为1mm~10mm)波段的雷达。其具有探测范围广、穿透能力强、体积小等特点。由于海上目标数量多以及障碍物散射强度不同将会受到噪声的干扰容易造成虚警。针对此问题李瑞伟[1]等提出一种基于欧氏距离的点迹凝聚方法,解决了对于雷达数据存在无效点迹而产生的目标点分裂和虚警问题。Cao Lin[2]等提出了一种无需联合校准即可识别海洋障碍物和毫米波雷达传感器信息的方法,用来检测和识别海洋障碍物目标。该方法提取目标作为特征向量的位置和速度,并设计匹配评估函数,从两个传感器的数据信息中找到最佳匹配,提升了海洋障碍物目标识别效率。针对毫米波雷达的目标缺失现象,Zhai G[3]提出了一种基于自适应Sage-Husa卡尔曼滤波的目标跟踪算法,验证了算法估计的目标信息的准确性。毫米波雷达还具有目标本身的多样性和障碍物的散射强度不同,雷达会受到噪声的干扰的缺点。
2.1.2 激光雷达感知技术
激光雷达是以激光作为载波,激光是光波波段电磁辐射。其具有更好的分辨率和灵敏度,探测精度高等特点[4]。Wang S[5]等提出了一种基于船载激光雷达点云数据(PCD)的船舶与海岸线识别方法。对内河目标回波数据和噪声进行了分析和滤波,基于这三个鲁棒目标特征(相对长度、纵横比、点云的规模),采用K-Nearest Neighbors(KNN)分类方法对障碍物进行识别。但是对于移动的船只上非常明显的特征比如直线的长度,此方法效果较差。针对此问题,王肖[6]等对于动态目标感知进行了研究,考虑目标点云分布特性的状态观测及跟踪方法。采用了动态参考点、分块聚类等方法进行建模。并且在多目标的跟踪中提出决策树-跟踪门解决了复杂环境的关联模糊性,提升了动态目标的检测效率。激光雷达还具有受到天气因素影响大,不能在雪雨等极端天气下工作的缺点。
2.2 被动式感知
2.2.1 视觉相机感知技术
视觉相机是通过镜头投影到传感器的图像传送到能够储存、分析的设备上。其具有重量轻、功耗低、信息丰富等特点。在针对障碍物的检测方面。Han Wang[8]通过使用单眼和立体视觉方法,在航速达12节的高速USV中实现了检测和定位30m~100m范围内的多个障碍物的能力。随后其又对此方法进行了改进[9],融合了岸基障碍物探测设备,实现了对障碍物30m~300m障碍物的探测,但探测距离上还是不足以在实践中应用。为此该团队[10]提出了一种检测高清图像(2736×2192)由粗到精的方法,实现实时500m内的成功目标跟踪范围。但是目前只考虑了单个目标的检测,未来可以将此方法应用到多目标检测中。
在针对水面环境检测方面。梁秀梅[11]等使用改进的mean-shift的自适应图像分割算法、特征提取方法与目标图像识别技术。建立了海上障碍物和船只图像数据库,考虑了不同天气下对图像的影响,使用BP神经网络算法对其进训练,对障碍物和船只图片的识别率的目标达到了89.67%。但是效率较低,精确度差。张伊辉[12]等针对水面复杂环境不断变化的问题,在目标图像识别的预处理过程进行了滤波和直方图增强。处理后的图像进行自适应Otsu方法的目标分割和目标特征提取。利用获得的特征对LVQ神经网络进行USV视觉图像目标识别的训练和测试,对目标的识别率达到了94.44%。相比于前述方法提高了准确度。Feng T[7]等使用视觉相机对海天线水岸线进行检测,提出了一种适用于不同环境的鲁棒形态河岸线方法,可以在复杂的环境下提升检测的效率。视觉相机还具有光学图像中的海洋目标容易受到天气因素的影响,鲁棒性较差的缺点。
2.2.2 全景视觉感知技术
全景视觉是通过在设备周围安装的摄像头来获取设备周围的图像,从而提供更多的视觉信息[13]。其具有较大水平视场的多方向成像系统,能够获取丰富的环境信息,具有常规视觉相机无法比拟的优势,但目前在USV上应用较少。尹义松[14]通过全景视觉图像对利用海天线边缘梯度信息对附近的小目标进行了识别,可以在海雾、阳光直射等天气下对小目标进行检测。冯闪闪[15]等研究了鱼眼摄像头的成像模型,通过三维全景图像拼接、融合等技术,建立三维全景视觉辅助系统,有效的识别出障碍物并实施避碰。随着算力性能的提升和算法的优化,全景视觉系统趋向于更高的图像分辨率、更高的灵敏度、更好的实时性。未来以旋转式、多相机拼接式为代表的高精度全景视觉系统有望在USV航行障碍物检测与识别领域得到应用[16]。全景视觉同样还具有目标容易受到环境多种因素的影响,可见光图像的特征提取困难的缺点。
2.3 信息融合感知技术
信息融合感知技术是对多个传感器的信息进行关联、相关和综合处理。其具有强鲁棒性、高准确性和高空间分辨力等特点。王亚丽[17]等使用毫米波雷达对捕获前方目标的距离、速度和加速度的信息,将信息传给摄像头建立感兴趣区域。使用Adaboost方法完成目标的识别,实现了毫米波雷达与机器视觉获取数据在空间和时间上的融合。但是未考虑到在夜间光线不足时的情况。针对此问题的目标识别方法,程蕾[18]等利用毫米波雷达和相机进行了进一步的研究。利用雷达初步获取有效信号,排除干扰信号,使用相机进一步检测目标的尾灯信息,再将信息融合对行进的目标进行检测。许大光[19]等将毫米波雷达应用于无人艇目标检测,使用经典卡尔曼滤波实现对目标的跟踪,结合YOLO神经网络达成对目标识别的功能。最后采用了信息融合方法,依据信息融合规则得到障碍物相关信息。Yuan J[20]等采用雷达和机器视觉融合来检测目标,并设计了粒子滤波器来跟踪目标。该方法采用样本多样性改进程序来解决样本短缺问题,但跟踪精度随着粒子数量的增加而提高,计算量大。信息融合感知信息之间的关系和结构层次复杂,具有不同传感器受到噪声影响容易产生虚警,信息的高维度和大尺度导致计算量庞大的缺点。总地来说信息融合技术是目前环境感知技术的趋势,因此针对信息融合的不足提出一些改进方向:
1)对信息融合系统进行系统性建模综合集成,并整体优化。
2)利用算法冗余来降低不确定性[21]。
3)对算法进行优化和数据降维处理,提高信息融合的效率。
针对全景视觉、毫米波雷达、激光雷达技术以及信息融合的优缺点如表1所示。
表1 各感知技术的比较
3 局部路径规划算法
局部避碰规划是基于已知环境感知信息实时规划出一条满足USV动力学约束的无碰撞路径。在USV航行的过程中,传感器实时采集的信息和通信系统实时告知艇体附近的障碍物、船舶和突发信息,使得USV在保证能完成原任务的同时驶离原路径进行合理规避[22]。常见的局部规划算法有人工势场法、蚁群算法、细菌觅食优化、人工神经网络算法等。
人工势场法(APF)是智能体在环境中运动,其与目标点之间产生引力,与障碍物之间产生斥力,最后通过合力来控制智能体运动。其具有计算简单、效率高的特点。Xie S[23]等提出了一种改进的避障算法,修正了引力场函数。在改进型APF中,USV能够绕过目标周围的障碍物成功到达终点,只花费了和原算法近似相同的时间,但其不是最优解。APF还存在障碍物复杂环境下陷入局部最优的缺点。
粒子群优化(PSO)算法即源于对鸟群捕食行为的研究,一群鸟随机搜寻食物,若此区域里只有一块食物,找到食物的最简单有效的策略就是搜寻目前距离食物最近的鸟的周围区域[24]。其具有简单有效的达到收敛区域。但是PSO存在着精度较低,容易陷入局部极小点的缺点。针对此问题Xia G[25]利用量子力学提出了改进的量子PSO,不仅收敛速度相比原算法更快,而且有效地避免了陷入局部最优的状态,但是存在着精度较低的缺点。
蚁群算法(ACO)来源于蚂蚁在寻找食物过程中发现路径的行为。其具有过程直观、求解思路简单的优点。Liu X[26]基于ACA和聚类算法(CA),针对USV的动态避障和路径规划问题,构建了一种适用于复杂海洋环境的自动避障方法。基于ACO和CA两种智能算法的动态路径规划和避障算法,具有收敛时间短、计算负载均衡、综合性能指标好的特点。但ACO还存在稳定性差,求解函数困难的缺点。
细菌觅食优化算法(BFO)是受细菌的觅食行为启发而提出的算法,将每个细菌看作带求解问题的可行解,通过细菌的趋向、聚集、繁殖和迁徙的四种行为完成最优解的搜索。其具有简单、所需经验少的优点。但有仍易于陷入局部最优的问题,针对此问题,龙洋[27]等将模拟退火算法的机制引入到细BFO中,计算更新前后的迁移个体的适值度,接受优化解的同时以一定概率接受劣解,使得BFO能够较好地跳出局部最优。但BFO还存在着单个细菌个体之间的信息交流不足和搜索步长的固定影响着算法的收敛速度,不满足在复杂环境下USV避碰实时性的缺点。
人工神经网络(ANN)是对人脑神经元网络进行抽象并建立模型,按不同的连接方式组成不同的网络。其具有寻得最优解的能力,模型建立简单的特点。其被广泛并成功地应用于各种机器人问题。如机器人在导航任务中选择一个具有连续值的转向角,神经网络机器人控制器会尽量在导航任务中像生物一样[28],然而USV的运动规划不仅仅是避免碰撞和到达目标点,其运动稳定性高也是成功执行任务的关键。USV运动的稳定性是一个在大多数相关工作中被忽略的关键属性,其要求USV的转向角尽可能为合理值,以免转向角在运动过程中突然大角度改变。Shamsfakhr F[29]等使用ANN的反向传播算法使得其验证的机器人在遇到拐角时也能进行稳定的运动。Woo J[30]提出了一种基于深度强化学习的USV避碰方法。该方法将COLREGs,对于不同的情况有不同的回避要求设计奖励函数。适用于避碰决策阶段,决定是否需要避碰,如需要,决定避碰行动的方向。但是未考虑到多船(艇)会遇和两船(艇)通过协商绕开COLREGs进行避碰的情况。ANN还具有对模型的求解困难,需要强大的算力进行模型训练的缺点。
针对局部避碰规划算法的优缺点以及改进方法如表2所示。
表2 局部路径规划算法的优缺点以及改进策略
4 航向控制
在USV完成避碰的局部路径规划后需要交由航向控制系统实施避碰,其是USV避碰的关键。航向控制是根据航向偏差求解目标力矩,是一个时变、非线性、多扰动的复杂系统,其可以使得USV能够在航线上出现障碍物时快速准确改变航向来确保安全航行。目前常见的航向控制算法主要有PID 算法[31~32]、滑模控制[33~35]、模型预测控制[36~37]和模糊控制[38~39]。
PID算法是一种经典的控制算法,只需调节KP、KI、KD的参数即可快速准确完成系统的控制。其具有工程实现方便、鲁棒性强等特点[31]。使用PID控制航向要仔细调节控制参数才能达到最佳的控制效果,须事先测得USV所有水动力参数并将其输入系统,难以建立精确的数学模型。Yunsheng F[32]提出了一种USV航向控制的模糊自适应PID控制算法,通过模糊推理实现PID航向控制参数在线整定,且此方法对参数变动和外部扰动具有良好的鲁棒性。但PID算法还具有参数调节需要精细化的缺点。
滑模控制(SMC)是一类特殊的非线性控制,具有快速响应、对应参数变化及扰动不灵敏、无需系统在线辨识、物理实现简单的特点。然而现有的控制器大多是基于线性动态模型设计,没有很好地考虑非线性、各种不确定性。针对此问题Kim HyunWoo[33]研究提出了一种新的带扰动和状态观测器的鲁棒滑模控制方法,用于控制USV水射流系统的喷嘴角。在控制反馈回路中加入状态观测器和干扰观测器以提高跟踪性能可以实现对USV航向的良好控制,从而增加USV避碰的成功率。Chen Z[34]一种滑模控制器来跟踪直线和其他形状的任意期望轨迹,并利用饱和函数来避免抖振现象。与其它控制器相比,该控制器具有更快的响应速度、更好的暂态响应和鲁棒性。Wang R[35]提出了一种基于积分反推SMC的USV航向径向基函数(RBF)网络控制算法,实现了转向过程中船舶的准确、稳定的跟踪。SMC还具有当状态轨迹到达滑动模态面,难以严格沿着滑动模态面向平衡点滑动,产生抖振的缺点。
模型预测控制(MPC)是当前的控制动作是在每一个采样瞬间通过求解一个有限时域开环最优控制问题而获得。MPC能处理PID较难解决的多变量约束优化控制问题。为解决USV如何稳定地避障问题,王浩[37]等设计了一种基于准无限时域MPC的轨迹跟踪控制器。虽然在仿真的条件下可以很快的收敛到期望的航迹,但是未考虑到各类干扰的情况。柳晨光[36]验证了在相同的环境干扰和初始条件下,非线性模型预测控制(NMPC)的控制效果比线性模型预测控制(LMPC)的控制效果更好,得益于计算机计算速度的提升,对非线性的求解速率也得到提升。
模糊控制(FC)是一种使用模糊数学理论的控制方法。其具有比传统的控制理论更强的控制能力,对于过于复杂的系统具有很好的适应力的特点。FC的核心是建立一个合适的模糊控制规则库。在USV航行期间,障碍物的分布将影响船体的速度和航向[38]。但是FC精度不高,赵东明[39]等提出了一种应用模糊神经网络算法的航向控制器设计方法。通过仿真此设计方法具有控制精度高和鲁棒性好的特点。为了提高水面USV在未知、复杂环境下的连续避障性能,林政[38]等提出一种具有速度反馈的模糊避障算法,不仅考虑了所有障碍物的分布情况,设计了更为全面的模糊控制表,在保证USV避障性能的基础上降低了USV控制系统的复杂度。FC还具有控制系统复杂度高,控制精度不高的缺点。
目前大部分USV的控制还是使用的传统PID控制,虽然可快速准确完成系统的控制,但其鲁棒性较差,在不同环境下需要进行大量的调参。未来可以尝试不同的控制方法来对USV的控制系统进行控制。
针对PID、滑模控制、模糊控制以及模型预测控制的优劣做以下总结,如表3。
表3 航向控制技术优劣总结
5 结语
本文从环境感知、局部路径规划和航向控制三个方面对USV避碰技术发展现状进行了阐述,总结了近年来USV避碰技术领域取得的成果和不足,分析了各算法的特性及缺陷。由于USV工作环境的复杂性和未知性,需要不断改进和完善现有的避碰技术,提升对未来的预测能力,加强系统的自主学习能力,使USV系统更具有前瞻性。基于USV避碰技术的研究现状,提出如下展望:
1)在环境识别方面,目前仅使用单种类型的传感器进行采集数据所获得的信息远不足以支撑USV进行环境识别。未来应使用多传感器信息融合方法对环境进行精确的建模,采用鲁棒性强的算法对采集的相关信息进行识别。
2)在局部路径规划方面,虽然近十几年来智能算法得到了极大的进步,但是在USV的避碰规划方面应用大多还停留在理论或仿真阶段。未来应在进行局部路径规划时将任务区的水文状况特征考虑在内,这样可以更贴近于真实的任务区状态,从而提高路径规划算法在USV领域的实用性。
3)目前USV的避碰还未将编队和避障问题相结合,暂未考虑卫星定位信号中断或雷达、AIS设备失效的情况。一些文献的研究仅限于在开阔水域和可见度良好的情况下,未考虑到风浪流对船航行的干扰。这些将会是未来研究的重点方向。