APP下载

AUV 导航-规划-控制技术研究综述

2023-07-22李冀永钟荣兴徐雪峰邓福建于双宁王益民

舰船科学技术 2023年12期
关键词:惯导导航系统航行

李冀永,钟荣兴,徐雪峰,邓福建,于双宁,王益民

(天津航海仪器研究所, 天津 300131)

0 引 言

智能水下机器人(autonomous underwater vehicle,AUV)是一种无脐带缆、依赖自身能源以预编程或完全自主方式完成作业任务的无人水下潜器[1-2]。较之遥控水下机器人(remotely operated vehicle,ROV)或载人潜水器,AUV 具备脱离操纵人员自主航行实现自主作业的能力,无需母船支持,具有更好的安全性和经济性[3-4]。AUV 一般用于海洋科考任务、工程设备检修维护以及军事任务,如海底石油管线巡检、地形地貌精细探测、水文参数测量、矿产资源探测、水下目标搜索、自主排雷、反潜警戒以及中继通信等,近年来,受到各国科研机构及研究人员的广泛重视[5]。

AUV 自主航行是实现作业任务重要基础,品质良好的自主航行需要几点要素:1)导航系统提供稳定精确的实时位姿信息。AUV 作为一类自主机器人系统,完成既定航行任务的前提是明确自身位姿状态,而水下环境中电磁波传输距离极短,AUV 水下航行时无法使用卫星导航设备定位,需依靠惯性导航元件、多普勒测速仪(Doppler velocity logger,DVL)等设备实现导航[6-7],导航精度不仅影响航行任务完成效果,还决定了AUV 上浮校正位置的次数,影响AUV 隐蔽性。2)规划系统提供安全可行的航行路径。AUV 在广阔水域航行,需充分利用环境信息进行实时决策,结合自身传感器规避环境中的未知障碍,以高效安全的方式规划安全经济的路径[8-9]。3)控制系统实现品质良好的运动控制。AUV 需要充分考虑自身特性,根据配置的执行机构,在具有环境扰动、模型参数不确定等影响下稳定完成期望运动,从而实现预定的具体任务[10-11]。

本文分析近年来AUV 自主航行过程中导航、规划以及控制技术的发展,最后对AUV 未来发展趋势和挑战进行了展望。

1 AUV 导航技术

AUV 作为一种无缆自治的水下机器人,由自主导航、规划、控制构成的自主航行能力是AUV 完成任务的核心,如图1 所示。尤其随着AUV 面向智能化、集群化发展过程中,自主航行技术对保障AUV 作业能力起到愈发重要的作用。

图1 AUV 自主航行框架Fig. 1 The architecture of AUV autonomous voyage

水下导航系统需要提供AUV 的准确位置、姿态信息,引导AUV 从起始点按照要求精度到达目的地。由于水下环境中电磁波传输距离极短,卫星导航技术无法在AUV 处于水下时应用,因此水下导航与陆空导航具有较大差别。依据AUV 任务需求合理使用各类导航手段是AUV 完成既定任务的基础,常见的AUV 导航技术包括惯性导航技术、水下声学定位与导航技术、地球物理场导航技术等。

惯性导航设备因具有自主性好、信息输出频率高而成为了组合导航系统的核心部件之一,借助其他高精度的导航设备辅助惯性导航设备抑制误差随时间的积累或修正误差,以提高导航系统的性能指标[12]。水下声学定位与导航包括利用多普勒测速仪(Doppler velocity logger,DVL)和声学基线系统两类:DVL 能够获取AUV 相对水底或水层的速度,在AUV 导航系统中往往与惯导进行信息融合提升惯导精度;声学基线系统分为长基线、短基线和超短基线系统等,能够依据声学信息提供AUV 位置,但长基线系统需要在海底预先铺设,短基线和超短基线系统作用距离均相对有限,对环境有一定需求。地球物理场导航主要包括重力匹配导航、地磁导航等,能够直接获取位置信息,但需要事先在AUV 上建立用于信息匹配的数据库,在AUV 上应用尚不成熟。目前,以惯性导航系统、DVL 等传感器为基础的组合导航技术在AUV 上得到了广泛的应用[7]。

RDI 与Kearfott 公司联合研制的SeaDevil 号AUV 使用惯导/DVL 组合导航系统,其惯导设备使用Kearfott 公司开发的惯性产品,包括MOD VIIA 型加速度计和T24、T16-B 罗经等设备,SeaDevil 号AUV 数据通过卡尔曼滤波器进行惯导/DVL 数据融合,定位精度可达到航程0.5%[13]。美国海军研究生院研制的ARIES 型AUV 采用惯导/DVL/GPS 组合导航系统,其中,选择频率为1 200 kHz 的DVL 以及惯导单元,并配置了一个水面载波相位差分GPS,以AUV 定期上浮方式修正导航偏差[14]。美国伍兹霍尔海洋研究所、蓝鳍机器人公司、英国国家海洋中心也均将基于惯性导航系统和DVL 的组合导航技术应用于AUV[15]。

AUV 需要选择一种有效信息整合策略将各传感器输出的导航信息进行有效融合,信息融合方法在组合导航系统中起着至关重要的作用,常用方法包括卡尔曼滤波(KF)、扩展卡尔曼滤波(EKF)、无迹卡尔曼滤波(UKF)、粒子滤波(PF)等。KF 是最基础的数据融合方法,挪威Hugin 1 000 型AUV[16]以及丹麦的Maridan 150 型AUV[17]均采用了该方法进行数据融合。由于水下环境复杂,模型难以精确建立,因而EKF,UKF,PF 等非线性数据融合算法被进一步应用于AUV 组合导航领域。D.Loebis 等[18]将模糊逻辑技术引入到PF 和EKF,对基于GPS/惯导的AUV 组合导航系统进行了数据融合研究,仿真结果表明该技术能提高组合导航系统的性能。张晓娟等[19]将EKF 应用于AUV 组合导航,AUV 导航系统包含罗经/DVL/GPS,仿真结果表明EKF 能很好的融合观测数据,误差相对于GPS 和船位推算单独定位时明显减小。张涛等[20]将UKF 应用到惯导/LBL 组成的AUV 组合导航系统中,提升了系统的定位精度。Karimi 等[21]面向基于惯导/DVL的组合导航系统,分别采用UKF 和EKF 进行了数据融合验证,结果表明EKF 精度更好。

当前,以惯导、DVL 为核心传感器,以EKF,UKF 等算法进行多传感器数据融合是AUV 实现自主导航的主流做法,但其也具有以下缺陷:1) DVL 直接测量速度信息而非位置信息,虽然能校正惯导的位置信息,但组合后得到的位置信息依然会随时间发散;2)海洋环境中存在的温、盐、密变化、风、浪、流干扰均会影响导航效果,因此,AUV 需要定期上浮通过卫星导航校正,不仅降低了AUV 作业效率,还影响了其隐蔽性;3)由于DVL 是一种主动声源,会进一步削弱AUV 隐蔽性。因此,各研究机构也在研究多种辅助导航手段提升水下自主导航效果,随着水下声学定位与导航、水下地形匹配、水下重力匹配等辅助导航技术的发展,AUV 长航程导航效果有望得到进一步提升。

2 AUV 规划技术

AUV 的路径规划指在包含障碍物等约束条件的水下环境内,AUV 对预期航线、航向等不断迭代、优化,形成符合某类目标函数最优的路径的技术[22]。由于AUV 决策自主能源自持的特性,良好的规划技术不仅能够确保AUV 及时规避障碍物,实现安全航行,还能提供最优路径,节约能源。AUV 路径规划可分为全局路径规划和局部路径规划,全局路径规划指AUV 根据电子海图等手段获取已知全局环境信息从而规划出的路径,可以在AUV 执行任务前离线获取,因此对算法实时性要求不高。局部路径规划指AUV 在航行过程中根据配备的声呐、摄像机、DVL 等传感器感知到环境中事先未知的障碍物、实时海流情况下,快速调整现有规划路径,对于算法实时性、鲁棒性要求较高[23]。在具体规划方法上,可以分为以人工势场法、视觉锥法、A*和D*等算法为代表的传统算法以及以粒子群算法、蚁群算法、深度学习算法、强化学习算法为代表的智能算法。

人工势场法由Khatib 发明[24],这种方法利用环境中障碍物产生的虚拟斥力和目标点产生的虚拟引力引导机器人达到目标,具有结构简单,容易实现的优点,但存在容易陷入局部极值、机器人在障碍物前方难以搜索可行解等缺陷。Yun 等[25]提出一种改进人工势场法,避免了局部极小值,并降低了水下机器人首向改变量;Cheng 等[26]利用在人工势场法中利用速度矢量合成技术降低了AUV 航行中的能耗。A*是一种启发式规划算法,常用于静态环境中AUV 的规划避障。Chen 等[27]提出了一种基于A*算法的AUV 全局规划方法,Garau[28]进一步在A*算法中考虑了海流对AUV 的影响。但A*算法基于网格搜索策略,限制了AUV 搜索空间,有一定局限性。D*算法对A*算法进行了改进,进一步适用于动态路径路轨问题。视锥法基于AUV 前视声呐对障碍物的感知,通过构造一个避障速度锥实现障碍物规避。Wiig 等[29]对该方法进行了了大量研究与改进,目前完成了纵倾速率、纵倾和关键距离约束条件下复杂海底地形规避、冰盖避碰航行、多组动态障碍物共同规避等复杂场景的避碰算法的仿真与试验验证,为Hugin AUV 提供了避碰系统。

智能算法可以进一步分为基于群体智能与基于机器学习两类算法。基于群体智能一类包括蚁群算法、粒子群算法、遗传算法等,这类算法将AUV 路径规划转换为目标函数寻优问题,能够在高维空间有效使用,较好解决作业调度和旅行商问题,但也存在需要精确环境模型、不易得到全局最优解的缺点。占银[30]提出了一种改进蚁群与人工势场结合的AUV 规划算法,实现全局规划与局部避障的有效结合,改善了传统蚁群算法中收敛慢、不易得到全局最优的缺陷。祖伟[31]在粒子群算法中引入了遗传算法中交叉、变异策略,提升了算法搜索能力,实现了AUV 在实际海底的三维路径规划,对突发的障碍也具备一定适应性。Tanakitkorn 等[32]研究了一种针对AUV 的遗传算法,通过在代价函数中增加A U V 能量损耗项,实现了AUV 节能路径规划。基于群体智能的规划方法还包括萤火虫算法、人工鱼群算法等,这一类算法均较适用于AUV 全局路径规划。

基于机器学习方法主要包括人工神经网络算法、强化学习算法等,需要通过数据训练进行学习,具有对环境模型依赖性低,能够解决实时规划的优势。但部分算法学习成本较大,需要大量数据、时间,且泛化性依赖于学习效果。AUV 规划时一般将传感器采集的环境信息作为网络输入,将规划路径作为输出,通过大量数据对网络进行训练得到误差收敛的网络模型。朱大奇等[33]重点研究了障碍物对神经网络中神经元激励和输出的影响,AUV 能够利用人工神经网络实现避障规划,其团队还将自组织神经网络与生物启发神经网络结合,继续研究了多AUV 路径规划算法。强化学习是一类无监督学习方法,将规划作为马尔科夫决策过程处理,环境根据AUV 动作给出奖励或惩罚强化信号,AUV 根据强化信号和自身状态选择动作。强化学习是一个不断试探、评价从而改善动作策略的过程,目的是使累积奖励最大,可以在无先验环境下实现AUV 避障。冉祥瑞[34]设计了一种基于MaxQ 学习算法的AUV 路径规划分层框架,通过分层强化学习方式获得避障策略,并在仿真中验证了算法的有效性。徐杨[35]结合使用了粒子群算法与值迭代网络的强化学习方法实现了海生物捕捞机器人的避障规划。Yoo[36]利用强化学习算法实现了船舶在海流中的路径规划,并在仿真中与A*算法进行了对比。Cheng 等[37]将深度强化学习算法引入到水下机器人避障中。

3 AUV 控制技术

AUV 通过导航系统获得自身运动状态,通过路径规划算法得到期望路径或轨迹后,需要依靠控制算法计算AUV 执行机构输出,实现路径或轨迹误差的收敛。设计品质优良的AUV 控制器需考虑如下难点:1)大部分AUV 是一类欠驱动系统,部分自由度不能直接由执行机构控制,需要依靠动力学耦合关系间接控制;2)AUV 运动学模型和动力学模型具有强非线性,其水动力系数还会随着航态而变化;3)AUV 动力学模型包含大量水动力系数,模型难以精确获得,且易遭受外部环境干扰影响。

PID 控制器结构简单,鲁棒性强,广泛应用于AUV 运动控制中。文献[38] 提出了一种模糊自适应PID 算法,自主调整控制器参数,实现AUV 首向和深度控制。闫敬等[39]提出了一种融合Q 学习与PID 控制器的AUV 跟踪方法,利用Q 学习策略调节控制器参数,改善控制品质。在IAUV 方面,文献[40] 利用PID 控制器实时跟踪逆运动学规划器规划的期望轨迹,实现了Girona-500 型IAUV 在机械臂作业时的稳定姿态控制,完成了水下目标平稳抓取。PID 控制器本质是一类线性控制器,但AUV 是一类强非线性系统,易受外界扰动影响,因此这类控制方法具有一定局限性。

S 面控制是刘学敏等[41]提出的一种用于AUV 运动控制的方法,借鉴了模糊理论思想并与PID 控制相融合。S 面控制利用Sigmoid 函数构造关于误差的非线性控制器,因此相较于传统PID 控制器更适用于具有强非线性特征的AUV。李岳明[42]进一步对S 面控制器的位置阶和速度阶的稳定性做出了全面论证,并提出了一种新的积分调整项,构造了品质更好的自适应S 面控制器。Li 等[43]面向携带机械臂的IAUV,提出了一种基于模型的S 面控制器,结合干扰观测器以及机械臂耦合干扰前馈补偿项,实现了IAUV 精确运动控制。目前,S 面控制及其改进方法广泛用于AUV,ROV 以及USV 的运动控制中。

滑模控制是一类特殊的变结构非线性控制方法,由切换函数和趋近律构成,切换函数评估当前系统状态,根据状态选择对应趋近律形成反馈控制律趋近滑模面,因此具备变结构特性。孙俊松[44]提出了一种基于干扰观测器的终端滑模控制方法,提高了海流干扰和参数摄动情况下AUV 的控制品质。考虑执行机构饱和及曲线路径跟踪问题,韩亚楠[45]提出了一种降阶扩张状态观测器和反步积分滑模相结合的控制方法,在模型参数不确定、具有外界干扰的条件下进行了仿真验证。滑模控制不需要模型精确参数,对外界干扰具有鲁棒性,能较好结合其他控制方法。滑模控制的缺陷是系统在趋近律引导下可能会频繁穿越滑模面,引起抖振现象,导致执行机构震颤,影响控制品质。

反步控制是一种常用于欠驱动AUV 的控制方法,其设计过程通过递归迭代李雅普诺夫函数,求取控制器的解析解。贾鹤鸣[46]提出了一种滤波反步法,通过滤波器获得信号微分值,避免了系统对虚拟控制输入信号反复求导过程,对信号具有一定鲁棒性,实现了欠驱动AUV 三维路径跟踪控制。徐昊[47]考虑AUV 受高频海浪影响,基于海浪滤波器与滑模反步法设计了控制器,实现AUV 节能三维路径跟踪控制。Liang 等[48]针对欠驱动AUV 三维路径跟踪问题,设计了基于滑模控制和反步法相结合的控制器,并通过模糊理论近似外界干扰和模型不确定项,提升控制器的鲁棒性。反步法主要问题是计算较复杂,可能需要面对虚拟控制输入微分爆炸或积分饱和等问题。

除上述方法之外,自适应控制、模糊控制、神经网络控制均在AUV 自主航行中有一定应用。

大部分AUV 配备了具有鲜明物理意义的十字舵配合主推进器构成执行机构,控制器解算后直接输出期望舵角和主推进器转速并由对应执行机构响应。但传统十字舵出现舵面卡死、失效等故障,会对AUV 航态造成严重影响。采用X 型布置的AUV 尾舵,每个舵面均能产生横摇、纵摇、首摇力矩,具有更强的容错控制能力,文献[49]还论证了X 舵有相比十字舵更好的舵效,因此,X 舵在AUV 上得到了越来越多的应用。但X 舵物理意义不如十字舵明确,X 舵AUV 控制器输出不再是舵角而是力/力矩形式,还应考虑控制分配策略。

控制分配策略可分为直接分配法、伪逆法及其改进方法、最优分配法等。直接分配法利用几何优化法直接进行控制分配,易于理解但计算量大。伪逆法原理是通过对执行机构的配置矩阵直接求取伪逆,计算执行机构输出。Fosson[50]将伪逆法引入AUV 控制分配,该方法及其改进方法在AUV 领域应用较为广泛。文献[51]利用加权伪逆法为各执行机构分配了权重,一定程度上避免了执行机构饱和问题。伪逆法计算量小,易于理解,但没有考虑执行机构的饱和特性,也未考虑控制输入的饱和特性,可能会影响控制精确性,此外仅能对单一目标进行优化。最优分配法采用最优化理论,通过约束条件下对目标函数寻优的方式实现控制分配策略,王小平[52]提出了一种改进序列二次规划算法,提高了X 舵的控制分配精度和计算速度。张英浩[53]提出了基于Levy 飞行特征的X 舵优化分配方法,避免目标函数陷入局部最优的情况,并讨论了卡舵、舵损模式下AUV 容错控制及控制分配的策略。

4 未来发展趋势和挑战

AUV 自诞生以来就不断向智能化方向发展,但当前AUV 仍处于较低智能化水平[54],自主学习能力和与环境交互能力有望通过引入人工智能技术进一步提高;相较于UAV、陆地机器人等机器人系统,AUV 仍以个体作业为主,集群编队能够大大加强AUV 环境搜索、海域侦察等任务的作业效率,是AUV 未来发展的另一大趋势;深远海航行具有重要的科学和军事意义,AUV 无需驾驶员,深远海航行安全性更好,随着新材料、新能源技术的进一步发展,朝着更深、更远的大洋进行探索具有更强的可行性。AUV 向智能化、集群化、深海远洋化发展的需求,也为由导航、规划和控制构成的自主航行技术提出了新的挑战。

当前AUV 导航系统多以由惯导、DVL 为核心构成。如何进一步提高惯导、DVL 等传感器的测量精度、如何构造更适于AUV 运动特性的数据融合方法、如何在个别传感器失效时有效保证导航精度等问题均需进一步研究。在多平台组队集群时,如何根据多AUV 甚至多跨域平台配置的异构传感器实现高精度导航,发挥“1+1>2”的作用也需进一步研究[54]。军事任务中,还需要考虑DVL 测量带来的隐蔽性问题。最后,将地磁导航、重力匹配、地形匹配、SLAM 等技术融入到AUV 导航系统中,有望解决传统AUV 导航系统需上浮校正的问题,大大增强AUV 航行隐蔽性。

当前AUV 路径规划技术以A*、D*、人工势场等方法为主,面向未知动态环境适应性较差,利用强化学习方法使AUV 具备面向环境自主学习能力有望解决这一问题[23]。但如何合理确定强化学习中的奖励函数、如何提升强化学习泛化性、如何解决强化学习训练需要大量数据等问题需要进一步研究。此外,在组队集群任务中,借助编队中其他AUV 实现品质优良的规划效果也需要进一步研究。

当前AUV 实际航行中的控制算法仍以PID 控制、S 面控制等结构简单、无需模型参数的控制方法为主。但面对波、浪、流干扰的复杂海洋环境以及不同工作模式(如AUV 目标搜索、回收、IAUV 带臂作业等)仍缺乏足够适应性。进一步通过人工智能方法提升AUV 面向不同环境的控制能力,强化AUV 深远海作业时故障诊断以及容错控制能力,研究AUV 长距离航行能量最优控制方法,从AUV 控制精度、控制鲁棒性以及节能角度提高控制效果,是AUV 控制技术面临的重要挑战。

5 结 语

本文从多角度分析归纳了AUV 自主航行中导航技术、规划技术以及控制技术的发展,对AUV 自主航行技术未来发展趋势和挑战进行了展望。

猜你喜欢

惯导导航系统航行
到慧骃国的航行
说说“北斗导航系统”
自适应模糊多环控制在惯导平台稳定回路中的应用
“北斗”导航系统是怎样炼成的
无人机室内视觉/惯导组合导航方法
小舟在河上航行
基于Bagging模型的惯导系统误差抑制方法
一种GNSS/SINS容错深组合导航系统设计
航行
解读全球第四大导航系统