基于切换视线法的欠驱动无人艇鲁棒自适应路径跟踪控制

2019-01-03曾江峰万磊李岳明张英浩张子洋陈国防

兵工学报 2018年12期

曾江峰，万磊，李岳明，张英浩，张子洋，陈国防

(1.哈尔滨工程大学水下机器人技术重点实验室，黑龙江哈尔滨 150001;2.哈尔滨工程大学船舶工程学院，黑龙江哈尔滨 150001)

0 引言

随着海洋资源开发和海洋防卫技术的快速发展，无人艇(USV)作为一种重要的海洋装备受到了广泛重视，其在海洋环境监测、海底测绘、军事侦察等活动中扮演着越来越重要的角色[1-2]。为了高效地完成给定任务，USV通常需要进行路径跟踪操作。然而复杂多变的海洋环境极大地影响了USV的操纵性，且受到经济成本、复杂性等因素影响，大部分USV都属于欠驱动系统，给实现精确的路径跟踪带来了挑战。

制导律在路径跟踪控制系统中至关重要，并在一定程度上决定了路径跟踪效果[3]。目前，由于视线(LOS)法简单、高效，已被普遍应用于路径跟踪制导系统设计中[4-7]。需要指出的是，文献[3-7]所研究的参考路径均为特定几何路径或光滑多项式曲线路径。这些路径在实际应用中难以提前假定，存在较大的局限性。与之不同，文献[8-10]研究由一系列连接航路点的直线单元组成的复合路径跟踪问题，航路点可以提前设定，更能体现工程应用中USV的路径跟踪需求。最初，基于航路点路径跟踪中的LOS圆半径被设计为定值[8]，其形式简单但收敛时间过长。为了提高收敛速度，一些学者相继提出了比例型LOS[9]、指数型LOS[10]. 其中，指数型LOS在改善收敛性方面更为显著，但由于其引入了指数函数、朗伯W函数，使得求解LOS角的运算时间过长。路径跟踪控制系统的另一重要组成部分为动力学控制器。文献[11-13]在USV、船舶等水动力系数已知的假设下设计了基于反步(Backstepping)法的路径跟踪控制器。考虑到模型的不确定性问题，文献[14]设计了基于径向基函数神经网络(RBFNN)的稳定自适应控制器；文献[15]设计了鲁棒自适应RBFNN路径跟踪控制器。值得注意的是，通常的Backstepping方法对USV的模型参数过于依赖，而传统RBFNN为了获得较高的逼近精度，需要设置大量网络节点个数，从而使在线自适应参数过多，导致学习时间过长。

基于以上分析，本文研究一类欠驱动USV基于航路点的路径跟踪问题。针对制导系统，提出了一种新的切换型LOS制导律，在改善路径跟踪误差收敛性的同时，降低了求解LOS角的运算量。对于动力学控制器，则开发了一种基于预测器和RBFNN的复合神经网络，与传统RBFNN相比，其具有较高的逼近精度。同时，引入最小学习参数思想[16]进行网络结构优化，将每个网络的在线自适应参数固定为1个，而不依赖于网络节点数，能够有效地避免由于增加节点数而带来的网络计算负担。最后，通过仿真实验验证了所提出的制导律、控制器的有效性。

1 USV运动模型及问题描述

1.1 USV建模

对USV进行水平面的运动分析，其状态可以用向量[ηT,vT]T进行描述。其中：η[x,y,ψ]T表示USV在大地坐标系n下的位置及艏向角；v[u,v,r]T表示USV在艇体坐标系b下的纵向速度、横向速度和艏向角速度。则USV在水平面的三自由度运动学及动力学非完全对称模型[17-18]可表示为如下向量形式：

(1)

式中：矩阵R(ψ)∈R3×3、M∈R3×3、C(v)∈R3×3、D∈R3×3、B∈R3×2分别为USV从坐标系b到n的旋转矩阵、惯性矩阵、科氏力和向心力矩阵、阻尼力矩阵、执行器配置矩阵，它们的定义为

R(ψ)

(2)

(3)

C(v)

(4)

(5)

正常量m11、m22、m23、m32、m33、d11、d22、d23、d32为USV的水动力系数；f[fu,fr]T为控制输入向量，其中fu为推进器推力，fr为舵角产生的力矩；d[du,dv,dr]T为由风、浪、流等外界环境引起的干扰力/力矩向量，du、dv分别表示纵向、横向干扰力，dr表示艏向干扰力矩。

(6)

式中：

(7)

Fu(v,r)、X(u)、Y(u)、Fr(u,v,r)为光滑函数。本文假定USV的模型具有任意不确定性，即水动力系数完全未知或是时变的，同时动力学方程中的函数结构不确定。

为了更好地进行控制器设计与分析，本文引入如下假设：

假设2USV横向速度v具有一致耗散有界性。

对于一般的水面船舶来说，假设2总是成立的。文献[19]根据一些典型船舶的横向动力学特性对v的有界性给出了系统性的分析和证明。

假设3USV艏向控制器能保证对期望艏向角的精确跟踪，即ψ≈ψd[5]。

上述假设中，假设3的引入主要用于更方便地对横向路径跟踪误差进行分析。假设3可以通过调整艏向控制器参数，以减小艏向角跟踪误差来保证。

1.2 神经网络在线逼近

考虑到USV在实际海洋环境中的模型不确定性及干扰未知性，本文在控制器设计中使用RBFNN来增强控制器的鲁棒性。RBFNN具有非线性辨识能力，能够在一个紧集ΩZ∈Rn中逼近任意未知连续函数[20]：

f(Z)=W*TH(Z)+ε,∀Z∈ΩZ，

(8)

(9)

其中W=[w1,w2,…,wl]T∈Rl为权值向量，l为正整数，表示权值向量维数，H(Z)=[h1(Z),h2(Z),…,hl(Z)]T∈Rl为基函数向量。本文选用高斯函数作为基函数，其形式为

(10)

式中：bj为第j个基函数宽度；cj=[cj1,cj2,…,cjn]T∈Rn为基函数中心。

1.3 USV路径跟踪控制目标

路径跟踪不要求目标点与时间具有直接依赖关系，但有时为了满足一定的时间性能，可以增加一个被控对象沿指定路径的速度要求[21]。则USV的路径跟踪控制目标可以表述为

(11)

式中：ye(t)为USV垂直于期望路径的横向跟踪误差；ψd(t)为USV的期望艏向角；ud为期望纵向速度，一般为定值。

2 切换型LOS制导律设计

制导系统能为控制器提供一个实时的参考艏向角，用以引导被控对象趋向期望路径[22]。本文着重实用性，研究USV跟踪由一系列通过路径点的直线路径单元组成的复合路径问题，为此提出一种基于最短距离法、具有快速收敛特性的切换型LOS制导策略，如图1所示。图1中，P1,P2,…,Pk-1,Pk,Pk+1,…,Pn为路径的航路点坐标，Pk(xk,yk)为第k个坐标，PLOS(xLOS,yLOS)为LOS的参考位置，yd为期望位置，Pt(x,y)为USV在t时刻位置，αk-1为路径方向角，ψLOS为LOS角，Rl为比例型LOS的切换圆半径，Rs为切换型LOS的切换圆半径，Rmin为最小切换圆半径，Rk为第k个切换下一坐标点的圆半径，Δ为前视距离。

在由相邻的两个路径点Pk-1与Pk组成的直线路径单元上，可以通过如下关系求得LOS的参考位置：

(12)

式中：LOS圆半径R为以USV为圆心所做的与期望路径相交或相切的圆半径。考虑LOS圆与期望路径相交的一般情况，在图1中取R=Rl，使用投影算法可以得到视线角ψLOS为

ψLOS

(13)

式中：Δ一般取船长L的整数倍。在最初LOS制导律中，用于求取PLOS的圆半径为定值，并且严格要求R≥|ye|，以保证(12)式有解[8]。因此，为了应对所有的偏移距离|ye|，R必须设置充分大。但是较大的R相当于映射出较大的前视距离Δ，导致船舶以较长的时间收敛到期望路径。为此，一些研究者提出了比例、指数形式的R来缩短收敛时间[9-10]。使用比例形式的R来求取LOS位置方法如下：

(xLOS-x)2+(yLOS-y)2=R2=(Rmin+|ye|)2，

(14)

具有指数特性的R计算流程为

(15)

式中：朗伯W函数为f(x)=xex的逆函数；Rmin为船长的整数倍；d为指数衰减系数。

由(14)式、(15)式可知：当|ye|充分大时，指数形式的R≅|ye|要小于比例形式的R，并且产生一个与路径相切的圆。这使得期望航向垂直于预定路径，即驱使USV以最短的距离趋向期望路径；当|ye|比较小时，指数型R仍能保证其小于比例型Rmin+|ye|，并且以小于1的速率增加。因此，相比于具有比例型R的LOS制导律，指数型策略能够为USV提供一个更为陡峭的ψLOS，以缩短路径跟踪误差收敛时间。但是指数型R不能够通过任意增大d来加快R收敛至|ye|的速率，因为这样容易导致求取PLOS方程无解。另外，指数型R由于引入指数函数、朗伯W函数而过于复杂，在实际使用中会导致计算时间过长而无法满足实时性要求。

基于以上分析，本文提出一种新的、基于最短距离趋近思想并且运算量小的切换型LOS制导律。其R的更新策略设计如下：

R=0.5(1-sgn(|ye|-Rmin))(Rmin-|ye|)+|ye|，

(16)

式中：当|ye|>Rmin时R=|ye|，制导律能够引导USV始终以最短距离方向趋向期望路径；当|ye|≤Rmin时R=Rmin，制导律能够驱使USV以较大的速率快速消除路径跟踪误差。在图1中，基于所提出的切换型LOS制导律，LOS圆半径R的变化为Rs→Rmin，其中Rs为|ye|>Rmin时的LOS圆半径R. 比例型制导律R的变化情况为Rl，而指数型制导律R则介于二者之间。3种制导律R随偏航距离|ye|的函数变化曲线如图2所示。

3 鲁棒自适应控制器设计

本文通过对USV的运动模型深入研究，提出了一种基于预测器和RBFNN的鲁棒自适应复合神经网络控制器。相比于传统神经网络只使用跟踪误差进行权值更新，本文设计的复合神经网络使用跟踪误差和预测误差作为网络输入。由于为神经网络提供了更丰富的输入信息，网络收敛速度与逼近精度得到了提高。同时，网络设计借鉴最小学习参数思想，选择网络权值范数而非整个权值向量作为学习参数，将每个神经网络的在线自适应更新参数压缩为1个，能够有效地减轻网络计算负担。

3.1 艏向控制器

在风、浪、流等外界环境力扰动下，USV需要侧滑以抵抗干扰力，则期望艏向角可以定义为

ψdψLOS-β，

(17)

式中：βarctan(v/u)为侧滑角。则艏向跟踪误差为

(18)

对(18)式求导，得

(19)

则虚拟控制律αr可以设计为

(20)

式中：kψ>0为设计参数。

为了避免对虚拟控制量αr反复求导，本文引入动态面控制技术以避免计算膨胀问题。将虚拟控制量αr通过时间常数为Tr的1阶低通滤波器以得到滤波控制信号rd：

(21)

(22)

定义艏向角速度跟踪误差为

re=r-rd，

(23)

对(23)式微分并考虑USV动力学方程，得

(24)

定义函数φr(Zr)=Fr(u,v,r)，其中Zr=[u,v,r]T。由于假设USV水动力系数完全未知，φr(Zr)为光滑未知函数。使用RBFNN来对未知项进行逼近，则反馈控制律可以设计为

(25)

式中：kr>0为设计参数；r为未知正常量估计值，其中为理想权值的范数。将(25)式代入(24)式，可得

(26)

定义zr=r-为预测器的估计误差，并设计神经网络模型辨识更新律为

(27)

式中：λr>0为设计参数。

本文引入状态预测误差，并结合跟踪误差来构建神经网络自适应参数更新律r：

·r=ηr(12(r2e+μrz2r)HTr(Zr)Hr(Zr)-κrr)，

(28)

式中：ηr>0,μr>0,κr>0为设计参数。

根据以上设计，艏向误差动力学系统可以描述为

(29)

3.2 纵向速度控制器

定义纵向速度跟踪误差为

ue=u-ud.

(30)

对(30)式求导并结合USV动力学方程，可得

(31)

(32)

式中：ku>0为设计参数；u为未知正常量的估计值，其中为理想权值的范数。则由(31)式、(32)式可得

(33)

定义zu=u-为预测器的估计误差，并设计神经网络模型辨识更新律为

(34)

式中：λu>0为设计参数。设计神经网络自适应参数更新律u为

·u=ηu(12(u2e+μuz2u)HTu(Zu)Hu(Zu)-κuu)，

(35)

其中ηu>0,μu>0,κu>0为设计参数，则纵向速度误差动力学系统可以描述为

(36)

4 稳定性分析

4.1 横向路径跟踪误差分析

USV横向路径跟踪误差动力学方程可以结合(6)式及USV与参考路径之间的几何关系而得到：

(37)

考虑LOS制导律、 (17) 式与假设3，即USV艏向角ψ能够精确地跟踪如下定义的期望艏向角：

(38)

则横向路径跟踪误差动力学为

(39)

4.2 艏向和纵向速度跟踪误差分析

定理1对于由(6)式、(7)式组成的欠驱动USV系统，在假设1、假设2成立的前提下设计：制导律为(13)式、(16)式；控制律为(25)式、(32)式；神经网络自适应更新律为(28)式、(35)式；状态预测器如(27)式、(34)式，则能够保证系统中所有信号一致最终有界。

证明考虑如下李雅普诺夫函数：

(40)

对(40)式求导，并代入(29)式、(36)式，得

(41)

对 (41) 式进行不等式放缩[16]并进行整理，得

(42)

(43)

(44)

定义：

式中：

则(44)式最后可演绎为

(45)

(46)

(47)

(48)

(49)

因此，系统中所有信号一致最终有界。在所设计的动力学控制器中，可以通过调节控制增益kψ、ρr、ki、κi、λi、ηi以得到期望的暂态性能和稳态误差。而通过增加kψ、ρr、ki、λi，可以使跟踪误差和预测误差任意小。

5 仿真实验

为了验证本文所提出的基于切换LOS制导律和复合神经网络控制器的路径跟踪策略有效性及优越性，以文献[23]中的USV为对象进行了仿真实验。USV船长L=1.25 m，风、浪、流等引起的环境干扰力假定由1阶高斯- 马尔可夫过程生成[24]：

(50)

式中：cu、cv、cr为设计参数；wu、wv、wr为高斯白噪声。

在本节的如下仿真实验中，USV初始状态、控制器设计参数均保持不变。USV初始状态设置为[x(0),y(0),ψ(0)]T=[40 m,20 m,-π/6 rad]T、[u(0),v(0),r(0)]T=[0 m/s,0 m/s,0 rad/s]T，期望速度设置为ud=1 m/s，控制器参数选择为kψ=4、kr=8、ku=5、Tr=0.05、λr=λu=50、ηr=ηu=1、μr=μu=3、κr=κu=1. 每个神经网络各含21个节点，基函数分布区间为[-2,2]×[-1,1]×[-1,1]，宽度为bj=2.

首先，为了验证所提出的切换型LOS制导律的快速性与高效性，将其与指数型LOS制导律进行路径跟踪对比，控制器则共同采用本文所提出的复合神经网络。参考路径设定为弧形路径，模拟USV绕行障碍物，航路点坐标见(51)式。仿真中，最小LOS圆半径设定为Rmin=3 m，路径点切换的圆半径设置为Rk=3 m.

P1=(10 m,10 m),P2=(80 m,80 m),
P3=(150 m,100 m),P4=(200 m,70 m),
P5=(220 m,10 m).

(51)

运行仿真程序的计算机内存为8 GB，表1为分别使用两种制导律而完成路径跟踪的计算机负载对比，图3、图4分别为路径跟踪过程中的USV位置、偏航距离的结果对比。

表1 使用不同制导律的计算机负载对比

由表1可知，在控制器不变情况下，采用切换型LOS制导律而设计的路径跟踪控制系统所耗计算机平均内存与仿真时间均远小于指数型LOS. 验证了所提出的制导律具有简捷、高效、易于工程应用的特点。

图3、图4直观地反映了USV运动轨迹，紫色小艇表示使用切换型LOS的USV实时位姿；图4给出了USV在路径跟踪过程中的偏航距离收敛情况。从图3和图4中可以看出，两种制导律都能成功实现USV对给定路径的跟踪，但切换型LOS具有更快的收敛速度以及更好的拐点性能。在路径跟踪的初始阶段，偏航距离|ye|比较大，切换型LOS的圆半径R=|ye|，即USV以最短距离方向趋向直线路径单元，而指数型LOS的圆半径R>|ye|. 因此切换型LOS制导律能以较小的前视距离引导USV快速趋向期望路径。而当|ye|比较小时，切换型LOS的圆半径R=Rmin，指数型LOS的圆半径R>Rmin. 虽然指数型在|ye|=0时也能够取到R=Rmin，然而由于需要切换航路点以及环境干扰等因素的影响，|ye|不可能始终维持在|ye|=0. 因此，切换型LOS同样能够改善USV在转换航路点时的跟踪性能。

为了验证所设计的复合神经网络控制器的有效性，将其与只使用跟踪误差进行自适应参数更新的传统神经网络进行路径跟踪对比，而制导律则共同使用切换型LOS. 复合神经网络控制器标记为CNN，传统神经网络控制器标记为NN，跟踪路径选择梳状路径，模拟USV执行海底测绘任务。设置Rmin=5 m，Rk=3 m，路径的航路点坐标设定为(52)式，仿真结果如图5～图8所示。

P1=(47.55 m,-15.45 m),P2=(84.63 m,98.68 m),
P3=(113.17 m,89.40 m),P4=(76.08 m,-24.72 m),
P5=(104.62 m,-33.99 m),P6=(141.70 m,80.13 m),
P7=(170.23 m,70.86 m),P8=(133.15 m,-43.26 m).

(52)

图5为USV采用不同控制器进行梳状路径跟踪的轨迹图，紫色小艇为使用CNN的USV实时位姿。图6为路径跟踪误差收敛情况，其中图6(b)给出了艏向角跟踪在时间t为115～130 s的局部放大图。由图5、图6可知，CNN具有更快的响应速度与收敛精度。这是因为CNN使用跟踪误差和预测误差作为网络输入进行自适应参数更新，相比只采用跟踪误差的NN含有更丰富的输入信息，提高了网络逼近精度。由于存在环境干扰力，艏向角和纵向速度收敛至期望值并有微幅振动。由图5可知，USV艏向角并非始终与期望路径相切，原因在于本文在控制器中进行侧滑角补偿以抵抗漂移力，来提高路径跟踪精度。

另外可以看到，尽管梳状路径的长边与短边连接处的路径方向发生突变，USV的艏向与纵向速度能够快速做出相应的响应，如图6(b)、图6(c)所示。图7给出了所设计的CNN预测器在路径跟踪过程中对USV艏向角速度、纵向速度的估计结果，由图7可知该预测器能够实现对速度状态的准确预测。图8为CNN自适应参数的收敛情况，由图8可知自适应参数稳定后，能够有效地根据外界环境干扰及路径变化情况及时更新以保证较好的控制效果。由于本文使用最小学习参数思想进行网络结构优化，使每个网络只含有一个在线自适应参数，能够有效地减轻网络计算负担。图9给出了路径跟踪过程中控制力矩、控制力的变化过程，其稳定在一定的合理范围之内。

6 结论

本文对欠驱动USV航路点路径跟踪问题进行了研究，提出了基于切换LOS和复合神经网络的鲁棒自适应控制策略。其中，切换型LOS能够有效地解决传统制导律中的收敛时间慢、计算负载大等问题。另外，针对USV模型不确定性及环境干扰力未知问题，设计了基于预测误差和最小学习参数思想的复合神经网络控制器。该控制器相比于传统神经网络具有模型辨识精度高、在线学习参数少、易于工程实现等优点，并通过李雅普诺夫方法，对系统稳定性进行了分析。对比仿真实验验证了所提控制方法的有效性及优越性。