基于神经网络的潜艇水面航向控制研究
2014-08-06熊瑛,颜俐,许建
熊 瑛 ,颜 俐 , 许 建
(1 中南民族大学 电子信息工程学院,武汉 430074;2 中国舰船研究设计中心,武汉 430064)
由于任务的需要,潜艇主要在近海的水面及近水面航行,其活动范围经常在水面和距水面几十米的浅海区.统计资料表明,海面大约在70%的时间里有大小不同的海浪发生,因此潜艇在任务中不可避免地经常在风浪环境中运动.在海浪的作用下,潜艇会产生摇摆和击水,不仅影响潜艇的水面航行,而且影响潜艇的近水面航行.在PID操舵仪[1-3]中,通常采用控制参数人工整定的办法来适应潜艇航行工况和外部环境的变化.若控制参数不合适,将导致控制效果变差,操舵幅度大,操舵频繁,舵机损耗大,缺乏对潜艇动态变化及海况变化的自适应能力.自适应自动舵[4,5]提高了控制的精确性,减少了操纵工作量,但是,它以代价函数中的参数估算为基础,而且需要精确地建立扰动模型,算法繁琐,实现成本高,加上潜艇的非线性特性,控制效果和稳定性难以保证.因此,对潜艇在水面和近水面航行的操纵控制进行研究,并设计合理的滤波器滤除或衰减风浪干扰对操舵的影响将是本文的重点.
1 航向控制器和滤波器的设计
1.1 控制系统的结构设计
神经网络[6-8]是通过采用某种网络拓扑结构而构成的功能强大的活性网络,具有很强的非线性逼近能力,以及自学习、自适应和模型辨识的能力.潜艇在实际航行运动控制中,由于其航行速度的变化以及外界风、浪、流的干扰,在航向急剧改变或外界海况复杂的情况下,必须考虑潜艇操纵运动中由于非线性动力特性、系统滞后、执行机构死区等造成的非线性影响.针对潜艇参数不确定性和外界干扰随机性的特点,为了取得令人满意的控制效果,本文利用神经网络具有很好学习能力的特点,设计了直接模型参考的神经网络自适应控制器.可以针对潜艇在复杂海况下的学习,达到自适应的目的.
在水面和近水面航行时,风浪干扰的作用常常使潜艇沿某一指令航向作不规则的横荡和回转运动.风浪干扰所激励起的操舵,不仅会加剧舵机的磨损,增加潜艇航行阻力,而且会产生较高的操舵噪声,影响艇员的工作和生活环境.因此必须引入滤波器[9,10].潜艇水面航向控制的结构如图1所示.由于潜艇在水面运动会受到风浪干扰,因此可以通过利用参考模型的输出和实际输出的误差在线修正RBF神经网络的权值,从而达到自适应的目的.由于水面航向控制是一个单输入单输出的系统,不存在耦合关系.因此反馈回来的信号只有一个航向信号,为了达到降低打舵噪声的目的,必须对反馈的航向信号进行滤波,以降低潜艇打舵频率和出舵量.
图1 直接模型参考的神经网络自适应控制Fig.1 Direct model with reference to the control means of self-adapting neural network
1.2 航向偏差切比雪夫II型滤波器的设计
潜艇的航向控制是一种大惯性的具有低通特性的运动控制,所以它对低频扰动的响应比较大,而对高频扰动的响应较弱[11-13].风浪干扰相对于潜艇而言属于高频干扰,为此,在设计潜艇操纵控制器时有必要设计一种低通滤波器滤除风浪干扰的影响.这种低通滤波器的幅度平方响应在通带内应具有单调特性,并且在Ω=0处具有最大平坦响应,在阻带内具有等波纹特性.切比雪夫II型滤波器正是符合此种要求的滤波器.
切比雪夫II型滤波器的幅度平方响应表达式为:
(1)
在式(1)中TN(Ω)为n阶切比雪夫多项式,Ωs为阻带截止频率,Ωp为通带截止频率.
(2)
传递函数的阶数n通过阻带中一个特定频率上的衰减指标来确定.设在Ω=Ωs处,幅度等于1/A,则由式(1)和式(2)得到:
(3)
解式(3)的方程,可得:
(4)
切比雪夫Ⅱ型低通滤波器的传输函数既有极点又有零点.如果将其写成:
(5)
在式(5)中:C0为增益因子.则在jΩ轴上的零点为:
(6)
如果n是奇数,那么对于l=(n+1)/2,零点在s=∞处.极点为:
pl=σl+jΩl,l=1,2,…,n,
(7)
(8)
(9)
(10)
由于风浪干扰频率在0.5 rad/s以上,潜艇舵角-航向响应的频率在0.3 rad/s左右,因此,设该滤波器的通带截止角频率为0.3 rad/s,阻带截止角频率为0.75 rad/s,最大通带衰减为2 dB,最小阻带衰减为20dB,利用相关的函数就可设计出该滤波器.
设计出的滤波器传递函数为:
Ha(S)=
(11)
切比雪夫Ⅱ型滤波器频率响应曲线如图2所示.
图2 切比雪夫Ⅱ型滤波器频率响应曲线Fig.2 Chebyshev Ⅱ filter frequency response curve
1.3 RBF神经网络控制器设计
RBF神经网络控制器的自适应是依赖于参考模型的输出和实际输出的误差,因此参考模型的设计在很大程度上影响着潜艇的控制质量,参考模型要能真实地反映潜艇航向机动的动态过程,才能很好地根据误差修正RBF神经网络的权值,达到自适应的控制效果.
(1)参考模型的设计.
潜艇水面航向近似二阶模型为KT方程:
(12)
式(12)中φ为航向角;δr为方向舵角;T、K为模型参数,为未知的常数.
式(13)为一个二阶系统,给出具有理想性能的参考模型为:
(13)
其中φm为参考模型给出的航向角;φr为模型参考信号系统的输入;ωn为系统的自然频率;ζ为系统的相对衰减系数,ωn和ζ根据系统性能的要求确定.要确定ωn和ζ就必须了解航向机动的动态过程,参考模型对于给定一个航向指令的响应应该比实际响应要慢,这样才能很好地将实际输出逼近参考模型.因此潜艇水面航向修正时的响应时间对于ωn和ζ确定至关重要,对于一个二阶模型为KT方程的潜艇水面模型就必须知道K、T参数的值,从而才能很好地确定潜艇航向修正的响应时间.利用Matlab工具箱对潜艇水面航向的KT方程进行离线辨识,得到系统的方程从而确定系统的响应时间.
利用历史航行数据作为离线辨识的输入和输出,方向舵角δr的数据作为输入,航向φ作为输出,利用Matlab工具箱对潜艇水面KT方程进行离线辨识.以某艇的历史航行数据(见图3 )为辨识数据,潜艇以8kn航速航行,航向机动60°,辨识结果如图4所示.
图3 历史航行数据的输入和输出Fig.3 History of voyage data input and output
图4 辨识航向输出和实际航向输出Fig.4 Identify the output of the course and practical course
(14)
(2)RBF神经网络控制器的设计.
径向基函数(RBF)神经网络是由J.Moody和C.Darken在20世纪80年代末提出的一种神经网络,它是具有单隐层的三层前馈网络,由于它模拟了人脑中局部调整、相互覆盖接受域的神经网络结构,因此RBF网络是一种局部逼近网络,已证明它能以任意精度逼近任意连续函数.本文之所以采用RBF神经网络是由于RBF网络的激励函数为高斯函数,因此不会产生局部极小点,而且RBF网络相对于BP网络收敛速度快,对于潜艇这种学习时间要求短的对象具有更大的优势.
由于水面航向控制相对比较简单,设计控制器的网络结构为输入层为一个神经元,中间隐含层为5个神经元,输出层为1个神经元的RBF神经网络,其结构如图5所示.
图5 RBF神经网络结构图Fig.5 Neural network structure of RBF
在RBF网络中输入是一维的,为指定航向φz和经过滤波器反馈回来的实际航向φ的偏差e=φz-φ,所以RBF输入向量为X=φz-φ,RBF的径向基向量为H=[h1,h2,h3,h4,h5]T,其中hj为高斯函数:
(15)
其中σj为节点j的基宽度参数,σj>0,μj为网络的第j个节点的中心矢量.
该RBF神经网络k时刻的基宽向量为:
Δ=[σ1,σ2,σ3,σ4,σ5]T.
(16)
网络k时刻的权值向量为:
W=[w1,w2,w3,w4,w5].
(17)
因此k时刻网络的输出的舵角为:
δm(k)=WH=w1h1+w2h2+w3h3+w4h4+w5h5.
(18)
取RBF网络的性能指标函数为:
(19)
φ(k)为k时刻的潜艇航向滤波后的实际输出,φm(k)为k时刻参考模型的输出航向.
因此根据梯度下降法及链式法则,可得权值的学习算法如下:
(20)
wj(k)=wj(k-1)+Δwj(k)+α(wj(k-1)-
wj(k-2)).
(21)
其中η为学习速率,α为惯性系数.代入相关参数可得:
(22)
wj(k)=wj(k-1)+η(φ(k)-φm(k))·
(23)
φ(k)为k时刻的滤波后的实际输出航向,φm(k)为k时刻参考模型的输出航向,δ(k)为k时刻的控制器输出的舵角.
同理可得RBF网络隐含层神经元的高斯函数的中心参数μj及基宽σj的学习算法如下:
(24)
σj(k)=σj(k-1)+ηΔσj(k)+α(σj(k-1)-
σj(k-2)).
(25)
(26)
μij(k)=μij(k-1)+ηΔμij(k)+α(μij(k-1)-
μij(k-2)).
(27)
在上述算法中,通过潜艇滤波器反馈回来的航向信号φ、控制器的输出舵角δr、以及参考模型输出航向和潜艇实际输出的航向误差就能在线修正RBF神经网络的权值以及高斯函数的中心参数μ及基宽σ,从而达到自适应的目的,以适应水面航向在复杂海况下的自适应控制.在学习算法中∂φ(k)/∂δ(k)称为Jacobian潜艇航向机动过程中的Jacobian信息.表示潜艇的航向输出对舵角的控制输入的敏感性,其值可通过离线辨识的KT方程可以得到.在RBF神经网络算法中,对∂φ(k)/∂δ(k)的值的精度要求不是很高,不精确的部分可以通过网络权值和高斯函数的中心参数和基宽的调整来修正,关键是其符号方向要正确,因此也可以用∂φ(k)/∂δ(k)的正负来代替,这样可以使算法更简单.
通过对网络的训练学习,可以得出网络的训练结果如图6所示.
图6 RBF网络训练结果Fig.6 Network training results of RBF
从图6可以看出,RBF神经网络的收敛速度很快,在训练18步后就能达到0.005级别的误差,因此完全可以满足潜艇的快速性.利用训练好的网络对潜艇进行控制,当潜艇指令航向发生变化或潜艇出现干扰时,神经网络又通过参考模型和实际输出的误差来修正网络权值,从而达到很好的控制效果.
2 系统仿真验证
为了验证直接模型参考的自适应控制和滤波器的有效性和算法的合理性,进行了航速为6kn,11kn和海况5级,航向保持阶段艏斜浪情况下的仿真.
(1) 航速6kn,初始航向0°,目标航向30°,5级艏斜浪,采样时间0.1s,仿真时间1000s,结果见图7~9.
图7 航向变化曲线Fig.7 The curve of course
图8 未滤波时方向舵角变化曲线Fig.8 The curve of rudder angle without filter
图9 滤波后方向舵角变化曲线Fig.9 The curve of rudder angle with filter
(2)航速11kn,初始航向0°,目标航向30°,5级艏斜浪,采样时间0.1s,仿真时间1000s,结果见图1~12.
图10 航向变化曲线Fig.10 The curve of course
图11 未滤波时方向舵角变化曲线Fig.11 The curve of rudder angle without filter
图12 滤波后方向舵角变化曲线Fig.12 The curve of rudder angle with filter
可以看出在5级海浪的情况下,航向机动过程中航向响应的过渡过程平稳,没有超调,机动时间较快.在复杂的海况下神经网络控制器能很好的适应风浪的干扰.仿真结果表明,基于直接模型参考的神经网络自适应控制器具有较强的自适应性和较好的鲁棒性.
从图9和图12可以看出,航向偏差切比雪夫Ⅱ型滤波器滤波效果明显,在潜艇航行时能够有效地滤除风浪干扰对潜艇航向控制的影响.潜艇在低速航行时的滤波效果与高速航行时相比相差不大,但操舵角和打舵频率较高.这与潜艇在低速航行时舵效低,操纵性差的理论相符.但与不滤波时的航向控制相比,在航向改变阶段,打舵平稳;在航向保持阶段,舵角明显偏小,且打舵频率低,表明该滤波器的滤波效果明显.在高航速时,滤波效果明显,舵角小,打舵频率低,航向可以保持较高的控制精度.
表1统计了上述仿真在航向保持阶段的打舵频率和最大操舵角的对比结果.从表1中可以看出,在控制精度满足性能指标的前提下,未滤波情况下的平均打舵次数明显高于滤波情况下平均打舵次数.在6kn航速下,打舵次数减少65.8%,11kn航速时,平均打舵次数减少69.4%.
表1 仿真结果对比表
3 结语
本文通过对潜艇水面航向控制中存在的问题进行研究,制定了潜艇航向神经网络自适应控制方案,在风浪干扰下采用RBF神经网络进行控制,并完成了神经网络控制器和滤波器的设计,结果表明,结合航向偏差切比雪夫Ⅱ型滤波器的直接模型参考神经网络自适应控制在潜艇航向运动控制中的应用能够取得令人满意的效果.
参 考 文 献
[1] 王淑瑛. 浅谈潜艇操纵控制系统自动化的发展[J]. 舰船导航,2004,3: 39-43.
[2] 夏列国. 美国核潜艇液压及液压舵机系统[J]. 潜艇, 1984, 1: 14-24.
[3] 何 斌, 徐亦凡. 非线性PID控制器在潜艇深度控制中的应用[J]. 船海工程, 2007, 36(6): 118-120.
[4] 何卫华. 潜器自动操纵控制系统的基本原理及其现状[J]. 舰船科学技术, 2005, 27(3): 20-24.
[5] 胡 坤, 徐亦凡. X舵潜艇空间运动仿真数学模型[J]. 计算机机仿真, 2005, 22(4): 50-5.
[6] 孙增忻, 张再兴. 智能控制的理论与技术[J]. 控制与决策, 1996, 11(1): 1-8.
[7] 王永骥, 涂 健. 神经元网络控制[M]. 北京: 机械工业出版社, 1998.
[8] 黄华斌, 孙 霖, 杨国志. 一种基于BP神经网络的潜艇自动舵探讨[J]. 船海工程, 2006, 1: 12-14.
[9] 王 君, 殊 莉, 蔡之华. 一种基于卡尔曼滤波和模糊控制的RBF神经网络新型学习算法[J]. 计算机应用, 2006, 7(7): 46-49.
[10] 覃光华, 王顺久, 缪 韧. 基于卡尔曼滤波技术的人工神经网络权重估算及应用[J]. 四川大学学报, 2008, 4(7): 25-28.
[11] 刘 清. 船舶操纵运动模糊神经网络控制系统研究[D]. 武汉:武汉理工大学, 2002.
[12] 林叶锦. 船舶运动模糊神经网络控制系统的研究[D]. 大连:大连海事大学, 2006.
[13] Cristi R, Papoulias F A, Healey A J. Adaptive Sliding Mode Control of Autonomous Underwater Vehicles in the Dive Plate[J]. IEEE, Oeeanic Eng, 1990, 15(3): 152-160.