基于模拟退火法的悬停飞艇载货控制分配研究
2023-03-29王宇航杨天祥王新阔
王宇航,杨天祥,王新阔
(1. 西北工业大学自动化学院,陕西 西安 710129;2. 航空工业特种飞行器研究所,湖北 荆门448035)
1 引言
随着科技的发展,现代飞行器的安全性、可靠性不断提高,许多先进飞行器配备了多操纵面和多推力矢量发动机[1]。现代重载运输飞艇迅速发展,融合了推力矢量先进技术,改善了可靠性与安全性,逐渐成为各个国家的研究热点。
多推力矢量发动机成为飞艇主要的操纵方式后,需要采用控制分配技术对多个发动机进行协调操纵[2]。工程中最常用的控制分配[3]方法为广义逆法,这类方法计算简单,易于实现,但广义逆阵的选取不是唯一的,通常的做法是选择控制效率矩阵的 Moore-Penrose 逆,但这种选取方式无法保证控制分配效率,为了体现控制分配策略优势,需要寻找控制分配效率最大的广义逆阵。
通常做法是利用遗传算法强大的搜索能力优化广义逆法,但其容易陷入局部最优解,为了获得全局最优解,文献[4]加入了小生境遗传算法,文献[5]在基本遗传算法中加入切断算子与拼接算子。根据文献[4-5]中提高样本多样性避免陷入局部最优的思想,本文将模拟退火算法思想融合到遗传算法中。
通常小范围的质量干扰可以利用飞艇自身的鲁棒性去消除[6]。但当飞艇的重量或重心发生大幅变化时,如重载飞艇的货物装载与投放[7],重心、转动惯量变化将影响飞艇的操稳特性[8]。文献[9]从相互作用力的角度将变化视为干扰,同时根据观测器的观测值,对控制器进行干扰补偿。文献[10]实时计算飞机重心,控制飞机水箱中水的实时流动,维持飞机重心。本文结合文献[9-10]中方法的优点,利用水箱的补水与放水策略维持飞艇总重量、重心的稳定。
因此,本文采用控制分配策略进行控制设计,寻找最大分配效率的同时,为了避免陷入局部最优值,利用基于模拟退火思想优化的遗传算法的去优化广义逆阵;设计水箱补偿货物质量策略进行仿真,观测悬停飞艇对货物干扰的响应,达到飞艇悬停装卸货物并维持姿态与高度稳定的目的。
2 多推力矢量飞艇建模
2.1 飞艇推力矢量分布
本次实验飞艇如下图1所示,不同于常规飞艇,实验飞艇共有8个推力矢量发动机、方向舵与升降舵。
图1 推力矢量飞艇
2.2 发动机推力分析
根据推力矢量发动机偏转角的定义[11],以一个发动机为例,列写出推力矢量发动机在艇体系[12]中的分量
(1)
δTy,δTz为推力矢量发动机偏转角,推力矢量发动机相对于飞艇体积中心的坐标为RT=[xTyTzT],推力力矩在艇体系中可表示为
(2)
2.3 飞艇动力学模型
除了推力之外,飞艇还受到气动力、流体惯性力、重力及浮力[12]。计算出的合力在艇体系中沿三轴分解,建立飞艇动力学方程,得到以下公式
(3)
(4)
其中m表示飞艇质量,Fx,Fy,Fz表示艇体系中x,y,z的三轴合力,φ,θ,ψ表示滚转角、俯仰角、偏航角,p,q,r表示艇体系三轴角速度,L,M,N表示艇体系三轴合力矩,u,v,w表示艇体系三轴速度,I表示飞艇转动惯量。
2.4 质量干扰模型
将货物看作加入飞艇模型的干扰,写出干扰的力与力矩公式
(5)
(6)
mΔ表示货物质量,lx,ly,lz表示货物在艇体系中的x,y,z坐标。
图2 飞艇模型输入输出
3 控制系统模块化设计
根据多推力矢量建模分析,多推力矢量飞艇与常规飞行器最大的不同点就是推力矢量发动机代替操纵舵面成为了主要的操纵方式,飞艇的姿态变化不再依靠某个单一的舵面进行操纵,而是需要多个发动机进行协调操纵。为了在不改变常规控制律设计方式的同时体现多推力矢量的优势,将控制律设计模块与控制分配模块分开设计。
将控制系统进行分层模块化设计,通过控制分配技术将多推力矢量飞艇飞行过程中的期望力与力矩分别映射到飞艇机体系的三轴上,再利用设计的控制分配模块,将三轴力与力矩协调分配到各个发动机。
图3 控制系统的分层模块化设计
4 飞艇控制分配
控制分配问题可以描述如下:给定期望虚拟变量v(t)∈Rk,映射B:Rm→Rk(m>k),通过不定方程Beu(t)=v(t)求解u(t)。其中,控制变量u(t)∈Rm,Be称为控制效能矩阵。
4.1 控制分配方法评价
控制分配评价方法有很多,利用转矩可达集思想可以评价控制分配的效率[10]:
4.2 广义逆法
广义逆是最常用的控制分配方法,对控制分配问题给出了如下解:
u=Fud+Pv
(7)
对于ud=0,rank(v)=3,Wu=I这种不含权值的分配问题,即
Beu=v,BeP=I
(8)
令Bex=0(x=(x1,x2,…,xm)T,rank(Be)=r)。设该方程的基础解系为ξ=[ξ1,ξ2,…,ξm-r],则x=k1ξ1+k2ξ2+…+km-rξm-r为该方程的通解。
式中
(9)
显然x=[x1,x2,x3]构成了方程Bex=[0,0,0]T的通解。
4.3 控制分配寻优参数
优化目标是找出一组参数K使得广义逆阵P对应的分配效率最大。
其中
(10)
4.4 模拟退火算法
模拟退火算法的提出主要是为了解决局部最优解问题[14]。从算法设计角度上来说,首先,算法初始假定一个较高的T值,这个值被称作模拟温度,此时算法运算是不稳定的,选择当前错误的可能性很高。当T衰减的时候,算法的演算方向就会变稳定,而选择错误的可能性也会下降。最后,达到停止迭代的条件时可以找到大致最优方案。
4.5 基于模拟退火思想的遗传算法
由上文知,K为需要优化的参数,而模拟退火算法主要依据降温过程完成优化,对于局部的优化能力较强。而遗传算法全局搜索能力强,但其局部优化能力弱,可能会出现早熟现象和遗传漂移的情况,容易到局部最优中无法跳出[15];因此结合两种算法思想,取长补短,能更好更快地得到全局最优解。
模拟退火思想应用到遗传算法的具体操作步骤如下:
1) 初始化种群
设置需要进行遗传操作的代数,初始化g=0;
设置群体的规模大小N,并根据设置的群体规模大下选择一定数量的有效个体组成初始群体P(t);
设置遗传算法操作算子交叉概率算子Pc,变异概率算子Pm;
设置退火的初始温度TC;
设置每次温度下降的退火衰减因子k。
2) 适应度函数计算
一般选取的适应度函数都是与目标函数相关,在模拟退火遗传算法的思想中,模拟退火算法将适应度函数与退火温度联系起来,可以组成新的适应度函数。
假设第i个个体在种群中的适应度为
(11)
其中,c(X)是目标函数,T即为模拟退火算法中的温度T,它在随机迭代进程中逐渐减小。
3) 选择运算
4) 交叉运算
采取轮盘赌的形式选择个体进行单点交叉计算。
5) 变异运算
交叉概率Pc控制速度大小,过小会导致寻优过程过慢,过大会导致个体消失太快,容易陷入到局部最优之中。而变异概率Pm过小就难以产生新个体,Pm过大导致新种群与原来种群差异过大。因此,为了减少固定概率值带来的影响,可以让这两个参数值随着适应度函数进行变化,并调整两者如下
(12)
(13)
6) 模拟退火运算
进行交叉和变异之后,产生的新个体通过模拟退火运算判断是否接受。
7) 终止条件
到达最大迭代次数。
图4 模拟退火算法流程图
4.6 算法总结
P=P0+[x1,x2,x3]=P0+ξ·K矩阵作为控制分配的最终目的,控制分配模块将控制律模块虚拟的期望力和力矩通过P矩阵转换为飞艇实际输入,伪逆法直接求取矩阵P的Moore-Penrose逆,加权伪逆法加入了权重矩阵Wu,基于模拟退火算法思想的遗传算法在加权伪逆法的基础上,寻找具有最大分配效率参数矩阵K,三种算法的可优化范围逐渐增大,寻找到的控制分配的效率也会逐渐增大。
图5 算法思想对比图
5 飞艇控制器设计
5.1 控制律设计
由于采用控制分配策略,所以只需要采用常规控制律设计方法得到虚拟控制量,将控制律设计分为横纵向分别设计。
采用常规PID控制器进行控制得到飞艇纵向控制律:
(14)
上式中的为可调参数,同理可得横侧向控制律,将控制律输出的期望值送到控制分配模块,控制分配模块将期望合力与合力矩转换为实际飞艇的推力矢量输入,达到控制目的。
图6 控制系统分层结构
6 飞艇悬停装载策略
6.1 水箱分布
利用飞艇自身的对称性,以飞艇中轴线为中线,在飞艇横向对称安排水箱,对于要分析的飞艇来说,设计三个货物吊装点,在飞艇中轴线分为前部中部后部三个,具体水箱的安装位置与吊装点如图所示。
图7 水箱分布
6.2 货物装载方式
1) 当飞艇进行装载货物时,根据吊装点的不同选择对应位置的水箱进行排水以减轻飞艇质量,使之满足加上货物后飞艇总体质量不变;
2) 当水箱排水达到一定质量后开始进行货物的装载,此时保持水箱继续排水直到排出水的质量与货物质量相同;
3) 当排水和货物上升均完成后,飞艇恢复到稳定状态,此时表示一次货物的装载完成。飞艇进行卸载货物的步骤与装载货物的思路基本相同,只是将排水过程换成进水过程即可。
7 仿真及结果分析
悬停配平状态选取V=0.1m/s,H=100m。由水箱分布可知,飞艇横侧向受到的货物干扰较小,横侧向姿态保持稳定,实验主要观测飞艇纵向姿态参数变化。
7.1 控制分配优化设计
7.2 控制分配优化结果
本次实验规定遗传算法交叉概率初始值为0.5,变异概率初始值为0.1。选择种群规模为100,选择迭代次数为100 次。
模拟退火思想优化遗传算法中主要影响求解质量与求解时间的是退火温度的下降梯度,一般情况下选择为0.97~0.99之间。本次实验规定下降梯度为0.98,实验结果如下:
图8 加权伪逆控制分配效率(30.90%)
图9 模拟退火优化遗传算法控制分配效率(49.27%)
可以看到,基于模拟退火思想改进的遗传算法相较于加权伪逆算法,优化效果有显著提高,分配效率是加权伪逆算法的1.59倍。
优化后得到的纵向控制分配P矩阵为
P=[ -0.5244 27.4203 -89.0803 4.0020
-16.6119 -36.4108 -0.5594 14.9044
35.3557 13.6680 1.1496 -26.6969 12.0420
-2.5360 20.5063 5.2565 -6.3171 -50.9687]
(15)
7.3 货物吊装实验
设计前中后部三个吊装点,分一次性大质量吊装以及小质量连续吊装共六组实验,以验证设计的悬停状态飞艇控制分配对于货物装卸时纵向姿态保持的有效性,实验要求飞艇姿态可以保持稳定,高度偏差在-10 ~10m之间。
表1 悬停货物吊装实验
为了表示飞艇货物装卸时货物质量变化,将水箱、货物质量变化,总质量变化用曲线画出:
图10 吊装货物质量变化
7.4 货物吊装实验结果
将仿真根据吊装方式分为两组,利用模拟退火优化后的分配阵控制飞艇悬停,加入货物,观察参数选取为飞艇速度、高度、俯仰角。
图11 实验1姿态运动参数变化
图12 实验2姿态运动参数变化
从实验结果图可以看到,采用一次性吊装策略,飞艇的姿态在有限时间内只会有一次干扰,加入货物之后,飞艇的高度在400秒内达到稳定,变化范围在2米以内,姿态维持稳定,符合实验要求。
相对于一次性吊装策略,连续吊装采取的策略是每隔100秒吊装质量为1t的货物。连续吊装5次,仿真时间选取500秒,观测纵向参数的变化。
图15 实验5姿态运动参数变化
图16 实验6姿态运动参数变化
可以看出,随着吊装货物次数的增加,飞艇的高度呈缓慢下降或上升趋势,结合一次性吊装实验的结果,飞艇完成装卸工作后大概需要400~500秒的时间用于恢复稳定状态,因此当连续吊装货物的时间间隔较短时容易造成飞艇的不稳定现象,但在连续吊装的三次实验中经过5次货物的装卸,飞艇高度改变量小于3m,俯仰角改变量小于5°,符合实验要求。
7.5 控制效果优化比较
图17 不同控制分配方法控制效果
利用飞艇中部吊装8t货物进行了一次仿真,将伪逆法、加权伪逆法、遗传算法和基于模拟退火思想的遗传算法的飞艇悬停吊装货物高度变化进行对比,发现控制分配效率的增大的同时,也改善了控制效果。
8 结论
仿真利用控制分配策略控制多推力矢量飞艇悬停,在加权伪逆法基础上利用基于模拟退火算法优化的遗传算法搜索广义逆阵,增大了控制分配效率,改善了控制效果;在飞艇悬停装卸货物时,运动参数的变化显示水箱补水与排水的策略消除了货物对飞艇带来的干扰,悬停飞艇姿态稳定。实验结果验证了控制分配策略以及水箱装载策略的有效性。