含弹簧阻尼装置空间机器人捕获卫星操作力学分析及缓冲、柔顺控制
2020-12-18朱安,陈力
朱 安,陈 力
(福州大学机械工程及自动化学院,福州350116)
随着人类对太空探索的不断深入,全球每年都向太空发射大量通讯、导航、气象、观测等各种功能的卫星,这些卫星中难免会有一小部分未能到达预定轨道,或者在轨道运行过程中发生失效;另外,卫星达到使用寿命一般情况下是因为其携带的燃料耗尽,而不是本身发生故障。因此若可以对上述卫星进行回收再利用,将能够极大地降低太空探索的成本。目前,使用空间机器人完成对卫星的回收任务具有广阔的应用前景,受到了国内外学者的广泛关注[1−9]。一般情况下,在轨捕获操作可分为如下4个阶段:1)对被捕获卫星进行观测;2)空间机器人逐渐靠近被捕获卫星,进行捕获阶段的准备;3)空间机器人末端抓手与被捕获卫星的捕获点接触、碰撞;4)捕获完成后,对空间机器人与被捕获卫星形成的混合体系统进行镇定控制。其中,捕获操作的第3阶段、第4 阶段最为关键且最具挑战,因此众多学者均致力于此阶段的研究。
针对捕获操作的第3 阶段,笔者研究团队[10]对空间机器人捕获卫星过程的动力学演化模拟进行了分析,且计算了碰撞冲击效应;陈钢等[11]针对碰撞问题,利用碰撞过程中产生冲量的原理建立了碰撞动力学模型,且提出了一种碰撞运动分析算法;Liu 等[12]基于赫兹接触理论建立了空间机器人与目标之间的接触力,并深入地分析了对心碰撞和偏心碰撞对整个系统的影响;Uyama 等[13]对空间机器人与自由漂浮卫星的接触效应进行了实验的评估;Yoshida 等[14]基于动量守恒定律研究了空间机器人捕获卫星的碰撞动力学及运动学问题;笔者研究团队[15]通过假设模态法近似描述柔性杆的弹性变形,然后利用动量冲量法分析了空间机械臂捕获卫星的碰撞动力学。值得注意的是,上述学者虽然注意到了对碰撞分析的必要性,但却忽略了对关节的保护问题。事实上非合作卫星一般具备高速、旋转等特性,而空间机器人的关节是较为脆弱的部分,若捕获操作中未对关节进行保护,关节就有可能受到冲击破坏,从而使捕获操作失败,甚至造成空间机器人的损坏。地面机器人中,为了防止机器人与外界环境发生碰撞时造成关节的冲击破坏,在关节电机与机械臂之间加入串联弹性执行器(Series Elastic Actuator,SEA)是一种行之有效的手段[16−20]。然而SEA 的加入将极大地增加关节的柔性,考虑到空间机器人为无根树系统,且由于其自身结构特点与太空微重力、高真空环境的特殊性,一般由SEA 引发的柔性振动将很难得到抑制,从而造成控制精度的下降,严重时可能使系统失稳。因此,本文针对空间机器人尝试设计了一种弹簧阻尼缓冲装置(Spring-Damper Device, SDD)。相较于SEA,SDD不仅能够实现冲击载荷的快速缓冲卸载,而且还能使柔性振动快速衰减,实现对柔性振动的抑制。
针对捕获操作的第4阶段,Huang 等[21]对空间机器人捕获卫星后质量特性与反作用轮结构发生变化的问题,提出了一种改进的Sate-Dependent Riccati 最优控制器;Wang 等[22]针对空间机器人捕获非合作卫星的运动规划和控制问题,利用四次Bezier 曲线和自适应粒子群算法,提出了一种最优翻转策略和协调控制方案;Flores-Abad 等[23]为了减小空间机器人在轨捕获旋转目标的撞击,通过初始和最终边界条件的随机不确定性,求解了一种最优控制方案。然而上述控制方案均未将冲击效应考虑在内,在实际的捕获操作过程中,特别是针对具有高速、旋转特性的非合作卫星,由于冲击效应的存在,关节电机开启时将受到瞬时冲击力矩,瞬时冲击力矩过大时也可能造成关节的损坏。因此,如何在限制瞬时冲击力矩的前提下实现对混合体系统的镇定控制,具有一定的探索价值。强化学习控制由于能通过试错与环境交互而不断地进行自我优化,具有极强的环境适应能力[24−27];高速、旋转卫星的巨大动能很容易使捕获后形成的混合体系统处于严重失稳状态,这很可能导致控制系统在运行过程中违反约束条件,使系统性能下降甚至出现安全问题,因此对系统输出或状态的约束控制是实现镇定控制的重要一环。而Barrier-Lyapunov 函数能在物理极限内保持机器人末端执行器的约束,即可以保证系统的瞬态性能和稳定性[28−30],对实现严重失稳的混合体系统镇定具有一定的优势。故本文提出一种基于Barrier-Lyapunov 函数的自适应积分强化学习控制方案。该方案通过自适应强化学习追踪系统不确定参数,而不是直接参与控制率的设计,从而降低强化学习对系统参数的依赖性。
本文为了在空间机器人捕获卫星操作过程中保护关节免受冲击破坏,设计了一种SDD,且配合该装置提出了一种柔顺策略。用含耗散力Lagrange方程法与Newton-Euler 法导出了分体系统动力学方程;通过牛顿第三定律、捕获点的速度、位置约束计算了碰撞冲击效应与冲击力,并结合动量守恒关系导出了混合体系统动力学方程;提出了一种自适应积分滑模强化学习控制方案,在限制瞬时冲击力矩情况下,实现对失稳混合体系统的镇定控制;通过对捕获操作过程的仿真,验证了所提柔顺策略与控制方案的有效性。
1 SDD模型结构及缓冲柔顺策略
1.1 SDD模型结构
SDD的模型图如图1(a)所示,其原理图如图1(b)所示。SDD主要由旋转阻尼器与扭转弹簧组成,扭转弹簧主要起传动与吸收冲击能量作用,旋转阻尼器则实时提供阻尼力抑制柔性振动。扭转弹簧与旋转阻尼器两端分别与电机端、机械臂端固连,为了让阻尼器实时同步提供阻尼力抑制柔性振动,将其嵌套在弹簧内部实现同步运动。将电机端、机械臂端的阻尼力等效为由阻尼器提供,以便更加真实地描述空间机器人系统。图1中ksi、Dti(i=1,2)分别为扭转弹簧的刚度、旋转阻尼器的阻尼系数;Dmi、DLi(i=1,2)分别为电机、机械臂端等效阻尼器的阻尼系数。
图1 SDD结构Fig.1 Structural of the SDD
1.2 缓冲柔顺策略描述
在捕获的第3阶段,空间机器人机械臂末端与被捕获卫星发生剧烈碰撞,此时机械臂末端将受到很大的冲击力矩。在传导至电机转子的过程中,该力矩会被弹簧和阻尼器快速卸载,从而实现对关节的保护。在捕获的第4阶段,根据关节所能承受的极限力矩值来设置一个关机力矩阈值,当检测到瞬时冲击力矩超过所设阈值后电机关停,此时SDD中的弹簧将会提供弹力来减小关节所受冲击力矩,阻尼器将会快速耗能抑制柔性振动。但若只设定关机力矩阈值,将导致电机频繁的开关机,很容易造成电机的损坏。因此,本文所提的缓冲柔顺策略同时设置了开、关机阈值,当检测到瞬时冲击力矩超过关机力矩阈值时电机关停;当SDD将瞬时冲击力矩降低到开机阈值后电机再次开启。
2 空间机器人捕获卫星操作分析
2.1 分体系统动力学建模
配置SDD的空间机器人系统与卫星系统如图2所示,为更直观地显示SDD在空间机器人中的安装位置,其位置示意图如图3所示。其中xOy为系统随轨道平动的惯性参考坐标系;xiOiyi(i=1,2)为空间机器人各分体的主轴连体坐标系;xsOsys为固定在卫星质心上的本体坐标系。文中所用符号定义如下:m0、I0、d0分别为载体的质量、转动惯量、质心到第一个关节铰中心的距离;ms、Is、ds分别为卫星的质量、转动惯量、质心到末端把手的距离;mi、Ii、Li(i=1,2)分别为第i个机械臂的质量、转动惯量、长度;Imi(i=1,2)为第个i电机转子的转动惯量;di(i=1,2)为第i个关节铰中心到机械臂i质心的距离; θ0、 θi、 θs、θmi(i=1,2)分别为载体姿态角、机械臂转角、卫星姿态角和电机转子转角。
图2 空间机器人与卫星系统Fig.2 Space robot and satellite systems
图3 SDD 位置示意图Fig.3 Position diagrams of SDD
由图2可导出载体质心O0、机械臂i(i=1,2)质心Oci相对原点O的矢径为:
2.2 碰撞冲击效应与碰撞力计算
2.3 混合体系统动力学建模
3 控制器设计
本文捕获的卫星为高速、旋转的非合作卫星,由于冲击效应的存在,混合体系统将发生较大的位置偏移,强化学习控制方案因具有较强环境交互能力,对严重失稳的混合体系统具有良好的镇定控制效果。空间机器人捕获非合作卫星的时间较短,其数据源相应较少,且碰撞过程要求保持末端执行器约束,因此提出一种基于Barrier-Lyapunov 函数的自适应积分强化学习控制方案,通过强化学习追踪系统不确定参数,而不直接参与控制器的设计,降低了控制器对数据的依赖性。
系统控制流程如图4所示,其通过性能评测器(Performance Measurement)产生滑模信号,然后强化学习控制器(Learning Controller)根据滑模信号来不断地优化系统评估参数cˆ,使其接近系统真实参数c,从而消除系统参数不确定的影响。基于Barrier-Lyapunov 函数的力矩设计器(Torque Designer)则通过系统评估参数cˆ与滑模信号S共同设计输出力矩,从而使控制器可以在物理极限内保持机器人末端执行器的约束,保证系统的瞬态性能和稳定性。
图4 系统控制流程图Fig.4 Control block diagram of system
4 仿真模拟分析
4.1 碰撞过程中SDD抗冲击性能模拟
采用图2所示的空间机器人系统与卫星系统进行仿真试验研究。空间机器人系统参数如下:
m0=100 kg,mi=10 kg(i=1,2),L0=1 m,Li=2 m(i=1,2),di=1 m(i=1,2),I0=64 kg·m2,Ii=3.5 kg·m2(i=1,2),Imi=0.05 kg·m2(i=1,2),ksi=2865 N/rad(i=1,2),Dmi=28.65 N·s/rad,Dti=1146 N·s/rad(i=1,2),DLi=28.65 N·s/rad(i=1,2)。卫星参数如下:ms=50 kg,ds=0.5 m,Is=8.5 kg·m2。假设空间机器人初始位置为qr=[0 m,0 m,100◦,30◦,60◦]T,初 始 速 度 为q˙r=[0 m/s,0 m/s,0◦/s,0◦/s,0◦/s]T。
为了突出SDD在空间机器人捕获卫星操作撞击过程中的抗冲击性能,在多组卫星速度下,分别对配置SEA 与SDD的空间机器人关节所受冲击力矩进行力学模拟,其中SEA 的中弹簧与SDD中的弹簧刚度相同。结果如表1、表2所示,表中第一列为卫星速度,第二列、第三列分别为有、无配置SEA 或SDD下关节所受最大冲击力矩,第四列为关节所受冲击力矩降低的最大百分比。从表1、表2的对比可以看出,在碰撞过程中,对于给定的不同卫星速度,SEA 与SDD均能起到缓冲作用,但由于SDD中的阻尼器能够有效地吸收、消耗冲击能量,表现为抗冲击性能比SEA 更好,且可看出配置SEA 最大可将碰撞冲击力矩降低40.98,配置SDD最大可将碰撞冲击力矩降低55.42%,因此可以认为配置SDD能在碰撞过程对关节起到更好的保护作用。
表1 不同卫星速度下SEA 抗冲击性能对比Table 1 Comparison of impact resistance of SEA at different satellite velocities
表2 不同卫星速度下SDD抗冲击性能对比Table 2 Comparison of impact resistanceof SDD at different satellitevelocities
4.2 镇定控制过程中缓冲柔顺策略性能模拟
系统控制参数如下:Λ1=diag(1.2,1.2,1.2),Λ2=diag(0.01,0.01,0.01),KV=diag(500,500,500),ε=5 ,Γ1=0.0005 ,Γ2=0.001 ,Γ3=0.0015 ,Γ4=0.0008,w1=1000/(1+0.03t)2,w2=600/(1+0.03t)2,w3=440/(1+0.03t)2,w4=440/(1+0.03t)2,σ1=4000/(1+0.5t)1.5,σ2=100/(1+5t)1.5,σ3=440/(1+t)1.5,σ4=440/(1+t)1.5,cˆi=10(i=1,2,3,4)。空间机器人初始位置、速度同4.1,卫星速度取q˙s=[0.1 m/s,0.1 m/s,8.6◦/s]T,混合体系统期望状态为qd=[100◦,30◦,60◦]T。为了尽可能地保护关节,需先让SDD将碰撞产生的冲击力矩卸载后电机才能开启,经计算分析可知1.5 s内冲击力矩可卸载,因此电机在发生碰撞1.5 s后开机。结合式(14)、式(20)可计算出电机开机时混合体系统的位置为qrsθ=[84.62◦,11.15◦,25.63◦]T,仿真时间为30 s。
为了体现SDD相较于SEA 的优势,仿真时采用文献[20]所示的SEA 结构进行对比。假设在电机负载情况下,关节能承受的冲击力矩为120 N·m;第一组仿真将关机力矩阈值设为FC=100 N·m,开机力矩阈值设置为FO=10 N·m;考虑到随着空间机器人使用年数的增加,关节所能承受冲击力矩将会下降,因此第二组仿真将关机力矩阈值设置为FC=80 N·m,开机力矩阈值设置为FO=10 N·m。
从图5可知,在镇定控制阶段,配置SDD电机经过4次关停后进入稳定输出状态。从图6可知,配置SDD能达到限制瞬时冲击力矩的效果,且由于阻尼器可以对弹簧产生的柔性振动起到抑制效果,因此不会出现冲击力矩远超关机阈值的情况。从图7~图9可知,配置SDD与配置SEA均能实现镇定控制,但会出现SDD曲线高于SEA曲线的情况(如图7、图9所示),使配置SDD的系统似乎没有配置SEA 的系统稳定;但事实上轨迹的运动状态与开关机间隔有关,开关机间隔越大系统处于无控状态的时间越长,则偏离期望轨迹的距离就越大,反之亦然。
图5 含SDD电机开关机信号(第1组)Fig.5 Switch signal of joint motor with SDD(1st group)
图6 含SDD关节所受冲击力矩(第1组)Fig.6 Joint impact torque with SDD(1st group)
图7 载体姿态角轨迹(第1组)Fig.7 Trajectory of attitude angle (1st group)
图8 关节角1轨迹(第1组)Fig.8 Trajectory of joint angle 1(1st group)
图9 关节角2轨迹(第1组)Fig.9 Trajectory of joint angle 2(1st group)
从图5与图10的对比可以看出,电机达到稳定输出状态的开关机次数有明显的增加,原因在于随着关机阈值的减小,电机的输出能力会随之下降,导致实现镇定控制的时间增加。通过图11可以看出,即使减小关机阈值,SDD仍能达到限制瞬时冲击力矩的效果,表现出较好的安全性。从图12~图14可知,配置SEA 系统出现无法实现镇定控制的现象,原因在于配置SEA 的系统在抑制由弹簧产生的柔性时采用了奇异摄动法,需通过设计快变子力矩来抑振,当电机输出能力被进一步削弱时(关机阈值减小)就无法提供足够的抑振力矩来抑制柔性振动,从而导致系统镇定控制失败;而SDD中的抑振是通过弹簧来实现的,因此SDD表现出比SEA 更好的稳定性。
图10 含SDD电机开关机信号(第2组)Fig.10 Switch signal of joint motor with SDD (2st group)
图11 含SDD 关节所受冲击力矩(第2组)Fig.11 Joint impact torquewith SDD(2st group)
图12 载体姿态角轨迹(第2组)Fig.12 Trajectory of attitude angle (2st group)
图13 关节角1轨迹(第2组)Fig.13 Trajectory of joint angle1(2st group)
图14 关节角2轨迹(第2组)Fig.14 Trajectory of joint angle2(2st group)
5 结论
针对空间机器人捕获非合作操作卫星,设计了一种SDD,提出了一种柔顺策略与强化学习控制方案,主要有如下结论:
(1)所设计的SDD可以在碰撞过程中有效地减小关节所受碰撞冲击力矩。
(2)配合SDD所提的柔顺策略可以在镇定控制过程中将关节所受瞬时冲击力矩限制在安全范围。
(3)所提基于Barrier-Lyapunov 函数的自适应积分强化学习控制方案可以在限制关节所受瞬时力矩的前提下,实现混合体系统的镇定控制。