某新型车载多管负载行进间稳定控制方法
2023-04-02高强侯远龙吕明明毛斌侯润民羊书毅吴斌
高强, 侯远龙, 吕明明, 毛斌, 侯润民, 羊书毅, 吴斌
(1. 南京理工大学 机械工程学院,江苏 南京 210094; 2. 江苏科技大学 机械工程学院,江苏 镇江212100; 3. 内蒙古北方重工业集团有限公司,内蒙古 包头 014033)
0 引言
某多管负载在舰载使用时,其扰动周期大约3.7~4.2 s,可以通过平台罗经实时测量载体姿态,计算目标诸元后,通过测角元件位置闭环进行随动控制[1-3]。在陆地上某多管负载通常只做定位控制。某类身管负载在陆地上行进间使用时,其扰动周期通常为1.0~2.0 s,扰动频率远高于舰载使用情况,其控制原理与舰载使用不同,是利用安装在身管负载的陀螺仪敏感负载速度,在行进间利用稳定器实现稳定控制[4-7]。为了能够实现多管负载在陆上行进间稳定跟踪,其结构需在陆上使用的基础上进行优化改进。
某多管负载在舰载应用时,其负载重心通常与垂直向耳轴接近,或者耳轴轴线通过重心。而在陆地上应用时,由于通常只做定位控制,其耳轴位于负载底端,距离负载重心较远,具有较大的非线性不平衡力矩。因此某新型车载多管负载在陆上行进间稳定跟踪时,需按照舰载应用优化设计其结构,负载重心与垂直向耳轴接近,尽量减小不平衡力矩,使得耳轴两端的载荷基本平衡,减小控制过程中由于克服不平衡力矩所产生的能量消耗,同时减小非线性不平衡力矩带来的干扰。本文后续研究是基于负载基本平衡的条件下进行的。
某多管负载在陆地上应用时,控制系统具有诸多非线性因素,例如,底盘行进时路面颠簸不平带来的外部扰动力矩、非线性摩擦力矩、发射时的冲击力矩,以及不同工况下转动惯量变化等系统内部参数摄动因素。
某新型车载多管负载行进间稳定控制时,在多管负载上安装速度陀螺仪,其设计带宽不小于100 Hz,能够充分敏感多管负载的振动信息。以陀螺仪采集速度为反馈,构成速度闭环,首先保证在载体行进间,当负载指令速度为零的情况下,多管负载相对于大地的速度与指令速度误差的积分,即积分位置误差小于某考核指标,以实现速度环高精度稳定。在此基础上,再利用旋转变压器进行高精度位置跟踪,这是后续研究内容,不在本文进行展开研究,本文重点研究稳定控制。需要说明的是,本文给出的稳定精度测试方法,是在研发阶段、在摇摆台上,半实物仿真条件下的炮控系统稳定精度测试方法,是研制阶段的重要依据。在下一阶段将多管负载安装到底盘车上后,再依据国家军用标准GJB 6361-2008规定的方法考核炮控系统稳定精度。
自抗扰控制[8-10](ADRC)利用扩张状态观测器(ESO)将作用于被控系统的全部不确定性因素,即包括被控系统未建模动态、内外部扰动及其他未知不确定性因素,皆统一作为总扰动,无需建立其总扰动的精确数学模型,而是扩张成新的状态变量,进行实时估计并加以补偿。文献[8]利用ESO 观测某飞机模型飞行过程中空气密度、压力、温度、迎角、气流速度等不确定性因素,利用反推自抗扰控制器进行飞行姿态控制,相对于传统控制方法,收敛速度快、状态轨迹平滑,具有更好的鲁棒性和稳定性。文献[9]针对某风能转换系统的转动惯量、驱动转矩等重要参数随扰动和风速的变化而大范围变化、大大降低了风能转换系统性能的问题,利用ESO 精确估计永磁同步发电机系统的转动惯量和机械扭矩,并用于计算补偿控制量。文献[10]利用扩展状态观测器对系统的总体扰动进行实时估计和补偿,在预先未知系统不确定性的情况下,提高了系统的鲁棒性和抗干扰性。
实时、准确获取载体扰动速度、加速度对于行进间跟踪控制至关重要。由于噪声存在于所有信号中,所以采用差分方法近似估计信号的导数,存在较大偏差。虽然卡尔曼滤波可以抑制扰动,同时求取信号导数,但是需要有对象的数学模型,限制了信号求导的通用性。采用不基于对象模型的信号导数求取方法,通常有线性方法,如高增益微分器[11-13]和2 阶振荡环节;非线性方法[14-19],如非线性跟踪微分器(NTD)和滑模微分器;线性、非线性混合方法[20-21],如混合微分器(HD)。
Atassi 等[11]将高增益微分器应用于输出反馈控制器的设计,其在增益趋于无穷大或无穷小时,对给定信号可以提供准确的时间导数,但是随着增益趋于无穷大或无穷小时,使得小的高频噪声也随之放大,因此需选取高精度传感器。高增益观测器误差是终极有界的,需选取合理的增益倍数使得误差收敛接近于零。文献[12]以永磁同步电机系统为例,采用高增益观测器设计方式,实现永磁同步电机前馈型扩张标称数学模型的观测器设计,设计了自适应观测器增益矩阵,满足全速工况的高增益条件,简化了观测器的增益选取,实现了基于自适应高增益观测器的预测电流控制方法。文献[13]利用非线性微分同胚变换,对感应电机强耦合非线性系统进行转化,提出一种基于高增益观测技术的感应电机磁链观测器,实验结果表明,可以通过对增益参数的调整实现观测误差的任意精度收敛。
韩京清等[14]利用2 阶最速开关系统构造出跟踪不连续输入信号,提取了近似微分信号的机构,并给出了非线性跟踪-微分器的设计及分析过程。仿真结果表明,所设计离散跟踪-微分器在跟踪性能、微分品质、消颤现象等方面都有很好效果。 文献[15]采用非线性扩张状态观测器对气压变化产生的扰动力,以及伺服电动缸时变的摩擦力和负载力进行观测并补偿,利用非线性跟踪微分器改善了微分信号品质。文献[16]针对滑模微分器要求信号的高阶导数需满足一定的约束条件问题,利用跟踪微分器求取虚拟控制量的1 阶导数,相对动态面方法取得了更好的控制效果,且对控制增益变化的适应性更好。 Arie[17]提出一种基于滑模技术的非线性微分器,其吸纳了滑模变结构鲁棒性强、精度高等优点,但是由于切换函数的存在,不能保证系统变量在有限的时间内达到滑模面并保持在滑模面上,而是系统变量在滑模面附近做小幅值的快速切换,因此容易产生抖振现象。文献[18]提出了一种新型无模型滑模跟踪微分器,采用嵌套的广义signum 函数来减少收敛过程中的超调,可对噪声信号进行可靠的滤波和导数估计。文献[19]采用高阶滑模微分器观测液压伺服系统负载速度和加速度,通过理论证明,相比其他观测器,高阶滑模微分器具有限时间收敛的优点,可以确保使用观测状态构建的控制系统稳定性,且控制性能得到改善。
线性微分器在系统状态远离平衡点时,收敛速度快,但在接近平衡点时收敛速度慢;非线性微分器在系统状态接近平衡点时,收敛速度快,但在远离平衡点时收敛速度慢。王新华等[20]设计了一种线性微分器与非线性微分器相结合的、快速收敛的混合微分器,使系统在远离平衡点和接近平衡点都能自动快速地向平衡点收敛,并且不需要切换函数,从而防止了系统的抖振现象。文献[21]设计的混合微分器在系统状态远离平衡点时线性环节起主导作用,接近平衡点时非线性环节起主导作用,使得系统状态始终保持快速收敛性,将混合微分器等价为期望的闭环系统跟踪误差动态,以提升轨迹线性化控制方法的鲁棒性。
RBF 神经网络是一种性能优良的三层前馈型神经网络,拓扑结构紧凑,收敛速度快,具有任意的非线性逼近能力。对存在内部参数摄动、系统外部扰动的非线性系统,可用于控制参数的实时整定,以提高控制系统的动、静态特性。文献[22]利用RBF 神经网络强大的学习和自适应能力,自适应调整PID 参数,使得控制算法具有良好的跟踪性、抗干扰性和鲁棒性,在不同的天气条件下,通过对比绝对误差积分、平方误差积分等指标,表明RBF-PID 控制策略提高了控制精度,降低了曝气成本。文献[23]提出了一种基于自整定PID 控制器的转台伺服/运动控制系统的实现方案。通过圆形和星形轨迹跟踪误差可知,采用PID 参数RBF 自整定后,跟踪误差分别减小了65.9%和38.2%,提高了系统控制精度。文献[24]设计了一种RBF-PID 控制器,利用RBF 神经网络辨识出的悬浮系统信息,实时调整PID 参数。通过方波跟踪、负载质量变化分别模拟外部指令的变化以及内部参数的摄动,实验表明,RBF-PID 控制方法在处理磁悬浮系统的外部干扰和内部参数变化时,具有较强的控制鲁棒性,能够保证系统的控制精度和快速性。
结合ESO、混合微分器、神经网络的优点,本文设计了一种基于扰动速度自适应补偿的新型控制器,并将该控制器应用于某新型车载多管负载系统的高精度稳定控制。通过仿真及台架试验验证了本文提出控制策略的优良控制效果。
1 某新型车载多管负载系统
1.1 某新型车载多管负载系统结构与组成
某新型车载多管负载系统结构示意图如图1所示。系统由多管负载、负载支架、齿弧、齿轮、减速器、交流伺服电机、旋转变压器、陀螺仪等组成。
图1 某新型车载多管负载系统结构示意图Fig. 1 Structural diagram of a new vehicle-mounted multi-tube load system
某新型车载多管负载在陆上行进间跟踪时,需按照舰载应用设计其结构,负载重心与垂直向耳轴接近,尽量减小不平衡力矩,使得耳轴两端的载荷基本平衡,减小控制过程中由于克服不平衡力矩所产生的能量消耗,以及非线性力矩干扰。
交流伺服电机通过减速器、齿轮、齿弧驱动多管负载进行俯仰运动。安装在多管负载上的陀螺仪实时测量负载的运动速度,反馈到速度控制器构成速度闭环;安装在耳轴上的旋转变压器实时测量多管负载相对于负载支架的角度,反馈到位置控制器构成位置闭环,以实现跟踪控制,本文的稳定控制未用到旋转变压器。
1.2 某新型车载多管负载系统非线性分析
某新型车载多管负载系统采用交流伺服电机控制系统,工作过程中,电机中电流时间常数远小于机械时间常数,电流响应的延迟时间可以忽略,即
式中:L为电机电枢回路电感;R为电机电枢回路电阻。
电机电磁转矩为
式中:Td为电机电磁转矩;Kd为电机力矩系数;Ce为电机反电动势系数;ω为电机角速度;Ka为放大器增益;U为控制电压。
由转矩平衡方程可得
式中:TL为负载扰动力矩;Tf为摩擦力矩;J为折算到电机转子上的总转动惯量;i为减速比;θ为负载实际位置;B为黏性摩擦系数。
将式(2)代入式(3),可得
式(4)两边同乘以1/i,并整理得
式中:f(X,t)和g分别为系统的非线性动力学方程及控制增益,为外部有界扰动项,即满足|d(t)|≤C,C为常数,。
在实际工作过程中,负载扰动力矩TL、摩擦力矩Tf以及系统的转动惯量J、黏性摩擦系数B等各参量具有明显的不确定性,且随着工作状态、温度等的变化而变化,表现出强烈的非线性动态特征。
2 稳定控制器设计
稳定控制器采用PI 计算速度环主控制量;由ESO 观测载体行进间负载所受到的扰动速度,利用混合微分器快速收敛的特性,采用混合微分器对速度扰动进行微分处理,进一步得到扰动的加速度;综合扰动速度和加速度,利用单神经元计算补偿控制量,同时构造RBF 网络对系统进行在线辨识,建立其在线参考模型,为神经元控制器提供梯度信息,由单神经元控制器完成补偿控制量参数即速度及加速度补偿系数的自学习,以实现外部扰动因素的动态补偿。控制原理框图如图2 所示。图2中,ωd为指令速度,eω为速度误差,uS为主控制量,uB为扰动补偿控制量,d0为补偿因子,KM为系统开环放大系数,ωL为外部扰动速度,z3为对被控对象未建模动态和外部扰动作用的综合估计值,z4为扰动加速度,为辨识速度误差,为辨识速度值。
图2 控制原理框图Fig. 2 Block diagram of the controller
2.1 PI 控制
控制器主控制量采用PI 控制,令目标速度为ωd(t),由陀螺仪测量的负载速度为ω(t),则速度误差为eω(t)=ωd(t)-ω(t),则控制器主控制量为
式中:ksp为速度环比例系数;ksi为速度环积分系数。
2.2 扩张状态观测器
自抗扰控制系统的核心是把系统的建模误差和外扰作用均视为系统的“总扰动”而进行预估并补偿。ESO 采用非线性结构综合估计被控对象未建模误差与外部扰动部分,ESO 根据负载速度ω(t)、速度环控制量u(t)产生 3 个信号z1(t)、z2(t)和z3(t)。z1(t)跟踪系统输出角速度,z2(t)跟踪输出角加速度,z3(t)为对被控对象未建模动态和外部扰动作用的综合估计值。本文采用ESO 估计载体行进间负载所受到的速度扰动。3 阶ESO 离散化方程为
式中:h为积分步长;β01、β02、β03为可调误差校正增益;a1、a2、δ1为设计参数;fal(eω′(t),a,δ)为非线性函数,
由式(8)计算 ESO 时,采用了非线性函数fal(eω′(t),a,δ),该非线性函数的特点是:偏差小时增益大,偏差大时增益小。文献[25]证明指出,这种不平滑的特性易引起系统响应的颤振现象,为此,本文采用一种新的非线性函数定义为nfal(eω′(t),c,b,γ)[26-27],以代替fal(eω′(t),a,δ)
式中:b控制曲线的取值范围;γ控制曲线中心位置;c控制nfal(· )函数曲线形状。
由此可将3 阶ESO 离散化方程改进为
2.3 混合微分器
利用求解2 阶微分方程,把2 阶微分方程转换为2 阶系统,得到线性微分器,但是线性形式的微分器对于非线性的信号通常具有滞后性。Arie[17]提出一种基于滑模技术的非线性微分器,它吸纳了滑模变结构鲁棒性强、精度高、收敛快等优点,但是由于切换函数的存在,系统变量在滑模面附近做小幅值的切换,容易产生抖振现象。因此,本文利用线性和非线性结合的混合微分器,这种微分器在系统状态远离和接近平衡点时都能保持快速收敛,而且具有良好地抑制噪声的能力,同时由于结构连续,抖振现象可以被避免。
令y1(t)为扰动速度估计值,y2(t)为扰动加速度估计值,ey(t) =y1(t) -z3(t),q=m/n(m、n为设计参数)。则混合微分器的状态空间形式为
式中:R、ah0、ah1、bh0、bh1为设计参数。在本文后续的讨论中,令扰动加速度y2(t) =z4(t)。
2.4 速度环稳定控制量
速度环稳定控制量u(t)由主控制量uS(t)和扰动补偿控制量uB(t)组成。
式中:β1为速度补偿系数;β2为加速度补偿系数。
固定取值的速度补偿系数和加速度补偿系数,不能适用于所有的负载扰动频率和幅值。因此本文引入神经网络,对速度补偿系数和加速度补偿系数进行在线学习、修正。
2.5 基于神经网络的扰动补偿控制量
速度补偿系数β1和加速度补偿系数β2是控制系统的两个关键参数,对控制系统的性能有重要影响。为进一步提高控制系统对扰动的鲁棒性,利用具有自学习和自适应能力的单神经元计算补偿控制量,同时构造RBF 网络对系统进行在线辨识,建立其在线参考模型,为神经元控制器提供梯度信息,由单神经元控制器完成补偿控制量参数,即速度补偿系数β1和加速度补偿系数β2的自学习。在图2 中NNC 为基于单神经元的控制器,用于计算补偿控制量,z3(t)、z4(t)为NNC 的两个输入。速度补偿系数β1和加速度补偿系数β2作为NNC 的结构系数,由人工神经元在线更新,以提高其自学习能力。
参数自适应调整的目标是使系统输出和期望输出之差最小,本文神经网络整定性能指标[28-29]为
基于梯度下降法,速度补偿系数β1及加速度补偿系数β2修正算法如下:
式中:η1为速度补偿系数学习速率;η2为加速度补偿系数学习速率;表示被控对象的Jacobian 信息,通过RBF 神经网络辨识得到。采用RBF 神经网络的结构为 2-4-1,其输入矢量为,r1(t) =ω(t),r2(t) =u(t)。其权数调整的准则定义为
RBF 神经网络权值的调整算法为
式中:ωj表示隐含层节点和输出层节点之间的连接权重,j= 1,2,3,4;Δωj(t)为权重的调整增量;φj(t)为隐含层第j节点的高斯基函数;ρ和η′分别为动量因子和学习因子。
RBF 神经网络的输出为
式中:Cj为隐含层第j节点的中心矢量,Cj=[cj1,cj2]T;bj为该节点基宽度参数。
根据上述方程式,式(16)和式(17)中使用的Jacobian 信息 ∂ω/∂u如下:
式中:k=1, 2。
3 仿真及台架试验结果
用于仿真及台架试验的负载及交流伺服系统参数 为:J=0.025 8 kg·m2,Kd=0.20 N•m/A,Ce= 0.195 V/(rad•s-1),i= 445,R=0.07 Ω,B=0.000 143 N•m/(rad•s-1)。
速度环PI 控制参数ksp=0.093,ksi=0.000 052。扩张状态观测器参数β01= 11.2,β02=4000,β03=1000,h=0.005,c=0.5,b1= 2.5,b2= 2.0,γ= 0.005。混合微分器参数R=27,ah0=0.1,ah1=0.015,m=1,n=2,bh0=0.3,bh1=0.015。速度补偿系数和加速度补偿系数的初始值分别为β1= 0.016228,β2= 0.00069219,补偿增益系数d0= 1.0。
神经网络参数η1= 0.002,η2= 0.03,η′= 0.05,ρ= 0.05。执行RBF 神经网络学习算法的硬件平台是由STM32F107VCT6 单片机构成的硬件系统,CPU 主频为72 MHz。
通过速度环控制计算机仿真,以及摇摆台半实物仿真实验,验证了所设计的某新型车载多管负载行进间稳定控制策略的正确性。
3.1 稳定控制仿真
某新型车载多管负载在陆上行进间稳定跟踪时,路面颠簸不平带来的扰动,是负载受到的主要扰动。按照当前载体行驶速度以及技术水平,通常最大取高低向扰动频率为1 Hz,扰动幅值为 2o。稳定控制的基础就是要将路面带来的扰动准确、实时的估算出来。因此,为验证扩张状态观测器对扰动速度的观测能力,在系统状态方程中增加209.33sin ( 2πt) mil/s的速度扰动项。同时为了模拟随机干扰,在正弦速度扰动的基础上叠加了幅值为 3 mil/s 的随机扰动项。
速度扰动与扩张状态观测器速度观测值对比图如图3 所示,二者误差图如图4 所示。通过图3 可知,速度观测曲线相对于速度扰动曲线较为平滑,原始速度扰动含有高频随机干扰。通过图4 可知,速度扰动与速度观测值的误差在稳定阶段保持在 ±2 mil/s 以内,具有较高的观测精度。对比可知,扩张状态观测器除了可以观测速度扰动外,对扰动速度中的高频随机分量具有一定的滤波作用。
图3 正弦速度扰动观测图Fig. 3 Diagram of Sine velocity disturbance observations
图4 正弦速度扰动观测误差图Fig. 4 Diagram of Sine velocity disturbance observation errors
本文针对外部速度扰动设计了速度补偿和加速度补偿,通过扩张状态观测器得到了扰动速度观测值用于速度补偿。由于扰动速度观测值仍存在一定的随机干扰,若直接对其求微分得到扰动加速度,会对干扰产生放大效应。为此本文利用混合微分器获取扰动加速度。
基于滑模技术的非线性微分器,其吸纳了滑模变结构鲁棒性强、精度高等优点,但易产生抖振现象。图5 给出了2 阶滑模微分器(SOSMD)和混合微分器获取扰动加速度的对比图。由图5 可知,按照SOSMD 获得的扰动加速度存在±130 mil/s2的振动,由此带来的加速度补偿电压存在约±0.33 V 的波动,对系统稳定性不利。利用混合微分器获取的扰动加速度平滑,相对于理论计算值其时滞小于10 ms,可以用于实时加速度补偿。
图5 扰动加速度对比图Fig. 5 Comparison of disturbed accelerations
为验证所提出速度环控制算法的正确性,将目标速度与陀螺仪反馈速度的误差进行积分,积分值的量纲是mil,即积分位置误差。本文通过该积分位置误差来对比速度环控制算法的优劣。速度控制仿真时,目标速度取值为0 mil/s,负载扰动根据实际应用分别取为:频率0.25 Hz、幅值0.5°,频率0.25 Hz、幅值0.2°,频率0.5 Hz、幅值0.4°,频率1 Hz、幅值2.0°,即速度扰动分别为 13.083sin(0.5πt) mil/s, 52.33sin(0.5πt) mil/s、209.33sin(πt) mil/s、209.33sin(2πt) mil/s,通过速度误差积分得到的积分位置误差考核速度环控制性能。
为了研究扰动速度、扰动加速度与积分位置误差之间的关系,使扰动速度、扰动加速度二者幅值的最大值为单位1,将位置误差积分值、扰动速度单位值、扰动加速度单位值作在同一幅图中进行研究。例如,负载扰动为频率1 Hz、幅值2.0°时,将扰动速度209.33sin(2πt) mil/s 除以209.33,将扰动加速度1314.61cos(2πt) mil/s2除以1314.61。
根据实际的调试规律,先调试速度、加速度小的情况,之后再逐步增加速度和加速度。因此本文先按照式(13)计算控制量,调试出速度补偿系数β1和加速度补偿系数β2的初值,之后再利用神经网络对β1和β2进行在线学习,使得二者的取值对于频率 0.25 Hz、幅值 0.5o,频率 0.25 Hz、幅值2.0°,频率0.5 Hz、幅值 4.0o,频率1 Hz、幅值2.0°的负载扰动均适合,保证系统在各种负载扰动情况下的动态精度和响应时间。
在速度扰动为13.083sin(0.5πt) mil/s的条件下,速度环采用PI 控制的同时,加入速度及加速度补偿控制,通过人工多次调试,确定β1和β2的取值分别为0.016 228 和0.000 692 1 9。图6 为积分位置误差值图。
图6 扰动0.25Hz/0.5°积分位置误差图Fig. 6 Position errors for the disturbance of 0.25 Hz/0.5°
由图 6 可知,积分位置误差值在经过约 0.485 s 的振荡调整后进入稳定状态,其值在 ±0.212 mil 范围内变化。由此可知,在速度扰动为13.083sin ( 0.5πt) mil/s的条件下,速度环控制器对外部速度扰动具体较好的抑制作用,动态稳定控制精度在仿真指标要求的 ±0 .6 mil 范围内。
在速度扰动为52.333sin(0.5πt)mil/s的条件下,若β1和β2的取值保持0.016228 和0.00069219不变,按照式(13)计算控制量,积分位置误差值图如图7 所示。由图7 可知,积分位置误差值在经过约0.675 s 的振荡调整后进入稳定状态,其值在范围内呈负正弦规律变±0.852 mil 化,其变化规律基本与扰动速度规律相反。通过分析可知,动态稳定控制精度超出了仿真指标要求的±0.6 mil 范围,达不到对系统动态精度的要求。由此可知,对于不同的速度扰动,速度补偿系数β1和加速度补偿系数β2需在线学习、调整。
图7 扰动0.25 Hz/2.0°积分位置误差图 Fig. 7 Position errors for the disturbance of 0.25 Hz/2.0°
在速度扰动为 52.333sin(0.5πt) mil/s 的条件下,补偿控制量利用式(14)进行计算,神经网络对β1和β2进行在线学习,积分位置误差值图如图8所示。由图8 可知,积分位置误差值在经过约 0.62 s 的振荡调整后进入稳定状态,其值在 ±0.208 mil 范围内变化,动态稳定控制精度在指标要求的±0.6 mil 范围内。补偿系数β1和β2的学习过程如图9 所示。β1和β2的初始值分别为0.016 228和0.000 69219,经过2.935 s 的学习后,β1的取值稳定在0.016141,β2的取值稳定在0.000 823 57。
图8 神经网络学习的扰动0.25 Hz/2.0°积分位置误差图Fig. 8 Position errors for the disturbance of 0.25 Hz/2.0° with NN
图9 扰动0.25 Hz/2.0° 时β1和β2自学习曲线Fig. 9 β1andβ2learning curves for the disturbance of 0.25 Hz/2.0°
通过分析可知,相对于β1和β2的取值保持不变的情况,在速度扰动为52.333sin(0.5πt) mil/s 的条件下,采用神经网络在线调整、学习补偿系数β1和β2后,积分位置误差值最大值由±0.852 mil 减小到了±0.208 mil,减小百分比为75.58%。
为考核本文所提出控制算法对于不同频率速度扰动的自学习能力,在扰动速度分别为209.33sin(2πt) mil/s 和209.33sin(πt) mil/s 条件下,研究积分位置误差值。
在速度扰动为209.33sin(πt) mil/s 的条件下,补偿控制量利用式(14)进行计算,神经网络对β1和β2进行在线学习,积分位置误差值图如图10 所示。由图10 可知,若β1和β2的取值保持不变则积分位置误差值在±2.733 mil 范围内变化;神经网络对β1和β2进行在线学习,在经过约3.69 s 的振荡调整后进入稳定状态,其值在±0.324 mil 范围内呈负正弦规律变化,动态稳定控制精度在仿真指标要求的 ±0.6 mil 范围内。
图10 神经网络学习的扰动0.5 Hz/4.0°积分 位置误差图Fig. 10 Position errors for the disturbance of 0.5 Hz/4.0° with NN
补偿系数β1和β2的学习过程如图11 所示。β1和β2的初始值分别为0.016228和0.00069219,经过3.635 s 的学习后,β1的取值稳定在0.01099 8 ,β2的取值稳定在0.0002967。
图11 扰动0.5 Hz/4.0° 时β1和β2自学习曲线 Fig.11 β1andβ2learning graph of disturbance 0.5 Hz/4.0°
通过分析可知,在速度扰动为209.33sin(πt) mil/s的条件下,相对于β1和β2的取值保持不变的情况,采用神经网络在线调整、学习补偿系数β1和β2后,积分位置误差值最大值由±2.733 mil 减小到了 ±0.324 mil,减小百分比为88.14%。参数β1和β2学习稳定时间与积分位置误差值稳定时间基本一致,在3.7 s 内完成调整、学习。
在速度扰动为209.33sin(2πt) mil/s 的条件下,补偿控制量利用式(14)进行计算,神经网络对β1和β2进行在线学习,积分位置误差值图如图 12 所示。
图12 神经网络学习的扰动1.0 Hz/2.0°积分位置误差图Fig. 12 Position errors for the disturbance of 1.0 Hz/2.0° with NN
由图12 可知,若β1和β2的取值保持不变积分位置误差值在±4.339 mil 范围内变化。神经网络对β1和β2进行在线学习,在经过约2.955 s 的振荡调整后进入稳定状态,其值在±0.397 mil 范围内呈负正弦规律变化,动态稳定控制精度在仿真指标要求的±0.6 mil 范围内。补偿系数β1和β2的学习过程如图13 所示。β1和β2的初始值分别为0.01622 8和0.00069219,经过2.875 s 的学习后,β1的取值稳定在0.011078,β2的取值稳定在0.000 358 65。
图13 扰动1.0 Hz/2.0° 时β1和β2自学习曲线Fig.13 β1andβ2learning graph of disturbance 1.0 Hz/2.0°
通过分析可知,相对于β1和β2的取值保持不变的情况,在速度扰动为209.33sin(2πt) mil/s 的条件下,采用神经网络在线调整、学习补偿系数β1和β2后,积分位置误差值最大值由±4.339 mil 减小到了±0.397 mil,减小百分比为90.85%。参数β1和β2学习稳定时间与积分位置误差值稳定时间基本一致,在3.0 s 内完成调整、学习。
利用混合微分器获取的扰动加速度平滑、时滞小,而按照SOSMD 获得的扰动加速度存在的振动。图14 给出了在速度扰动为209.33sin(2πt) mil/s的条件下,利用混合微分器和SOSMD 获取扰动加速度,进而计算补偿控制量,进行稳定控制的积分位置误差对比图。
图14 混合微分器和SOSMD 位置误差对比图Fig. 14 Comparison of position errors using HD and SOSMD
由图14 可以看出,由于SOSMD 获得的扰动加速度存在振动,导致负载积分位置值不稳定,积分位置误差亦存在振动现象,振动峰值达到 2.252 mil,其积分位置误差峰值是采用混合微分器获得的扰动加速度进行补偿的6.36倍,使得系统的动态性能变差。
3.2 摇摆台试验
为验证理论研究的正确性,利用摇摆台进行半实物仿真实验。将负载通过过度座圈与摇摆台刚性连接,利用摇摆台向负载提供周期振动,以模拟载体在路面上行驶时传递给负载的外部扰动。
摇摆台试验包括控制计算机箱、伺服放大箱(电源板、RDC 转换板、伺服放大板等)、交流伺服电机、台架、多管负载、电源柜、陀螺仪、旋转变压器等。由陀螺仪测量多管负载速度。
试验使用的6 自由度摇摆台如图15 所示。
图15 摇摆台图Fig. 15 Stewart platform
该摇摆台可以根据不同的负载情况选择空载、4 t、8 t 和15 t。摇摆台上位机操作界面如 图16 所示,可利用摇摆台进行横向、纵向、偏航正弦试验,需输入各自由度对应的幅值、频率、相位等参数。
图16 摇摆台上位机操作界面Fig. 16 Operational interface of the host computer of a Stewart platform
本文试验时目标速度取值为0 mil/s,纵摇负载扰动分别为:频率0.25 Hz、幅值2.0°,频率0.5 Hz、幅值4.0°,频率1 Hz、幅值2.0°,即速度扰动分别为 52.33sin(0.5πt) mil/s 、 209.33sin(πt) mil/s 、209.33sin(2πt) mil/s,通过速度误差积分得到的积分位置误差考核速度环控制性能。速度环由陀螺仪测量的负载角速度作为反馈,系统稳定运行10 s 后采集数据如图17所示。
图17 给出了速度扰动为52.33sin(0.5πt) mil/s 时的积分位置误差。由图17 可知,误差最大值为0.393 mil,误差均方差为0.237 mil,误差小于0.5 mil的百分比为100%,误差小于0.3 mil 的百分比为82.15%,误差小于0.2 mil 的百分比为33.25%。
图17 扰动0.25 Hz/2.0°时摇摆台试验积分位置误差图Fig. 17 Position errors for the disturbance of 0.25 Hz/2.0° on a Stewart platform
图18给出了速度扰动为209.33sin(πt) mil/s时的积分位置误差。由图 18 可知,误差最大值为 0.667 mil,误差均方差为 0.236 mil,误差小于 0.5 mil的百分比为96.45%,误差小于0.3 mil的百分比为78.65%,误差小于0.2 mil的百分比为55.55%。
图18 扰动0.5 Hz/4.0°时摇摆台试验积分位置误差图Fig. 18 Position errors for the disturbance of 0.5 Hz/4.0° on a Stewart platform
图19 给出了速度扰动为209.33sin(2πt) mil/s 时的积分位置误差。由图19 可知,误差最大值为0.743 mil,误差均方差为 0.321 mil,误差小于 0.5 mil 的百分比为81.95%,误差小于0.3 mil 的百分比为62.75% ,误差小于 0.2 mil 的百分比为39.55%。
图19 扰动1.0 Hz/2.0°时摇摆台试验积分位置误差图Fig. 19 Position errors for the disturbance of 1.0 Hz/2.0° on a Stewart platform
图20 给出了速度扰动为209.33sin(2πt) mil/s 跟踪速度8.333 mil/s 时的积分位置误差。由图20 可知,误差最大值为0.884 mil,误差均方差为0.345 mil,误差小于0.5 mil 的百分比为81.75%,误差小于0.3 mil的百分比为62.24%,误差小于0.2 mil 的百分比为38.45% 。由图 20 可知,在目标速度取值为 8.333 mil/s,速度扰动为209.33sin(2πt) mil/s 条件下,积分位置误差均方差小于指标要求的0.5 mil。
图20 扰动1.0 Hz/2.0°,跟踪速度0.5°/s 时摇摆台试验积分位置误差图Fig. 20 Position errors for the disturbance of 1.0 Hz/2.0° , tracking speed of 0.5°/s on a Stewart platform
由图17、图18、图19 可知,在目标速度取值为0 mil/s,速度扰动分别为52.333sin(0.5πt) mil/s、209.33sin(πt) mil/s、209.33sin(2πt) mil/s 条件下,积分位置误差均方差均小于指标要求的0.5 mil。
4 结论
本文针对某新型车载多管负载行进间稳定跟踪控制问题,设计了一种基于ESO 观测扰动速度、混合微分器计算扰动加速度、神经网络自适应计算补偿控制量的新型控制器,以实现外部扰动因素的实时、动态补偿,使系统具备良好的动态跟踪特性。得出主要结论如下:
1) 速度环计算机仿真表明:扩张状态观测器除了可以观测速度扰动外,对扰动速度中的高频随机分量具有一定的滤波作用;按照SOSMD 获得的扰动加速度存在振动,由此带来的加速度补偿电压存在约±0.33 V 的波动,对系统稳定性不利,然而利用混合微分器获取的扰动加速度平滑,时滞小于10 ms,可以用于实时加速度补偿;速度扰动分别为 52.333sin(0.5πt) mil/s、209.33sin(πt) mil/s 和209.33sin(2πt) mil/s 条件下,相对于β1和β2的取值保持不变的情况,采用神经网络在线调整、学习补偿系数β1和β2后,积分位置误差值减小百分比分别为75.58%、88.14%和90.85%,较好地抑制了外部速度扰动的影响,实现了高精度速度环控制;由于SOSMD 获得的扰动加速度存在振动,导致负载积分位置值不稳定,积分位置误差亦存在振动现象,相对于利用混合微分器获取扰动加速度进行补偿情况,积分位置误差峰值增大了约6.36 倍,系统动态性能变差。
2) 摇摆台试验表明:速度扰动分别为52.333sin(0.5πt) mil/s 、 209.33sin(πt) mil/s 和209.33sin(2πt) mil/s 条件下,积分位置误差均方差分别为0.237 mil、0.236 mil 和0.321 mil,速度环较好地补偿了外部速度扰动的干扰,稳定控制精度高。
综上所述,将本文所提出的速度环稳定控制算法应用于某新型车载多管负载在陆上行进间跟踪控制,能有效抑制外部扰动的影响,实现了高精度稳定控制,具有良好的应用前景。