基于模糊自适应的连续整定PID舵机控制器
2018-09-11张展华桂延宁王发林
张展华,桂延宁,周 彬,王发林
(机电动态控制重点实验室,陕西 西安 710065)
0 引言
在二维弹道修正弹的修正系统中,电动舵机作为修正执行机构是整个系统中不可或缺的一部分,电动舵机的响应速度和稳态精度等指标会直接影响二维弹道修正弹的修正能力,因此电动舵机控制器的设计至关重要。现有的二维弹道修正弹电动舵机系统一般常使用经典的比例微分积分(Proportion Integral Derivative简称PID)控制器,该控制器算法结构简单、易于实现,具有很强的工程实用价值[1]。然而经典PID控制本质上仍是一种线性控制,这对于二维弹道修正弹电动舵机系统这种多变量、非线性、时变的复杂系统而言不能起到良好的控制作用[2],其动态响应以及对负载变化的适应能力都已不能适应弹道修正弹电动舵机系统越来越高的要求。
为提高电动舵机控制器的动态响应以及适应能力,目前研究中主要使用的方法是将经典PID控制与智能控制相结合[3],利用智能算法来调节整定PID参数,适应系统的变化规律,进而更加有效地控制系统动作。目前常见的智能控制和经典PID控制结合的算法主要有神经网络PID,神经网络模糊PID[4],模糊自适应PID[5]等。其中神经网络PID以及神经网络模糊PID虽然一般可以连续调节整定PID参数,但由于算法较为复杂,计算量较大,难以在二维弹道修正弹电动舵机控制器上直接应用[6]。模糊自适应PID算法结构较为简单,但其在离散论域下控制规则较为粗糙,对PID参数只能进行离散间断的调节整定,这对于高响应速度、强适应能力需求的二维弹道修正弹电动舵机系统来说控制能力明显不足[7];在连续论域下虽然可以对PID参数进行持续的调节整定,控制
能力有所提高,但其控制曲面上极点较多,控制规则仍不够平滑[8],且其在重心法反模糊化时需要进行大量的积分运算,计算量过大,难以满足二维弹道修正弹电动舵机控制器实时性的要求[9]。针对二维弹道修正弹电动舵机控制器高响应速度、强适应能力、高实时性的需求,本文提出了基于模糊自适应的连续整定PID舵机控制器。
1 二维弹道修正弹电动舵机控制系统的结构及模糊自适应算法
1.1 二维弹道修正弹电动舵机控制系统的结构
二维弹道修正弹的电动舵机控制系统一般采用位置环、转速环、电流环的三闭环控制策略[10],本文中的电动舵机控制系统以无刷直流电机为控制对象,其系统结构如图1所示。
图1 电动舵机三闭环控制系统结构图Fig.1 The three loops control cycles of electromechanical actuator
图1中电流环是电动舵机控制系统的最内环,起到控制转矩,限制最大电流的作用。由于电流环的响应速度很快,目前一般使用经典PI控制器,放弃了把微分D引入到电流环控制中,以避免微分因子的加入造成电流环的震荡。速度环用来实现速度的实时跟踪,在负载转矩变化时维持速度在设定值。速度环的控制算法与电流环的控制算法差别不大,也使用经典的PI控制器。位置环作为三环控制的最外环,直接决定舵机系统的动、静态性能,是电动舵机控制系统设计中最关键的部分之一,为提高控制性能,目前位置环的控制器一般均使用PID控制器。然而经典PID控制器由于Kp、Ki、Kd参数固定,很难保证系统既具有较快的响应速度,同时又具有较小的超调量以及较好的鲁棒性和静态性能。因此需要在位置环对经典PID控制器进行改进,使其尽可能好地兼顾各项性能指标。
1.2 模糊自适应算法
模糊自适应算法可以根据系统的运行状态获取系统过程状态的连续信息,通过在线辨识和修正过程的模糊模型,从中获取所需的控制规则,实现在线模糊控制规则的自学习或自动调整模糊控制器的参数,以便适应环境条件或过程多数的变化以及由于人的经验性所获得的模糊控制规则的经验性和局限性,使系统大大提高适应能力,获得较强的鲁棒性,维持控制系统所要求的性能准则[11]。
模糊自适应算法是基于Zadeh的模糊理论,它通常由模糊化、模糊规则库、模糊推理、反模糊化和软反馈5个部分组成。模糊化通过变换因子、语言变量和隶属度函数将把系统的实值输入转换成对应的模糊子集。模糊规则库通常是一系列的IF…THEN模糊规则的集合,它包含了现场控制人员的经验或相关专家的知识,是模糊推理的核心部分[12]。模糊推理就是基于模糊逻辑的原理,把模糊规则合成为一个从输入空间的模糊子集到输出空间模糊子集的映射,通常使用的方法有Mamdani法和Takagi-Sugeno法。反模糊化则是通过反变换因子、语言变量和隶属度函数将一个输出的模糊子集转换成对应的实值输出,常使用的方法有Max-Min重心法,代数积-加法-重心法和最大隶属度法等。软反馈即由软件实现地对控制器自身性能的反馈,它通常由性能测量、控制量校正、规则参数修正组成。通过软反馈就可以不断地调整和改善控制器的性能,以使对被控过程的控制效果达到更佳的状态。使用模糊自适应算法的控制系统的结构一般如图2所示[13]。
图2 模糊自适应控制系统原理图Fig.2 The schematic of thefuzzy-adaptive control system
2 基于模糊自适应的连续整定PID舵机控制器
本文所提出的基于模糊自适应的连续整定PID舵机控制器是以模糊自适应算法为基础,采用连续论域,mamdani法推理的IF…THEN模糊规则,Max-Min重心法反模糊化,在模糊推理得到的极点较多的模糊控制曲面中,选择其中离散的169个点,然后通过使用3次曲面拟合得到平滑的控制曲面以及对应的连续函数,并以此连续函数作为最后的控制函数对PID参数进行连续的调节整定。
控制器分为两个部分,离线部分可以通过对模糊自适应算法中的模糊控制曲面进行3次曲面拟合得到对应的PID控制函数,该部分可在实验台上由一般计算机完成。在线部分通过PID控制函数对PID控制器进行连续的调节整定,进而对系统进行控制,该部分为弹载舵机控制器实际操作的部分,在弹载计算机给出控制指令后开始进行。其原理框图如图3所示。
图3 控制器原理图Fig.3 The schematic of the controller
本控制器首先选取合适的变换因子将基本论域变换为连续论域[-6,6],控制器中输入输出的模糊变量均划为七个模糊子集,分别为{NB,NM,NS,ZO,PS,PM,PB},对应的语言变量表示为{负大、负中、负小、零、正小、正中、正大}。所有变量对应的隶属度函数均选择对称的三角形隶属度函数,控制器中的模糊推理采取IF…THEN模糊规则的mamdani法推理,反模糊化选取Max-Min重心法进行反模糊。在反模糊化得到模糊控制曲面后,开始对模糊控制曲面进行合适的离散取点。考虑到本控制器的控制规则应与模糊控制规则尽量接近,因此选取论域中语言变量的隶属度最大的点以及隶属度函数交叉的点,即论域的整数点。在本控制器中,有两个输入变量误差以及误差变化率,每个变量都可以取{0,±1,±2,±3,±4,±5,±6}共13个值,因此两个变量共可以得取13×13共169个离散点。然后在取得的离散点中以误差为x,误差的变化率为y,对应的模糊控制曲面的值为z,进行三次曲面拟合。
(1)
要使代价函数E最小,则必须满足以下方程:
(2)
为使推导方便,令z=a1+a2x+a3y+a4x2+a5xy+a6y2+a7x3+a8x2y+a9xy2+a10y3=a1b1+a2b2+a3b3+a4b4+a5b5+a6b6+a7b7+a8b8+a9b9+a10b10。即b1=1,b2=x,b3=y,…,b10=y3,则b1,b2,…,b10为空间中线形无关的一组基。再令li=(xi,yi),表示选取的离散点坐标(xi,yi),i=1,2…,169。则式(2)中的等式可以展开为下式:
(3)
写成线性方程组的形式即为:
(4)
将式(4)改写成矩阵形式:
BBTA=BZ
(5)
A=(a1,a2,…,a10)T,Z=(z1,z2,…,z169)T。
然后使用求解线性方程组的一般方法解出系数矩阵A,则可以得到拟和的3次曲面以及对应的连续函数式z=f(x,y;a1,a2,…,a10)。三次曲面拟和完成后,则以拟和的3次曲面作为新的控制曲面,对应的连续函数式z=f(x,y;a1,a2,…,a10)作为控制函数对PID参数进行连续的在线调节整定,进而对电动舵机进行更为有效的控制。
3 仿真验证
本文使用Matlab中的Simulink工具箱、Fuzzy Logical工具箱及Curve Fitting工具箱进行仿真验证。系统中的伺服电机选用MAXON公司的EC22无刷直流电机,该电机额定电压24 V,额定功率100 W,额定转速27 000 r/min,额定转矩48.5 mNm,搭配的减速机构减速比为40∶1,负载为柔性负载,其大小与舵机转角成正比。系统的最终指标要求如下:1)最大输出角度10°;2)最大动作频率8 Hz;3)最大负载力矩1 N·m/10°;4)幅值最大误差≤10%;5)最大相位误差≤10%。
首先通过对模糊自适应控制器进行仿真,生成模糊曲面,并选取其中语言变量隶属度最大的169个点得到模糊控制表,以Kp参数整定为例,其模糊控制曲面如图4所示,模糊控制表为表1。
然后通过对模糊控制表中选取的169个离散点进行3次曲面逼近,得到对应的控制函数以及控制曲面如下所示:
控制函数:f(x,y)=p00+p10x+p01y+
p20x2+p11xy+p02y2+p30x3+p21x2y+
p12xy2+p03y3。
函数系数(95%的置信区间):
p00=0.015 6(-0.113 7, 0.144 9);
p10=0.596 4(0.545 2, 0.647 7);
p01=0.657 3(0.606, 0.708 6);
p20=-0.000 192 1(-0.005 727, 0.005 342);
p11=9.057×10-5(-0.004 815, 0.004 996);
p02=-0.000 499 5(-0.006 034, 0.005 035);
p30=0.000 300 3(-0.001 425, 0.002 026);
p21=-0.007 511(-0.008 99, -0.006 032);
p12=-0.003 861(-0.005 34, -0.002 382);
p03=-0.000 461 7(-0.002 187, 0.001 264)。
拟合优度(Goodness of fit):
和方差SSE: 32.5;均方根误差(RMSE): 0.452 1;
确定系数(R-square): 0.977 8;
调整的确定系数(Adjusted R-square): 0.976 6。
表1 模糊控制表Tab.1 The fuzzy control diagram of Kp
图4 模糊控制器曲面Fig.4 The fuzzy control surface of Kp
图5为使用3次曲面拟合后得到的控制曲面对比图4和图5可知,3次曲面拟合后的控制曲面与原先的模糊控制曲面具有相似的控制规律,但其控制曲面更加平滑、控制特性更加连续,更加逼近非线性系统的控制规律。
图5 使用3次曲面拟合后得到的控制曲面Fig.5 The control surface using cubic function surface approximation
下面是电动舵机系统使用基于模糊自适应的连续整定PID(下面简称连续整定)舵机控制器进行空载阶跃响应、负载阶跃响应以及负载8 Hz正弦信号跟踪响应的仿真,并与经典PID及模糊自适应PID(下面简称模糊自适应)控制器进行对比,其中动态响应性能可以通过上升时间以及过零点相位误差来比较,适应能力可以通过负载阶跃响应中有无明显的稳态误差以及负载8 Hz正弦信号跟踪响应中的最大幅值误差来比较,实时性则可以通过10次平均仿真时间来比较。仿真结果如图6—图10及表2—表4所示。
图6 系统空载阶跃响应对比图Fig.6 Simulation system response with no load
经典PID模糊自适应连续整定上升时间τ/ms11.1688.5118.278稳态响应/(°)10.0310.0210.02
图7 系统负载阶跃响应对比图Fig.7 Simulation system response with load impact
经典PID模糊自适应连续整定上升时间τ/ms11.1259.5679.405稳态响应/(°)9.72810.0210.02
图8 经典PID负载8 Hz正弦信号跟踪响应曲线Fig.8 The 8 Hz sine response with load impact of PID controller system
图9 模糊自适应负载8 Hz正弦信号跟踪响应曲线Fig.9 The 8 Hz sine response with load impact of fuzzy adaptive PID controller system
图10 连续整定负载8 Hz正弦信号跟踪响应曲线Fig.10 The 8 Hz sine response with load impact of continuous setting PID controller system
经典PID模糊自适应连续整定最大幅值误差/%22.6711.369.54过零点相位误差/(°)—7.385.9410次平均仿真时间/s—50.5711.81
由图6和表2可得,在空载阶跃响应中,连续整定舵机控制器的上升时间比经典PID控制器缩短了约26%,比模糊自适应控制器缩短了约3%。稳态响应上,三种系统差异不大。
由图7和表3可得,在负载阶跃响应中,连续整定舵机控制器的上升时间比经典PID控制器缩短了约15%,比模糊自适应控制器缩短了约2%。稳态响应上,经典PID控制器出现了明显的稳态误差,而连续整定和模糊自适应的稳态精度较为接近,基本不存在稳态误差,可见连续整定和模糊自适应控制器都具有一定的适应能力。
由图8—图10和表4可得,在负载8 Hz正弦信号跟踪响应中,经典PID控制器的跟踪响应曲线已经出现了明显的变形,该控制器已无法完成8 Hz正弦信号的跟踪;连续整定舵机控制器和模糊自适应控制器的跟踪曲线较为完整,能完成8 Hz正弦信号的跟踪任务。在最大幅值误差方面,模糊自适应控制器为11.36%,不符合舵机系统的设计指标,连续整定舵机控制器为9.54%,较模糊自适应控制器降低了1.82%,百分比对比来看,降低了约16%,符合系统的设计指标。在过零点相位误差方面,连续整定舵机控制器和模糊自适应控制器都符合系统的设计要求,连续整定舵机控制器较模糊自适应控制器误差度数减少了1.44°,约20%,且在负载8 Hz正弦信号跟踪响应仿真中,还统计了在同一仿真系统,相同工况下连续整定舵机控制器和模糊自适应控制器的仿真时间,10次统计取平均值,模糊自适应舵机控制器的仿真时间约为50.57 s,连续整定舵机控制器的仿真时间约为11.81 s,约为模糊自适应控制器的23%。可见连续整定舵机控制器的计算量远小于模糊自适应舵机控制器,更适合于工程中设计应用。
4 结论
本文提出的基于模糊自适应的连续整定PID舵机控制器,是指在模糊自适应算法的基础上,通过对含有较多极点的模糊控制曲面的3次曲面拟合得到平滑连续的控制函数,并以此控制函数连续的调解整定PID参数,输出对应连续变化的控制信号,调节舵机的转角进而控制弹道偏向。与模糊自适应PID及经典PID舵机控制器相比,基于模糊自适应的连续整定PID舵机控制器具有更好的动态响应和适应能力,且其计算量相对于连续论域的模糊自适应PID控制器来讲更少,实时性更强。通过Matlab仿真验证表明,在空载阶跃响应中和负载阶跃响应中,基于模糊自适应的连续整定PID舵机控制器的上升时间相对于经典PID舵机控制器分别减少了26%和15%,且在负载下不存在明显的稳态误差。在负载8 Hz正弦信号跟踪响应中,基于模糊自适应的连续整定PID舵机控制器相对于模糊自适应PID舵机控制器,在最大幅值误差方面减少了16%,在过零点相位误差方面减少了20%,且其仿真时间仅为后者的23%。可见基于模糊自适应的连续整定PID舵机控制器动态响应快,适应能力强、实时性好,适合在二维弹道修正弹上应用。进一步的研究方向为通过外场实验细化系统控制的模糊规则,并在硬件平台上进行对应的设计验证。