APP下载

基于改进多种群PSO 算法的火炮随动系统调节器参数优化*

2020-08-10段纬然贾长治闫媛媛

火力与指挥控制 2020年6期
关键词:调节器惯性种群

韩 超,段纬然,贾长治,闫媛媛

(1.陆军工程大学石家庄校区,石家庄 050003;2.解放军32181 部队,石家庄 050003)

0 引言

随动系统又名伺服系统,属于自动控制系统范畴,特点为输出量能够以一定准确度跟随输入量的变化而变化。火炮随动系统是火炮火力控制系统的重要组成部分,其性能直接影响火炮的动态特性和射击精度[1-2]。

为了使火炮随动系统获得更好的动静态性能,一般采用三闭环控制结构(位置环、转速环和电流环),每个控制环内均有一个PID 调节器,火炮随动系统的控制效果与PID 参数有直接的关系。所以,三闭环火炮随动系统的优化问题可以转换为3 个PID 调节器参数优化的问题。粒子群算法(Particle Swarm Optimization,PSO),是一种启发式的智能优化算法,该算法结构简单,可操作性强,便于实现,得到很多学者的关注和研究使用[3-5]。

本文针对粒子群算法存在易陷入局部最优的不足,提出一种改进的全局粒子群优化算法,算法主要针对基本PSO 算法做了两方面改进:一是采用惯性权重指数递减策略,使得前期搜索范围大、速度快,后期能够迅速收敛,提高精度。二是为保证种群全局搜索能力,采用将初始种群划分为多个子群协同寻优的策略。通过K-均值聚类算法对初始种群进行聚类划分以实现种群划分,在确保粒子群局部搜索和全局搜索能力的同时,可有效避免粒子群陷入局部。将改进后的粒子群算法用于火炮随动系统调节器参数优化,可有效提升参数优化水平。

1 火炮随动系统数学模型建立

火炮随动系统采用位置环、转速环和电流环三闭环控制结构。三闭环随动系统结构框图如图1所示。

图1 三闭环随动系统框图

位置环是随动系统的最外环,主要由位置环调节器(APR)、机械传动装置和位置环前向滤波器装置组成,是随动系统性能的最终体现环路。位置环的调节器产生速度设定值,使随动系统能够准确跟随定位。位置环动态模型框图如图2 所示。

速度环主要由速度调节器(ASR)、电流环、伺服电机、前向及反馈滤波器和速度传感器组成。

图2 位置环动态模型框图

速度环实际上是对电流环进行控制,速度调节器通过设定值与实际值的偏差产生电流设定值,即电流环中允许通过的最大电流,可使电机平稳工作在不同的速度,从而实现控制电机转速的目的。速度环可提高系统抵抗速度扰动和阻力矩的能力,改善动态特性,速度环动态模型框图如图3 所示。

图3 速度环动态模型框图

电流环主要有电流环调节器(ACR)、伺服交流电动机、电力电子变换器、前向及反馈滤波器和电流检测装置组成。电流环可减小电机时间常数,消除死区,减小电流波动干扰,改善电机特性。由于电流可直接控制电机的转矩,电流环通过控制输出电流完成对电机转矩和转速的控制[6-7]。电流环动态模型框图如图4 所示。将上述位置环、速度环和电流环按实际结构组合,三闭环随动系统动态模型框图如下页图5 所示。

图4 电流环动态模型框图

2 随动系统三闭环调节器参数优化

本文采用Simulink 仿真环境建立随动系统动态模型,为分析和研究火炮随动系统提供了一个准确、可靠的平台[10]。三闭环随动系统共有3 个调节器,3 个调节器均采用PI 控制算法,则共有6 个调节器参数需要优化。

图5 三闭环随动系统动态模型框

随动系统3 个闭环参数优化需要解决两方面问题:一是选取目标函数;二是采用优化算法优化调节器参数,使这个目标函数最小(或最大)。

目标函数一般分3 种,第1 种是调节品质型目标函数,一般为超调量、衰减率、上升时间和调整时间等的函数;第2 种是误差积分型目标函数,一般分为平方误差积分、时间乘平方误差积分和时间乘绝对误差积分;第3 种为综合型目标函数,即将上述两种目标函数相结合,取长补短,从而得到一类综合型的目标函数。本文采用综合型目标函数,目标函数如下:

其中,c1、c2分别为误差和控制量在目标函数中的权值,d1、d2分别为积分型和指标型目标函数的权值。Mp为超调量,Mpb为期望超调量,e(t)为设定值与实际值间的偏差,u(t)为控制器输出。

调节器参数优化过程如下:先对优化算法进行参数初始化,再调用初始调节器参数,启动Simulink仿真模型,并生成动态过程数据和指标数据,计算此次仿真结果的目标函数值,判断迭代终止条件是否满足,若满足,则输出最优调节器参数;若不满足,则调用优化算法更新调节器参数,并再次调用Simulink 仿真模型。

3 标准粒子群算法

粒子群优化算法(Particle Swarm Optimization,PSO)是由James Kenney 和Russell Eberhart 设计的一种仿生计算方法,它是模拟自然界中生物捕食现象而提出的群体智能算法,具有操作简单,计算速度快等特点,近些年得到了广泛关注和研究[11]。

PSO 的基本思想是把搜索空间中的每个粒子看成优化问题的多个解,所有的粒子都有一个被优化的函数所决定的适应值(目标函数值),每个粒子飞翔的方向和距离由一个速度向量决定,粒子们通过追随当前的最优粒子完成在解空间中的搜索[12]。

粒子群算法的核心算子为速度的更新公式,如式(2)所示:

其中,Xbestin为粒子i 迄今为止经历的最优位置,称作粒子的“认知部分”;Xbestgn为迄今为止整个粒子群经历的最优位置,称作粒子的“社会部分”。

为了平衡全局与局部搜索惯性,引入了惯性权重ω,表征了前一时刻的速度对后一时刻速度的影响程度,在标准粒子群算法中,惯性权重ω 为常数[13]。

c1表示认知因子,c2表示社会因子,它们分别代表了向自身当前最优值和全局当前最优值推进的加速权值。r1,r2为0~1 之间的随机变量。粒子按式(3)来更新位置

根据实际问题,粒子的取值范围和速度都会设定相应的取值范围,寻优的过程就是上述速度更新公式及位置更新公式的迭代,迭代过程会在达到预先设定的目标值或迭代次数后终止。

4 惯性权重指数递减PSO(ED-PSO)算法

标准PSO 算法在求解复杂多极值问题时极易陷入局部最优解从而导致早熟收敛,惯性权重ω 是粒子群算法中重要的参数,较大的惯性权重可提升全局搜索能力,粒子收敛速度快,缺点是解的准确度下降;反之,准确度提升,但收敛速度降低易出现“早熟”现象[14]。一般迭代初期取较大惯性权重,以有效搜索整个空间,加快寻优速度,后期惯性权重取较小值,以有利于算法收敛,结果精度高。相关研究表明,惯性权重的取值应该选择递减策略,文献[15-19]中,将t/tmax或tmax/t 作为计算惯性权重函数的变化量,虽然能起到惯性权重随迭代次数递减的作用,但是,不同的最大迭代次数会导致惯性权重变化趋势相差很大,如图6 所示,同为第100 次迭代,在曲线1 中惯性权重为0.85,而在曲线5 中惯性权重为1.01,显然不利于算法稳定性。

图6 惯性权重与迭代次数关系图

本文提出一种基于指数函数的惯性权重递减策略,公式如下:

式中,ωmax代表最大惯性权重,ωmin代表最小惯性权重,tmax为最大迭代次数,t 为当前迭代次数,f(tmax)是最大迭代次数的函数。基于指数函数的惯性权重递减曲线如图7 所示,从图中可看出,不同的最大迭代次数,其惯性权重变化趋势相差不大,有利于算法稳定。

图7 惯性权重与迭代次数关系图

5 基于K-均值与惯性权重指数递减的多种群PSO(KEDM-PSO)算法

上节虽然提出了一种新的惯性权重调整策略,在一定程度上提升了算法性能,但是单纯调整惯性权重仍存在一定的缺陷。考虑到种群进化算法的特性,当种群过于集中时,群体将在局部极值点停滞,失去开拓新区域的能力,所以,种群多样性低会导致种群的早熟收敛[20],因此,增加种群多样性,对提升算法性能十分重要。

文献[21]指出,多种群PSO 算法运行效率和精度远远高于单种群PSO 算法,但文中多种群的构建是通过随机选取种群中的粒子。文献[22]则是将一定规模的种群平均分成几个子群,每个子群按各自不同的规则进化。这两种多种群构建策略均具有一定的盲目性。考虑到种群进化算法的特性,当种群多样性降到较低水平时,群体将在局部区域提前收敛,失去开拓新区域的能力。所以,找到一种保持种群多样性的多种群构建方法,对于提升算法性能是至关重要的。同时,过度增强种群多样性又会造成收敛速度缓慢的问题,影响最终所得解集的收敛性。综合考虑系统复杂程度、种群规模、解集的多样性和收敛性,采用基于K-均值聚类算法将初始种群划分为3 个子群,这种构建方法可兼顾多样性和收敛性要求。

为防止子群在迭代初期产生粒子聚集,进而导致算法早熟收敛,需在迭代过程中重新采用K-均值聚类算法划分种群,完成互换子群内的粒子,所以在整个搜索过程中,各子群内的粒子是处于动态组建状态的。迭代过程中,需根据当前种群聚集程度,决定是否需要重新采用K-均值聚类算法进行子群划分。

采用文献[23]提出的种群多样性度量方法表征种群聚集程度,即:

式中,L 为搜索空间对角最大长度,n 为种群规模,m为数据维数,xilt表示迭代时刻t 第i 个粒子的第l 维坐标值,Ql表示所有粒子的第l 维坐标值的平均值。上述间距公式可用于描述种群各粒子的离散程度,M(t)越大表示种群平均间距越大,种群多样性越大,反之亦然。这种根据平均间距描述种群多样性,进而进行多次K- 均值聚类对种群重新分类的方法,可交互每个子群间的信息,降低发生局部最优的可能。

5.1 算法步骤

下面是基于K-均值聚类的多种群指数惯性权重递减PSO 算法具体流程:

步骤2 随机初始化种群中粒子的初始位置,且采用K-均值聚类方法将种群分为3 类;

步骤3 对每个种群均采用指数惯性权重递减PSO 算法进行迭代;

步骤4 设置种群多样性度量值阈值,当种群多样性度量值小于此阈值时,采用K-均值聚类对种群进行一次划分。

步骤5 从3 个子群中的全局最优粒子及其位置和目标函数值中选择种群的全局最优粒子及其位置和目标函数值;

步骤6 判断是否满足迭代终止条件,若不满足,则返回步骤3,否则迭代结束,输出结果。

5.2 仿真结果及分析

选择标准PSO、惯性权重指数递减PSO 和K 均值聚类+惯性权重指数递减PSO 3 种方法进行对比分析。随动系统3 个控制闭环共6 个参数(每个闭环只采用P 和I 参数) 的寻优范围均为[0.1,100],惯 性 权 重 因 子ω 的 取 值 区 间 为[0.8,1.2],认知因子c1和社会因子c2取值均为2。根据随动系统复杂程度,标准PSO 和惯性权重指数递减PSO 的种群规模为120 个,最大迭代次数为200 次;K 均值聚类+惯性权重指数递减PSO 的种群规模为200 个,最大迭代次数为200 次。算法采用Matlab m 语言和Simulink 混合编程,仿真实验在CPU 为4 G 的PC 机上进行。

从目标函数值与迭代次数关系曲线(图8)中可发现,采用KEDM-PSO 算法优化的随动控制系统,其目标函数终值比PSO、ED-PSO 算法的均要小。

图8 目标函数值曲线

同时,从图中也可发现,KEDM-PSO 算法对应目标函数值随种群迭代更新的次数较多,与另两种算法相比,具有更优的寻优能力。

图9 种群多样性度量

从图9 种群多样性度量值曲线中可发现,PSO、ED-PSO 算法对应的种群多样性度量值随着种群迭代越来越小,说明种群粒子越来越集中,易出现陷入局部最优的情况。而KEDM-PSO 算法对应的种群多样性度量值随着种群迭代呈现先变小后变大,最终逐渐趋于较PSO、ED-PSO 算法较大的一个种群多样性度量值,说明KEDM-PSO 算法在整个迭代期间并没有发生整个种群粒子过于集中的现象,一直保持较强的寻优能力。

下页图10 为3 种算法种群粒子在寻优前后的分布图。为了便于展示粒子聚集情况,结合随动控制系统,选择位置调节器、速度调节器和电流调节器的比例参数作为三维显示的特征参数,其中,(a)、(d)分别为PSO 算法寻优前后粒子聚集情况,(b)、(e)分别为ED-PSO 算法寻优前后粒子聚集情况,(c)、(f)分别为KEDM-PSO 算法寻优前后粒子聚集情况,(a)、(b)、(c)为在寻优空间随机生成的数据点集。从图形对比可看出,KEDM-PSO 算法在寻优完成后,能够清晰看出3 个数据聚集点,表明了在寻优空间中是存在多个极值点的,而单个种群的寻优极易造成局部最优情况,KEDM-PSO 算法可以完成在多个极值点中取最优,寻优能力得到进一步增强。

图11 为3 个算法对应随动系统的阶跃响应曲线,表1 为3 种算法结果对比,从图11、表1 中可看出,采用KEDM-PSO 算法优化的随动控制系统与PSO 和ED-PSO 相比,均能较早地到达设定值,动态响应较好,同时,调节时间缩短了2~3 倍。虽然KEDM-PSO 算法优化出的随动控制系统较ED-PSO 算法有超调产生,但是其超调量较小,对系统影响甚微。总体来讲,采用KEDM-PSO 算法优化的随动控制系统各方面性能要优于其他两种方法。

图10 种群分布图

图11 阶跃响应曲线

表1 算法结果对比

6 结论

本文针对火炮随动系统调节器参数优化问题,提出一种基于K-均值与惯性权重指数递减的多种群PSO(KEDM-PSO)算法。为保证种群的全局搜索能力以得到最优的参数,采用将初始种群划分为多个子群协同寻优的策略。兼顾种群多样性和收敛性,通过K-均值算法将初始种群分为3 个子群,3个子群协同寻优,为保持种群多样性,在种群多样性度量值小于一定阈值时,重新采用K-均值算法对种群分组。

3 个子群的寻优均采用惯性权重指数递减策略,惯性权重值在整个寻优过程内,呈现前期大,后期小的非线性变化过程,具有前期搜索范围大,速度快,后期惯性权重小,利于算法收敛、稳定的特点。试验表明,K-均值聚类与惯性权重指数递减相结合的PSO 算法,具有较好的寻优能力,为火炮随动系统调节器参数优化提供了一种可行的方法。

猜你喜欢

调节器惯性种群
山西省发现刺五加种群分布
基于KF-LESO-PID洛伦兹惯性稳定平台控制
“最大持续产量”原理分析
由种群增长率反向分析种群数量的变化
让音乐成为幼儿情绪的“调节器”
新型游梁式抽油机平衡块调节器
电厂自动控制系统调节器应用概述
无处不在的惯性
对惯性的认识误区
无处不在的惯性