APP下载

基于蚁群算法的机器人系统LQR最优控制研究

2018-01-24武凌宇王晓东吴建德

传感器与微系统 2018年1期
关键词:最优控制蚂蚁人工

武凌宇, 王晓东, 吴建德

(昆明理工大学 信息工程与自动化学院,云南 昆明 650500)

0 引 言

目前,对自平衡机器人[1]稳定性控制的算法有很多,如PID、自适应、最优控制、智能控制等[2~7],尤其利用线性二次最优控制器(linear quadratic regulator,LQR)较传统的PID控制可获得更为稳定的平衡过程,且使系统达到误差跟踪的效果更佳。针对LQR最优控制存在的参数不确定性的问题,起初出现较多人为参数整定方法,但该方法具有很大的滞后性和随机性,增加控制系统的误差和操作人员的工作强度,同时无法在线监测机器人的姿态和位置估计,不利于自平衡机器人的控制。近年来,随着传统控制技术与现代计算机技术的结合,涌现出了一系列全新的组合式控制算法,可基于多种算法,如蚁群算法、遗传算法、神经网路、人工鱼群算法、A*算法、免疫算法和粒子群算法等智能技术,用于参数、路径寻优等。文献[6]提出了一种基于遗传算法采用不同目标函数的概念对权矩阵进行优化;文献[8]利用参数满意度对权矩阵进行优化,并且考虑了控制性能和系统能量之间的关系参数,但是在实际应用中,针对在特殊激励源下进行函数权矩阵优化,以及在初始条件下可行解的构造和在特殊课题、复杂环境下设计相应算子(忽略外部环境)等问题中,进行的优化策略具有局限性,应用在实际系统中更是存在较大难度[8]。针对这些不足,本文引进蚁群优化(ant colony optimization,ACO)算法进行控制器参数优化。

本文基于蚁群算法对LQR最优控制器的权矩阵Q中参数q11,q22,q33,q44进行寻优,并代入自平衡机器人系统模型进行验证。实验证明:该方法优于传统人工选定LQR参数的整定方法,改善了人工优化的随机性和耗时性。

1 基于蚁群算法的LQR参数优化

1.1 LQR最优控制

对自平衡机器人建立状态空间方程[9]

(1)

当系统被外界干扰后,通过调节系统作出最快响应,得到一个新的平衡状态u*,使输出跟踪输入,并保证性能指标J最小。其充要条件为

u*=-Kx=-R-1BTPx

(2)

式中P为黎卡提方程(P,Q,R三者的关系式)的正定对称解;K为线性最优反馈增益矩阵。

二次型指标函数为

(3)

式中Q为4×4维正半定对称阵;加权阵R为2×2维正定对称阵。

由文献[10,11]对机器人建模,提取权矩阵参数

(4)

(5)

根据工程实践,选择不同的Q阵参数解,将R选为单位阵,仅对Q阵中的4个参量进行优化,同时选定4个量的范围。要确定Q阵,必须确定q11,q22,q33,q44的数值,根据经验值确定参数取值为5位数,整数部分2位,小数部分3位。数组(q11,q22,q33,q44)可以与20位数字序列相对应,如图1。则LQR参数优化的问题近似虚拟为经典旅行商问题(travel salesman problem,TSP)。

图1 20位数字序列分配

依据文献[12],实验开始每一个横坐标点处有10个数字可供选择(0~9),而从横坐标看,每只蚂蚁每次仅前进一个单位长度,最终经过多次迭代,可以确定出一条最优路径,得到具有20个数字的序列,根据图1,确定数组(q11,q22,q33,q44)。

1.2 蚁群算法[13~15]

图2为搜索路径的描述过程。图2(a)为初始时刻,模拟路径的分配,路径BC和CE为1个单位距离,路径BD和DE为2个单位距离,假设A为蚁穴,F为食物源,蚂蚁从蚁穴出发寻找食物。图2(b)为在0.5个单位时间时,蚂蚁在B点处随机选择路径,即概率相等。由于蚂蚁沿途留下的信息素会随着时间的推移逐渐消散挥发,信息素浓度大小表示路途的远近,而信息素会吸引更多的蚂蚁重复这条路[16],经过1个单位时间的运行,将产生最短路径,如图2(c)所示。

图2 模拟蚂蚁觅食路径

1.3 控制器流程分析

根据上述设计方案得设计流程如图3。

图3 执行流程

具体实现步骤如下:

1)程序开始选择m只人工蚂蚁置于原点(起始点),设置算法初始参数:信息启发式因子α,能见度的重要性β,信息素挥发系数ρ,信息素初始浓度C,信息素强度素Q*和最大迭代次数N。

2)设置一个长度为20的数组antk,k=1,2,3,…,m,存放蚂蚁k走过的位置信息。

3)当开始执行迭代时,蚂蚁出发,每经过一个节点时,计算状态转移概率

(6)

式中τij为蚂蚁从节点i转移到节点j的信息素,即轨迹强度[12];ηij为能见度信息,通常取ηij=2/dij;α为信息启发因子,表示途经过的蚂蚁在行进过程中不断积累的信息素对于当前的蚂蚁群体的启发作用,数值越大,蚂蚁协作性越强,越倾向于选择其他蚂蚁走过的路径,即随意搜索性降低,而该值过小则会导致其值过早陷入局部最优;期望启发因子 (能见度的重要性),能见度概念的引入可以使算法的收敛速度加快,但是其值过大则会造成人工蚂蚁每次只选择距离当前节点最接近的候选节点,即会造成算法进入局部最优的窘况,所以在实际中应用时,期望启发因子这一项需要忽略,则转移概率最终将完全取决于信息素。

4)用轮盘赌的方法为蚂蚁选择下一节点,并移动到该点,更新位置数组。

5)经过20个单位时间后,所有蚂蚁都经过了20个整数点,一次迭代实现,得出相应数组(q11,q22,q33,q44),并且求出相应评价值,评价指标函数

(7)

式中T为采样时间;LP为模拟计算点。当系统稳定时间过长或者超调过大等情况时,Qe会较大。

6)当m只人工蚂蚁完成一次路径搜索后,对两节点之间的信息素含量进行更新,更新信息素如下

(8)

(9)

(10)

式中F为信息强度素,其影响算法收敛速度,是一个常量,表示蚂蚁k在当前路径搜索中释放的信息素总浓度;Lk为蚂蚁k本次路径搜索所走过的路径总长度。

7)重复执行步骤(3)~步骤(6),选取每次迭代的最优路径,直到达到最大迭代次数。

2 仿真实验分析

2.1 设置实验装置

两轮自平衡机器人以嵌入式运动控制器GUS为控制核心,操作系统为WinCE,满足工业IEC61131—3标准,OtoStudio为软件应用平台,运行仿真平台PC采用Intel(R)Core(TM)i7—3537U,采用64位操作系统,基于X64的处理器。利用陀螺仪作为倾角位置传感器,ISM4803作为驱动芯片模块,为方便控制机器人运行,并观察和记录运行中的状态,采用工业触摸显示屏。图4为机器人控制系统结构。

图4 两轮自平衡机器人控制系统结构

2.2 实验结果与比较

规定初始参数:m=100,α=1,ρ=0.5,Q*=100,各路径初始信息素含量值为20000,为了避免算法得到局部最优结果取消了能见度系数的作用,故令β=0。用横坐标为0~20,纵坐标为0~9的二维坐标显示结果,N次迭代后,最终蚁群算法运行结果如图5。20位数字序列为50754096680851208041,得参数结果为q11=50.754,q22=9.668,q33=8.512,q44=8.041。

图5 蚁群算法最优路径结果

将结果带入自平衡机器人的模型仿真中,得到机器人俯仰通道阶跃响应仿真曲线如图6,输出分别为机器人的位移(m)、速度(m/s)、俯仰角度(rad)以及机器人俯仰角速度(rad/s)。与传统人工确定参数对比,如表1,可以看出:输出为机器人位移量时,人工选择较蚁群算法选择的调节时间ts多0.63s;输出为机器人速度量时,人工选择较蚁群算法选择的谷值时间tL和调节时间tS分别多0.11s,0.59s;输出为机器人俯仰角度时,人工选择比蚁群算法选择的谷值时间tL,峰值时间tP和调节时间tS分别多0.03,0.22,0.31s,最大偏差值是蚁群算法选择较人工选择仅多0.006rad;俯仰角速度量,人工选择较蚁群算法选择的峰值时间tP和调节时间tS分别多0.06,0.67s,最大偏差值是蚁群算法选择较人工选择仅多0.022rad/s。

表1 俯仰通道人工选择参数与蚁群算法选择参数调节时间结果对比

图6 俯仰通道阶跃响应仿真曲线

相较较于人工试探法多次选定最优参数结果,基于蚁群算法的LQR参数选定方案响应速度更快,明显缩短了调节时间,而系统输出量的最大偏差值相对误差较小,对整体系统的稳定性影响可忽略。实验结果表明,蚁群算法选择的权值使得机器人在俯仰通道上更快速的平稳,达到更优的自平衡效果。

3 结 论

本文以两轮自平衡机器人为研究对象,通过对其控制器参数优化,得到如下结论:

1)利用蚁群算法可以优化LQR最优控制器的权矩阵,通过仿真实验结果验证所设计算法的实用性和有效性。

2)与传统人工选择方法比较,结果表明:改进后的算法能够快速确定参数值,提高了系统动态的稳定性,缩短控制时间,减轻了人工优化参数的工作量,改善了算法参数的随机性和耗时性。

3)仅利用蚁群算法对权矩阵参数提出优化策略,此外利用多算法融合策略可以对最大偏差值进行优化,实验效果有待在后续工作中进一步完成。

[1] 阮晓钢.两轮自平衡机器人的研究与设计[M].北京:科学出版社,2012:1-12.

[2] 刘浩梅,张昌凡.基于LQR的环形单击倒立摆稳定控制及实现[J].中南大学学报,2012,43(9):3496-3501.

[3] 符 川,屈铁军,孙世国.动调频液柱阻尼器基于遗传算法的LQR控制优化设计[J].振动与冲击,2015,34(2):210-214.

[4] 马永杰,云文霞.遗传算法研究进展[J].计算机应用研究,2012,29(4):1201-1206.

[5] 胡寿松,王执铨,胡维礼.最优控制理论与系统[M].北京:科学出版社,2005.

[6] 郭一峰,徐赵东,涂 青,等.基于遗传算法的LQR算法中权矩阵的优化分析[J].振动与冲击,2010,29(11):217-220.

[7] 史恩秀,陈敏敏,李 俊,等.基于蚁群算法的移动机器人全局路径规划方法研究[J].农业机械学报,2014,45(6):53-57.

[8] 张葛祥,金炜东,胡来招.多变量系统控制的参数满意优化设计[J].控制理论与应用,2004,21(3):362-366.

[9] 屠运武,徐俊艳,张培仁,等.自平衡控制系统的建模与仿真[J].系统仿真学报,2004,16(4):839-341.

[10] 宋西蒙.倒立摆系统LQR—模糊控制算法研究[D].西安:西安电子科技大学,2006:33-36.

[11] 吴春明,陈 治,姜 明.一群算法中系统初始化及系统参数的研究[J].电子学报,2006,34(8):1530-1533.

[12] 樊晓平,罗 熊,易 晟,等.复杂环境下基于蚁群优化算法的移动机器人路径规划[J].控制与决策,2004,19(2):166-170.

[13] 鲍庆勇,李舜酩,沈 峘,等.自主移动机器人局部路径规划综述[J].传感器与微系统,2009,28(9):1-4.

[14] Erin B,Abiyev R,Ibrahim D.Teaching robot navigation in the presence of obstacles using a computer simulation program[J].Procedia-Social and Behavioral Sciences,2010,2(2):565-571.

[15] 张波雷,许蕴山,夏海宝.一种基于自适应蚁群算法的数据关联方法[J].传感器与微系统,2012,31(8):27-29.

[16] 朱庆保,杨志军.基于变异和动态信息素更新的蚁群优化算法[J].软件学报,2004,15(2):185-192.

猜你喜欢

最优控制蚂蚁人工
人工3D脊髓能帮助瘫痪者重新行走?
条件平均场随机微分方程的最优控制问题
人工,天然,合成
人工“美颜”
带跳跃平均场倒向随机微分方程的线性二次最优控制
基于CPSO-RBF神经网络喷氨量的最优控制
我们会“隐身”让蚂蚁来保护自己
蚂蚁
新型多孔钽人工种植牙
采用最优控制无功STATCOM 功率流的解决方案