仿人预测控制在双足机器人步行控制中的应用*
2014-09-25,
,
(贵州财经大学 数学与统计学院,贵州 贵阳 550025)
0 引 言
迄今为止,双足机器人已得到了很大发展,就动态步行的实现方法可以分为三类:传统的有动力驱动的机器人,被动行走机器人,二者的结合半被动步行。而传统的有动力驱动的机器人的动态步行是基于零力矩点(zero moment point,ZMP)原理实现的,ZMP轨迹是影响机器人步行稳定性的重要因素,很多步行控制方法目的都是为了优化机器人的实际ZMP轨迹,以实现稳定行走[1~4]。基于ZMP的步行控制的传统方法有地面反作用力控制、落脚点控制和模型ZMP控制等。目前,最先进的控制方法是基于ZMP的预测控制,它模拟人行走要利用未来路况信息的原理,利用未来目标ZMP的信息设计预测控制器,对机器人的质心运动进行控制,以实现实际ZMP对目标ZMP的跟踪。预测控制具有人大脑对人行走控制的思维,因而,在先进的机器人ASMIO上得到了成功的应用[5]。
然而,预测控制也存在缺点,预测控制需要比较精确的预测模型,在环境扰动导致模型失配时预测控制的性能下降较快。特别是双足机器人的行走环境复杂,要建立精确的动力学模型是不可能的,并且任何控制面对不同的控制对象,也不是万能的。本文作者在文献[6]中对利用仿人智能控制改进预测控制,做了一些探索。本文进一步研究在双足机器人步行控制中引入仿人智能控制的必要性和仿人智能控制改进预测控制的可行性,并设计了仿人预测控制器,最后通过仿真实验验证了新的控制器对双足机器人步行控制的有效性。
1 预测控制在步行控制中的应用
1969年,Vukobratovic M等人针对双足机器人行走的稳定性,首次提出了ZMP的概念[7]。ZMP点是指脚底受到的地面反力的合力相对于该点的力矩,沿地面方向力矩分量为零的点。当机器人稳定行走时,ZMP点始终位于足底形成的支撑多边形中。迄今为止,ZMP 行走方法已得到广泛的应用并取得了显著的成就[1~3]。与人行走控制身体重心(或质心)获得稳定性类似,机器人行走也可以通过控制质心来调节ZMP的运动轨迹,使ZMP位于支撑凸多边形中。然而,在动态步行中,质心的投影在某一时刻可以超越支撑多边形,致使ZMP点可能位于支撑多边形外,从而导致行走不稳定[4]。所以,这就需要在线控制质心运动以生成稳定步行模式。
围绕质心轨迹的控制产生了很多方法[8],这些方法计算量大,只能离线生成步行模式。考虑到人行走要利用未来路况信息的原理,机器人专家们把目光转向预测控制,这种控制是Sheridan T B于1996年为了解决工程难题提出的[9],是一种利用未来的信息进行控制的方法。到1985年,Katayama T等人把预测控制方法拓展到多输入多输出(MIMO) 伺服系统并得到了较完善的结果[10]。2003年,日本学者Kajita S等人成功地把它运用到双足机器人领域,提出了基于预测控制的步行模式生成理论[3],并在文献[2,3]中进行了研究,也在目前最先进的双足机器人ASMIO上得到了成功应用。基本原理是,通过伺服系统的反馈功能利用未来目标ZMP 信息设计预测控制器,对质心运动进行控制来调节实际ZMP轨迹对目标ZMP轨迹的跟踪。这一理论是在线解决步态跟踪误差及其稳定性的有效方法,也符合人行走要利用未来路况信息的原理。
然而,预测控制依赖于预测模型的准确性,在环境扰动导致模型失配时预测控制的性能下降较快。为了解决这个问题,很多文献从理论上探索了一些方法[11],比如:自适应预测控制、遗传算法预测控制、神经网络预测控制和专家系统预测控制等。但是,这些方法只是在理论上对预测控制作了改进,在实际应用时由于算法复杂,实时性差,限制了它们在机器人领域的应用。
2 预测控制与仿人智能控制的结合
2.1 引入仿人智能控制的必要性
1983年,重庆大学周其鉴教授在多国仪器仪表国际学术会议上发表了仿人智能控制的原型算法[12]。其后,经过李祖枢教授等近30年坚持不懈的努力,不断发展和完善了仿人智能控制理论[13],并在工业难控对象的应用中取得了显著成果,已形成了通用工业智能仪表[14]。尤其已在单级摆和二级摆的摆起倒立运动控制中得到了成功应用[15],仿人智能控制具有人的思维特点,它模拟有经验的控制专家的行为,不需要建立精确的数学模型,通过控制器自身的智能行为去应付对象和环境的各种变化。此外,这种方法具有算法速度快、准确的特点,满足在线实时性要求。
如图1所示,分析双足机器人在行走过程中腿的运动,在伸缩力 的作用下腿可以伸缩,相当于机器人膝关节的弯曲或伸展而产生质心的上下运动,这相当于人们所熟悉的倒立摆的运动。因此,通常将三维空间机器人近似为一个集中了所有质量的点和连接该质点与支撑点的无质量的腿组成的倒立摆[4]。由此,从仿人智能控制算法对倒立摆的成功控制而言,它完全可以引入到双足机器人的稳定行走控制中。
图1 双足机器人的倒立摆近似模型
第1节已分析预测控制在机器人行走控制中的应用。在行走控制中,预测模型用的是预估的状态空间模型,这与实际机器人系统的动力学模型具有高阶非线性的特点是有差别的。简化后的动力学模型虽然计算简单实时性强,但是与实际系统存在模型失配的问题,特别是还存在环境扰动等因素情况下,这种模型失配问题会进一步加大。但预测控制用在实际系统中需要比较精确的预测模型,在模型失配时预测控制的性能下降较快。由于仿人智能控制对模型的精确性依赖程度不高并对误差有较强的抑制能力,所以,预测控制与仿人智能控制的结合能克服环境扰动和模型失配的缺点。
2.2 仿人预测控制系统设计
仿人智能控制器模拟人的主动开环控制和强时变控制,预测控制模拟人行走要利用未来路况信息的原理,其共同特征是主动时变控制。两者的结合将是对人的控制思维特点的较全面模拟。本文提出的仿人预测控制器是基于对人自身行走控制的认识:人在行走过程中当身体重心超出极限时甚至处于危险时,会毫不犹豫地调整身体重心恢复平衡;而在步行活动处于正常范围时则处于无意识或有意识的经验控制,使波动尽量小。这种人意识处理的结果是:身体活动在正常区间运行平稳,突发事件瞬间切换,能够确保行走时的身体平衡,环境扰动时也能保证平稳行走。这种具有人思维的控制策略对于机器人的稳定行走控制至关重要。如图2所示,为仿人预测控制系统原理框图。
图2中,pref为目标ZMP,pvar为扰动形成的可变ZMP,uh(t)为仿人智能控制器的输出,up(t)为预测控制器的输出,p为实际ZMP轨迹。仿人预测控制器的工作原理如下:在系统工作时仿人智能控制器和预测控制器同时工作,仿人智能控制设置较宽的误差控制带,其作用是用最短的时间将系统带入正常状态;预测控制的作用是利用预测模型将系统稳定在正常状态,并使控制曲线最优。控制量切换要选择合适的时机对这2种控制信号进行切换。
图2 仿人预测控制原理框图
对图1所示的双足机器人建立动力学模型为
(1)
(2)
3 仿真实验验证
仿人预测控制系统根据ZMP误差及其变化量切换控制变量,实施对机器人动力学系统的控制,以使实际ZMP输出能很好地跟踪带可变ZMP的期望值。表1所示为误差相平面上的特征和相应的控制模态。
表1中,K4+为强正控制力,起到抑制负超调的作用,它的值越大,对应的超调量越小;K4-为强负控制力,起到对误差变化率的调节作用,使之进入误差变化率零带;K3+为较强正控制力,其作用是在进入稳态响应过程中,可以减少延迟时间,使系统响应速度快;K3-为较强负控制力,影响系统正超调处的运动状态,促使响应曲线向着误差零带运动并加速;K2+为次强正控制力,在这段控制区域,系统响应获得了快速上升;K2-为次强负控制力,其作用是使系统加速向误差零带运动;K+为较弱正控制力,K-为较弱负控制力,此时系统有回到预测控制的倾向;对系统而言,加大K+和K-作用可以使系统尽早进入稳态范围,这时预测控制器输出up(t)对整个步行控制系统起控制作用。
下面用期望ZMP带矩齿形扰动pvar=-0.08和高频波扰动pvar=0.08 sin 50t时的情况对如图2所示的仿人预测控制系统进行验证。相平面分区控制参数取值为:K4+=8,K3+=6,K2+=3,K+=1,K-=-1K2-=-3,K3-=-6,K4-=8,考虑到实际情况,误差e0和误差变化率Δe0取值为e0=±0.1,Δe0=±0.1。
表1 误差相平面上的特征变量与控制模态
图3所示结果显示对具有扰动的ZMP,仿人预测控制系统能实现较好地跟踪。对具有复杂扰动的可变ZMP,控制模态的设计会更复杂。根据仿人智能控制对误差的强抑制能力,只要控制模态设计合理,仿人预测控制系统仍然可实现对期望ZMP的跟踪。
图3 仿人预测控制系统对期望ZMP的跟踪情况
4 结 论
本文从双足机器人的三维倒立摆简化模型和仿人智能控制在倒立摆控制中的成功应用方面,研究了在双足机器人行走控制中完全可以引入仿人智能控制。论证了仿人智能控制可以改进预测控制因模型失配而性能下降的缺点,并设计了仿人预测控制器。由于仿人智能控制器模拟人的主动开环控制和强时变控制,预测控制模拟人行走要利用未来路况信息的原理,设计新的仿人预测控制器的目的,是为了让机器人的步行能力具有人的思维模式和利用未来路况信息。最后,通过仿真实验验证了新的控制器对双足机器人步行控制的有效性。
参考文献:
[1] Vukobratovic M,Borovac B.Zero-moment point-thirty five years of its life[J].International Journal of Humanoid Robotics,2004,1(1) :157-173.
[2] Kajita S,Morisawa M,Harada K,et al.Biped walking pattern generator allowing auxiliary ZMP Control [A]∥Internationonal Conference on Intelligent Robots and Systems,Beijing,China,2006:2993-2999.
[3] Kajita S,Kanehiro F,Kaneko K,et al.Biped walking pattern ge-neration by using preview control of ZMP[C]∥Int’l Conference on Robotics & Automation,Taiwan,china,2003:1620-1626.
[4] 梶田秀司.仿人机器人[M].管贻生,译.北京:清华大学出版社,2007.
[5] 于秀丽,魏世民,廖启征.仿人机器人发展及其技术探索[J].机械工程学报,2009,45(3):71-75.
[6] 敬成林,李祖枢,薛方正.双足机器人稳定行走的仿人预测控制研究[J].计算机工程与应用,2010,46(23):21-24.
[7] Vukobratovic M,Juricic D.Contribution to the synthesis of biped gait [J].IEEE Transactions on Biomedical En-gineering,1969,16(1) :1-6.
[8] Kyung N K,Kim J G,Huh U Y.Stability experimental of a biped walking robot with inverted pendulum[C]∥The 30 th Annual Conference of the IEEE Industrial Electronics Society,Bustan,Korea,2004: 247522479.
[9] Sheridan T B.Three models of preview control[J].IEEE Tran-saction on Human Factors in Electronics,1966,7(2):91-102.
[10] Katayama T,Ohki T,Inoue T,et al.Design of an optimal contro-ller for a discrete time system subject to previewable deman-d[J].International Journal of Control,1985,41(3):677-699.
[11] Kittisupakorna P,Thitiyasooka P,Hussainb M A,et al.Neural network based model predictive control for a steel pickling process[J].Journal of Process Control,2009,19(4):579-590.
[12] Zhou Qijian,Bai Jianguo.An intelligent controller of novel de-sign[C]∥Proc of a Multi-National Instrumentation Conference,Part 1,Shanghai,China,1983:137-149.
[13] 李祖枢,涂亚庆.仿人智能控制[M].北京:国防工业出版社,2003.
[14] 李祖枢.仿人智能控制研究20年[C]∥1999年中国智能自动化学术会议论文集(上册),北京:清华大学出版社,1999:20-23.
[15] 李祖枢.仿人智能控制理论与多级摆的摆起控制[C]∥人工智能回顾与展望,北京:科学出版社,2006:174-207.