不确定非线性系统的事件驱动鲁棒跟踪控制

2018-07-12崔黎黎王晓薇

沈阳师范大学学报(自然科学版) 2018年3期

崔黎黎, 王晓薇, 吴　鹏, 王　利

(沈阳师范大学科信软件学院, 沈阳　110034)

在实际工业领域中,大多数被控对象具有高度非线性,很难获得其精确的数学模型,这使得实际动态系统和系统的数学模型间普遍存在不确定性,从而导致系统的性能变差甚至不稳定,因此,控制器设计时鲁棒性是研究者们所考虑的重点。非线性鲁棒跟踪控制研究如何设计控制器使系统在不确定性作用下能够跟踪一个给定的目标轨迹,一直是控制领域研究的一个重点内容。研究者们基于经典的控制理论,如变结构控制[1]、模型预测控制[2]、反演控制[3]、神经网络控制[4]等,提出了各种鲁棒跟踪控制方法。然而,上述方法虽然实现了鲁棒跟踪,但大多数未考虑系统性能的优化。

近年来,自适应动态规划方法(adaptive dynamic programming, ADP)由于具有自学习与优化能力,能够有效解决动态规划的“维数灾”问题,现已成为了控制领域研究的热点。目前ADP理论在非线性系统的最优控制[5]、微分对策[6]、多智能体系统的最优控制[7]等方面已取得了许多重要的研究成果。在最优跟踪控制方面,文献[8]针对一类不确定连续非线性系统提出了基于评价网络-控制网络结构的神经网络自适应鲁棒器设计方法。文献[9]基于ADP方法研究了一类不确定离散非线性系统的鲁棒跟踪控制问题。文献[10]提出了一个在线策略增强学习算法,实现了一类未知非线性系统的H∞跟踪控制。文献[11]针对一类未知不确定性系统的跟踪控制问题提出了一个数据驱动ADP算法。然而,上述控制器设计方法均未考虑网络带宽的限制,所设计的控制器是基于时间驱动的,采用实时更新的方式,因此网络负荷和计算量较大,在实际应用中具有一定的局限性。据作者所知,目前基于ADP的不确定非线性系统的事件驱动鲁棒跟踪控制相关结果尚未见报道。

本文针对一类非线性系统提出一种基于事件驱动自适应动态规划方法的鲁棒跟踪控制方案。首先,利用系统增广技术将原系统转化为由跟踪误差和目标轨迹表示的增广系统,从而将原系统的鲁棒跟踪问题转化为增广系统的鲁棒镇定问题。为了处理不确定性的同时优化系统跟踪性能,定义了一个新的性能指标函数,进一步将增广系统的鲁棒镇定问题转化为其标称系统的最优控制问题,推导得出相应的HJB方程和最优控制策略,并在理论上证明了问题转化的等价性。针对标称系统,提出了一个事件驱动自适应动态规划算法设计近似最优控制策略,值得指出的是该控制策略仅在事件触发时刻更新,可大大减少网络负载和计算量。利用Lyapunov稳定性理论严格证明了闭环系统的一致最终有界稳定性。仿真例子验证了所提出的控制方案的有效性。

1　问题描述

考虑如下的不确定非线性系统:

(1)

其中:x(t)∈Rn为系统状态;u(t)∈Rm为系统控制输入;d(t)∈Rm为控制扰动。假设f(x(t))和g(x(t))满足Lipschiz连续性条件,且系统在Ω∈Rn是强可控的。本文的控制目标是设计事件驱动鲁棒跟踪控制策略u(t),使得扰动存在时系统状态x(t)能够跟踪给定的目标轨迹xd(t)。假设期望轨迹满足如下的表达式

(2)

其中:xd(t)∈Rn为有界的期望轨迹;fd(xd(t))为Lipschiz连续函数,并满足fd(0)=0。

定义如下的跟踪误差

ed=x(t)-xd(t)

(3)

利用式(1)～式(3)可得系统的跟踪误差动态方程为

(4)