APP下载

基于人工智能模型的自动容错跟踪控制研究

2022-04-27罗锦彬

关键词:增益分布式矩阵

罗锦彬

(龙岩学院 物理与机电工程学院,福建 龙岩364000)

工业多智能体系统因其在多机器人协作、编队飞行、车联网等领域的广泛应用而受到越来越多的关注[1-2].工业多智能体系统通过网络进行协作,以完成诸如协作跟踪控制的复杂任务.然而,由于系统规模的扩大,故障的发生概率大大增加.任意节点的故障都可能通过通信网络蔓延到整个系统.因此,多智能体的容错控制问题已成为越来越重要的焦点[3].本文引入人工智能模型中的强化学习算法,提出了一种新颖的分布式中间估计器,提高实时容错跟踪性能.

1 控制问题描述

用Q=(v,ε,A)表示无向图,其中v={1,2,…,N}表示图中的节点集合,ε表示图中的边集合,A是Q的邻接矩阵.连通无向图Q的生成树T包含了所有节点.用D表示度矩阵,与图Q相关的拉普拉斯矩阵可以表示为L=D-A.如果存在领导者,则涉及的钉扎矩阵表示为J=diag{ji},其中,ji=1表示节点i观察到领导者.

假设系统中有N个代理节点,第i个代理节点的状态可以采用以下的方程描述:

(1)

yi(t)=Cxi(t)+Dsfsi(t)+Rdi(t)

(2)

其中,xi(t)是系统状态,ui(t)是控制输入,wi(t)是外部扰动,yi(t)是系统输出,di(t)是测量到的扰动.fi和fsi分别是处理故障和传感器故障.

领导者的动态方程为:

(3)

y0(t)=Cx0(t)

(4)

其中,x0(t)、y0(t)、r0(t)分别表示领导者的状态、输出和输入.令δi(t)=xi(t)-x0(t)为节点i的追踪误差,追踪误差的动态性可以由式(5)、(6)进行刻画.

(5)

(6)

本目标是针对所考虑的多智能体系统处理自动容错跟踪控制问题,提出一种新颖的基于在线强化学习的分布式中间估计器,并基于此设计了一种容错跟踪协议来保证协同跟踪控制性能.

2 基于强化学习的估计器设计

在构造分布式中间估计器前,首先定义以下中间变量:

(7)

(8)

ζτ(t)和ζs(t)均为时变参数,因此节点i的分布式中间估计其构造如下:

(9)

(10)

(11)

(12)

(13)

(14)

其中μ和η是待确定的常数.

参数θ(t)的导数被用作在线估计性能的调节动作的指标,在指定时间间隔内θ(t)的变化量来确定源故障模式.同时,自适应切换机制可以评估和改进在线估计性能,切换的逻辑为:

(15)

其中t0表示异常事件触发的时刻.实际上,在激活参数选择过程之前,会进行确定调整参数的测试.节点i的CFTTC如下所示:

(16)

其中,K是使A-BK为赫尔维茨矩阵的矩阵.令H1=[I,0,0,0],H2=[0,I,0].全局闭环容错跟踪的动态性可以刻画为:

(17)

(18)

接下来提出了一种基于在线强化学习估计策略的自动容错跟踪控制算法(如算法1所示).为了实现观察者增益的更新,需要预先从追随者中选择具有较强计算能力的汇入节点.引入了一种广播机制:通过生成树实现汇入节点与其他节点之间的数据传输.汇入节点作为数据处理中心,具有以下两个基本功能:首先,通过广播机制收集各节点相对输出的估计误差信息,检查自适应切换机制的触发条件;其次,更新ζs、ζτ和观察者增益Ta.在广播机制的帮助下,更新后的观察者增益可以通过生成树有效地传输到整个网络.

算法1的调节功能通过三个主要步骤来实现.首先,应用性能评估步骤来监控实时评估性能是否下降.然后,在估计性能恶化的情况下,将激活下一步的源故障模式定位,以确定主要的调整参数,并且将执行关键参数和观测器增益的更新过程,直到估计性能恢复.源故障模式定位的决策逻辑是关键调整参数ζτ和ζs分别对应于过程故障和传感器故障.如果确定了正确的对应参数,估计性能就会恢复.最后,通过准确的估计来实现可靠的容错控制.

算法1中所选择的参数可以根据其功能分为两组.其中一组参数ζτ和ζs是用来确保闭环系统稳定条件的可行性.另一组参数στ、σs、tu、ϑ和gt是用来改善算法1的瞬态和稳态性能.

算法1 基于强化学习的自动容错跟踪控制算法1: 计算观察者增益Ta;2: 估计参数δ′i(t)、ξ′τi(t)、ξ′fsi(t)、τ′i(t)和f·′si(t);3: 计算CFTTCui(t);4: 通过广播机制收集||eφi(t)||信息;5: 汇入节点计算eφ(t);6: Ifeφ(t) >= ε then7: 记录时间t0;8: Ifeφ(t)-ε >= gt then9: 计算θavd1=1tu∫tu1t0θ·(t)dt;10: 更新ζτ(t)=ζτ(t0)+qθ;11: 计算θavd2=1tu∫tu2tu1θ·(t)dt;12: 更新ζs(t)=ζs(t0)+qθ;13: 计算θavd3=1tu∫tu3tu2θ·(t)dt;14: If |θavd2-θavd1|>|θavd3-θavd2| then15: 发生处理故障;16: ζτ(t)=ζτ(t0)+qθ,ζs(t)=ζs(t0)+σ1qθ;17: If |θavd2-θavd1|<|θavd3-θavd2| then18: 发生传感器故障;19: ζτ(t)=ζτ(t0)+qθ,ζs(t)=ζs(t0)+σ2qθ;20: If |θavd2-θavd1|-|θavd3-θavd2|<ϑ then21: 发生联合故障;22: ζτ(t)=ζτ(t0)+qθ,ζs(t)=ζs(t0)+qθ;23: 计算增益Ta并广播至所有节点;

3 实验评估

图1 估计对比结果

相对输出估计性能指标θ(t)的曲线见图2.由于在0到15秒期间未触发自适应切换机制,因此θ(t)始终为0.在15到55秒期间,估计性能多次恶化,此时可以看出θ(t)可以驱动参数ζτ和ζs的更新.在55秒后,由于在当前参数下估计性能令人满意,θ(t)的更新停止.

图2 相对输出估计性能指标

4 结论

本研究利用强化学习这一强大的人工智能模型来实现多轴运动控制系统的故障跟踪控制.通过观测器结构设计和在线实现阶段的改进,展示了所提出的分布式中间估计器具有较高的可行性和可靠性,提出的CFTTC能够获得令人满意的协同控制性能.

猜你喜欢

增益分布式矩阵
基于增益调度与光滑切换的倾转旋翼机最优控制
基于单片机的程控增益放大器设计
基于Multisim10和AD603的程控增益放大器仿真研究
分布式光伏热钱汹涌
分布式光伏:爆发还是徘徊
程控增益射频宽带放大器
初等行变换与初等列变换并用求逆矩阵
基于DDS的分布式三维协同仿真研究
矩阵
矩阵