基于广义二型模糊神经网络的移动机器人轨迹跟踪控制
2023-05-08周俊赵涛
周 俊 赵 涛
(四川大学电气工程学院 四川 成都 610065)
0 引 言
随着机器人技术的诞生和发展,移动机器人已广泛应用于工厂自动化、建筑、军事、农业等领域[1]。移动机器人的研究主要有三个问题:SLAM技术、避障技术和轨迹跟踪技术。作为三个主要问题之一,能否渐进地跟踪给定或计划的参考轨迹决定了任务能否成功执行。正因为如此,它引起了学术界的广泛关注。
轮式移动机器人(WMR)是一个欠驱动的非线性系统[2]。它是一个独立控制变量的个数小于系统自由度的系统。这也是欠驱动系统和全驱动系统的根本区别。同时,在节能、降低成本、减轻重量、增强系统灵活性等方面均优于全驱动系统。然而,这种非线性和欠驱动特性成为轮式移动机器人成功控制的一大障碍。同时,外界环境的各种因素,如干扰、摩擦等,也可能成为WMR不可预测的不确定性因素。如何提高WMR的抗干扰能力仍然是一个挑战。
为了进一步研究如何控制非线性欠驱动系统,人们进行了大量的研究。传统的PID控制方法难以满足控制的稳定性和精度要求。为了提高对移动机器人的轨迹跟踪的控制效率,国内外的学者们提出了多种控制方法。例如自适应控制控制法、滑模控制法、反演控制法等[3-6]。但由于控制系统易受到外界扰动以及参数不确定的影响,导致实际的控制系统与期望的数学模型间存在较大偏差,以至于无法达到轨迹跟踪的效果。
近年来,模糊逻辑系统在各种应用中得到了广泛的应用[8]。模糊逻辑是一种精确的概念推理系统。对于模型未知或不确定的描述系统,采用模糊集和模糊规则进行推理,可以解决常规方法难以处理的模糊信息问题。对精确集合中的元素使用隶属度值进行模糊化, 这样的模糊集合称为一型模糊集合。因为它的隶属度是完全清晰的,所以使用一型模糊集可能不足以处理难以表示为真实值的不确定性。因此,为了增强传统模糊系统描述和处理不确定性的能力,进一步对给出集合中的隶属度值进行模糊化,从而使描述的集合模糊性增强,这种扩展的模糊集称为二型模糊集。区间二型模糊集作为一型模糊集的一个扩展,提高了其处理干扰和不确定性的能力。而作为区间二型模糊集的扩展,由于广义二型模糊集隶属度的灵活性,能较好地处理不确定性。因此,在实际应用中具有很大的优势。
本文将广义二型模糊逻辑系统与神经网络相结合,提出一种广义二型径向基函数模糊神经网络控制方法来跟踪轮式移动机器人的轨迹。通过利用专家经验,模糊控制可以用来弥补移动机器人动态特性中的非线性和不确定性等因素,但是一旦确定了控制规则和隶属函数,就无法对其进行修改,这限制了它们的自适应能力。而人工神经网络的学习算法可以很好地解决这个问题[10]。因此,模糊逻辑控制和人工神经网络是高度互补的。径向基函数神经网络是一种前向神经网络,它克服了局部极小问题,易于训练,并且具有快速的学习和收敛速度的优点[9]。广义二型径向基函数模糊神经网络可以更有效地对规则库中可能存在的不确定性进行建模,从而更好地满足实际应用的需求。
本文将径向基函数神经网络的控制理论扩展到广义二型模糊神经网络中。与一型模糊神经网络相比,它的隶属度函数的参数自适应地变化,使得它处理不确定性的能力也得到了增强。最后通过MATLAB验证了该方法的有效性和优越性。
1 移动机器人的数学模型
轮式移动机器人一般由多个轮子构成,在不影响整体分析的前提下,可以将其简化为左右驱动轮的车型[7]。
如图1所示,小车的位姿由其左右两个驱动轮的轴中点M在全局坐标系的坐标及航向角θ来表示,即小车当前位姿为P=[x,y,θ]T,υ和ω分别是机器人的线速度和角速度,是机器人模型的输入。
图1 机器人模型结构示意图
机器人模型的运动学方程如下:
(1)
假设机器人的期望轨迹是qr=[xr,yr,θr]T,期望的状态为: [νr,ωr]。
根据坐标转换,可得系统的误差方程为:
(2)
对其求导,可得位姿误差微分方程:
(3)
小车轨迹跟踪的目标就是寻找有界输入[υ,ω]T,使得对任意位姿以及误差,系统的误差方程均能收敛到0,即:
(4)
2 广义二型模糊神经网络
2.1 广义二型模糊逻辑系统
(5)
(6)
如图2所示,广义二型模糊逻辑系统的典型结构主要包括模糊化、规则库、模糊推理机、降型和解模糊器。
图2 广义二型模糊逻辑系统
2.2 广义二型径向基函数神经网络
1) 径向基函数神经网络。径向基函数神经网络是一种逼近性好、训练简单、学习速度快的前向神经网络。目前,它已广泛应用于函数逼近、模式识别、图像处理、自动控制等领域。径向基函数神经网络的结构如图3所示。
图3 径向基函数神经网络
径向基函数神经网络主要包括三层。输入层表示源节点的输入,该层仅起到输入数据的作用。隐藏层激活函数为径向基函数,它的功能是将输入的数据从低维非线性可分映射到高维线性可分空间。这样,网络从输入到输出的映射是非线性的,而对于可调参数,网络的输出是线性的。输出层为隐藏层神经元输出的线性加权和。
径向基函数是一个实值函数,其值仅取决于到原点的距离。而径向基函数神经网络采用径向基函数作为隐藏元素的“基”,使得输入向量可以直接映射到隐藏层空间而无需权值连接。因此,可以直接用线性方程组求解网络的权值,大大加快了学习速度。
径向基函数神经网络常用欧氏距离和高斯函数,其激活函数可以表示如下:
(7)
式中:xp是第p条输出样本;bi是隐藏层第i个节点的高斯函数的中心点。
最终的结果为:
(8)
损失函数为:
(9)
2) 广义二型径向基函数模糊神经网络。广义二型径向基函数模糊神经网络的结构如图4所示。
图4 广义二型径向基函数神经网络结构图
该结构主要包括输入层、径向基函数层、降型层和去模糊化层。
(1) 输入层:该层将模糊化多个清晰向量并将它们输入到下一层。它的输出是通过计算广义二型隶属度函数的值生成的。
(2) 径向基函数层:该层包含i个规则,每个规则包含j个节点,其中节点数等于α截平面数。初始化从隐藏层到下一层的连接权重:
Wk=[wk1,wk2,…,wkp]Tk=1,2,…,q
(10)
式中:p是隐藏层元素的数量;q是输出层元素的数量。权重初始化为:
(11)
式中:kmin和kmax分别是训练集第k个输出神经元所有期望输出的最小值和最大值。
不同神经元的中心宽度可以随中心的变化而调整,从而使不同的神经元能够反映不同特征的输入信息。在隐藏层中,距离可以通过神经元数目来调整。其优点是通过试错法使中心的初始化合理化。不同的输入特性在不同的中心上反映得更为明显,其反映了高斯核的特性。
中心参数的初始值为:
(12)
式中:N是隐藏层的神经元总数,nmin和nmax分别是第n个特征的所有输入信息的最小值和最大值。
初始化宽度向量:
(13)
式中:df为宽度调整系数。其功能是提高网络的局部响应能力。
设置误差损失函数为:
(14)
式中:ylk和tlk分别是网络的实际输出和期望输出值。
通过学习,神经网络的各种参数可以自适应地调整到最佳值。权重参数的迭代如下:
α[wkm(h-1)-wkm(h-2)]
(15)
α[cmn(h-1)-cmn(h-2)]
(16)
α[dmn(h-1)-dmn(h-2)]
(17)
式中:Wkm(h)是第h次迭代中的调节权重;cmn(h)是第h次迭代的中心分量;β是学习率。
(3) 降型层:该层执行将广义二型模糊集映射到一型模糊集的数学运算。由于输出集都是二型模糊集,为了得到每个规则的一型模糊集,这里需要一个降型的步骤。该降型集为:
(18)
(19)
(20)
(4) 去模糊化层:为了得到各输出变量的精确输出值,将前一步得到的模糊值转化为清晰的控制信号作为系统的输出值:
(21)
式中:α=[1,(N-1)/N,…,1/N,0],N为广义二型模糊集被分割的次数。
3 控制器设计
式中:y为上、下隶属度函数的均值。次隶属函数选择为梯形。其对应的α平面的次隶属度为:
式中:λ是决定次隶属函数形状的参数。特殊情况下,即当其为0时,次隶属函数为正方形,GT2FS转化为一个区间二型模糊集。GT2FLC的模糊规则如表1所示。
表1 模糊规则表
本文基于移动机器人的实际位姿与期望位姿之间的偏差设计控制器,实时调整参数,使系统具有较好的鲁棒性和稳定性。设计系统模型如图5所示。
图5 轨迹跟踪控制系统框图
4 仿真结果与分析
在这一部分中,为了测试本文所提方法的性能和抗干扰能力,此外,还与PID控制、模糊控制和一型模糊神经网络(T1FNN)的仿真结果进行了比较。
在MATLAB平台上对所设计的二型模糊控制器进行仿真,用模糊控制器调整控制律中切换控制项的增益,即模糊控制在神经网络的基础上进行控制,参考信号为模糊控制参考轨迹。
本节分三个部分对系统仿真结果进行阐述:一是线性轨迹跟踪;二是圆形轨迹跟踪;三是干扰下的轨迹跟踪对比。通过对这三个具有代表性的轨迹跟踪的仿真,可以得出结论,该方法不仅能使系统更快的输出达到指定位置,在抗干扰能力方面也具有优越性,证明了该方法在控制轮式移动机器人上的有效性。
为了验证该方法的有效性,本文利用MATLAB对移动机器人的跟踪控制进行了仿真。
情况1:移动机器人跟踪直线轨迹。跟踪结果与位姿误差如图6-图13所示,其中:xe、ye的单位为m,θe的单位为rad。
图6 直线轨迹跟踪(PID)
图7 直线轨迹跟踪位姿误差(PID)
图8 直线轨迹跟踪(模糊控制)
图9 直线轨迹跟踪位姿误差(模糊控制)
图10 直线轨迹跟踪(T1FNN)
图11 直线轨迹跟踪位姿误差(T1FNN)
图12 直线轨迹跟踪(GT2FNN)
图13 直线轨迹跟踪位姿误差(GT2FNN)
情况2:移动机器人跟踪圆形轨迹。跟踪结果与位姿误差如图14-图21所示。
图14 圆轨迹跟踪(PID)
图15 圆轨迹跟踪位姿误差(PID)
图16 圆轨迹跟踪(模糊控制)
图17 圆轨迹跟踪位姿误差(模糊控制)
图18 圆轨迹跟踪(T1FNN)
图19 圆轨迹跟踪位姿误差(T1FNN)
图20 圆轨迹跟踪(GT2FNN)
图21 圆轨迹跟踪位姿误差(GT2FNN)
情况3:接下来考虑在有干扰情况下, 将几种控制器的控制效果进行对比。当WMR达到平衡时,遇到一个外部干扰R=25 N, 干扰持续1 s。图22为在干扰下四种控制器的响应。
图22 干扰误差对比曲线
(26)
(27)
(28)
在情况1和情况2中,可以很容易地观察到,GT2FNN在跟踪线性或圆形轨迹方面比PID、T1FNN和模糊控制器具有更好的跟踪效果,并且能够在最短的时间内令位姿误差趋于0。
在情况3中,可以观察到当扰动被加入时,每个控制器的性能是不同的。从图22可以看出,GT2FNN系统能够以最快的速度保持稳定,并且表现出较强的鲁棒性,并取得了最好的效果。当系统添加干扰时,跟踪结果与位姿误差对比表2列出了所有控制器的ISE、IAE和ITAE。可见,GT2FNN在处理不确定性方面比PID、模糊控制器和T1FNN有更好的性能。
表2 外部干扰评价指标
5 结 语
本文提出了一种基于广义二型径向基函数模糊神经网络的控制方法来控制WMR的跟踪。上述结果表明,该系统能够很好地跟踪合理的轨迹,并能快速地将位姿误差收敛到0,具有良好的稳定性。仿真结果表明,该控制器达到了预期效果,并且具有良好的收敛性和稳定性,能够满足实际轨迹跟踪的需要。在未来,通过减少广义二型模糊系统的复杂度计算,能使其性能得到进一步的提高。