APP下载

基于模糊逻辑的水平面导航控制器软硬件设计与实现*

2021-03-16

舰船电子工程 2021年2期
关键词:冲量定向轨迹

(海军航空大学青岛校区 青岛 266100)

1 引言

在过去的几十年中,水陆平面上的受控对象已成为众多学者的研究主题。受控对象主要是轮式移动机器人和螺旋桨式车船,该控制过程中存在控制理论中诸多难题亟待解决,因此目标对象的控制遇到重重困难,诸多文献为解决部分问题提供了各种控制方法,如使用时变控制器,通常具有较低的收敛速度[1~2];或使用以指数收敛速度[3]为特征的定常控制器,该控制器具有不连续性。

本文探讨了控制学科中的导航问题,即一个物体在水平面上,从起始航行到所需的航线,定向到目标点的最佳定向运动。物体的运动具有以下参数:全运动时间的刚性约束、单向操纵的可能性和有限数量的冲量。上述参数由数学模型解释,但同时也促使开发了用于对象控制的方法。本文介绍了三种新的控制方法:基于改进多重打靶法、误差定位法、模糊逻辑法,目的是通过确定冲量的执行类型和顺序,来评估从初始航向到目标点的最佳导航操纵轨迹。控制方法在软硬件实验平台上进行仿真,该平台设计用于模拟通过上述方法计算出的冲量类型和执行顺序。以期为水平面上受控对象的控制方法研究提供参考。

2 数学模型

假定目标物体的运动是在水平面内实现的,其受不变的确定时间和相同的初始到目标的距离的约束(图1a)。此运动包括两个阶段,第一个阶段是匀速直线阶段,没有任何外部控制输入;而第二个阶段是控制定向阶段。在极坐标系下,在目标物体定位前,第一阶段的航向及其径向位移的运动方程为式(1)。

图1 受控对象的轨迹和参数

其中,φ0是初始速度,是物体在第一阶段中的速度。

第二定向阶段主要由两个参数定义,一个是相对时间因子τ*,另一个是转弯航向角Δφ(图1(a))。第二个定向阶段分为N个子阶段,记为i+1(i=1,2,…,N)。

沿追踪线BC(见图1(b))的相位持续时间为τ(2)=τ-τ(1)。

假设在操纵时刻的初始水平速度已知,对于每一阶段,水平速度通常表示为式(3):

在特定相位i+1中,径向单位矢量λ和转向单位矢量μ的初始值分别等于上一阶段i结束时的值λ0(i)和μ0(i),如式(5)所示:

如果一个子阶段的持续时间为τ(2),从操纵开始点B开始达到目标点C,则转向运动只有一个子阶段。这种情况被认为是单相的,其转向距离和时间在上述模型中都是不变的值。单相位转弯对运动的定向速度分量要求较高,而多相位转弯约束较少,可以避免定向过程中的刚性运动条件[6]。沿追索线(B到C)(图1(a))的单相操纵路径为参考距离,用于测试各子阶段中最终目标C的运动误差。

1)转向运动的横向冲量(Lat)。其中定向速度的特征是具有有限的幅值和在80°附近的固定角度υ。这种类型的冲量具有两个分量:一个是与物体的速度正交的分量,该速度代表对转弯运动的唯一贡献,也是定位速度大小的重要主要部分。另一个是纵向分量,作为沿方向的速度相加,以略微调整由于横向运动路径而引起的错位。物体速度的表达式,在极坐标下,阶段(i+1)中物体速度的表达式为式(7):

2)横向运动的纵向冲量(Lon)。该冲量是到目标运动的一个贡献。在这种情况下,定向速度记为,由有限的幅值和零角υ定义。该冲量的作用是纠正由于将对象移动到目标点C所经过的约束时间而导致的到目标的错过距离[7]。的表达式如式(8):

3)没有冲量(Ni)。这种运动是最常见的,物体在同一方向上以相同的速度大小继续运动。在这种情况下,定向速度矢量的大小等于零,因为物体的速度表示式(9):

通过确定每个子阶段中冲量的类型,操纵相位可以根据与目标的距离和方向来调整和校正。

3 控制方法设计

通过计算启动时间和冲量类型,提出并实现了三种优化连续转向轨迹的方法。其基本思想是将操纵相位时间τ2划分为N个Δt的间隔,然后在从1到N的每个间隔分别应用下列决策方法之一,通过式(7)、(8)和(9)激活其中一种冲量类型。目标是计算每个间隔的子轨迹,以便到目标C的轨迹是N个子轨迹的连接[8~9]。

3.1 改进多重打靶法

经典的单次打靶法是一种广泛用于求解两点边界值问题的数值方法,这些问题主要是具有给定解的初值和终值的微分方程[10~11]。该方法通过更改初始斜率,以表示物体从初始点“射出”的轨迹,这个初始斜率会导致轨迹“击中”目标或最终值。可以将受控对象的运动阶段视为一种边界值问题,其中初始值和最终值分别是操纵起始点B和目标点C。

改进的多重打靶法(MMS)使用了问题的时间分解。确切地说,时域被划分为N个区间Δt=[ti-1,ti] ,i=1,2,...,N,其 中τ(2)=[t0,tN] ,且τ(1)=t0<t1<...<tN=τ。该方法的新颖之处在于,MMS无需为每个时间间隔引入人为初始值,而是在选择最佳打靶之前应用三个单次打靶。EN(IN,tN-1)为到目标的最终误差距离,式(10)所示:

上述MMS旨在评估边界点B和C之间的最佳轨迹,该轨迹将目标的临时最终误差的成本函数J最小化为式(12):

MMS的输出是应用在tk-1实例上的冲量类型,这些冲量产生最佳轨迹。将MMS应用到实际中,例如,对于从1到N的第j个间隔,该算法计算出三次打靶后剩余时间的轨迹。最接近目标的打靶被选为最佳打靶。然后在第j个区间采用最佳打靶诱导的轨迹,并以其最终值作为初值,确定第(j+1)个区间的最佳打靶,该方法产生的最佳耦合数据可用于评估其他方法。

3.2 误差定位方法

考虑到上述系统规范,将操纵目标的运动视为开始定向点B和目标C之间的受控导航。基于这些事实,设计了一种逻辑决策控制器,以保证该类系统对目标的最小误差[12~13]。本研究设计了一种新型时不变控制器,即误差定向控制器(Current Error Orientation,CEO),其结构如图2所示。

图2 CEO方法的结构和输入/输出

设计的两输入一输出误差定向控制器作为输入:误差E1(t)表示期望角度βc与角度β(t)之间的差值,误差E2(t)表示期望误差εc和实际误差ε(t)之间的差值,其中β(t)表示物体的速度矢量与目标的夹角(见图1(b))。误差ε(t)定义为到目标d2T的剩余距离与到d2go的距离之差,在由计算的运动方向上,误差ε(t)与剩余运动时间t2go的关系为式(13):

式(14)和式(15)分别给出了E1(t)和E2(t)的数学表达式。

CEO控制器通过横向冲量调节物体朝向目标的方向β(t),由E1(t)解释。在达到期望方向β(t)后,CEO控制器通过执行纵向冲量来控制误差值ε(t),从而隐式地调整最终误差。在达到期望方向β(t)和误差ε(t)的情况下,控制器做出无冲量使用的决策,与第三种类型相对应。这些逻辑决策是在操作阶段为每个实例t生成的。

3.3 模糊逻辑法

图3显示了决策模糊逻辑控制器(FLC)的结构,其中FLC用于控制驱动对象的横向运动。在目前的应用程序中,FLC被设计成在每个时间间隔内决定要执行的冲量类型[14~15]。该冲量序列旨在确保每个预定角度和相对运动因子的最小误差。

图3 模糊逻辑结构

模糊逻辑使用隶属函数来定义清晰的物理输入值在多大程度上属于语言变量集中的术语。一般来说,模糊控制系统主要由三个基本组成部分组成,即模糊化块、模糊推理机(规则库)和反模糊化块。任何FLC的本质都是模糊推理机,它既包括决策逻辑又包括知识库。模糊化块将每个清晰的输入信息转换为模糊值。知识库由一个数据库组成,数据库中有必要的语言变量作为规则集,而决策逻辑用于决定模糊逻辑运算的执行方式。模糊推理机以模糊值的形式确定每个模糊规则的输出,这些模糊值(输出)在去模糊化块中转换为脆值。

本文设计的模糊控制器是一个双输入单输出控制器,输入是角β(t)和来自CEO方法的误差ε(t)。FLC的输出是在特定时间间隔开始时执行的冲量类型决策I(t)。因此,输出被归结为三个隶属函数,横向、纵向和无冲量。用梯形隶属函数对输入变量进行模糊化,用三角形隶属函数对输出变量进行模糊化。隶属度边界如图4所示。

图4 输入和输出变量的隶属函数定义

本文采用的方法是最大值法(Mean of Maximum,MoM)。去模糊化值定义为隶属度所有值的均值,由式(16)给出:

其中,I(t)为最大值,cj为隶属函数最大的点,L为输出分布达到最大值的次数。

4 硬件设计

静态仿真测试是通过软硬件设计的组件实现的,如图5所示。电子控制器与led二极管连接,所需的软件控制输入是期望的转向角 Δφ∈[8°,18°],相对时间因子τ*以及上述控制方法之一。静态冲量模拟器按照时间序列打开二极管,操作员可以为非最佳最终误差选择另一个参数对,同时须在一组预定义的角速度之间选择物体角速度。这一可视化程序相当于在两个环内点燃安装在受控对象上的强大冲量。第一个面向82°侧向,以模拟横向冲量功,第二个在轴向上以最终的0°方向安装,呈现纵向冲量。

图5 软件/硬件组装

硬件的设计和编程可打开所有双色二极管上的绿灯,以指示系统准备就绪以及第一阶段的持续时间τ(1)。在打开混合光之前,打开红灯会持续Δt时间,以表明冲量不再可用于转向,并且持续所有剩余的定向时间t2go。

电子输入包括微控制器单元、Arduino板、能够与PC机进行USB连接的板以及附加板。人机界面基于字符LCD模块,配有用于选择方法和参数对Δφ和τ*的触觉开关。外部EPROM单元能够存储和调用大数据集。

冲量执行的可视化过程是通过34个LED二极管完成的,其中22个用于横向冲量,另外12个用于纵向冲量。在应用的硬件上,74HCT595串行到并行链由外部电源供电,二极管电流受阳极电阻限制。由于74HCT595的整个串行链将输出设置为存储寄存器时钟信号(引脚12)的选通冲量上的并行寄存器,因此串行寄存器中的所有预定义状态会同时出现在输出端口上。内部计时器中断例程可实现可视化过程的精确计时,选择1ms的时间分辨率,并且上述硬件的抖动小于62ns,而延迟是恒定且可重复的。

5 仿真与讨论

为了研究所提出的方法产生最小最终误差的操纵轨迹的能力,利用上述数学模型进行了大量的仿真。操纵由三种驱动冲量来执行:1)横向冲量(Lat),沿物体运动方向产生的横向速度为ULat=21.8m/s、最佳角度为υ=82°;2)纵向冲量(Lon),沿物体运动方向产生的纵向速度为ULon=20.0m/s;3)无 冲 量(Ni),其 速 度 为UNi=0.0m/s。冲量的执行时间和采样时间分别为300ms和 Δt=320ms。

目标C距离物体初始位置的径向距离为D=36697m。假定物体的初始速度全运动时间τ=86.97s,为了选择最终误差,对每个选定的相对时间因子τ*∈[0.5,0.8]和期望的转航角度 Δφ∈[8°,18°]进行重复模拟。到目标的最终误差距离是通过适当数量和类型的冲量来实现的,仿真结果如表1所示。

通过比较各种方法的结果,可以得出结论:对于每个期望的操纵航向Δφ和时间因子τ*,所有方法都给出了近似的最终误差距离,其中,模糊逻辑方法的最终误差距离最小。

表1中出现的最终误差距离被假定为系统误差(偏差)。为了确定系统对模型误差的灵敏度,在每个采样间隔内对系统参数进行任意扰动。由于目标的速度是数学模型的本质,所以期望并选择将扰动加到目标速度的大小上,即ΔV(i)∈[-5,+5]ms-1,约占定向速度幅值的25%,其方向为Δθi∈[-0.25°,+0.25°]。为了模拟三种方法在存在扰动时的有效性,选择了Δφ=8°和τ*=0.75的情况。在每个采样间隔中,三种方法的扰动将等量地增加。重复n次模拟,并且三种方法的最终误差遵循正态分布定律,其结果参数显示表2中。参数包括平均最终误差距离Edf(m)、标准偏差σ(m)以及最小Edf(m)min和最大误差距离Edf(m)max。根据表2的数据可知,模糊控制方法的性能最佳,适合作为水平面上受控对象的控制方法。

表1 三种方法的仿真结果

表2 在扰动情况下的仿真结果

6 结语

对目标操纵控制的三种决策方法进行了比较分析,给出了在外部扰动存在时,所有方法的提升和收敛结果。本文提出了一种改进多重打靶法,将直接多重打靶法和单一打靶法相结合,因此大大简化了操纵轨迹优化,并且比单次打靶方法具有数值稳定性。改进多重打靶方法涉及最小逻辑问题分析,因此被用作初步估计受控对象参数的参考。这种方法的缺点是它不允许将有关解决方案的信息显式地包括到问题解决过程中。CEO方法采用经典控制理论,对多输入单输出系统应用时不变控制律,这种方法提供了操纵的数学解决方案,但在实际系统上实施之前需要进行进一步的稳定性分析。模糊逻辑方法(FLC)已经在许多系统上证明了其有效性,它通过模糊规则集将解决方案显式地结合到问题中。由本研究的仿真数据可知,模糊逻辑方法相比于其他两种控制方法的性能更优。

猜你喜欢

冲量定向轨迹
定向运动的迁移价值研究
解析几何中的轨迹方程的常用求法
连续3年销量翻番,2022年欲冲量4000万,福建这家动保企业正强势崛起
小班定向式军事游戏的开展
中班定向式军事游戏的开展
大班定向式军事游戏的开展
轨迹
轨迹
冲量及动量定理的示例探讨
物体受到F=kv的力时的归类解析