APP下载

不可靠通信的云控场景下网联车辆控制器的设计*

2021-05-12潘济安李克强王建强吴向斌

汽车工程 2021年4期
关键词:网联时延控制器

许 庆,潘济安,李克强,王建强,吴向斌

(1. 清华大学车辆与运载学院,北京 100084;2. 英特尔中国研究院,北京 100080)

前言

先进的网络通信技术为智能汽车赋予了更多应用场景[1]。特别是近年来,随着5G 及相关通信技术的发展,行业内提出了智能网联云控等技术,基于路侧感知及计算设施,构建物理空间上的设计运行域,进一步降低成本的同时提高车辆智能化水平。然而现有通信技术的一些固有不确定性(如丢包或时延)和通信信道特性(如带宽限制)等可能降低网联车辆控制精度,影响行驶安全性[2]。因此,对非理想通信环境下网联车辆控制器设计方法的研究具有实际应用需求。

在网络控制系统领域,非理想反馈信息下的控制问题是重要研究方向。其中,Elia等[3]提出了一种对数量化反馈控制的方法,证明了利用对数离散分布的反馈控制量依然可以镇定系统,且给出了保持系统稳定的最粗糙量化密度计算方法。Tsumura等[4]在上述对数量化理论的基础上,考虑了同时包含量化和随机丢包的反馈控制,研究了在包含丢包情况下,对数量化反馈控制的稳定性,并提出了保证系统稳定的最大丢包率和最粗糙量化密度之间的平衡关系。Xu 等[5]考虑更一般场景,研究了马尔可夫跳变线性系统的量化反馈控制镇定问题,基于半凸优化的方法,提出了用线性矩阵不等式求解模态相关跳变控制器的方法。关于随机时延下的控制问题,Halevi 等[6]考虑了一种综合通信控制系统中,系统建模及控制器设计问题,针对包含时延的反馈控制系统建模问题,提出了一种利用过去的状态量和控制量增广状态方程的方法。在这样的增广思路影响下,大量针对时延系统的研究都采用增广的方法。Zhang 等[7]同时考虑了网络控制系统中传感器的时延和控制器的时延,把两个时延考虑为两个独立的马尔可夫过程,同时用历史状态量做增广,对系统进行建模,提出了镇定控制器求解的线性矩阵不等式条件。Zhang 等[8]同样采用了增广历史状态量的方法,推导了求解时变时延下镇定反馈控制器参数的线性矩阵不等式,同时该研究还给出了稳定性条件松弛处理时的线性矩阵不等式的形式,提升了实际工程求解的实用性。在车辆控制领域,也有相关研究关注通信对网联车辆控制系统的影响。早期在PATH 项目中,Seiler 等[9]初步分析了在车辆控制中通信丢包的影响,并提出了控制器的设计方法。Orosz 等[10]研究了通信时延对多车队列系统稳定性的影响,并提出了在时延下的多车队列控制器设计方法。

上述研究针对一般抽象的网络控制系统数学模型,分析了通信丢包、时延及量化等非理想通信因素对系统稳定性的影响,并提出了闭环稳定控制器的设计方法。然而此部分研究对系统的建模较为简单,难以直接应用于复杂车辆系统的控制。同时,其中一些控制方法具有较高的计算复杂度,难以实际工程应用。部分研究考虑了车辆网联控制场景中非理想通信的影响,但场景较为单一,以纵向控制为主,且方法与场景耦合度强,难以扩展应用于更多的车辆控制场景。

综上,面向一般的网联车辆控制系统,关注随机通信丢包或时延下的量化控制器设计问题,将存在不可靠通信条件的系统建模为跳变系统,提出适用于非理想通信环境下的网联车辆控制方法,以及基于线性矩阵不等式的控制器求解方法,保证系统的稳定性。

1 非理想通信下的网联车辆控制系统建模

一类典型的网联云控应用框架如图1 所示。在该类应用中,车辆的状态以及环境的状态由路侧传感器获得,并发送给同样在路侧或云端的网联控制器,计算得到对应的车辆纵横向控制指令,并通过网联无线通信发送给车辆执行。在这一过程中,通信通道的量化、丢包或时延等非理想特性可能影响车辆的控制性能。面向上述典型网联应用,为针对车辆的纵横向控制特性进行解耦分析,本研究主要考虑两类功能场景:网联横向轨迹跟踪控制和网联纵向队列跟踪控制。

图1 一类典型的网联云控车辆控制场景

1.1 网联车辆横向控制动力学模型

在网联车辆轨迹跟踪控制场景中,路侧感知传感器获得受控网联车辆的位置、姿态等状态信息,通过网络发送给路侧控制器,控制器基于反馈信息,计算受控车辆按固定车速跟踪指定轨迹的前轮转向角,并最终通过车路通信(vehicle⁃to⁃infrastructure,V2I)发送给受控车辆执行。

基于文献[11]中车道保持系统的控制方法,构建车辆横向轨迹跟踪控制模型,如图2所示。

图2 一种车辆横向跟踪控制系统模型

忽略环境风扰动,使用状态反馈控制器,用零阶保持器以采样时间T离散化,得到离散系统:

式中:Alat为路径跟踪离散系统状态矩阵;Blat为控制矩阵;Pr为控制目标输入系数矩阵;Klat为反馈控制器增益;x(k)为系统状态量,如式(3)所示,其包含β(k)、r(k)、ψL(k)、yL(k),分别为质心侧偏角、横摆率、航向角误差与预瞄距离ls处侧向误差;δ(k)为前轮转角;ρ(k)为道路曲率。上述离散系统中各矩阵参数由式(4)计算得到。

式中:cf、cr分别为前、后轮侧偏刚度;lf、lr分别为质心到前、后轴的距离;m为整车质量;Iz为汽车绕垂直轴的转动惯量;v为纵向车速;ls为预瞄距离。

1.2 网联车辆纵向控制动力学模型

在网联车辆纵向队列跟踪控制场景中,路侧传感器获得前方车辆及受控车辆的位置信息、速度信息及加速度信息等,路侧或边缘计算单元通过这些信息计算控制量,并通过V2I发给受控车辆。

基于已有的自适应巡航控制领域的研究成果,选择文献[12]中使用的巡航控制系统动力学模型,利用状态反馈控制器控制自车加速度,用零阶保持器以采样时间T离散化,得到如下系统:

式中:Along为离散系统状态矩阵;Blong为离散系统控制矩阵;G为离散系统控制目标输入系数矩阵;Klong为反馈控制增益;x(k)为系统状态量,其包含Δd(k)、Δv(k)、af(k),分别为距离误差、速度误差与自车加速度;afdes为自车期望加速度;ap(k)为前车加速度。上述离散系统中各矩阵参数由式(9)计算得到

其中:

式中:Along0为连续系统状态矩阵;Blong0为连续系统控制矩阵;G为连续系统控制目标输入系数矩阵;Klong为连续系统控制目标输入变量系数矩阵;τh为跟车时距;KL与TL分别为自车加速度1 阶系统的增益与时间常数;T为离散周期。

2 网络随机丢包或时延下的量化控制器设计

为研究在上述网联车辆控制场景中非理想通信影响下的控制器设计方法,基于网络控制系统理论,将量化反馈下的丢包、时延等时变非理想通信因素建模为马尔可夫跳变过程,并面向离散马尔可夫跳变线性系统求解其控制器。

2.1 马尔可夫跳变线性系统的量化反馈控制

以离散跳变线性反馈控制系统为对象,其系统方程可表示为

式 中:对 所 有θ(k) ∈{1,…,N},有Aθ(k)∈Rn×n,Bθ(k)∈Rn×nu,Cθ(k)∈Rny×n。当θ(k)=i时,称系统处于第i个模态。θ(k)为值域在集合{1,…,N}中的随机过程,若系统随时间的跳变遵守马尔可夫过程,则上述系统被称为离散马尔可夫跳变线性系统(discrete markovian jump linear system)。其不同模态之间的状态转移矩阵为

式中:pij为模态i转移到j的概率,对所有i,j∈{1,…,N},满足pij≥0及

在网络控制系统中,网络带宽限制了每周期的通信传输数据量,对传输信息的量化必不可少。对数量化可以更充分地利用有限带宽控制反馈中量化相对误差,文献[3]中也证明可利用对数离散的控制量镇定闭环系统,并推导了最粗糙量化条件,本文中也采用对数量化的方法。

综上,考虑一种用于式(11)系统的模态相关对数量化线性反馈控制器:

式中:i为系统模态;Hi为模态相关的控制增益;βi为控制增益修正量;ρi为当前时刻的对数量化密度。上述的量化反馈包含两个过程:对数编码过程及对数解码过程。其中,对数编码过程主要发生在控制器输出侧,根据控制量确定量化编码值l;解码过程主要发生在受控对象接收端,根据接收的量化反馈信息重建并通过控制增益修正计算实际控制量。

针对上述对数量化线性反馈控制系统,文献[4]中提出了设计马尔可夫跳变线性系统的镇定量化反馈控制器的理论依据,即:若存在形为式(13)的量化反馈控制器,其控制增益为,增益修正量为βi=,则该控制器可以镇定马尔可夫跳变式(11)系统,当且仅当存在正定矩阵序列Yi∈Rn×n及矩阵序列Zi∈Rnu×n,使如式(14)所示的线性矩阵不等式成立:

式中i,j∈[1,…,N]。

基于式(14),通过求解线性矩阵不等式组可行解,可以得到量化反馈下马尔可夫跳变线性控制器。这一过程可由成熟的计算机工具直接求解。需要注意的是该方法通过线性矩阵不等式求解对应于不同跳变模态i的控制器增益Hi,进而求解不同模态下的镇定控制量。在实际控制中,量化密度可根据网络情况进行选择,若受控系统存在不稳定的特征值,根据文献[2],在保证系统稳定性的条件下,最粗糙的量化密度可以由式(15)计算得出。

式中∏eigu(A)表示系统系数矩阵A中所有不稳定的特征值。实际选择的量化密度应大于最粗糙量化密度。

2.2 随机丢包下的对数量化反馈控制器设计

包含随机丢包过程的线性反馈系统架构见图3,其系统方程可以表示为

图3 随机丢包下的对数量化反馈控制系统

式中β∈{0,1}为丢包状态系数。若β= 0 表示发生丢包,控制信息没有被受控对象收到,系统退化为开环系统;反之则为无丢包状态。丢包研究中常见的伯努利过程可以看作简化的两状态马尔可夫过程,给定丢包率pd,其状态转移矩阵可表示为

因此,在给定量化密度及丢包率的前提下,可以用2.1 节中求解线性矩阵不等式的方法求解在无丢包状态下的镇定控制参数,进而镇定包含丢包的线性对数量化反馈控制系统。需要注意的是,虽然上述系统为两状态跳变系统,然而另一状态为丢包状态,无反馈控制,因此只须计算无丢包状态下的反馈控制参数即可。

2.3 随机时延下对数量化反馈控制器设计

包含控制时延的对数量化反馈控制系统见图4,在该系统中网络传感器收集系统状态信息,网络控制器根据收集到的状态信息计算控制量,控制量通过包含对数量化及随机通信时延的通信通道发送给受控对象并执行。

图4 随机时延下对数量化反馈控制系统示意图

为简化求解,对系统的通信部分(网络控制器到受控对象)作出如下假设:

(1)随机时延Tdelay离散且有界,其可行集合表示为{0,ΔT,2ΔT,…,NΔT},取实际时延上界与离散集合相对应;

(2)假设不同离散时延之间的转移遵循马尔可夫过程,且转移概率矩阵为已知,即时延从iΔT转移到jΔT的概率pij,不同时延之间的转移概率矩阵为P=[pij]。

综合上述假设,包含时变时延的离散线性反馈控制系统方程可表示为

式中:u(k-i)为k-i时刻控制器计算得到的控制输出;δi∈{0,1}为表征具体时延是否发生的系数,若对应系数取1则表示发生对应步长的离散时延。

利用矩阵增广的方法,可将上述方程转化为跳变系统的方程形式。首先,构造增广的系统状态变量:

根据上述增广系统状态量的形式,可将式(18)系统表示为

式中:(Aaug)i为增广系统对应于状态i的状态矩阵组;(Baug)i为增广系统对应于状态i的控制矩阵组。

式(20)即为增广形式的包含时变时延的反馈控制系统方程,由于上述系统的建立是基于时延的跳变为马尔可夫过程的假设,因此上述增广系统也是一个马尔可夫跳变线性系统。利用式(14)提出的线性矩阵不等式条件,即可求解对应于不同模态的控制增益Hi。由于不同模态对应于不同的时延大小,因此通过线性矩阵不等式解出的是对应于不同离散时延的控制增益。

特别的是,由于增广系统的状态变量如式(19)所示,因此增广系统的模态相关反馈控制增益计算公式为

式中:Hi(j) 表示Hi向量的第j个元素;[x1(k),…,xn(k)]T表示原系统所有状态变量;n为原系统状态变量维数。需要注意的是,由式(21)可知,在k时刻计算控制量需要已知之前N个离散历史时刻的控制量,因此需要在控制器输出侧设置缓存,保存之前N个时刻的历史状态量,用于控制量计算。

通过量化编码、解码和增益修正,最终的实际控制量为

式中:i为k时刻实际接收时延对应的模态;ρk为k时刻的量化密度。

3 随机时延或丢包下的网联车辆控制系统仿真试验

为验证本文提出的在随机时延及丢包下的量化控制器设计方法,基于Matlab⁃Simulink搭建仿真平台(其中车辆纵向动力学建模参照文献[13],车辆横向动力学仿真建模使用自行车模型),分别面向网联车辆纵向及横向控制场景设计控制器,并分析仿真结果。

3.1 网联车辆横向控制仿真

在网联车辆横向控制仿真试验中,式(1)系统方程部分参数如表1所示。

表1 车辆横向跟踪控制系统参数

根据系统方程,基于2.2节和2.3节中提出的包含丢包或时延过程的系统控制器设计方法,即可求解对应的轨迹跟踪控制量化反馈控制器参数。在仿真试验中,受控车辆按照恒定车速u追踪一正弦曲线轨迹,仿真试验中参考轨迹生成函数如式(23)所示。

横向控制仿真试验的控制表现主要通过参考轨迹和实际轨迹的横向距离误差及航向角误差来反映,在本研究中设置归一化的跟踪误差指标TEI(tracking error index),其计算公式为

式中:Ts为仿真总时长;αy、αa分别为横向距离误差和航向角误差的权重系数,在本研究的仿真试验中取αy= 1,αa= 0.5;yr及ψL的定义参考图2。

为对比在不同丢包、时延及量化状态下的控制性能,对其进行离散化设置,具体参数见表2 和式(25)~式(28)。同时,在仿真试验中,根据文献[14],结合实际工程应用情况,设计了航向角偏差反馈的PID 控制器,以对比本文提出控制器设计方法的控制效果,PID控制器参数见表3。

表2 横向仿真试验量化密度与丢包率设置

表3 对标PID控制器参数设置

不同量化密度及丢包率下对标控制器跟踪误差指标与本研究提出控制器跟踪误差指标之差如图5所示。其中,为避免随机性影响,跟踪误差指标数值为20 次仿真试验取均值的结果。从图中可以看出,在较小的丢包率及较精细的量化密度下,普通控制器和本文提出的控制器都可以很好地镇定系统,如图5 中下方平面部分所示。随着丢包率的增加及量化密度的减小,二者的平均跟踪误差情况都变差,但普通控制器的控制表现波动较大,且会在更低的丢包率下就出现较大的误差波动。特别是在一定的丢包率和量化密度范围内,如图5 中方点虚线圈出斜面部分所示,本文提出方法设计的控制器的控制性能都远优于普通控制器。需要指出的是,在超过一定丢包率范围后,通过查看仿真响应曲线发现两种控制器下的车辆控制误差都急剧增大,因此仿真试验中设置了误差上限,也因此出现了图中短划线圈出的平面部分,此部分的对比不再有意义。

图5 两种控制器不同量化密度及丢包率下跟踪误差指标差值

不同时延分布矩阵下跟踪误差指标对比情况如图6所示。图中跟踪误差仍为20次仿真试验取均值的结果。根据上文对时延分布矩阵设置可知,由P1到P4代表着大时延出现的概率逐渐增大,因此从仿真结果中可以很容易看出,相比于普通定参数控制器,尽管在无时延或小时延(例如P1、P2)的情况下控制表现差别不大,但在不同的时延分布及量化密度下,本文提出的控制器控制表现差距更小,特别是在出现大的跳变时延(如P4)及较粗糙的量化密度情况下依然能保持控制误差在一定范围内,而在该种情况下普通定参数控制器有可能出现控制性能劣化严重的情况(例如图6(d)中P4下的折线,此时车辆控制误差已达仿真上界)。

3.2 网联车辆纵向控制仿真

在网联车辆纵向控制仿真试验中,式(6)系统方程中相关参数设置如表4所示。

根据系统方程,基于2.2节和2.3节中提出的包含丢包或时延过程的系统控制器设计方法,即可求解对应的网联车辆纵向控制量化反馈控制器参数。在仿真试验中,设置前车按照一定的速度曲线行驶,网联控制器控制后车跟踪前车。在仿真试验中,为保证测试的一致性,设计前车速度为一分段函数,即

图6 不同时延分布及量化密度下控制误差参数对比

表4 纵向控制仿真参数设置

纵向控制仿真试验控制表现主要通过跟踪误差来反映,主要包含对距离误差和速度误差的评价,在本研究中设置归一化的跟踪误差指标TEI,其计算公式为

式中αd、αv分别为距离误差和速度误差的权重系数,在本研究的仿真试验中取αd= 1、αv= 0.1。

为考察在不同丢包、时延及量化状态下的控制表现,在仿真试验中,对其进行离散化设置,具体参数设置见表5和式(31)~式(34)。

表5 纵向仿真试验量化密度与丢包率设置

同时,在仿真试验中还设计了LQR(linear quadratic regulator)控制器进行对标。LQR 控制器可以得到状态线性反馈系统在某一性能指标下的最优控制律,且方法简单、易于实现,理论分析和实际应用都较广泛,因此本文选择LQR 控制器来对比本研究提出控制器设计方法的控制效果,该LQR 控制器的设计目标为最小化跟踪误差,同时保证执行器在非饱和输入下的平稳性,针对该问题的控制器代价函数为

通过调整权重矩阵Q和R即可获得较为良好的控制效果。对于本研究所关注的受控系统,通过调整,在无时延及丢包状态下获得较为良好控制效果的Q和R矩阵的设置如表6所示。

表6 对标LQR控制器参数

不同量化密度及丢包率下本研究提出控制器跟踪误差指标与对标控制器跟踪误差指标之差如图7所示。与横向控制仿真类似,为减少随机因素的影响,跟踪误差为20 次仿真试验取均值的结果。可以看出较好的量化以及较低的丢包率下本文提出控制方法和普通的控制器可以达到近似的控制误差范围。而在一些较差的量化密度以及较大的丢包率下,本文提出的方法有相对较好的控制误差范围,如图7 中方点虚线圈出部分所示。需要说明的是,和横向控制仿真试验结果相比,纵向控制仿真试验结果中两种控制器的控制表现差别并不明显,这主要体现在较小丢包率和较好的量化时两种控制器性能差异不大。其原因主要是:一方面,LQR也是很好的控制器,其对于丢包和量化带来的影响本身具有一定的鲁棒性,在一般工况下,本研究提出的控制器可以与LQR 达到相同的控制效果,这也说明了本研究提出控制器的可行性,且在信道质量较差的工况下,本研究提出控制器性能明显优于LQR 控制器;另一方面,因为车辆纵向动力学仿真模型包含动力系统模型、传动系统模型等,存在更复杂的耦合非线性动力学关系,而对比的两组控制器都是针对线性系统设计的,会产生一些控制效果的差异。另外,值得注意的是在某些非常大的丢包率下本研究使用的控制器跟踪误差指标比LQR 还要差,如图7 中短划线圈出部分所示,通过查看响应图发现在较大的丢包率下两种控制器都出现了较大的振荡,此时的跟踪误差指标对比对于车辆控制不再具有实际意义。

图7 不同丢包率及量化密度下跟踪误差指标差值

在上述条件设置下,本研究提出的控制器和LQR 控制器在不同时延分布、不同量化密度下的跟踪误差指标如图8 所示。由时延分布矩阵可知,由P1到P4代表着大时延出现的概率逐渐增大。从仿真结果中可以很容易看出,在不同的时延分布及量化密度下,传统定参数控制器控制性能波动较大,在一些较低的时延分布(例如P1、P2)及较精细的量化下控制性能较好;而在较粗糙的量化密度下,控制性能有明显变化,特别是在一些大时延出现概率较大(例如P4),同时量化也较为粗糙的情况下,性能劣化严重。相比之下,尽管本文提出的控制方法无法保证在无时延情况下的最优性,但在不同的时延分布下控制表现差异较小,在部分较大时延出现的情况下,控制表现也不会出现明显波动。同时,从另一维度考察,随着量化密度的变化,本文提出的控制器的控制性能波动也远小于普通定参数控制器。

4 结论

在网联车辆控制领域,非理想通信因素对控制系统性能的影响是车辆和通信行业共同关注的重要问题。工程实践及部分国内外研究也表明,一些现有通信技术固有的不可靠因素,如通信丢包、时延、量化等,会给网联车辆控制带来一定的安全隐患。本文基于上述背景,开展了考虑通信中随机丢包或时延的网联车辆控制系统的研究,为已知通信丢包或时延概率分布的网联车辆控制系统设计安全的控制策略提供了理论依据。综合本文的研究内容及结果,主要结论如下。

(1)面向非理想通信下网联车辆控制问题,提出了一种马尔可夫跳变线性系统量化反馈控制器设计方法,利用求解线性矩阵不等式组,计算对应于不同系统模态的量化及控制参数以镇定系统。在此基础上,通过矩阵变换,将该方法拓展到包含随机时变丢包或时延的量化反馈控制场景,提出不同丢包、时延及量化状态下的车辆控制参数求解方法。

图8 不同时延分布及量化密度下控制误差参数对比

(2)面向解耦的网联车辆纵向控制和横向控制,利用Matlab/Simulink 搭建了仿真环境,验证本研究所提出的控制方法。仿真结果表明:在一定的丢包率及量化密度范围内,相比于传统控制方法,本研究提出的控制器控制表现波动更小;在不同的时延分布及量化密度下,相比于传统控制方法,本研究提出的控制器控制表现波动更小,特别是在一些大时延及较粗糙的量化密度下,依然可镇定受控车辆。

(3)仿真试验中也发现,在一些极端恶劣的通信工况下,本研究提出的方法和传统方法仍会导致系统状态产生波动。未来研究可考虑从应用角度出发,结合具体场景中车辆系统非线性动力学的具体特点,推导可镇定边界,同时结合实车试验,验证边界计算的合理性,进一步为网联车辆的安全控制提供基础。

猜你喜欢

网联时延控制器
三转子式比例控制器设计与内泄漏分析
南京溧水电子3款控制器产品
基于云控平台雾计算架构的网联汽车路径控制
计算机网络总时延公式的探讨
计算机网络总时延公式的探讨
基于物联网的IT运维可视化管理系统设计与实现
《舍不得星星》特辑:摘颗星星给你呀
基于NFV的分布式SDN控制器节能机制
新势力“网联”动了谁的奶酪?
网联大考