APP下载

改进狼群算法的交通子区迭代学习边界控制方法

2023-10-18贾光耀闫飞张添翼

计算机应用研究 2023年9期

贾光耀 闫飞 张添翼

摘 要:针对基于固定增益迭代学习的交通子区边界控制方法收敛速度慢、迭代次数过多及控制精度差的问题。提出了一种迭代学习结合改进狼群算法的交通子区边界控制方案。该方案首先根据宏观基本图理论建立交通子区路网的车辆平衡方程,设计出系统的迭代学习控制律。其次分析了迭代学习控制对宏观基本图的影响,引入自适应步长的狼群算法,该算法以上一批次的宏观基本图为模型,离线对迭代学习控制器的比例和微分增益系数进行寻优,再将最优结果代入下一控制周期迭代学习控制中,进而改善收敛速度与精度。最后,对该方案的收敛性提供了数学证明,而仿真实验结果也表明该算法相较于具有固定增益的迭代学习控制器,收敛速度得到提升,对系统期望轨迹也具有较好的跟踪精度,具有较强的可行性与有效性。

关键词:交通子区; 边界控制; 宏观基本图; 迭代学习控制; 狼群算法

中图分类号:TP273   文献标志码:A

文章编号:1001-3695(2023)09-033-2775-06

doi:10.19734/j.issn.1001-3695.2023.01.0023

Iterative learning boundary control method for traffic subregion based onimproved wolf pack algorithm

Jia Guangyao, Yan Fei, Zhang Tianyi

(School of Electrical & Power Engineering, Taiyuan University of Technology, Taiyuan 030024, China)

Abstract:Aiming at the problems of slow convergence speed, too many iterations and poor control accuracy of traffic subregion boundary control method based on fixed gain iterative learning, this paper proposed a traffic subarea boundary control scheme based on iterative learning and improved wolf pack algorithm. In this scheme, it established the vehicle balance equation of traffic subarea network based on macroscopic fundamental diagram theory, and designed the iterative learning control law of the system. Secondly, it analyzed the influence of iterative learning control on the macroscopic fundamental diagram, and introduced the adaptive step size wolf pack algorithm to optimize the scale and differential gain coefficient of the iterative learning controller offline, and then put the optimal results into the next control cycle iterative learning control, so as to improve the convergence speed and accuracy. Finally, the convergence of the algorithm was proved mathematically, and the simulation results show that compared with the iterative learning controller with fixed gain, the proposed algorithm improves,the convergence speed and has better tracking accuracy of the expected trajectory of the system, and it has strong feasibility and effectiveness.

Key words:traffic area; perimeter control; macroscopic fundamental diagram; iterative learning control; wolf pack algorithm

0 引言

城市區域交通边界控制策略是城市交通控制的重要组成部分,也是处理城市交通拥堵问题最常用的方法之一,其主要思想是优化调控边界交叉口的信号配时实现区域交通的调整,避免区域交通向饱和或过饱和状态恶化,从而提高区域交通的通行效率。宏观基本图(macroscopic fundamental diagram,MFD)的理论原理最早起源于二十世纪六十年代,Godfrey[1]通过采集的实际路网数据,证明了宏观交通流参数之间存在一定关系,为构建宏观交通流参数的关系模型奠定了基础。随后文献[2,3]又经过大量的实验数据分析,进一步验证了路网宏观基本图的真实存在性。由此展开了对宏观基本图理论研究的序幕。Shi等人[4]根据上海城市快速路路网一周的交通流数据,验证了路网中MFD的存在性。Saffari等人[5]提出考虑使用多个来源的交通数据来估计MFD,克服了单个传感器无法提供完整和准确的交通数据的不足。Ambyuhl等人[6]提出了一种基于新的基于技术可行交通状态上界平滑逼近的MFD函数,在测量信息不可用的情况下仍然能产生良好的MFD形状。随着对宏观基本图理论研究的不断深入,对宏观基本图影响因素的研究也逐渐展开。金雷等人[7]分析了MFD中存在的回滞现象,并且发现了加权流量和加权密度之间存在背离现象,进一步阐述了交通流饱和状态和MFD回滞现象之间的对应关系。Alonso等人[8]利用真实的统计数据分析了交通管制措施对宏观基本图的影响,得出交叉口的调节会在路段和路网层面上影响交通流变量。易超等人[9]首先根据MFD理论搭建宏观交通流模型,发现公交站点的形式会对路网宏观交通流产生一定的影响。以上对宏观基本图影响因素的研究中,大多考虑不同因素对宏观基本图的影响,而控制过程中对宏观基本图的影响研究却相对较少。

随着MFD理论研究的不断深入,边界控制的研究也在不断进行。Sirmatel等人[10]提出将非线性模型预测公式运用在路网的反馈边界控制中,使系统状态接近于期望状态,提高了路网运行效率。Chen等人[11]针对过饱和区域的边界控制问题,提出一种基于反馈线性化的比例积分控制器,保证了路网维持在期望的累积状态。Zhang等人[12]以网络平衡为目标采用LQR方法进行边界控制,提高了路网的通行效率。Keyvan-Ekbatani等人[13]提出了一种基于队列长度或历史延迟的门控流量分配方法,而实验结果表明该方法不仅提高了网络的整体性能,而且也降低了队列向上游节点传播的可能性。

以上基于MFD理论的边界控制策略中,很多是依据建立的模型来进行控制,其效果容易受模型准确度的影响。而从宏观角度看,对于城市中的特定区域,交通流存在着很强的重复特性。如果能利用交通流的这种重复性对交叉口进行控制,则对于改善城市交通状况具有重要意义。对于系统存在的这种往复特性,Arimoto等人[14]提出的迭代学习控制能够以简单的方式处理复杂非线性、时变和未知系统的控制问题,并得到了广泛的应用。侯忠生等人[15]首先在高速公路匝道中运用迭代学习控制方法,并给出了将迭代学习控制结合反馈控制策略的混合匝道控制策略,增强了系统的鲁棒性。金尚泰等人[16]将迭代学习控制运用到边界控制中,并对不同路网情况进行了仿真,取得了不错的效果。在此基础上,Yan等人[17]考虑了实际路网中存在的扰动和不确定因素,提出了一种考虑干扰因素的迭代学习边界控制策略,并模拟实际路况进行仿真,而实验结果也表明所提方法能够有效抑制不同程度干扰的影响。而后Yan等人[18]又考虑了迭代域中实验长度随机变化的问题,在迭代学习算法中加入平均算子,降低了迭代学习的要求。李宏伟等人[19]在迭代学习边界控制基础上加入BP神经网络算法,大大加快了迭代学习的收敛速度。以上基于迭代学习的边界控制方法虽然取得了不错的进展,但也存在一些不足:a)目前基于迭代学习的边界控制方法大多使用固定增益,无法根据实际情况来进行实时调整,因此收敛速度较慢;b)在控制过程中MFD只提供了一个期望的控制指标,未得到充分利用;c)已有的迭代学习优化算法大多需要大量的历史数据来进行参考,这就导致控制时无法进行实时优化。针对以上问题,本文提出了一种改进狼群算法的交通子区迭代学习边界控制方案。该方案首先分析了宏观基本图在迭代学习过程中的变化情况,得到每批次间宏观基本图模型变化不大的结论,因此用于近似预测区域内的车辆数。再引入改进狼群算法,通过该模型离线对迭代学习控制器的比例和微分增益系数进行寻优,再将最优结果代入下一次的迭代学习仿真控制中,从而提高收敛速度和精度。

1 宏观交通流模型

1.1 宏观基本图

宏观基本图是路网的客观属性,可以从宏观层面反映出路网的交通状态。典型的MFD曲线如图1所示,它近似地描述为不对称、向右倾斜的单峰函数,其回归模型可以表示为G(x)=ax3+bx2+cx+d,其中a、b、c、d为MFD曲线的拟合系数。图中xc为路网的最佳累积车辆数,在该车辆数附近流出该区域的车辆数G(x)最大。当x<x1时,区域路网处于非拥堵状态,随着路网累积车辆数的增加,流出路网的车辆数G(x)也在增加;当x1≤x≤x2时,路网处于临界拥堵状态,该状态下路网通行效率最高;当x>x2时,路网处于拥堵状态,这时G(x)随着路网内的累积车辆数的增大而减小,路网发生拥堵。如果不进行边界控制限制进入路网内的车流,最终造成路网大面积拥堵,路网全面瘫痪,道路锁死。因此利用路网的MFD特性将累计车辆数控制在xc附近,可以达到避免路网发生拥堵的目的。

1.2 宏观交通流模型

如图2所示,假设一个单子区城市路网包括拥堵保护区1和区域边界及外围2两个部分,拥堵保护区域1是一个城市的中心区域,通常会吸引大量的交通需求并趋于临界拥堵或拥堵状态;区域2为其边界或外围区域。将子区1内的累计车辆数划分为若干变量,则子区1车辆平衡方程可表示为

dx11(t)dt=q11(t)+q21(t)u21(t)-x11(t)x(t)G(x(t))+ζ1(t)dx12(t)dt=q12(t)-x12(t)x(t)G(x(t))u12(t)+ζ2(t)x(t)=x11(t)+x12(t)+η(t) (1)

其中:x11(t)和x12(t)分别表示第t时刻区域1流入区域2的车辆数和第t时刻区域2流入区域1的车辆数;q11(t)表示第t时刻区域1的内部车辆交通流;q12(t)表示区域1到2的交通流量需求;q21(t)表示區域2到1的交通流量需求;x(t)表示第t时刻区域1的路网车辆数总和;ξ1(t)和ξ2(t)分别为系统中的过程干扰;η(t)为系统中的测量噪声。

4 仿真研究

4.1 仿真参数设置

为了进一步验证所研究的改进狼群算法的交通子区迭代学习边界控制方法的有效性,本文选取了义乌市某区域(如图4所示)的局部路网作为仿真测试路网,并通过MATLAB和VISSIM端口相连构成的平台进行实验。

该区域包括24个路口和56条双向通行车道,其中包括14个边界路口和19条对外路段,表1给出了路网的车道数情况,每条车道宽度3.5 m。通过义乌市交通控制中心的数据采集系统,采集了该区域从平峰以及高峰时段流量数据,边界交叉口处进口道的交通需求每半小时增加一次,模拟从平峰到高峰时段车辆的变化情况。

本次路网仿真实验采用了三种交通信号控制方案进行,控制方案如下:

a)固定配时。依据韦伯斯特方法计算出路网内固定配时方案,绿信比为1∶1。

b)迭代学习控制。根据式(3)所描述的交通流模型,参考文献[17]的开闭环迭代学习控制方法,以路网内最佳累积车辆数为目标,开环采用上一批次迭代在该时刻的误差乘上微分系数,闭环采用本批次迭代上一仿真周期乘以比例系数来不断地调整输入,得到相对应信号绿灯的时长un(k)为

un+1(k)=un(k)+L1[en(k+1)-en(k)]+L2en+1(k)(40)

其中:L1和L2为固定增益的微分系数和比例系数。

c)改进狼群算法的迭代学习控制。根据式(3)所描述的交通流模型,每次迭代以上一次的宏观基本图为模型使用改进狼群算法离线对参数进行寻优,将最优增益参数运用到下一次仿真的迭代过程中,最终得到相对应信号绿灯的时长un(k)为

un+1(k)=un(k)+L1(k)[en(k+1)-en(k)]+L2(k)en+1(k)(41)

仿真的配置如下:因现实城市道路中,路口的直行车辆一般要大于左转和右转车辆,所以不同交叉口的直行 ∶左转 ∶右转转向率设为3∶1∶1;路网的信号配时均设为两相位,仿真步长设为120 s;每次仿真的总时间均为7 200 s;迭代学习次数为80次;在实施边界控制时,迭代学习控制后的绿灯时长要满足引理1的信号时长约束条件,则对应信号周期的边界信号交叉口绿灯时长取值范围为[20,100]s;其他参数均为VISSIM缺省值。

4.2 仿真结果分析

根据VISSIM仿真实验结果,绘制路网累计车辆数与行程完成流之间的关系曲线,得到该区域的MFD曲线如图5所示。MFD的拟合模型为

G(x)=8.815×10-9x3-1.205×10-4x2+0.46x-25.03 (42)

固定增益参数迭代学习控制下的MFD曲线如图6、7所示,图6表示前10批次迭代学习控制下的MFD散点图,图7表示前40批次迭代学习控制下的MFD散点图。从图6看出相邻每批次迭代间的MFD图变化不大,从图7看出每10批次迭代间MFD图相差较大。因此利用这种每批次迭代学习MFD相差不大的特性,可近似预测车辆数情况,进而设计出狼群算法优化迭代学习的方案。

图8和9给出了固定增益迭代学习控制和改进狼群算法迭代学习控制在迭代轴上的误差图,从图8看到在迭代40批次后开始收敛,而图9中本文方法在不到40次就已收敛。

为了更清楚地看到迭代学习收敛情况,图10给出了固定增益迭代学习控制和本文方法的每批次迭代平均误差车辆数绝对值随迭代的变化情况,可以看出两种控制方案总体都呈现出收敛趋势,但是本文方法相比于固定增益迭代学习控制误差更小,收敛速度更快。随着迭代学习的进行,当迭代次数大于40批次时,本文方法平均误差车辆数小于固定增益的平均误差车辆数。图11~13给出了固定配时、固定增益迭代学习控制和本文方法最终稳定后的路网性能评价指标对比。可以看出,在前20个信号周期内路网内累积车辆数较少,此时间段的路网状态还未达到饱和,所以三种方案的控制效果相差不大,没有更多的优化空间。而在第20个信号周期后,随着路网中累计流量的增大,路网进入饱和状态,定时控制时路网中车辆的平均排队长度、平均延误都出现了明显的上升趋势,导致行车速度降低,而其余两种控制方案的路网性能指标都明显优于固定配时方案。再对比固定增益迭代学习和本文方法,当路网进入饱和状态后,本文方法的各性能指标都明显优于固定增益迭代学习控制。

表2给出了三种不同控制方案下的路网性能指标对比情况,可以看出本文方法相较于其他两种方案的车辆平均排队长度最小,较固定配时和固定增益的迭代学习控制分别降低了24.1%和6.7%。同时本文方法的车辆平均延误时间也最小,较固定配时和固定增益的迭代学习控制分别降低了22.5%和7.4%。而车辆平均速度方面本文所提方法最大,较固定配时和固定增益的迭代学习控制分别提高了10.4%和3.6%。結合以上数据充分说明本文方法有效地提高了路网通行效率。

5 结束语

针对基于迭代学习的交通边界控制收敛速度慢和控制精度差的缺点,本文提出了利用改进狼群算法优化迭代学习的控制方案。该方法首先分析了迭代学习控制对MFD的影响,发现了每批次间迭代学习对MFD影响不大的特性,进而可以利用MFD模型近似预测车辆数,再根据此特性利用改进狼群算法对控制过程进行优化。最后仿真实验结果表明,对控制器的参数动态调整后,提高了整个控制过程的收敛速度,同时也表明本文方法能够有效降低路网边界的控制误差,提高控制精度,因此提高了路网的运行效率。为了适应日益复杂的城市路网交通控制,迭代学习结合其他方法的混合控制方法将会有更大的研究价值。本文提出的交通边界信号控制方法是在理想路况条件的前提下进行的。而现实中的交通路网情况十分复杂,存在着比如交通事故、占道施工和道路禁行等各种干扰因素,而干扰因素的存在会导致控制效果变差。因此,在后续的研究中,将考虑其他干扰因素的影响,提高系统的抗干扰性能,使系统更接近实际道路状况,从而缓解交通拥堵。

参考文献:

[1]Godfrey J W. The mechanism of a road network[J]. Traffic Engineering and Control, 1969,11(7): 323-327.

[2]Daganzo C F, Geroliminis N. An analytical approximation for the macroscopic fundamental diagram of urban traffic[J]. Transportation Research Part B: Methodological, 2008,42(9): 771-781.

[3]Geroliminis N, Haddad J, Ranezani M. Optimal perimeter control for two urban regions with macroscopic fundamental diagrams: a model predictive approach[J]. IEEE Trans on Intelligent Transportation Systems, 2013,14(1): 348-359.

[4]Shi Xinyi, Lin Hangfei. Research on the macroscopic fundamental diagram for Shanghai urban expressway network[J]. Transportation Research Procedia, 2017,25: 1300-1316.

[5]Saffari E, Yildirimoglu M, Hickman M. Data fusion for estimating macroscopic fundamental diagram in large-scale urban networks[J]. Transportation Research Part C: Emerging Technologies, 2022,137: 103555.

[6]Ambyuhl L, Loder A, Bliemer M C J, et al. A functional form with a physical meaning for the macroscopic fundamental diagram[J]. Transportation Research Part B: Methodological, 2020,137: 119-132.

[7]金雷, 谢秉磊. 深圳市中心城区宏观交通流参数的背离现象[J]. 武汉理工大学学报: 交通科学与工程版, 2018,42(4): 579-583. (Jin Lei, Xie Binglei. Deviation of macro traffic flow parameters in downtown Shenzhen[J]. Journal of Wuhan University of Technology: Traffic Science and Engineering, 2018,42(4): 579-583.)

[8]Alonso B, Ibeas á, Musolino G, et al. Effects of traffic control regulation on network macroscopic fundamental diagram: a statistical analysis of real data[J]. Transportation Research Part A: Policy and Practice, 2019,126: 136-151.

[9]易超, 杨晓芳. 基于宏观基本图理论的公交站点形式影响分析[J]. 交通与运输, 2020,36(2): 25-29. (Yi Chao, Yang Xiaofang. Influence analysis of bus stop form based on macroscopic basic graph theory[J]. Traffic and Transportation, 2020,36(2): 25-29.)

[10]Sirmatel I I, Geroliminis N. Stabilization of city-scale road traffic networks via macroscopic fundamental diagram-based model predictive perimeter control[J]. Control Engineering Practice, 2021,109: 104750.

[11]Chen Qian, Li Shihua, An Chengchuan, et al. Feedback linearization-based perimeter controllers for oversaturated regions[J]. IEEE Intelligent Transportation Systems Magazine, 2022,14(1): 187-197.

[12]Zhang Haibo, Zhang Lingyu, He Zhonghe, et al. LQR-based perimeter control approach for urban road traffic networks[C]//Proc of the 6th Data Driven Control and Learning Systems. Piscataway, NJ: IEEE Press, 2017: 745-749.

[13]Keyvan-Ekbatani M, Carlson R C, Knoop V L, et al. Optimizing distribution of metered traffic flow in perimeter control: queue and delay balancing approaches[J]. Control Engineering Practice, 2021,110: 104762.

[14]Arimoto S, Kawamura S, Miyazaki F. Bettering operation of robots by learning[J]. Journal of Robotic Systems, 1984,1(2): 123-140.

[15]侯忠生, 晏靜文. 带有迭代学习前馈的快速路无模型自适应入口匝道控制[J]. 自动化学报, 2009,35(5): 588-595. (Hou Zhongsheng, Yan Jingwen. Model-free adaptive on-ramp control for expressway with iterative learning feedforward[J]. Acta Automatica Sinica, 2009,35(5): 588-595.)

[16]金尚泰, 丁莹, 殷辰堃, 等. 城市交通区域的迭代学习边界控制[J]. 控制与决策, 2018,33(4): 633-638. (Jin Shangtai, Ding Ying, Yin Chenkun, et al. Iterative learning boundary control for urban traffic area[J]. Control and Decision, 2018,33(4): 633-638.)

[17]Yan Fei, Wang Kun, Shi Zhongke. Iterative learning perimeter control method for traffic sub-region considering disturbances[J]. Physica A: Statistical Mechanics and Its Applications, 2021, 578: 126104.

[18]Yan Fei, Yan Gaowei, Ren Mifeng, et al. A novel control strategy for balancing traffic flow in urban traffic network based on iterative lear-ning control[J]. Physica A: Statistical Mechanics and Its Applications, 2018, 508: 519-531.

[19]李宏伟, 黎英. 偶发性事件下城市交通区域边界的最优控制[J]. 电子测量技术, 2019, 42(14): 63-67. (Li Hongwei, Li Ying. Optimal control of urban traffic area boundary under contingency events[J]. Electronic Measurement Technology, 2019,42(14): 63-67.)

[20]Hou Zhongsheng, Xu Jianxin, Yan Jingwen, et al. An iterative lear-ning approach for density control of freeway traffic flow via ramp metering[J]. Transportation Research Part C: Emerging Technologies, 2008,16(1): 71-97.

收稿日期:2023-01-10;修回日期:2023-03-05  基金项目:国家自然科学基金资助项目(61703300);中国博士后科学基金资助项目(2019M651082);山西省应用基础研究项目(201801D221191)

作者简介:贾光耀(1992-),男,山西长治人,硕士,主要研究方向为城市交通信号控制、城市交通子区边界控制;闫飞,男(通信作者),山西大同人,副教授,硕导,博士,主要研究方向为城市交通信号控制、迭代学习控制、智能交通系统等(yanfei@tyut.edu.cn);張添翼,男,山西大同人,硕士研究生,主要研究方向为城市交通子区划分、城市交通子区边界控制.