APP下载

基于机器学习的城市快速路速度-密度关系模型

2020-08-19林豪江竹李树彬

关键词:交通流聚类神经网络

林豪 江竹 李树彬

摘 要:为进一步提高速度-密度关系模型的精度以及更加精确刻画当前道路交通流动态变化特性,采用基于机器学习的方法对北京市三环路实测数据进行分析。首先对道路实测数据进行预处理,再采用层次聚类法确定不同交通流相位临界密度,最后利用传统速度-密度模型、BP神经网络以及局部加权回归进行对比分析并建立分相位的道路交通流速度-密度关系模型。利用现场实测数据对模型进行测试,结果表明:采用层次聚类可以为每个相位计算出更准确的分界点;与传统模型相比较,采用基于机器学习的方法为每个相位估计速度-密度关系模型能够获得更高的精度;对道路交通流进行分相位,建立速度-密度关系模型比基本图论的方法更能准确捕捉动态交通流的变化趋势。关键词:交通流;预处理;层次聚类;三相交通流;速度-密度模型中图分类号:TP 391.9

文献标志码:A

文章编号:1672-9315(2020)06-01109-08

DOI:10.13800/j.cnki.xakjdxxb.2020.0623开放科学(资源服务)标识码(OSID):

Speed-density relationship model of urban

expressway based on machine learning

LIN Hao1,JIANG Zhu1,LI Shu-bin3

(1.College of Energy and Power Engineering,Xihua University,Chengdu 610039,China;

2.Department Traffic Management Engineering,Shandong Police College,Jinan 250014,China)

Abstract:In order to further improve the accuracy of the speed-density relationship model and more accurately characterize the dynamic characteristics of current road traffic flow,this paper used a method based on machine learning to  analyze the measured data of the Third Ring Road in Beijing.This paper first preprocessed the road actual measured data;then used the hierarchical clustering method to determine the critical density of different traffic flow phases;Finally,the traditional speed-density model,BP neural network and local weighted regression are used for comparison and analysis,and a phased road traffic flow speed-density relationship model is established.The model was tested with the field data,and the results showed that the hierarchical clustering method can calculate more accurate dividing points for each phase;compared with the traditional model,the method based on machine learning can estimate the speed density relationship model for each phase with higher accuracy;the speed density relationship model is established by dividing the phases of the road traffic flow,which is more accurate than the basic diagram in  capturing the trend of dynamic traffic flow.

Key words:traffic flow;pre-processed;hierarchical clustering;three-phase traffic flow;speed-density model

0 引 言

隨着国民经济的飞速发展,我国私家车保有量呈急剧上升趋势,城市道路交通供给已经不能很好地满足出行者交通需求,道路交通拥挤逐渐成为社会问题。为了更好地缓解道路交通拥堵,提高道路通行能力,研究者们从交通流理论与模型的研究出发,通过揭示交通流的演变规律,为交通流控制与诱导提供理论基础[1]。

基于1个车流密度对应1个稳态交通流量这一假设,传统的交通流理论将道路交通流分为自由流和堵塞流2个交通相,速度随密度增加而减小,这样的流量与密度单一对应曲线被称为基本图[2]。德国物理学家KERNER在总结和研究了大量交通流实测数据的基础上,提出了三相交通流理论。该理论把交通状态划分成自由流相、同步流相和宽运动堵塞相3个交通相。近年来,国内外学者基于三相交通流理论提出了许多相关研究成果[3]。JIA等提出了基于三相交通流理论的元胞自动机模型,在考虑周期和边界等条件下,对同步流的基本图特性及入口匝道导致的不同拥堵模型进行了深入研究[4]。TIAN等利用基于交通流基本图的元胞自动机对三相交通流理论的影响进行还原分析[5]。REHBORN及HERMANNS等分别利用各自的交通流数据样本对交通流转变过程中的三相状态进行验证和分析[6-7]。CAO等运用基于统计的方法,通过速度分布标准差以及速度跃迁点等对三相交通流进行状态划分[8]。尽管基本图理论与三相位交通流理论目前还存在争议,但同步流的概念得到了普遍认可[9]。针对传统的统计学方法不能较好地划分交通流,根据层次聚类将交通流划分三相交通流;针对经典速度-密度关系模型已经不能较好适应目前交通流的复杂变化,提出利用机器学习中的局部加权回归以及BP神经网络对速度-密度关系曲线进行估计[10-11]。根据实测的交通流数据对以上方案进行分析验证,以期提高速度-密度关系曲线精度,为分析解决交通问题等提供理论基础,同时为速度-密度关系模型的确定提供新方法。

1 经典速度-密度关系模型

传统的交通流理论采用的速度-密度关系模型是基本图模型。它将道路交通流分为自由流和堵塞流2个交通相,速度随密度增加而减小。其中最常用的关系模型有Greenshields线性模型[12]、Greenberg对数模型[13]、Underwood倒指数模型[14]等。各个模型的数学表达式见表1.

Greenshields线性模型的数学形式简单,但是对于实际数据的拟合效果比较差。Greenberg对数模型将宏观模型和车辆跟驰模型联系起来,通常应用于交通密度较大的情况,但是会预测得到一个无限大的自由流速度,而且自由流速度和阻塞密度很难从实际数据中观测得到。Underwood倒指数模型的速度-密度关系为指数形式,主要应用于交通密度较小的情况,该模型的主要缺点是预测得到的阻塞密度无限大,而且不能从实际数据中观察得到阻塞密度。

2 基于层次聚类的速度-密度关系模型

基于上述分析,同时考虑到交通流的演变过程包含大量随机因素,各个车辆的运动特性存在差异,将所有的交通流特性用具有解析模型的经典模型进行描述具有一定的局限性。机器学习方法是一种非参数学习方法,它不必形成一个明确的假设来定义整个样本空间上的完整目标函数,它可以对每个查询样本形成一个不同的目标函数进行局部逼近[15]。通过研究北京市三环路实测数据发现,仅用速度分布标准差以及速度跃迁点等传统的统计学方法不能很好地对交通流相位进行划分,因此,文中提出一种基于层次聚类划分交通流状态,确定相位分界点的方法。该方法首先对道路实测数据进行预处理;再采用层次聚类法确定不同交通流相位临界密度;最后对各相位进行分段拟合得到相应的速度-密度关系。具体过程如下所示。

2.1 数据预处理

实验数据来源于RTMS检测器所检测的北京市三环路2012-06-03到2012-06-07(星期一至星期五)的道路交通流数据。其中前4 d的数据用于训练模型,最后1 d的数据用于模型验证。按照3个车道每2 min采集一次数据,每天采集2 160个数据,5 d共采集到10 800个数据,其中通道号1,2,3分别代表中央隔离带到外侧栏杆车道号。该道路交通流主要是小型汽车,偶尔会有大车通行。部分实测数据(以6月7日傍晚和深夜采集到的2組数据为例)片段见表2.

由于施工损坏、线路故障、处理错误、交通事件等种种原因,原始数据往往存在缺失现象;同时,由于微波检测器数据存储采用2 min额定时间间隔,超过这个间隔的点可信度大大降低,所以还存在时间误差很大的点。这些都给交通流数据的分析和深层次的数据挖掘带来不利影响,因此需要进行数据预处理以剔除错误数据,修复缺失数据等。根据表3的标准进行错误数据判别、剔除、修复等一系列预处理,将预处理后数据作为速度-密度关系模型参数估计等问题的输入[16]。交通流数据预处理前后对比如图1,图2所示。

比较图1,图2可知,通过剔除、修复错误实测交通流数据,可提高检测器数据质量,高质量的数据更加真实的反映出道路交通状态,对后续使用十分关键。

2.2 确定各相位临界点

对预处理后数据做统计分析,得到不同密度所对应的车辆速度分布标准差,见表4.分析计算结果发现,各密度下速度分布的标准差有多个跃迁点(如在5、7.33、10.33 veh/km)等,所以不适合以各车流密度下车辆速度分布的标准差作为划分依据。

考虑到机器学习中的聚类过程,其本质就是一种最优化过程,即通过一种快速运算使系统的目标函数达到一个极小值。层次聚类是通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树,它计算每一个类别的数据点与所有数据点之间的距离来确定它们之间的相似性,距离越小,相似度越高,并将距离最近的2个数据点或类别进行组合,生成聚类树。因此,为了克服统计学方法划分相位不准确的缺点,提高速度-密度关系模型的拟合精度,文中提出一种基于层次聚类的交通流相位划分方法,为每个相位计算出更为明确的临界密度。具体实施步骤为

1)初始化,也即是把每个样本归为一类,计算每2个类之间的距离,也就是样本与样本之间的相似度。

2)按照方差最小算法选取符合距离要求的类别,完成类间合并。

3)重新计算新生成的类与各个旧类之间的相似度。

4)重复2)和3)直到所有样本点都归为一类,结束。

通过层次聚类得到不同交通流状态的分界点,使用MATLAB编程计算可得到分类结果如图3所示,聚类结果的第1部分与第2部分的密度分界点为14.67veh/km,结合表4计算结果可知,其速度标准差分布在这个点也发生了明显的变化,所以以14.67veh/km作为自由流相与同步流相的密度分界点;第2部分与第3部分的分界点为105.33 veh/km,在该点附近速度-密度点图分布特别稀疏,而在离该点一定距离的左右两边都有大量的散点分布,说明在该点附近发生了状态跃迁,实现了从同步流到宽运动阻塞流的过渡,所以文中以聚类分界点作为同步流相与自由流相的分界点。

2.3 速度-密度关系标定

BP神经网络具有较强的非线性映射能力、自学习和自适应能力、泛化以及容错能力。数学理论证明3层的神经网络能够以任意精度逼近任何非线性连续函数,其自学习和自适应能力使其能够通过学习自动提取输出、输出数据间的“合理规则”,同时自适应的将学习内容记忆于网络的权值;最后将学习成果应用于新知识的能力(泛化能力)。将BP神经网络应用在交通流速度-密度关系曲线的估计中,能够得到更精确的速度-密度模型以及更好地反映出交通流的实际特点[17]。

局部加权回归(LWR)是一种非参数方法,在每次得到新样本时会重新训练临近的数据得到新参数值。需要预测的数据仅与训练数据的距离有关,距离越近,关系越大,反之越小;并且LWR可以有效避免欠拟合,减小了较远数据的干扰,仅与较近的数据有关。相比经典速度-密度,LWR能够更好地反映出速度-密度之间的关系,应用在交通流也能得到更精确的速度-密度模型以及更好地反映出交通流的实际特点。

通过2.2小节的方法,将实测交通流划分为自由流、同步流和宽运动阻塞流三相。为了给每个相找到更合适的交通流速度-密度关系模型,采用具有解析表达式的线性模型、对数模型、倒指数模型以及机器学习方法中的BP神经网络和局部加权回归等5种方法对每个相中的交通流数据进行拟合,并采用均方根误差公式(1)作为每种算法拟合效果的评判依据,旨在为每个相找到更合适的速度-密度关系模型。

RMSE=

ni=1(yi-)2

n

(1)

式中 yi为实际车辆速度,km/h;为预测的车辆速度,km/h;n为数据总量。

2.3.1 自由流状态分析

在自由流状态时,道路上车辆较少,车辆间的相互作用可以忽略不计[18]。驾驶员可根据自己的喜好来驾驶,有的可能为了赶路而选择高速行驶,有的可能为了舒适而选择适当的速度,所以自由流状态下的车速不太稳定,随机性比较大[19]。

采用5种模型对自由流状态下的速度-密度数据进行拟合的结果、均方根误差分别见图4、表5.

分析拟合结果可知,在自由流相,整体均方根误差都比较偏大,其中倒指数模型拟合效果最不理想,线性模型和对数模型拟合效果接近;与前3种有解析表达式的经典模型相比较,基于机器学习的BP神经网络和局部加权回归可取得更好的估计效果,而BP神经网络的估计效果最佳,其均方根误差较常用模型中估计效果最好的对数模型减小了1.01%,较同类型的局部加权回归方法估计效果减小了0.69%。这是因为在自由流相中,车辆行驶速度相差较大,随机性较强,显然BP神经网络这种学习模型不局限于具体的解析表达式,从道路上实际数据的特征出发,训练神经网络,提取车辆运动特征,建立起更适合自由流相的速度-密度关系模型,故在自由流相中可首选BP神经网络方法建立速度-密度关系。

2.3.2 同步流状态分析

随着道路上车流密度的增加,状态逐渐由自由流向同步流过渡。相对于自由流,处于同步流的车辆速度明显下降,车辆之间的相互作用越来越明显,车辆的速度也逐渐趋于稳定[20]。分别使用线性模型、对数模型、倒指数模型、BP神经网络以及局部加权回归对同步流状态下的速度-密度数据进行拟合,结果见图5、表6.

从图5和表6可知,处于同步流相中的车速比较稳定,相对于自由流来说车辆行驶速度不会出现太大波动,基于学习方法的BP神经网络和局部加权回归估计效果仍然优于经典模型。其中均方根误差最小的是BP神经网络,其均方根误差较常用模型中估计效果最好的线性模型减小了1.99%,较同类型的局部加权回归减小了0.59%.因此,在同步流相中,BP神经网络仍为建立速度-密度关系关系的首选方法。

2.3.3 宽运动堵塞流状态分析

在宽运动阻塞流中,车辆速度大大低于自由流中的车辆速度,其交通流量也将严重下降,车辆密度随之增加。在宽运动阻塞的下游分界面处,车辆有可能加速到自由流速度。而在宽运动阻塞的上游分界面处,来自自由流或同步流的车辆将减速。对于速度和密度关系的拟合结果见图6、表7.

车辆在宽运动阻塞流相中時走时停,速度分布比较散乱,根据拟合结果可知,机器学习模型较具有解析表达式的常用模型能够取得更好的估计结果。这是因为机器学习方法能够通过学习得到这一阶段的特征,精确捕捉交通流在微观层面上的变化趋势。而其中的局部加权回归的估计效果最好,其均方根误差较常用模型中估计效果最好的线性模型减小了3.14%,较同类型的BP神经网络均方根误差减小了2.43%.这是因为局部加权回归可以有效避免欠拟合,减小了速度变化较大数据的干扰,能够更加精确地反映出车辆密度的细微变化,所以在宽运动阻塞流相可选择局部加权回归方法拟合速度-密度关系模型。

2.3.4 最佳曲线

根据上述分析,基于机器学习的速度-密度关系模型较有明确解析表达式的经典速度-密度关系模型更适合描述北京市三环路实际道路交通流演化趋势;各相位的模型选用见表8,在自由流相以及同步流相采用BP神经网络;宽运动阻塞流相采用局部加权回归。最佳曲线拟合如图7所示。

3 模型验证

为了进一步验证文中所提模型的计算效果,采用北京市快速路2012-06-07的交通流检测器数据分别对文中所提出模型与基于基本图的模型计算结果进行仿真比较。其中,对于文中所提模型,首先利用层次聚类可求得自由流相与同步流相的密度分界点为14.6 veh/km,同步流相与宽运动阻塞流相的密度分界点为86.6 veh/km.然后基于第2小节分析结果对各相进行速度-密度关系模型选取,见表9;最后对速度-密度关系模型进行估计,如图8所示。

对于基本图模型,采用线性模型、对数模型、倒指数模型、BP神经网络以及局部加权回归对实际道路中的速度-密度关系进行计算,其结果见表10、图9.

将图8和表9结合图9及表10的计算结果进行比较可知,三相交通流的均方根误差较常用模型中拟合效果最好的线性模型减小了5.13%,较机器学习模型中拟合效果最好的局部加权回归模型减小了0.34%.分相位拟合更能反映出每个阶段的特性:自由流相拟合曲线均方根误差较基本图模型大,因为车辆行驶随机性太强,速度分布标准差特别大,导致曲线拟合结果不理想;同步流相拟合曲线均方根误差较基本图模型小,因为在同步流相车辆之间的相互作用越来越明显,车速逐渐趋于稳定,随机性减小,较小的速度分布标准差使其能够得到很好的拟合曲线;在宽运动阻塞流相拟合曲线均方根误差较基本图模型小,在宽运动阻塞流相车辆时走时停,速度都比较偏低,主要集中在20~35 km/h,速度分布相对比较集中,所以能够得到较好的拟合曲线。根据以上分析可得到三相交通流能够更好的刻画交通流的演变规律,能够清楚反映出每个阶段的特性。

4 结 论

1)提出了通过层次聚类分析确定各相位密度分界点的方法,得到更准确的三相交通流密度分界点,将交通流精确划分为三相。

2)仿真实验结果表明:在自由流相以及同步流相采用BP神经网络型估计速度-密度关系能够获得更好的拟合精度;在宽运动阻塞流相,采用局部加权回归效果最佳;基于机器学习的模型能够得到比经典模型更好的拟合精度,更适应复杂交通流的变化。

3)通过实测数据验证,发现分相位对交通流速度-密度关系进行拟合能够较基于基本图的经典模型取得更好的精度,并且能够清楚反映出每个阶段的特性,为精确刻画交通流的演变规律奠定基础。

参考文献(References):

[1] 高昆.基于交通流的实时交通状态辨识及事故风险预警模型研究[D].西安:长安大学,2019.

GAO Kun.Research on real-time traffic state identification and accident risk early warning model based on traffic flow[D].Xian:Changan University,2019.

[2] LIGHTHILL M J, WHITHAM G B. On Kinematic Waves.II.A theory of traffic flow on long crowded roads[J].Proceedings of the Royal Society a Mathematical Physical and Engineering Sciences,1955,229(1178):317-345.

[3]KERNER B S,REHBORN H.Experimental features and characteristics of traffic jams[J].Physical Review E Statistical Physics Plasmas Fluids & Related Interdisciplinary Topics,1996,53(2):1297.

[4]JIA B,LI X,CHEN T,et al.Cellular automaton model with time gap dependent randomisation under Kerners three-phase traffic theory[J].Transportmetrica,2011,7(2):127-140.

[5]TIAN J F,YUAN Z,TREIBER M,et al.Cellular automaton model within the fundamental-diagram approach reproducing some findings of the three-phase theory[J].Physica A Statistical Mechanics & Its Applications,2012,391(11):3129-3139.

[6]REHBORN H,KLENOV S L,PALMER J.An empirical study of common traffic congestion features based on traffic data measured in the USA,the UK,and Germany[J].Physica A Statistical Mechanics & Its Applications,2011,390(23-24):4466-4485.

[7]HERMANNS G,KULKOV I N,HEMMERLE P,et al.Simulations of synchronized flow in Tomtom vehicle data in Urban Traffic with the Kerner-klenov model in the framework of the three-phase traffic theory[M].Berlin:Springer International Publishing,2015.

[8]曹亞康,刘立英,王卫卫.城市快速路交通流速度-密度模型研究[J].物流技术,2013,32(7):166-169.

CAO Ya-kang,LIU Li-ying,WANG Wei-wei.Study on speed-density model of  traffic flow on urban expressway[J].Logistics Technology,2013,32(7):166-169.

[9]何蜀燕,关伟.城市快速路交通流状态跃迁的实证分析[J].中国公路学报,2008(5):81-86.

HE Shu-yan,GUAN Wei.Empirical analysis of phase transitions of traffic flow at urban expressway[J].China Journal of Highway and Transport,2008(5):81-86.

[10]张威虎,郭明香,贺元恺,等.一种改进的蝴蝶算法优化粒子滤波算法[J].西安科技大学学报,2019,39(1):119-123.

ZHANG Wei-hu,GUO Ming-xiang,HE Yuan-kai,et al.An improved butterfly algorithm optimizing particle filter algorithm[J].Journal of Xian University of Science and Technology,2019,39(1):119-123.

[11]孙晓永.基于BP神经网络的城市轨道交通合理规模研究[D].成都:西南交通大学,2018.

SUN Xiao-yong.Study on rational scale of urban rail transit based on BP neural network[D].Chengdu:Southwest Jiaotong University,2018.

[12]SHLAYAN N,CHALLAPALI K,CAVALCANT D,et al.A novel illuminance control strategy for roadway lighting based on greenshields macroscopic traffic model[J].IEEE Photonics Journal,2018,10(1):1-11.

[13]GREENBERG H.An analysis of traffic flow[J].Operations Research,1959,7(1):79-85.

[14]UNDERWOOD R T.Speed,volume,and density relationships:Quality and theory of traffic flow[J].Yale Bureau of Highway Traffic.,1961:141-188.

[15]徐剛,王磊,金洪伟,等.因子分析法与BP神经网络耦合模型对回采工作面瓦斯涌出量预测[J].西安科技大学学报,2019,39(6):965-971.

XU Gang,WANG Lei,JIN Hong-wei,et al.Gas emission prediction in mining face by factor analysis and BP neural network coupling model[J].Journal of Xian University of Science and Technology,2019,39(6):965-971.

[16]江竹,张琦,林勇,等.基于机器学习的中观交通仿真器模型参数标定[J].系统仿真学报,2007(24):5692-5695.

JIANG Zhu,ZHANG Qi,LIN Yong,et al.Machine learning-based parameters calibration of model in mesoscopic traffic simulator[J].Journal of System Simulation,2007(24):5692-5695.

[17]张磊,刘小明,来兴平,等.基于BP神经网络的急倾斜煤层耦合致裂方案优化[J].西安科技大学学报,2018,38(3):367-374.

ZHANG Lei,LIU Xiao-ming,LAI Xing-ping,et al.Optimization of coupled fracturing scheme for steeply inclined coal seam based on BP neural network[J].Journal of Xian University of Science and Technology,2018,38(3):367-374.

[18]武毅.基于三相交通流理论的元胞自动机模型研究[D].长春:吉林大学,2018.

WU Yi.Research on a cellular automata traffic flow model for three-phase theory[D].Changchun:Jilin University,2018.

[19]李磊,严敏,王涛,等.基于TPB的疲劳对汽车驾驶员不安全驾驶行为的影响[J].西安科技大学学报,2019,39(6):979-984.

LI Lei,YAN Min,WANG Tao,et al.Influence of fatigue driving on unsafe driving behaviors of drivers based on TPB[J].Journal of Xian University of Science and Technology,2019,39(6):979-984

[20]刘亚东.基于混沌理论和小波神经网络的拥挤交通流短时预测[D].重庆:重庆邮电大学,2018.

LIU Ya-dong.Short-term prediction for congested traffic flow based on chaos theory and wavelet neural network[D].Chongqing:Chongqing University of Posts and Telecommunications,2018.

猜你喜欢

交通流聚类神经网络
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
基于模糊聚类和支持向量回归的成绩预测
基于自适应神经网络的电网稳定性预测
基于流形学习的自适应反馈聚类中心确定方法
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
基于密度的自适应搜索增量聚类法
广州港大濠水道定线制引航要领
基于交通波理论的山地城市快速路拥堵研究
基于元胞自动机模拟沪金高速道路车流中的应用