基于数据相似性的路段短期交通流预测方法研究
2022-11-18于德新常丽君郭海波田广东
于德新,常丽君*,郭海波,田广东
1 吉林建筑科技学院 交通工程学院,长春 130114
2 吉林大学 交通学院,长春 130022
3 山东大学 机械工程学院,济南 250061
路段交通流预测是交通精细化管理与控制需要面对的问题,准确地预测交通流量对于解决城市交通拥堵,进行交通分配和路径诱导有着重要的意义[1-3].目前,交通流预测可分为两类,一类是早期基于统计学相关理论对交通流进行预测,但此方法不适合长期预测[4];另一类是新兴智能模型,如人工神经网络,模型可以在没有先验知识的情况下解决问题,但在训练中需要很多原始数据,若数据总量不足则会导致预测精度不高[5].这些模型虽然有一定应用,但只考虑数据的非线性特征,没有考虑数据之间的相似性[6-7].基于上述问题,本文以数据相似性为基础,建立交通流预测模型.综合考虑数据相似性,针对相应路段的交通流相似程度得到相似系数以及不稳定性系数,参数选取交通转移率,预测精度较高,符合交通流实际的波动情况,成为交通管理的有效依据.
1 交通流相似性分析
RFID交通数据采集方法与其他交通数据采集方法相比,在实时采集速率、数据存储量和信息交互速度等方面具有优势,可按照数据的相似性对数据进行识别储存[8-10].交通流历史数据存在规律性,图1(a)所示的是厦门市某路段9月13日至16日4个相邻工作日的交通流量,图1(b)所示的是厦门市某路段9月7日、14日、21日和28日4个相同星期五的交通流量,相同工作日(除去节假日和大型活动日)的交通流相比于同一周内其他日期呈现出较高的相似性,尤其是在同一时间节点、同一路段高峰、低峰的交通流量具有相似的趋势,故在相似性分析之前,先以一周内某一天作为分类的依据,再按交通流高峰、平峰、低峰划分时段,相似性分析检测到的实时数据与历史数据.
(a) 相邻工作日交通流量
1.1 相似系数
按一天内交通流不同时段的特征对RFID交通流数据划分成m个数据集,将得到的数据集作为列向量输入矩阵.xi=[x1,x2,…,xm]T(i=1,2,3,…,n),将n天内交通量汇总得到n行m列矩阵K=[k1,k2,…,kn],则在n天之内不同向量间的相似程度用一个表示相似性的系数O来表征,计算如下:
O=∑n≥j>j≥1B(i,j)n(n-1)/2,|O|≤1
(1)
B(i,j)=B(j,i)=cov(ki,kj)/D(ki)×D(kj)
(2)
式中,B为矩阵K的相关系数矩阵,如所示.其中,cov(ki,kj)为ki,kj的协方差;D(ki),D(kj)分别表示ki,kj的方差.交通流相似性与相似性系数O呈现正相关.
1.2 不稳定系数
定义矩阵V=[E(k1),E(k2),…,E(kn)],其中各元素为对应时间段的平均交通量.定义不稳定系数R如下所示.
R=D(V)/E(V)
(3)
其中,D(V)表示V的方差;E(V)表示V的平均值.R越小,表示交通流量的差异性越小.
1.3 相似性划分依据
为确保预测结果的准确性,对应时段该路段交通流的相似性系数O和不稳定系数R需要满足规定的要求,获取历史经验数据,从而判断当前时间段内该路段的交通流相似性,具体的划分标准如下:O>0.9,R<0.1.本节是为了挑选出同一时段同一路段与历史数据相似度最高的交通流实时数据,数据相似度越高,计算交通流转移率越准确,预测模型越精准.
2 交通流转移率的计算
交通流在道路网中的移动本质上就是某个路段中的交通流转移到了其他路段,分析交通流在路网中具体的转移情况可以得到道路网的交通流特征,通过RFID技术可以在道路的出口和入口设置检测装置,对车辆进行电子识别,能够轻松获取交通流在路网中的转移情况,融合转移特征与历史数据,预测路网交通流量.使用RFID进行检测时,预先设置的检测器会识别车辆进入或离开路网中某一个路段的电子标签,处理这些检测数据能够取得车辆的OD信息,也可以通过对比各检测器采集的车辆标识符计算到达和离开的车辆数.检测周期的大小需要根据交通流转移路段之间的距离来设定,转移路段之间的距离通常以路网中路段间平均行程时间来确定检测周期.
在最小检测周期内,机动车离开某一路段进入与之相邻的路段,称为临接转移,此时其电子标签标记f2应赋值为1,并重新标示该车辆;如果车辆在最小检测周期内没有完成转移,则是非临接转移,记录该时刻的交通转移量以1 min为周期,该周期内每有车辆经过,则记录值T=T+1,直到检测周期结束.路段车辆的离开总数等于临接转移量和非临接转移量的总和,所以各路段间的交通转移量计算方法如下:
Pi=∑f1
(4)
Tri=∑f2
(5)
其中,
f1={1,T 0,ti (6) f2={1,id1=id2 0,id1≠id2 (7) 叠加交通转移量,可获取对应路段节点的OD矩阵: T=|0P12…P1j P210…P2j ………… Pi1Pi2…0| (8) 于是可获得路段Xi到目标路段Y(预测路段)的转移率为: PXi→Y=PXiY/∑PXij (9) 其中,PXiY表示路段Xi到路段Y的交通转移量;∑PXij是路段Xi的交通转移总量,即所有从Xi路段流出的交通量. RFID实时采集交通流数据并进行存储,通过上述方法将采集和储存的数据进行相似度区分,对比挑选与历史数据相似度较高的交通流实时数据,得到相邻和非相邻路段的交通转移率,行程时间,从而实现对交通流的预测. 在进行交通流流量预测之前,首先需要获取路段的交通转移率,如需要某时刻路段Y的交通转移率,则在t时刻任意路段到目标路段Y的平均交通转移率计算如下所示: Xi→Y(t)=∑Pt(Xi→Y)/n (10) 其中,Pt(Xi→Y)是在任意时刻t的交通转移率;n对应相似度匹配的历史数据的数量. 除了交通转移率还需要获得路段间的行程时间,任意路段与某路段Y间的行程时间,计算方法如下: τxi→Y=(∑(t1-t2)f)/∑f (11) 在已知转移率和行程时间的状况下,预测该路段的交通流量为: PY(t)=∑PXi(t-τXi→Y)Xi→Y(t) (12) 其中,任意预测时刻t,τXi→Y是历史数据中平均行程时间;PXi(t-τXi→Y)是在时刻t-τXi→Y路段Xi的交通流量;Xi→Y(t)表示历史转移率的平均值. 本文以厦门市城市道路的RFID数据为依据,选取的10条测试路段中包含信号控制与无信号控制两种类型,为保证路网中每条路段都有均等的机会被抽中,随机选取试验样本,设定预测步长,表1所示的是历史和测试数据量.其中,通过挖掘历史经验数据来检测历史相应时段交通流的相似性,测试数据用来预测,并利用实际路段交通流数据验证方法的可行性. 采用分层抽样的方式选取交叉口控制方式不同的路段,验证不同路段类型情况下模型的准确程度,其中测试路段3,6,8和10有信号控制,其余测试路段无信号控制.选取某个时段,选取随机路段进行交通流相似性验证,以确定在一天中各个时刻预测方法的预测效果.应当优先考虑的是历史数据的相似程度,历史数据采用测试路段对应时段的高峰流量,选取该测试路段近7日的交通流量历史数据集,见表1. 表1 实验数据量Table 1 Total experimental data 根据路段1为期4 h,间隔20 min的数据,可知实测交通量X与历史交通量=(X1,X2,X3,X4,X5,X6,X7)的相似度为S=(0.948,0.922,0.929,0.910,0.971,0.920,0.929),其中maxS(X,Xi)=0.971.经模型验证可知,与实测交通流数据相似度最高的是X5.故以X5时间序列的交通流数据作为对比分析. 表2 交通流量序列Table 2 Traffic flow sequence 依据本文所提出的预测方法,对测试路段1~10进行交通量预测,在所有的数据时间轴中随机抽取24 h的交通流数据,时间步长选取20 min,得出测试路段1的预测结果与其真实值的比较如图2所示.从图2中可以得到,二者差距不大.测试路段1相对误差分布如图3(a)所示,相对误差不超过1 %,说明预测精度较高.所有测试路段的平均绝对误差如图3(b)所示,计算所得的平均绝对误差为0.061. 图2 测试路段1预测结果Fig.2 Prediction results of test section 1 (a) 测试路段1相对误差 综合实际路网和试验结果,可知本文预测模型主要受交通状态以及交叉口控制方式的影响,其中,无论交通状态稳定与否,模型的预测精度较高,但模型在不同的交叉口控制方式情况下表现出不同的预测精度,对比无信号控制,有信号控制的路段由于波动性较大,预测精度会相对降低,但预测效果依然较好. 为验证其准确性,采用t检验方法确定算法的平均误差是否小于0.1,于是做假设H0∶μ≤0.2,H1∶μ>0.2,设定α=0.05,对预测结果右侧检验,计算得P=0.02,和均大于0.05.接受假设,说明平均预测误差<0.1,说明可以保证准确度. 本文所提出的短时交通流预测方法利用交通流数据具有相似性这一特征,结合实时和历史交通流数据,从而计算相应路段交通流量的转移比例,通过交通转移率与路段行程时间计算,对各路段交通流进行分配预测.通过厦门市实际数据进行验证,证明了本文所提出模型的可行性.结果表明,在交通流波动状态时,该方法具有较高的鲁棒性,预测精度较高,适用范围广,成为交通管理者的可靠依据.3 交通流预测模型
3.1 交通转移率
3.2 路段间行程时间
3.3 路段交通流量预测
4 实例验证
5 结论