基于粒子群优化投影寻踪回归模型的短时交通流预测
2016-10-13邴其春龚勃文林赐云杨兆升曲鑫
邴其春,龚勃文,林赐云,杨兆升,曲鑫
基于粒子群优化投影寻踪回归模型的短时交通流预测
邴其春1, 2,龚勃文1,林赐云1,杨兆升1,曲鑫1
(1. 吉林大学交通学院,吉林长春,130022;2. 青岛理工大学汽车与交通学院,山东青岛,266520)
针对短时交通流数据的高度复杂性、随机性和非稳定性,为了进一步提高短时交通流预测的精度,提出一种基于粒子群优化投影寻踪回归模型的短时交通流预测方法。通过灰色关联度分析确定交通流预测影响因子,然后采用粒子群优化算法构建非参数投影寻踪回归模型,并利用上海市南北高架快速路的感应线圈实测数据进行实验验证和对比分析。实验结果表明:PSO-PPR模型的短时交通流预测效果明显提高,其平均预测精度分别比ARIMA模型和BPNN模型提高37.8%和27.2%。
智能交通系统;短时交通流预测;投影寻踪回归模型;粒子群优化;灰色关联度分析
准确、可靠的交通流预测信息是智能交通系统(intelligent transportation systems,ITS)的基础和关键,其预测精度直接影响着自适应交通控制系统以及动态交通诱导系统等多项ITS核心功能的应用效果。由于交通流预测信息的重要性,短时交通流预测一直是智能交通领域的研究热点,并已研究多种预测方法与模型。VOORT等[1]将ARIMA模型应用于短时交通流预测领域;WILLIAMS等[2]考虑交通流的周期性,全面而系统地阐述了季节性ARIMA模型在短时交通流预测中的应用;聂佩林等[3]为了克服单一预测模型性能不稳定的问题,提出了基于约束卡尔曼滤波的短时交通流量组合预测模型;于滨等[4]分析了K近邻算法的时间和空间参数,提出了4种状态向量组合的K近邻模型;DAVIS等[5]应用非参数回归模型进行短时交通流预测。此外,随着人工智能技术的发展,神经网络模型[6−8]、支持向量机模型[9−10]等被广泛应用于短时交通流预测领域。然而,由于短时交通流数据的高度复杂性、随机性和非稳定性,目前的预测方法普遍存在实时性差、寻优速度慢、维数祸根以及模型假设条件过多等不足,严重影响着短时交通流预测的实际应用效果。针对现有预测方法存在的问题,本文作者提出基于粒子群优化投影寻踪回归模型的短时交通流预测方法。首先通过灰色关联度分析确定预测影响因子,然后利用粒子群优化算法构建投影寻踪回归交通流预测模型,并采用上海市南北高架快速路的感应线圈实测数据进行实验验证,对模型的有效性进行测试。
1 投影寻踪回归模型
投影寻踪回归(project pursuit regression,PPR)模型是将投影寻踪技术和时间序列的回归分析结合起来的一种新型的统计方法,最初是由FRIEDMAN等[11]针对多元回归分析中的维数祸根问题提出来的。其基本思想是将高维数据通过某种组合,投影到低维(1~3维)子空间上,寻找出能反映高维数据结构或特征的投影,在低维空间对数据结构进行分析,达到研究和分析高维数据的目的[12]。投影寻踪回归模型的原理 如下。
设为维随机变量,()是一维随机变量,投影寻踪回归模型就是用若干个岭函数加权和的形式来逼近回归函数(),其数学表达式为
其中:G(Z)为第个岭函数;Z=∙=α11+α22+…+αx,为岭函数的自变量,表示维向量在投影方向α上的投影;α为第个投影方向,且满足;为岭函数的个数;β为第个岭函数对()贡献的权重系数。
投影寻踪回归模型的实现是对参数的步步寻优,关键是选取投影方向α、权重系数β和岭函数G(Z)的最优组合,使模型满足最小二乘极小化准则:
传统的PPR模型实现方法的实质是采用分层分组迭代交替的方法进行优化。然而,该优化过程计算复杂、编程实现难度较大,严重影响着PPR模型的推广应用。以往的研究大多采用遗传算法[13]对PPR模型的参数进行优化,但遗传算法存在对初始种群的选择有一定依赖性、收敛速度慢且未必得到最优解等问题。为此,本文采用收敛速度快、参数设置少的粒子群优化算法对PPR模型的参数进行优化。
2 粒子群优化算法
粒子群优化(particle swarm optimization,PSO)算法是由KENNEDY等[14−15]提出来的一种进化计算技术,源于对鸟群捕食行为的研究。设在维搜索空间中,存在个粒子构成的粒子群体,PSO优化算法采用速度−位置搜索模型,第个粒子的空间位置x=(x1,x2,…,x),=1,2,…,表示解空间的1个可行解,将其代入优化目标函数计算相应的适应度函数值来衡量x。第个粒子的速度v=(v1,v2,…,v)决定粒子在搜索空间单位迭代次数的位移。粒子通过动态跟踪个体最佳位置P=(p1,p2,…,p)和全局最佳位置P=(p1,p2,…,p)来更新自身的速度和位置,更新公式如下:
式中:为惯性权重系数;1和2为在[0,1]之间变化的随机数;1和2为加速因子。
3 基于PSO-PPR的交通流预测建模
投影寻踪回归模型是分析和处理非线性、非正态高维数据的一种有效的统计方法[16],鉴于传统优化方法的局限性,本文采用粒子群算法优化投影寻踪回归模型进行短时交通流预测。基于PSO-PPR的交通流预测建模步骤如下。
Step 1 确定预测影响因子。综合考虑短时交通流数据的时空相关性,利用灰色关联度分析方法确定预测影响因子x(=1,2,…,;=1,2,…,),和分别表示样本个数和预测影响因子个数。为消除不同量纲的影响,将x进行归一化处理:
其中,maxx和minx分别表示第个影响因子的最大值和最小值。
Step 2 线性投影。设投影方向为(=1,2,…,),则可得到一维投影值z:
Step 3 构造投影指标函数。在综合投影时,要求投影值z应尽可能大地提取x中的变异信息,即要求z的标准差S尽可能大,同时要求z与预测目标值y的相关系数绝对值|R|尽可能大,这样得到的投影值就可以尽可能多地携带预测影响因子x的变异信息,并且能够保证投影值对预测目标y具有较好的解释性[17]。因此,投影指标函数可构造为
其中:|∙|表示取绝对值;S为投影值z的标准差;R为z与y的相关系数。
Step 4 优化投影指标函数。当预测目标和预测影响因子的样本数据确定时,投影指标函数()只随投影方向的变化而变化。不同的投影方向反映不同的数据结构特征,最佳投影方向就是最大可能地暴露高维数据某类特征结构的投影方向。可通过求解投影指标函数最大化问题来估计最佳投影方向,即
这是以(=1,2,…,)为变量的复杂优化问题,常规方法处理较困难。本文采用粒子群优化算法进行优化,具体步骤如下。
1) 初始化粒子群优化算法的参数。包括粒子个数、粒子维数、迭代次数、加速因子、惯性权重系数等。
2) 以投影指标函数作为适应度函数计算每个粒子的适应度,并将其与自身的历史最佳位置适应度进行比较,若当前位置的适应度优于历史适应度,则将当前位置取代个体历史最佳位置。
3) 判断粒子群的全局最佳位置。将各个粒子的个体最佳位置适应度与群体的全局最佳位置适应度相比较,若高于群体的全局适应度,则将其位置取代全局最佳位置。
4) 判断终止条件。若不满足终止条件,则按式(3)和式(4)更新粒子的速度和位置,否则输出得到的最优解。
Step 5 短时交通流预测。将通过粒子群优化获得的最佳投影方向带入式(6)得到训练样本数据的投影值,根据预测目标值及其相应训练样本的投影值建立非参数投影寻踪回归预测模型。将测试样本进行归一化处理并计算其相应的投影值,利用得到的预测模型进行短时交通流预测。
4 实例验证
4.1 数据来源
实验数据来源于上海市南北高架长约10 km快速路上感应线圈检测器采集到的交通流数据。该路段设置有24个主线检测截面和30个匝道检测截面,分别安装有88个主线检测器和60个匝道检测器。实验数据为2008−09—2008−10间连续5个周一的24 h感应线圈数据,原始数据采样间隔为20 s。由于20 s采样间隔的交通流数据波动性较大,较少应用于短时交通流预测,本文分别将其合成为1,2和5 min数据进行预测分析。
4.2 预测影响因子确定
预测影响因子与预测目标之间存在确切的相关关系是保证交通流预测精度的前提。因此,本文综合考虑短时交通流数据的时空相关性,选取与预测交通流数据相邻的时间和空间数据作为候选影响因子,并利用灰色关联度分析确定最终的预测影响因子。以东侧主线NBDX16(2)感应线圈检测器2008−09−22采集到的5 min数据作为预测目标数据进行分析,其中NBDX表示南北高架东侧主线,16表示检测截面编号,②表示检测车道编号。灰色关联度分析结果如表1所示。
由表1可见:候选影响因子与预测目标的关联度均在0.9以上,说明候选影响因子与预测目标之间存在较强的相关性,能够有效保证交通流预测的精度。因此,本文选取上述8个候选影响因子作为交通流预测影响因子。
表1 预测影响因子灰色关联度分析
4.3 实验结果分析
为了评估本文方法在短时交通流预测上的实际应用效果,将东侧主线NBDX16②感应线圈检测器采集到的原始数据分别合成为1,2和5 min数据进行预测分析。选取2008−09−01采集的交通流数据作为拟合样本构建预测模型,将2008−09−08的交通流数据作为测试样本对模型的预测性能进行评估,共计1 440个1 min交通流数据,720个2 min交通流数据和288个5 min交通流数据。其中,粒子群优化算法的具体参数设置如下:粒子数为100个,粒子维数为8,加速因子1=2=2,惯性权重系数从0.9随迭代次数线性减小至0.4,最大迭代数为100次。通过粒子群优化得到的投影方向=(1,2,3,4,5,6,7,8)如表2所示。
为直观展现本文方法的短时交通流预测效果,图1~3所示分别为1,2和5 min交通流数据的预测结果。
由图1~3可见,本文方法得到的预测值与实际值之间拟合效果较好,说明本文方法对3种不同时间尺度的交通流数据均具有较好的预测效果。对比3种不同时间尺度交通流数据的预测效果可见:5 min交通流数据的预测效果最好,2 min交通流数据的预测效果次之;由于1 min交通流数据的波动性较大,少数样本的预测值与实际值之间误差略大,但总体能够满足短时交通流预测的需求。
为了对比分析本文方法在短时交通流预测上的优越性,选取具有成熟理论和较好预测效果的自回归移动平均模型(autoregressive integrated moving average model,ARIMA)和BP神经网络模型(back propagation neural network model,BPNN)作为对比方法,并采用平均绝对百分误差和均等系数2个指标进行评价。
1—实际值;2—预测值。
图1 1 min交通流数据预测结果
Fig. 1 Prediction results of 1 min traffic flow data
1—实际值;2—预测值。
图2 2 min交通流数据预测结果
Fig. 2 Prediction results of 2 min traffic flow data
1—实际值;2—预测值。
图3 5 min交通流数据预测结果
Fig. 3 Prediction results of 5 min traffic flow data
表2 投影方向结果
表3 3种模型的预测效果对比
其中:MAPE为平均绝对百分误差;E为均等系数;y表示时刻的实际值,表示时刻的预测值,为样本数。均等系数表示预测值与实际值之间演化趋势的相似度,均等系数越大,说明预测值与实际值之间拟合度越高。
表3所示为3种方法对不同时间尺度交通流数据的预测结果对比。由表3可以看出:不同预测模型的预测效果存在明显的差异,本文所构建的PSO-PPR模型对于3种不同时间尺度交通流数据的预测效果均优于对比方法。在平均绝对百分误差方面,其平均预测精度较ARIMA模型提高了37.8%,较BPNN模型提高了27.2%;在均等系数方面,本文方法的拟合效果同样优于另外2种对比方法。对于同一预测模型的不同时间尺度交通流数据,时间尺度越大,预测效果越好,这是因为随着时间尺度的增大,交通流数据的波动性减小,数据趋于平缓,预测模型能够更好地跟踪交通流数据的发展趋势。
5 结论
1) 综合考虑短时交通流数据的时空相关性,利用灰色关联度分析方法确定了交通流预测影响因子,极大地保证了模型输入数据的有效性。
2) 构建了适应于短时交通流预测的投影寻踪回归模型,并利用粒子群优化算法优化投影指标函数。
3) 以上海市南北高架快速路某路段为实验对象,分别将实测交通流数据合成为1,2和5 min数据进行实验验证和对比分析,验证了本文方法的有效性和优越性。
[1] VOORT M, DOUGHERTY M, WATSON S. Combining kohonen maps with ARIMA time series models to forecast traffic flow[J]. Transportation Research Part C: Emerging Technologies, 1996, 4(5): 307−318.
[2] WILLIAMS B M, HOEL L A. Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process: theoretical basis and empirical results[J]. Journal of Transportation Engineering, 2003, 129(6): 664−672.
[3] 聂佩林, 余志, 何兆成. 基于约束卡尔曼滤波的短时交通流量组合预测模型[J]. 交通运输工程学报, 2008, 8(5): 86−90. NIE Peilin, YU Zhi, HE Zhaocheng. Constrained Kalman filter combined predictor for short-term traffic flow[J]. Journal of Traffic and Transportation Engineering, 2008, 8(5): 86−90.
[4] 于滨, 邬珊华, 王明华, 等. K近邻短时交通流预测模型[J]. 交通运输工程学报, 2012, 12(2): 105−110. YU Bin, WU Shanhua, WANG Minghua, et al. K-nearest neighbor model of short-term traffic flow forecast[J]. Journal of Traffic and Transportation Engineering, 2012, 12(2): 105−110.
[5] DAVIS G A, NIHAN N L. Nonparametric regression and short term freeway traffic forecasting[J]. Journal of Transportation Engineering, 1991, 117(2): 178−188.
[6] 龚勃文, 林赐云, 李静, 等. 基于核自组织映射-前馈神经网络的交通流短时预测[J]. 吉林大学学报(工学版), 2011, 41(4): 938−943. GONG Bowen, LIN Ciyun, LI Jing. Short-term traffic flow prediction based on KSOM-BP neural network[J]. Journal of Jilin University (Engineering and Technology Edition), 2011, 41(4): 938−943.
[7] 吕进, 赵祥模, 樊海玮, 等. 基于生长自组织神经网络群的交通流预测[J]. 交通运输系统工程与信息, 2013, 13(3): 33−39. LÜ Jin, ZHAO Xiangmo, FAN Haiwei, et al. Traffic flow forecasting based on growing self-organized neural network group[J]. Journal of Transportation Systems Engineering and Information Technology, 2013, 13(3): 33−39.
[8] VLAHOGIANNI E I, KARLAFTIS M G, GOLIAS J C. Spatio-temporal short-term urban traffic volume forecasting using genetically optimized modular networks[J]. Computer-Aided Civil and Infrastructure Engineering, 2007, 22(5): 317−325.
[9] 傅贵, 韩国强, 逯峰, 等. 基于支持向量机回归的短时交通流预测模型[J]. 华南理工大学学报(自然科学版), 2013, 41(9): 71−76. FU Gui, HAN Guoqiang, LU Feng. Short-term traffic flow forecasting model based on support vector machine regression[J]. Journal of South China University of Technology (Natural Science Edition), 2013, 41(9): 71−76.
[10] WANG J, SHI Q X. Short-term traffic speed forecasting hybrid model based on chaos-wavelet analysis-support vector machine theory[J]. Transportation Research Part C: Emerging Technology, 2013, 27: 219−232.
[11] FRIEDMAN J H, STUETZLE W. Projection pursuit regression[J]. Journal of the American Statistical Association, 1981, 76: 817−823.
[12] 李祚泳, 汪嘉杨, 金相灿, 等. 基于优化算法的湖泊富营养化投影寻踪回归预测模型[J]. 四川大学学报(工程科学版), 2007, 39(2): 1−8. LI Zuoyong, WANG Jiayang, JIN Xiangcan, et al. Evolution algorithm based forecasting model for lake eutrophication using PPR[J]. Journal of Sichuan University (Engineering Science Edition), 2007, 39(2): 1−8.
[13] 李世玲. 基于投影寻踪和遗传算法的一种非线性系统建模方法[J]. 系统工程理论与实践, 2005(4): 22−28. LI Shiling. A nonlinear system modeling method based on projection pursuit and genetic algorithm[J]. System Engineering theory and Practice, 2005(4): 22−28.
[14] KENNEDY J, EBERHART R C. Particle swarm optimization[C]//Proceedings of the 4th IEEE International Conference on Neural Network, Piscataway: IEEE Service Center, 1995: 1942−1948.
[15] EBERHART R C, KENNEDY J. A new optimizer using particle swarm theory[C]//Proceedings of the 6th International Symposium on Micro Machine and Human Science. Piscataway: IEEE Service Center, 1995: 39−43.
[16] 徐飞, 徐卫亚. 岩爆预测的粒子群优化投影寻踪模型[J]. 岩土工程学报, 2010, 32(5): 718−723. XU Fei, XU Weiya. Projection pursuit model based on particle swarm optimization for rock burst prediction[J]. Chinese Journal of Geotechnical Engineering, 2010, 32(5): 718−723.
[17] 付强, 赵小勇. 投影寻踪模型原理及其应用[M]. 北京: 科学出版社, 2006: 144−145. FU Qiang, ZHAO Xiaoyong. Principle and application of projection pursuit[M]. Beijing: Science Press, 2006: 144−145.
(编辑 赵俊)
Short–term traffic flow prediction method based on particle swarm optimization projection pursuit regression model
BING Qichun1, 2, GONG Bowen1, LIN Ciyun1, YANG Zhaosheng1, QU Xin1
(1. College of Transportation, Jilin University, Changchun 130022, China;2. College of Automobile and Transportation, Qingdao Technological University, Qingdao 266520, China)
Considering the highly complexity, randomness and non-stability characteristics of short-time traffic flow data, a short–term traffic flow prediction method based on particle swarm optimization projection pursuit regression model was put forward. Traffic flow forecasting impact factors were determined by grey relational analysis. Then the projection pursuit nonparametric regression traffic flow forecasting model was constructed using particle swarm optimization algorithm. Finally, validation and comparative analyses were carried out using inductive loop data measured from the north-south viaduct in Shanghai. The results indicate that the proposed PSO-PPR model achieves better prediction performance than comparison methods. The average prediction accuracy of proposed method is 37.8% and 27.2% higher than ARIMA model and BPNN model, respectively.
intelligent transportation systems; short-term traffic flow prediction; projection pursuit regression model; particle swarm optimization; grey relational analysis
10.11817/j.issn.1672-7207.2016.12.041
U491
A
1672−7207(2016)12−4277−06
2015−11−05;
2016−02−03
国家高技术研究发展计划项目(2012AA112307);国家科技支撑计划项目(2014BAG03B03);国家自然科学基金资助项目(51308248, 51408257);吉林省科技发展计划青年科研基金资助项目(20140520134JH)(Project(2012AA112307) supported by the National High Technology Research and Development Program of China; Project(2014BAG03B03) supported by the National Science and Technology Pillar Program; Projects(51308248, 51408257) supported by the National Natural Science Foundation of China; Project(20140520134JH) supported by Jilin Province Science and Technology Development Plan of Youth Research Fund)
龚勃文,博士,讲师,从事智能交通系统研究;E-mail:gongbowen@jlu.edu.cn