基于时空特征分析的短时交通流预测模型
2016-05-22田保慧
田保慧,郭 彬
(河南交通职业技术学院 交通信息工程系,河南 郑州 450000)
基于时空特征分析的短时交通流预测模型
田保慧,郭 彬
(河南交通职业技术学院 交通信息工程系,河南 郑州 450000)
交通流预测的实时性和准确性直接影响到交通流诱导系统的高效性,是智能交通领域研究的热点。为了进一步提高短时交通流预测的精度,提出一种基于时空特征分析的短时交通流预测模型。在分析路段时空相关性的基础上,利用云模型改进的遗传算法对支持向量机的参数进行优化,得到最优的支持向量机模型,并实现短时交通流预测。以长春市局部路网的实测数据为基础,验证了所提出模型的有效性和可行性。
交通运输工程;交通量预测;时空特征分析;云模型;遗传算法;支持向量机
0 引 言
交通流预测在智能交通研究领域一直占据着举足轻重的地位,通过国内外研究学者的不断努力,形成了多种方法,如Kalman滤波法[1]、时间序列法[2]、神经网络法[3]、支持向量机[4]等。由于基于单一模型的预测方法都存在缺陷,国内外学者研究了很多基于组合理论的预测方法,如灰色神经网络预测方法[5]、基于小波包和最小二乘支持向量机的预测方法[6]、基于蚁群优化支持向量机的预测方法[7]等。
这些短时交通流预测方法在很大程度上都能得到满意的预测结果,但是普遍没有考虑路段时空相关性,预测因子考虑不全面,预测精度还有待于提高。为了进一步提高短时交通流预测的精确度,笔者一方面优化预测因子,充分考虑路段时空相关性,另一方面优化预测模型,通过云模型改进的遗传算法优化支持向量机模型,提出一种基于时空特征分析的短时交通流预测模型。以长春市局部路网的实测数据为基础,通过实例验证了所提出模型的有效性和可行性。
1 路段时空相关性分析
1.1 相似性分析
图1是同一日不同检测器的交通流量变化曲线,共28个检测器,随机选出4个检测器采集到的数据进行统计分析。从图1可以看出:在这些检测器中,部分交通流量变化曲线存在一定的相似性,这是路段截面相关性分析的基础。
图1 同一日不同检测器交通流量变化曲线Fig.1 Traffic flow change curve of different detectors on the same day
1.2 相关性分析
为了进一步了解各路段截面之间的相关程度,选择相关系数为相似系数,以相似系数作为聚类标准,采用系统聚类方法对路段截面数据进行分析。系统聚类分析法的具体步骤是:①数据的标准化处理;②确定相似系数;③计算类间距并进行聚类;④绘制系统聚类谱系图。
相关系数是描述变量间线性关系密切程度的数量指标。设路段截面交通流量统计数据矩阵为
(1)
式中:m为截面数;n为时间点数。
相关系数计算步骤如下:
1)对原始数据标准化变换
(2)
2)计算相关系数矩阵
R=QQ′
(3)
式中:R为相关系数矩阵;Q为标准化后的交通流量矩阵;Q′为Q的转置矩阵。
2 支持向量机
交通流预测是一种非线性回归问题,支持向量机(support vector machine,SVM)在解决这类问题上具有优势[8-9],因此选择SVM模型作为基础预测模型,其基本原理如下。
存在训练集:
式中:xi∈Rn为预测因子,即前几个时段的时空序列;yi∈R为预测值;i=1,…,l为训练集包含的训练样本数。
(4)
(5)
(6)
对上述问题进一步变换,将式(4)改写为
(7)
3 基于云模型的遗传算法优化支持向量机
在支持向量机的参数中,对模型的预测结果影响较大的是惩罚参数C、不敏感损失参数ε和核函数参数σ。同时考虑遗传算法存在一定的缺陷,如收敛速度慢,陷入局部最优,因此,采用基于云模型的遗传算法对支持向量机参数进行优化。
3.1 云模型
3.1.1 云的数字特征
图2 云模型及其数字特征Fig.2 Cloud model and its numerical characteristics
3.1.2 云发生器
云发生器有两种,一种是由定性到定量的过程,称为正向云发生器;另一种是由定量到定性的过程,称为逆向云发生器。如图3。
图3 云发生器Fig.3 Cloud generator
3.2 基于云模型的遗传优化支持向量机
基于云模型的遗传算法优化支持向量机参数的具体步骤如下[12],如图4。
图4 遗传优化支持向量机参数的流程Fig.4 Process of SVM parameters optimized by GA
1)初始化,随机产生一组支持向量机参数,并对其进行编码。
2)初始化种群,对种群规模、最大迭代次数等参数进行设定。
3)适应度评价。
4)以最大迭代次数为优化准则,如果满足条件则输出结果,即支持向量机的最优参数,从而得到训练好的支持向量机;如果不满足条件,则进行步骤5)。
5)执行选择、交叉和变异操作,生成新种群,再从步骤1)开始新一代遗传。
3.2.1 染色体编码与解码
3.2.2 适应度函数
适应度函数可以指导下一代的遗传和进化,是自然选择的唯一标准。通过合适地选择适应度函数能够提升算法的效率和解的质量。因为要实现SVM的参数优化,就要找到最优的模型,所以选择均方根误差函数为适应度函数。
3.2.3 个体选择
通过个体选择可以使适应度较高的个体遗传下来,并在代与代之间不断进化。笔者通过轮盘赌法进行个体选择,则个体被选择的概率为
(8)
3.2.4 交叉与变异
交叉的目的是保留父本的优秀基因,构成一个全新的个体。变异是为了保持种群的多样性,避免陷入局部最优。自适应遗传算法的交叉率和变异率函数绝对地保留了优秀个体,缺乏随机性,因此笔者采用正向云发生器对自适应交叉率和变异率函数进行改进,得到式(9)和式(10)。
(9)
(10)
4 基于时空分析和云遗传优化支持向量机的交通流预测模型
实现基于时空分析和云遗传优化支持向量机的交通流预测需要3个步骤:①训练样本的准备;②利用基于云模型的遗传算法对支持向量机模型进行训练;③利用训练好的支持向量机模型进行短时交通流预测。
4.1 训练样本的准备
训练样本的准备包括两个步骤:
1)路网数据的时空分析,得到具有时空特征的样本数据。
2)对样本数据进行归一化处理,将数据归一到区间[-1,1],公式如下:
(11)
式中:x为原始数据;y为映射后数据。
4.2 云遗传支持向量机的短时交通流预测
利用云遗传支持向量机进行短时交通流预测的流程如图5。
图5 云遗传支持向量机的交通流预测流程Fig.5 Process of traffic flow forecasting based on CGA-SVM
4.3 评价指标选取
为了评价所提出模型的有效性,选择相对误差XRE、平均相对误差XMRE、最大相对误差XMAXRE、均方根误差XRMSE为评价指标。相关表达式如下:
5 实例验证与分析
实验对象为长春市局部路网,如图6,取其中的12个路段断面进行分析。实验数据为2013年8月12—16日06:30—18:30的流量数据,每5 min采集一次,12个截面共产生720组数据,以前4天的576组数据作为训练样本,16日的144组数据为预测样本。在MATLAB7.0.1环境下设计云模型等相关程序,运用GA工具箱和LibSVM工具箱对支持向量机的参数进行优化。为了验证所提出的基于时空分析和云遗传支持向量机(时空CGA-SVM)预测模型的有效性,在实验过程中与云遗传支持向量机模型(CGA-SVM)和遗传支持向量机模型(GA-SVM)进行了对比和分析。
图6 长春市局部路网Fig.6 Local road network diagram of Changchun
首先进行路段时空特征的聚类分析,得到的聚类谱系图如图7。
图7 聚类谱系Fig.7 Hierarchical graph
由此可见,截面2,6,7,截面1,3,4,8,截面9,10,11,12均为相关性较强的一组。以截面4为例,对其进行短时交通流预测,实验分为两种情况:①对于GA-SVM模型和CGA-SVM模型,以截面4的历史流量作为输入变量;②对于基于时空分析的CGA-SVM模型,以截面1,3,4,8的历史流量作为输入变量。
在利用3种模型进行交通流预测之前,首先要对SVM参数进行优化。设置GA和CGA的种群规模、最大迭代次数均为m=30、Gmax=100,通过优化,得到最优的SVM参数结果如表1。
表1 支持向量机的参数优化结果
通过GA-SVM,CGA-SVM和基于时空CGA得到的预测结果和预测结果的相对误差如图8,3种方法的评价指标值如表2。
图8 预测结果和相对误差Fig.8 Prediction results and relative error
模型XMREXMAXREXRMSEGA-SVM0.12030.18182.1414CGA-SVM0.10040.16891.5284时空CGA-SVM0.74490.12820.8453
由图8可以看出,基于时空CGA模型的预测结果和实际值拟合的效果最好,同时,即使是流量变化较大的情况下,其预测结果的相对误差也能保持基本稳定。由表2可以看出,基于时空CGA模型的XMRE,XMAXRE,XRMSE是最小的,因此所提出方法的预测精度最高。
6 结 语
提出了一种基于时空特征分析的短时交通流预测模型,充分考虑了交通流数据的时空特征,同时结合云模型和遗传算法的优点,优化了支持向量机参数,得到了最优的交通流预测模型。与遗传支持向量机模型和云遗传支持向量机模型相比,所提出的预测模型提高了短时交通流预测的精度。实验表明基于时空分析和云遗传支持向量机的短时交通流预测方法具有有效性和可行性,同时,该短时交通流预测方法比较简单,易于实现,可以进行工程应用。
[1] 朱征宇,刘琳,崔明.一种结合SVM与卡尔曼滤波的短时交通流预测模型[J].计算机科学,2013,40(10):248-278. ZHU Zhengyu, LIU Lin, CUI Ming. Short-term traffic flow forecasting model combining SVM and Kalman filtering [J].ComputerScience, 2013, 40(10): 248-278.
[2] 张晓利,贺国光,陆化普.基于K-邻域非参数回归短时交通流预测方法[J].计算机应用与软件,2009,24(2):178-182. ZHANG Xiaoli, HE Guoguang, LU Huapu. Short-term traffic flow forecasting based on K-nearest neighbors non-parametric regession[J].JournalofSystemsEngineering, 2009, 24 (2): 178-182.
[3] 唐志强,王正武,招晓菊,等. 基于神经网络和混沌理论的短时交通流预测[J].山西科技,2005(5):117-120. TANG Zhiqiang, WANG Zhengwu,ZHAO Xiaoju, et al. Short-time traffic prediction based on neural network and chaos theory[J].ShanxiScienceandTechnology, 2005(5): 117-120.
[4] 杨兆升,王媛,管青. 基于支持向量机方法的短时交通流量预测方法[J].吉林大学学报(工学版),2006,36(6):881-884. YANG Zhaosheng, WANG Yuan, GUAN Qing. Short-term traffic flow prediction method based on SVM[J].JournalofJilinUniversity(EngineeringandTechnologyEdition), 2006, 36(6): 881-884.
[5] 陈淑燕,王炜. 交通量的灰色神经网络预测方法[J]. 东南大学学报(自然科学版),2004,34(7):541-544. CHEN Shuyan, WANG Wei. Grey neural network forecasting for traffic flow[J].JournalofSoutheastUniversity(NaturalScienceEdition), 2004,34( 7): 541-544.
[6] 姚智胜,邵春福,熊志华.基于小波包和最小二乘支持向量机的短时交通流组合预测方法研究[J]. 中国管理科学,2007,15(1):64-68. YAO Zhisheng, SHAO Chunfu, XIONG Zhihua. Research on short-term traffic flow combined forecasting based on wavelet package and least square support vector machines[J].ChineseJournalofManagementScience,2007,15(1):64-68.
[7] 刘艳忠,邵小建,李旭宏. 基于Lagrange支持向量回归机的短时交通流量预测模型的研究[J].交通与计算机,2007,25(5):46-49. LIU Yanzhong, SHAO Xiaojian, LI Xuhong. Short-term traffic flow prediction model based on lagrange support vector regression[J].TrafficandComputer, 2007, 25(5): 46- 49.
[8] 徐鹏,姜凤茹. 基于蚁群优化支持向量机的短时交通流量预测[J].计算机应用与软件,2013,30(3):250-254. XU Peng,JIANG Fengru. Short-term traffic flow prediction based on SVM optimized by ACO[J].ComputerApplicationsandSoftware, 2013, 30(3): 250-254.
[9] YAN Hongsen , XU Duo. An approach to estimating product design time based on fuzzy v-support vector machine[J].IEEETransactionsonNeuralNetworks, 2007, 18(3): 721-731.
[10] 李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-34. LI Deyi, LIU Changyu. Study on the universality of normal cloud model [J].EngineeringScience, 2004,6(8): 28-34.
[11] 杨朝晖,李德毅.二维云模型及其在预测中的应用[J].计算机学报,1998,21(11):961-969. YANG Zhaohui, LI Deyi. Planar model and ITS application in prediction[J].ChineseJournalofComputers,1998,21(11): 961-969.
[12] MIN Sunghwan, LEE Jumin, HAN Ingoo. Hybrid genetic algorithms and support vector machines for bankruptcy prediction[J].ExpertSystemswithApplications,2006,31(3):652-660.
[13] SRINIVAS M, PATNAIK L M. Adaptive probabilities of crossover and mutation in genetic algorithms[J].IEEETransonSystems,ManandCybernetics, 1994, 24(4): 656- 667.
A Short-Term Traffic Flow Prediction Model Based on Spatio-Temporal Characteristics Analysis
TIAN Baohui, GUO Bin
(Department of Traffic Information Engineering, Henan Communication Vocational Technology College, Zhengzhou 450000, Henan, P.R.China)
The real-time and accuracy of traffic flow prediction directly affect the efficiency of traffic flow guidance system, which is a hot issue of intelligent transportation system research. In order to improve the accuracy of short-term traffic flow forecasting further, a short-term traffic flow prediction model based on spatio-temporal characteristics analysis was proposed. On the basis of spatio-temporal correlativity analysis of section, the parameters of support vector machine (SVM) were optimized by using the genetic algorithm improved by cloud model. At last, the optimal SVM model was obtained, and it realized the short-term traffic flow prediction. Based on the measured data of local road network in Changchun city, the feasibility and effectiveness of the proposed model were verified.
traffic and transportation engineering; traffic flow forecasting; spatio-temporal characteristics analysis; cloud model; genetic algorithm; support vector machine
10.3969/j.issn.1674-0696.2016.03.22
2014-12-16;
2015-03-09
河南省交通运输厅科技计划项目(2014G21)
田保慧(1975—),女,河南郑州人,副教授,主要从事交通信息化方面的研究。E-mail:18341615@qq.com。
U491.1
A
1674-0696(2016)03-105-05