APP下载

改进的支持向量机算法在短时交通流预测中的应用

2012-01-09唐世星

承德石油高等专科学校学报 2012年1期
关键词:交通流量搜索算法交通流

唐世星

(承德石油高等专科学校人事处,河北承德 067000)

改进的支持向量机算法在短时交通流预测中的应用

唐世星

(承德石油高等专科学校人事处,河北承德 067000)

把交叉验证和网格搜索算法引入支持向量机预测算法,建立了改进的支持向量机预测模型,并将其应用于短时交通流预测进行实证分析。以某城市道路的实时数据来对模型进行验证,预测结果表明了该模型的有效性。

短时交通流预测;交叉验证;网格搜索;惩罚因子

支持向量机是一种建立在统计学习理论的基础之上发展起来的一种较好的机器学习方法,它根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳方案,以期获得最好的泛化能力。同时,支持向量机将优化问题转化为凸规划问题,所得局部最优解即为全局最优解。支持向量机已成为机器学习的新热点,已被广泛应用于模式识别、分类、回归估计、聚类等领域,但在核函数参数、惩罚因子的选择等问题上没有统一的认识,仍需进一步研究。

交通流短时预测是实现智能交通控制和诱导系统的重要环节,由于交通流量受诸多因素影响,使其具有非线性和不确定性[1-2]。本文在支持向量机预测模型中引入交叉验证和网格搜索算法,优化惩罚因子和核函数的参数,建立了改进的支持向量机预测模型,并将其应用于短时交通流预测进行实证分析。通过与经典的GM(1,1)模型和改进的GM(1,1)模型比较,表明该预测模型具有较高的预测精度,可用于短时交通流预测。

1 改进的支持向量机预测模型

考虑l个独立同分布的样本数据点{xi,yi},其中xi∈Rm为输入,yi∈R为输出,i=1,2,…,l。支持向量回归机是将样本数据{xi,yi}通过非线性函数φ(x)映射到高维特征空间{φ(xi),yi},然后在特征空间进行线性回归,即构造最优线性函数:

其中,w为权重向量,b为偏置项,均为待定系数。

构造并求解如下优化问题:

由于实际问题往往是非线性的,所以必须对线性情况进行拓广,引入核函数K(w,x),通过求解其对偶问题来求解,即

上式(2)、(3)中的C为惩罚因子,是模型泛化能力和精度之间的一个参数,ε为不敏感损失值(精度参数)。求解可得最优解,选择的正分量,可得:

构造估计函数:

即可对未知样本进行回归分析。

支持向量机常用的核函数有线性、多项式、径向基RBF和Sigmoid核函数。核函数的选择及其参数的确定决定了回归分析的效果和复杂程度,由于核函数目前只有上述几种,所以比较有效的一种方法是:选定核函数,通过交叉验证[4]搜索算法优化惩罚因子和核函数的参数,进而训练支持向量机进行回归预测,通过回归的均方误差(MSE)和相关系数来评价回归效果,从而选择最优的惩罚因子和核函数及其参数。

2 实证分析

本文以文献[5]中的常熟市某无检测器交叉口每5 min测得的交通流量为研究对象,利用建立的模型预测其短时交通流。该交通流量数据为{11,10,11,13,15,16,16,15},取前7个数据训练模型,用第8个数据做模型交通流量预测;使用Matlab平台和LibSVM做模型的算法实现。通过选择不同的核函数,并使用交叉验证获得优化的惩罚因子和核函数参数,可得到对应的回归模型均方误差和相关系数。比较可得,当核函数为RBF核函数,核函数参数值为0.0625,惩罚因子值为90.509 7时,短时交通流预测效果最优;把文献[4]和[5]的预测与本模型预测结果相比较,结果见表1。

由表1可知,改进的支持向量机模型拟合精度非常高,可以用于短期预测,并且得到第8个时间点的预测交通流量为15.0313,与实际交通流量相比其相对误差仅为-0.21% <1%,显然预测效果比较理想。短时交通流量的原始数据与本模型及文献[6]的预测值对比图见图1。

表1 预测结果比较

3 结 论

本文结合交叉验证和网格搜索算法,优化惩罚因子和核函数参数,建立了改进的支持向量机预测模型。通过Matlab软件编程实现该模型,编写了通用算法程序,计算过程简单。通过对某无检测器交叉口测得的短时交通流量进行实证分析和比较,证明本文所提出的预测模型是合格的,并且拟合精度较高,预测效果良好,可用于短时交通流量预测。但是,本模型的预测方案是完全数据驱动的,是定量的,具有一定的局限性。如何在该方法的基础上附加一定的定性分析,弥补完全数据驱动的不足是需要继续研究的课题。

[1] 刘静,关伟.交通流预测方法综述[J].公路交通科技,2004(3):82-85.

[2] 张孝利,陆化普.短时交通流预测特性及实例分析[J].公路交通科技,2009(26):62-68.

[3] 徐启华,杨瑞.支持向量机在交通流量实时预测中的应用[J].公路交通科技,2005(22):131-134.

[4] 李锋.基于舍一交叉验证优化最小二乘支持向量机的故障诊断模型[J].振动与冲击,2010(29):170-174.

[5] 孙燕,陈森发,周振国.灰色系统理论在无检测器交叉口交通量预测中的应用[J].东南大学学报,2002,32(2):256-258.

[6] 柯凤琴.一种改进的GM(1,1)模型在交通量预测中的应用[J].承德石油高等专科学校学报,2010(12):44-47.

Application of Improved Support Vector Machine Algorithm in Short-term Traffic Flow Forecast

TANG Shi-xing
(Personnel Department,Chengde Petroleum College,Chengde 067000,Hebei,China)

The paper introduces cross-validation and grid-search method to optimize the prediction accuracy of Support Vector Machine models,the establishment of an improved Support Vector Machine prediction model,and applied to short-term traffic flow forecasting empirical analysis.The paper also uses the real time data of certain urban road to test the efficiency of the proposed model and the result is satisfactory.

short-term traffic flow forecasting;cross-validation;grid-search method;penalty factor

U495

A

1008-9446(2012)01-0034-03

河北省高等学校科学技术研究指导项目:Z2 010210

2011-10-19

唐世星(1981-),男,安徽砀山人,承德石油高等专科学校人事处,讲师,研究方向:数据挖掘和建模。

猜你喜欢

交通流量搜索算法交通流
改进的和声搜索算法求解凸二次规划及线性规划
基于XGBOOST算法的拥堵路段短时交通流量预测
基于加权组合模型的短时交通流预测研究
一种平稳化短时交通流预测方法
基于GA-BP神经网络的衡大高速公路日交通流量预测
交通流随机行为的研究进展
路内停车对交通流延误影响的定量分析
基于汽车接力的潮流转移快速搜索算法
基于逐维改进的自适应步长布谷鸟搜索算法
基于跳点搜索算法的网格地图寻路