基于支持向量机的短时交通流预测方法建模
2018-06-11杨鑫赵静孙雨晴
杨鑫 赵静 孙雨晴
摘要:文章根据交通流特性对采集到的交通流数据进行错误数据的鉴别、缺失数据的补充、以及遴选数据的归一化等预处理操作,构建基于支持向量机的短时交通流预测模型。通过对数据进行预测,并与实际测试数据进行对比发现,支持向量机回归模型在短时交通流预测方面是可行的。
关键词:交通流;数据预测;支持向量机
一、交通流基本特征参数
研究交通流状态需对实时交通流进行评价,即选取一些定性和定量指标,对交通流的基本特征参数进行比较全面的描述。
(一)速度
速度是指单位时间内所行驶的距离,通常用 v表示,单位是距离/单位时间。在交通流的状态描述中,速度通常有两种方法:一种是指在特定观测地点的速度,一般使用地点平均车速;另一种是指特定路段的车速情况,用于表现空间运行状态的为路段的区间平均车速。地点平均车速是指具体道路上的某一个特定断面在单位时间段内所通过的所有车辆的瞬时速度的平均值;路段的区间平均车速是指该路段的长度与在该路段所通过所有车辆的平均行驶时间之比
(二)密度
密度是指在单位长度的道路上某一时间瞬时所行驶的车辆的总数,通常用k表示,单位是辆/单位长度。由于密度是瞬时值,使用电子检测相关设备并不容易获得,同时也存在许多检测困难。因此,密度一般会用车辆道路占有率替换。车辆道路占有率主要包括空间上的占有率与时间上的占有率。
(三)交通量
交通量是指在单位时间内通过道路上的某一个路段截面的实际车辆数,单位为辆/单位时间,通常用q表示,用来衡量城市道路交通状态。
(四)宏观上交通流的三个基本参数模型
交通流的三个基本参数是指流量、速度和密度。它们之间的关系反映为交通流的速度-密度模型、速度-流量模型与流量-密度模型。道路交通流基本参数关系模型是指流量q、速度v和密度k之间的关系,也可以通过以下的关系表达式来说明:
二、支持向量机理论基础
(一)机器学习
机器学习是指专门研究计算机怎样模拟或实现人类的学习行为,以逐步完善自身的知识结构体系。该模型通过研究与挖掘数据之间的内在关系,找出其内部规律,并利用这种规律对未来的数据进行有效预测。
(二)经验风险最小化
机器学习的根本目的是实现期望风险最小化。回归估计解决问题的实质是通过构造可行的最优函数的机器学习过程。由于事先并不知道数据集的真实联合概率分布 F(x,y),因此测试样本与预产生两者之间的偏差即经验风险最小化准则的经验风险:
经验风险是指根据训练样本的数据和经验来确定的值,经验风险最小化原则是指用经验风险 Remp(w)最小化代替期望风险R(w)最小化来进行计算。
(三)支持向量机原理
支持向量机的基本思想是在高维空间中寻找超平面,从而达到样本分类的目的,并使分类的间隔达到最大。因而应满足:
利用对偶原理将拉格朗日函数转化为求解如下泛函数的优化问题:
三、支持向量机短时交通流建模
根据需要选择及补充相应数据,确定试验的数据源。文章采用的是早高峰时段的流量数据以及对应的时段。
(二)通过对数据的分析来确定核函数以及惩罚因子和损失函数等相关系数。
(三)通过构造最优化问题,并输入样本值和预测值进行求解:
(四)由最优解建立决策函数,并使用测试集数据对未来时刻的交通量进行有效预测。
(五)应用MATLABl软件中的LIBSVM工具进行训练求解,得出短时交通流预测结果。
四、仿真结果分析
结合文章使用的支持向量机的短时交通流预测模型,对某段路早高峰实测数据进行预测,预测结果如图1所示。
从上图可以看出,整个回归模型实现了良好预测,预测序列与原序列具有较好的拟合程度,并达到了一定的精度,这说明该模型具有可行性,并且在实际工程中具有良好的适用性。文章在探讨核函数对短时交通流的预测效果时,对预测有影响的滞后时段d控制不变,同时实验的数据选取的是早高峰阶段即6:00—8:00的五分钟流量数据,控制了其他影响因素后来说明核函数的变化对预测效果的影响。
參考文献
[1]姚智胜,邵春福.基于状态空间模型的道路交通状态多点时间序列预测[J].中国公路学报,2007(7):113-117.
[2]张学工.关于统计学习理论与支持向量机[J].自动化学报,2000(1):11.
[3]刘静,关伟.交通流预测方法综述[J].公路交通科技,2004(3):82-85.