基于SVM与神经网络组合模型的短时交通流预测研究
2022-08-31刘君
摘要:为提高短时交通流预测的数据拟合能力,提出基于支持向量机(SVM)与神经网络的组合预测模型SVM-BPNN、SVM-RBFNN。结合实际道路的短时交通流数据,将组合模型与其他典型预测方法实验对比。结果表明,本文提出的组合模型SVM-RBFNN预测精度更高,在短时交通流量预测方面具有明显优势。
关键词:短时交通流;神经网络;支持向量机
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2022)17-0006-03
短时交通流预测常用方法有历史平均、神经网络、深度学习、回归分析等[1],但因交通流影响因素复杂,近年来,组合预测模型成为短时交通流预测的研究热点。目前将统计回归模型、神经网络、遗传算法等组合用于交通流预测已有部分成果,傅成红等构建基于深度学习的短时交通流量预测模型[2];文献[3]采用SVR与ANN进行预测研究,证明组合预测效果更好[3]。
神经网络模型存在依赖大样本、容易陷入局部极小等问题[4]。支持向量机以统计理论为基础,在解决小样本模型识别中优势明显,但对于大数据样本问题容易发生维数灾难[5]。本文根据支持向量机结构风险最小化和神经网络的非线性泛化能力,提出一种基于支持向量机与神经网络的组合预测模型预测短时交通流。
1 短时交通流主要参数
引起交通流变化的因素很多,其中主要包括交通流量、车速、车流密度、道路占有率等代表性特征参数[6]。交通流量表示单位时间内通过某一道路截面的车辆数。是反映道路系统交通变化的重要参数,若[T]时间内通过的某一道路截面的车辆数为[N],则交通流量[Q]定义为:
Q=N/T
车速通常指汽车在单位时间内的行驶距离,一般包括区间和时间平均速度。假设某一路段长为[L],[n]辆车通过该路段用时分别为[t1,t2,…,tn],则区间平均速度定义为[v1=nL/i=1nti],时间平均速度定义为:[v1=1ni=1nvi]
车流密度刻画路段在某时刻的车辆数。若长度为L的路段在某一时刻共有N辆车,则车流密度表示为:
H=N/L
道路占有率指汽车占用道路比重,主要反映道路的拥堵程度。某一观测路段L上有n辆车长分别为[l1,l2,…,ln],则道路的空间占有率为:
[Rs=i=1nliL]
2 支持向量回归机
支持向量机(SVM)在处理小样本非线性问题时有比较好的效果。假设[xi∈Rn][yi∈Rn]分别为模型输入值与输出值,线性回归的主要目标是找到输入与输出之间的线性关系[f(x)=ωx+b]。短时交通流量预测即通过最优估计寻找回归函数[f(x)=(αi-αi*)K(x,xi)+b],其中x为交通流量影响因素,[K(x,xi)]表示核函数,[ω]和b的值通过如下凸二次优化问题求解:
[minω,b,εZ=12ω2+Ci=1n(ξi+ξi*)],[s.t.f(x)-yi≤ε+ξiyi-f(x)≤ε+ξi*ξi≥0,ξi*≥0,i=1,2,…,n]
上式中C为惩罚因子,用来刻画间隔带之外数据的罚数,ε为不敏感损失系数,[ξi、ξi*]为松弛变量。
在上式引入拉格朗日乘子构建拉格朗日方程:
[L(ω,ξi,ξi*)=12ω2+Ci=1n(ξi+ξi*)-i=1nαi(ε+ξi-yi+ωxi+b)][-i=1nαi*(ε+ξi+yi-ωxi-b)][-i=1nβiξi-i=1nβi*ξi*,i=1,2,…,n]
令式中各参数偏导数为0,并引入核函数,可将问题转化为对偶问题:
[minαi,αi*M=12i=1n(αi-αi*)(αj-αj*)K(xi,xj)+εi=1n(αi+αi*)-i=1nyi(αi-αi*)]
[s.t.i=1n(αi-αi*)=0,αi≥0,αi*≤C/n,]
求解出[ω,b],即可得回歸函数:[f(x)=(αi-αi*)K(x,xi)+b]。常用核函数有线性、多项多、径向基核函数等,本文使用径向基核函数:
[K(x,xi)=exp(-x-xi2/σ2)]。
3 人工神经网络
BPNN和RBFNN因其强大的容错及自适应能力被广泛应用于各个领域。在短时交通流预测中,BPNN结构包含输入层、隐含层、输出层,在训练过程中通过自学获得输入、输出数据间的对应关系,通过正向传播信号、反向传播误差,不断修正各层间权值。
假设[X=[x1,x2,…,xn]]为模型输入向量,[Y=[y1,y2,…,yt]]为输出值,隐含层各单元输入为[D=i=1sWijX-bj],其中W表示输入层与隐含层神经元间的连接权重,bj为偏置。激励函数采用Sigmoid函数:
[f(x)=11+e-x]。
RBFNN在短时交通流预测也有广泛应用,其隐层基采用Gauss函数连接网络,确定了径向基函数的中心点就能确定隐含层的连接关系。RBF具有局部逼近特点,在分类、收敛速度等方面优势明显,激活函数为:
[G(x)=exp(-x2/2σ2)]
其中[x2]为欧氏范数,[σ2]为方差。
4 基于SVM与神经网络的组合模型
单项预测模型有各自的优势,但也存在一定的局限性,Yu等人提出混合预测思想,构建组合预测模型获得更为精准的预测效果[3]。但是因交通数据量大,SVM在预测中容易发生维数灾难,BPNN及RBFNN也容易出现局部极小问题。基于此,本文提出一种基于SVM与神经网络的组合模型,结合单项模型的优点,提高整体预测精度和可靠性。
组合模型中需根据实际情况确定各模型最优权重值,本文采用经典组合方式,通过模型对上一时段的预测均方误差确定组合权重,预测误差越大相应权值越小,加权组合预测表达式为:
[y(t+1)组合=a?(t+1)svm+(1-a)y(t+1)]
其中a、1-a为组合模型的权重值,当[y(t)-y(t)-?(t)svm-?(t)=0]时,a=0.5;否则,[a=y(t)-y(t)/[y(t)-y(t)+?(t)svm-?(t)]],即不同单项预测模型之间有近似的绝对误差时采用平均线性组合,否则采用最优组合方法确定权重值。[y(t+1)组合]为组合模型预测值,[y(t)-y(t)]、[?(t)svm-?(t)]分别为上一时段单项模型预测绝对误差。
5 实验结果分析
5.1数据来源
由于交通流量是反映道路交通情况的重要指标,本文采用美国明尼斯达州德卢斯大学网站提供的交通流量数据,该数据集描述了罗切斯特某环路每天的交通流量情况,采样间隔为5分钟,每天的数据长度为288。以2018年12月1日~20日数据为训练样本,2019年1月1~10日数据为测试样本集,共有训练样本5750个,测试样本2860个。
5.2数据预处理
样本数据集的预处理是提高预测精度的重要部分,车道检测数据受检传感器、通讯设备等不确定性因素影响,会导致样本数据的冗余、缺失、存在噪声等情况,对数据预处理后能够有效调整异常数据和降噪,提高模型预测效果。本文采用限幅滤波法处理样本的异常数据:
[xi*=E(x)+D(x),ifxi-E(x)+D(x)>μxi,ifxi-E(x)+D(x)≤μ]
其中[xi*]为更新数据,[E(x)]、[D(x)]分别为数学期望和方差。
5.3评价指标
设[yt]为时间段[t]的交通流量预测值,[yt]为交通流量实际值。选用平均绝对百分比误差(MAPE)和均方误差(MSE)为误差分析评价指标。
(1)[MAPE=1nt=1nyt-ytyt?100%];
(2)[MSE=1nt=1n(yt-yt)2];
MAPE和MSE表示某一时间段的预测误差,n为整个预测周期的时间段个数。
5.4预测值与实际值对比
采用Matlab分别建立基于SVM和BP神经网络、RBF神经网络的短时交通流量组合预测模型,对同一组数据进行预测。SVM采用径向基核函数,惩罚系数C=2,不敏感损失系数ε=0.001;BP神经网络学习速率0.01,激活函数采用Sigmoid函数,组合模型[y(t+1)组合=a?(t+1)svm+(1-a)y(t+1)]中权重值[a=0.35]。
与单项预测模型对比,组合模型预测精度高于常规单项模型,SVM-BPNN和SVM-RBFNN两种组合模型的平均绝对百分比误差(MAPE)分别为5.4%、4.1%,均方误差(MSE)分别为10.31、9.14(见表1),准确率最大为86.4%,预测值的绝对误差均控制在[10-2]量级。说明组合预测模型具有较好的非线性时间序列特征数据的学习能力,综合两种模型的优点,预测精度和预测能力明显优于单项预测模型,其中SVM-RBFNN预测平均绝对百分比误差最小。
5.5预测精度与单项模型对比
在训练集与测试数据完全相同的情况下,分别运用支持向量机(SVM),BP神经网络(BPNN),径向基神经网络(RBFNN)三种经典模型单独对实际道路交通流量数据进行预测。结果表明,三种模型单独预测值的MAPE分别为10.32%、16.27%、13.89%(见图1),并发现在引入上、下游路段交通流数据后,SVM的交通断面流量预测精度大约提高6%,但仍低于组合模型。相比之下组合预测模型能够综合单项模型的优势,在收敛速度、精确度等方面均优于单项预测模型。
6 结论
构建组合模型对短时交通流量进行预测,利用最优组合原理将支持向量机与人工神经网络进行组合,并通过对原始数据的预处理,改进单项模型的预测性能和预测准确度。实验结果表明,基于支持向量机(SVM)与BP神经网络的组合模型(SVM-BPNN)以及SVM与径向基神经网络(SVM-RBFNN)的組合预测模型,能够综合单项模型的优点,降低模型对历史数据的依赖,其中SVM-RBFNN预测效果最好,预测误差MAPE平均控制在10%以内,结果优于单项预测模型,适合用于短时交通流预测。
参考文献:
[1] 刘学刚,张腾飞,韩印.基于ARIMA模型的短时交通流预测研究[J].物流科技,2019,42(12):91-94,102.
[2] 傅成红,杨书敏,张阳.改进支持向量回归机的短时交通流预测[J].交通运输系统工程与信息,2019,19(4):130-134,148.
[3] Yu B,Wang Y T,Yao J B,et al.A comparison of the performance of ann and svm for the prediction of traffic accident duration[J].Neural Network World,2016,26(3):271-287.
2016 林海涛.面向短时交通流量预测的神经网络算法研究[D].南京:南京邮电大学,2016.
[5] 沈洋,戴月明.支持向量机多分类技术研究[J].数字通信世界,2019(6):116-117.
[6] 杨文臣,李立,胡澄宇,等.不利天气对公路交通安全及交通流的影响研究综述[J].武汉理工大学学报(交通科学与工程版),2019,43(5):843-849,854.
收稿日期:2022-02-10
基金项目:本文系2020年广州城建职业学院校级科研项目-自然科学项目“面向短时交通流量预测的神经网络组合预测算法研究”(2020Yzk07)成果;2019年广东省教育厅省级质量工程教育教学改革与实践项目(GDJG2019254);2019广东省职业技术教育学会第三届理事会科研项目重点立项课题(201907Z10)
作者简介:刘君(1983—),男,副教授,硕士,研究方向为群与图、数学建模。