APP下载

基于改进LSSVM的节假日高速公路行程时间预测

2018-10-31李松江宋军芬王鹏杨迪

关键词:权重粒子预测

李松江,宋军芬,王鹏,杨迪

(长春理工大学 计算机科学技术学院,长春 130022)

高速公路作为现代化的交通基础设施具有高速迅捷的特性,而节假日免费放行政策造成的交通拥堵严重扰乱了出行者的时间安排,因此,科学有效的交通预测方法成为了能够有效缓解我国高速公路节假日交通拥挤的重要手段,而行程时间预测可以有效调节出行者的路径选择[1,2],节省出行时间[3-5]。

在行程时间预测方法的研究方面,统计模型和智能化方法不断被提出。李瑞敏等使用多源数据,建立了权重分配和神经网络的数据融合模型对行程时间进行预测[6]。BUSTILLOS等结合N-Curve与KNN方法,提出了单近邻与多近邻的行程时间预测模型[7]。Wosyka等布设车牌识别系统采集车辆行程时间,建立决策树模型预测行程时间[8]。Wang J等提出STDNN时空延迟神经网络模型预测行程时间[9]。

上述预测方法中的样本数据都需要依托采集设备完成,由于经济状况和高速公路的等级局限,导致数据获取困难、信息缺失。而收费数据易获取、质量高、实效性强,且能反映车辆行驶信息,因此本文采用获取方便的收费数据,对节假日高速公路行程时间进行预测。

1 数据来源

以第一类客车(7座以下轿车、客车)的行程时间作为预测主体数据,实验选取东北某省2012年至2015年高速公路部分路网法定节假日收费数据作为历史数据集,以2016年S1路段(19.68km)数据作为测试数据,预测该路段的行程时间。首先统计车辆从收费站i到收费站j的进入时间和离开时间,然后按照公式(1)计算从收费站i至收费站j平均行程时间,时间间隔为15min。

式中,Ni,j,m是时段m内驶入收费站i,驶出收费站j的车辆总数;tex(p,j,m)是样本数据中第p条记录中车辆驶入收费站j的时刻;ten(p,i,m)是数据中第p条记录中车辆驶出收费站i的时刻。

2 数据分析及分类

以东北某省高速公路为例,对其节假日数据集按照行程时间分布规律集进行分类。

(1)清明节数据分析

统计2012年至2016年清明节时期某路段的客车数据,按照公式(1)计算行程时间,得到图1的清明节期间行程时间的变化曲线。

图1 清明节行程时间变化

(2)劳动节数据分析

以2012年至2016年五一期间的客车收费数据为例,按照公式(1)计算行程时间,得到图2劳动节前、中、后期的行程时间变化曲线。

图2 五一行程时间变化

(3)国庆节数据分析

统计2012年至2016年的收费数据,按照公式(1)计算行程时间,得到图3国庆节期间行程时间的变化曲线。

图3 国庆节行程时间变化

(4)元旦时期数据分析

统计2012年至2016年这5年元旦期间的收费数据,按照公式(1)计算行程时间,得到图4元旦前期、中期、后期行程时间的变化曲线。

图4 元旦行程时间变化

(5)春节数据分析

统计2012年至2016年这5年春节期间的收费数据,按照公式(1)计算行程时间,得到图5春节期间行程时间的变化曲线。

图5 春节行程时间变化

通过上述对节假日数据的分布规律,将节假日历史数据集分为5个子集:清明节、劳动节、国庆节、元旦的晨高峰和春节中期的晨高峰为一类;清明节、劳动节、国庆节、元旦前期的午高峰为一类;清明节、劳动节、国庆节、元旦后期的晚高峰为一类;春节前期和后期的高峰为一类;节假日的平峰为一类。

3 高速公路行程时间预测模型

3.1 最小二乘支持向量机

最小二乘支持向量机是一种以支持向量机为基础的基于统计学理论的学习算法,使用最小二乘线性系统作为SVM算法的损失函数,将SVM中的不等式约束变换为等式约束,简化了模型计算的复杂性,提高了求解速度。

对于给定的训练样本集T=(xi,yi)(i=1,2,…,n),根据结构风险最小化原理,定义以下优化问题:

式中,ω为权重,γ为惩罚因子,ei为损失函数的松弛因子,b是偏置项。引入Lagrange函数解决上述优化问题:

式中,αi为Lagrange乘子。对式(3)中参数求偏导为零,得到:

联立求解方程组,得到LSSVM的回归模型:

式(5)中K(xi,xj)为核函数。

3.2 构造核函数

在LSSVM模型中,为了更好的拟合,引入了核函数[10],提高了模型的非线性处理能力,解决了维数灾难问题。

经典的核函数分为全局核和局部核,它们性能差异较大,各有各的优缺点。目前的建模方法中一般采用单个核函数,然而这样建立的模型预测精度并不高,为了使行程时间的预测更为准确,提出把全局核Sigmoid和局部核RBF结合起来,互补不足,形成一个性能良好的混合核函数,公式如下:

式中,Km为混合核函数;KS为Sigmoid核函数;KR为局部核函数;β为混合权重因子,用来平衡全局核和局部核对混合核的影响。根据Sigmoid核和RBF核的公式,公式(6)可变形为:

3.3 PSO算法

PSO粒子群算法是通过对一群随机粒子的迭代寻找最优解,在每一次迭代过程中,粒子通过寻找个体最优值和全局最优值更新自身的速度和位置[11]。

假设在一个由N个粒子组成的种群的D维搜索空间中,粒子i在D维搜索空间中的位置为xi=(xi1,xi2,…,xid),速度为vi=(vi1,vi2,…,vid),粒子个体最优位置为Pi=(Pi1,Pi2,…,Pid),粒子群体全局最优位置为Pg=(Pg1,Pg2,…,Pgd),其中i=1,2,…,N。迭代中,粒子通过个体极值和全局极值更新自身的速度和位置,更新公式如下:

式中,vtid+1和xtid+1分别是粒子在t+1代的速度和位置;vtid和xtid为粒子在迭代t次后的速度和位置;w为惯性权重;c1和c2为学习因子;r1和r2是两个随机数,取值范围为[0,1]。

传统PSO算法收敛速度快,但是容易陷入局部极值,搜索精度不高,为了优化PSO算法,一些研究者对惯性权重和学习因子进行了改进。

(1)惯性权重是为了更好地平衡算法的全局搜索和局部搜索能力,当w值较大时,粒子的全局寻优能力强,不易陷入局部极值,反之,则局部寻优能力强,收敛速度快。基于此,研究者对w采用线性递减策略,即:

这样虽然可以达到所需效果,但是也存在弊端,即在搜索前期如果无法找到最优值,那么在搜索的后期随着权重的减小,很容易使算法快速收敛到局部最优。

(2)学习因子是用来调节模型学习的步长,公式(8)中第二部分为粒子自我认知部分,为社会经验部分。当c1=0时,粒子失去了自我认知能力,只有社会经验,这时粒子有扩展搜索空间的能力,具有较快的收敛速度,但容易陷入局部最优;当c2=0时,则粒子之间没有社会信息,只有自我认知能力,这时由于粒子之间没有信息的共享,整个粒子群相当于都在进行盲目的随机搜索,收敛速度慢,以致于算法很难得到最优解。因此很多研究借鉴线性递减策略的思想,对c1采用线性递减策略,对c2采用线性递增策略,即:

这样虽然可以达到所需效果,但是也存在w一样的弊端。

3.4 改进PSO算法

为了让群体快速找到全局最优,本文将对PSO算法进行以下改进。

(1)二阶递减惯性权重

对惯性权重采用二阶递减策略,不但减少迭代次数,还降低算法陷入局部最优的概率,公式如下:

式中,wmax为最大惯性权重;wmin为最小惯性权重;t为当前迭代次数;tmax为算法最大迭代次数。

(2)二阶异步变化的学习因子

对学习因子c1、c2分别采用二阶线性递减和二阶线性递增策略,公式如下:

式中,c1max和c2min是学习因子c1和c2的最大值,c1min和c2min是学习因子c1和c2的最小值。

4 实验分析

4.1 改进LSSVM模型参数设置

在预测行程时间之前,需要先设置模型的各个参数:设置γ∈[0 , 1000];核函数σ∈[0 ,10];Sigmoid参数η∈[0 , 10],权重因子β∈[0 , 1];种群规模N=30,最大迭代次数tmax=300,惯性权重w∈[0 , 1],学习因子c1∈[0 , 2.5] ,c2∈[0 , 2.5]。

4.2 性能评价指标

采用定义均方根误差(RMSE)、平均绝对误差(MAE)与平均绝对误差百分比(MAPE)评价预测结果的精度。

其中,TP(h)为h时段的预测行程时间;TA(h)为h时段的实际行程时间;Nh为预测时段数。

4.3 预测结果分析

选取2012年至2015年的节假日行程时间数据作为训练数据集,以2016年的节假日数据作为测试数据集。

(1)数据集分类预测结果分析

按照第2节中介绍的分类方法对选取的训练集和测试集进行分类,使用改进后的LSSVM模型对行程时间进行预测,以国庆节为例,得到图6所示的国庆行程时间预测结果。

图6 国庆节行程时间预测结果

从图6可以看出,国庆各个时期的行程时间预测值的变化趋势与实际值基本符合,表明对节假日数据集分类是可行的。为分析分类后预测模型的有效性和准确性,使用AMPSO-MK-LSSVM模型对未进行数据集分类的节假日高速公路行程时间进行预测。结果对比如图7所示。

图7 行程时间预测结果对比

由图7可以看出:与未进行数据集分类的行程时间预测值相比,数据集分类后的预测效果更好,预测值与实际值更吻合。为体现数据集分类方法的预测精度更高,按式(16)-(18)计算RMSE、MAE和MAPE,结果如表1所示。

表1 两种方法预测结果对比

由表1可以看出,数据集分类后模型预测的RMSE、MAE和MAPE与未进行数据集分类的模型预测结果相比均有一定程度的减少,其中RMSE降低了0.47,MAE降低了0.16,MAPE降低了0.55%。由此可见,对数据集分类提高了模型的预测精度。

(2)不同核函数预测结果分析

分别使用Sigmoid核、RBF核和MK核的AMPSO-LSSVM模型对10月7日路段行程时间进行预测,得到如下图所示的预测结果。

图8 基于Sigmoid核的模型预测结果

图9 基于RBF核的模型预测结果

由图8-图10可以看出,基于混合核函数的AMPSO-LSSVM模型预测效果更好,预测值与实际值基本一致。而且Sigmoid核和RBF核的预测效果相差无几,残差范围分别为[-3.68,6.87]、[-3.19,7.46],但是混合核函数的AMPSO-LSSVM模型预测效果更好,残差范围仅为[-2.9,3.12]。由此看出:混合核函数涵盖了全局核和局部核的优点,相对于单核核函数,使用混合核函数的AMPSO-LSSVM模型的预测效果显著提高。

图10 基于混合核的模型预测结果

(3)改进PSO算法预测效果分析

对比使用PSO-MK-LSSVM模型和AMPSO-MK-LSSVM模型的预测效果,在预测分析前先设置PSO-MK-LSSVM模型的各项参数:惯性权重w=0.9,学习因子c1=1.5,c2=1.7,其他参数设置同4.1节中设置的参数一致。改进PSO算法和标准PSO算法在参数寻优过程中适应度随迭代次数的变化曲线对比如图11所示。

图11 参数优化算法对比

由图11可以看出AMPSO算法迭代至75次就趋于全局最优解,而标准PSO算法需要迭代至99次才能趋于最优解。为体现改进模型的预测性能,将其与PSO-MK-LSSVM模型进行对比研究,使用RMSE、MAE和MAPE作为评价指标,计算结果如表2所示。

表2 两种模型预测性能对比

由表2可以看出,改进模型预测的RMSE、MAE、MAPE值与传统模型相比均有一定程度的减少,其中均方根误差降低了0.54,平均绝对误差降低了0.22,平均绝对误差百分比降低了0.89%。由此可见,与标准PSO算法相比,改进的PSO算法有着较好的全局学习能力和局部学习能力,很大程度上改善了标准PSO算法早熟收敛的缺点,降低了迭代次数,加快了寻优速度,提高了预测精度。

5 结论

(1)提出对节假日数据集进行分类的方法,提高了模型预测的准确性。

(2)使用混合核函数代替LSSVM原有的单核核函数,提高了模型非线性处理能力,预测准确度有了很大的提升。

(3)使用改进后的PSO算法对预测模型的参数进行优化,加快了样本训练速度,提高了预测精度。

猜你喜欢

权重粒子预测
无可预测
选修2-2期中考试预测卷(B卷)
选修2-2期中考试预测卷(A卷)
权重常思“浮名轻”
基于粒子群优化的桥式起重机模糊PID控制
为党督政勤履职 代民行权重担当
基于粒子群优化极点配置的空燃比输出反馈控制
基于公约式权重的截短线性分组码盲识别方法
不必预测未来,只需把握现在
层次分析法权重的计算:基于Lingo的数学模型