APP下载

基于IFA优化RBF神经网络的短时交通流预测模型

2022-09-05陈作汉

兰州理工大学学报 2022年4期
关键词:交通流量交通流萤火虫

曹 洁, 张 敏, 张 红,2, 陈作汉,2, 侯 亮,2,3

(1. 兰州理工大学 计算机与通信学院, 甘肃 兰州 730050; 2. 甘肃省城市轨道交通智能运营工程研究中心, 甘肃 兰州 730050; 3. 甘肃省制造业信息化工程研究中心, 甘肃 兰州 730050)

精准的短时交通流预测是交通管控和诱导的基础,是智能交通系统(intelligent transportation system,ITS)的关键技术之一.随着观测时间尺度的减小,交通流非线性、时变性、不确定性逐渐增强[1-2],预测困难增大,怎样提高短时交通流预测的准确性成为一个研究热点.为此,学者们在短时交通流预测问题上进行了大量研究以提高预测准确性[3-4],主要的模型方法可分为两大类[5-10],分别是基于数理统计的传统模型和基于非线性理论的智能模型.数理统计模型对平稳数据的预测效果较好,但并不适用于短时交通流数据,所以处理具有高度随机性的交通流数据主要应用非线性智能模型,主要包括BP神经网络(back propagation neuron network)预测模型、小波神经网络预测模型以及径向基(radial basis function,RBF)神经网络预测模型等.其中,RBF神经网络凭借其较快的学习速度和强大的数据拟合性能,在处理短时交通流问题上有明显优势.

RBF神经网络虽在交通流预测方面具有巨大优势,但同时由于模型超参数选取不当会致其无法收敛于全局极值点.因此,许多学者就如何优化RBF神经网络模型参数的问题进行了研究.Chen[11]使用改进的人工蜂群算法(artificial bee colony algorithm,ABC)优化RBF神经网络参数,提高了RBF神经网络的预测精度;Wei[12]将改进的引力搜索算法和RBF神经网络相融合,对交通流量进行了预测; Wang等[13]利用LSSVM和RBF神经网络对北京地铁的客流量进行了预测;陈明猜等[14]使用果蝇优化算法(fruit fly optimization algorithm,FOA)优化了RBF神经网络的超参数,提高了短时交通流量预测的精度.近几年凭借收敛速度快、搜索精度高而闻名的各种元启发算法在神经网络优化方面得到了广泛应用.目前,研究学者已在著名的多个优化问题上进行了测验,结论表明与其他的群生物智能优化算法相比萤火虫算法性能更加优越[15],具有良好的全局寻优收敛能力.萤火虫算法[16](firefly algorithm,FA)具有结构简易、调整参量少、易于实施的优点.各领域学者就萤火虫算法的改进做了许多研究,并将其应用在生产生活的各个方面.宋志强等[17]对基本萤火虫算法进行改进以提高搜寻BP神经网络的权阈值的精度.柳长源等[18]针对基本萤火虫算法中存在的问题对其进行改进,将其用于交通信号配时优化上.本文通过引入线性递减惯性权重和混沌机制来改进基本萤火虫算法,达到提高算法种群多样性和收敛速度的目的,结合RBF神经网络在处理具有高度随机性、非线性时间序列问题上的优势和萤火虫算法优良的全局搜索能力来预测短时交通流量.

综上所述,本文提出一种改进萤火虫算法(improved firefly algorithm,IFA)优化RBF神经网络(IFA-RBF)的短时交通流预测模型.对标准萤火虫算法的位置更新公式中引入线性递减惯性权重和搜索机制中增加混沌搜索,以改进FA后期存在的易陷入局部极值和种群多样性匮乏的问题,IFA被用于优化RBF神经网络的连接权值和基函数宽度,以提高RBF神经网络短时交通流预测精度.

1 萤火虫算法改进

萤火虫通过荧光亮度在整个搜索空间内互相吸引和移动,最终搜寻到最优解,算法结束.萤火虫之间相互移动吸引的数学描述如下:

xi(t+1)=xi(t)+β(xj(t)-xi(t))+αεi

(1)

其中:xi(t+1)是萤火虫xi第t+1次移动后的位置;α是步长因子,为[0,1]的常数;εi为服从正态分布的随机数;β是萤火虫xj对xi的吸引度,其表达式为

β=β0e-γrm

(2)

β0是初始位置吸引度;γ为光强吸收系数;m为常数,通常为2.

标准FA通过相互吸引和移动在整个搜索空间中搜寻最优解,但其在迭代后期容易在极值点周围反复振荡而无法收敛于极值点.另外,萤火虫种群多样性在迭代过程中会随着迭代次数的增加反而下降,增加了算法陷入局部极值的概率.针对上述缺陷,本文对标准萤火虫算法进行如下改进,避免其陷入“早熟”,提高其搜索精度.

1) 基于惯性权重的改进

由式(2)可知,萤火虫个体之间的吸引度会伴随着距离的减小而增大,导致在移动的过程中由于移动距离过大而造成寻优结果无法收敛在最优位置的问题.因此,在基本萤火虫算法的位置更新公式(1)中加入如下式所示的惯性递减权重,以提高算法后期收敛速度和寻优精度:

w=wmax-(wmax-wmin)t/MaxGeneration

(3)

其中:wmax、wmin分别为最大、最小权重;t为当前迭代次数;MaxGeneration为算法最大迭代次数.改进后的位置更新公式如下:

xi(t+1)=wxi(t)+β(xj(t)-xi(t))+αεi

(4)

通过上述改进,可使算法在迭代初期具有较大的权值,算法的全局寻优能力较强,避免陷入局部极值;算法迭代后期,权值逐渐减小,算法局部寻优能力增强,可有效避免因移动距离过大而反复振荡无法收敛于最优位置的问题.

2) 引入混沌优化机制

本文在上一步算法改进的基础上,引入混沌机制,运用混沌机制的随机性和遍历性特点,进一步提高算法寻优的精确度,丰富算法种群多样性和提高算法寻找最优解的遍历性,避免算法陷入局部最优解.

混沌优化[19]是将变量利用映射规则转换到混沌空间,运用混沌变量本身所具有的遍历和随机性特点进行寻优操作,进而将产生的解利用转换公式转化到优化空间.本文采用的映射规则是目前应用最为广泛的Logistic映射,表示为

(5)

(6)

其中:xd,max、xd,min分别表示第d维变量的上、下限.

萤火虫的混沌优化过程为:在每一轮迭代中,选取适应度函数最高的N个个体作为精英个体进行混沌优化操作,依照式(5)得到完全混沌化的序列,然后利用式(6)将式(5)所得混沌序列变换回萤火虫搜索空间,最终对精英个体进行混沌搜索,若搜索到更优解则予以替换.

2 IFA-RBF短时交通流预测模型

本文针对RBF神经网络隐含层神经元基函数宽度δj及隐含层和输出层之间的连接权值ωjp选取不当会降低短时交通流预测精度的问题,提出利用萤火虫算法优化RBF神经网络的基函数宽度和连接权值;另外,基本萤火虫算法在迭代过程中会出现易陷入局部极值和种群多样性匮乏的问题,故本文采用惯性递减权重和混沌搜索机制来解决基本FA存在的上述问题.本文构建的IFA-RBF神经网络短时交通流预测模型结构如图1所示.

图1 预测模型结构图Fig.1 Forecast model structure diagram

IFA-RBF模型交通流预测步骤具体如下:

Step1:交通流数据预处理.

Step2:设置FA算法中的光强吸收系数γ,光源处最大亮度β0,随机步长因子α,种群大小,最大运行次数.

Step3:利用每只萤火虫对RBF神经网络的基函数宽度δj和连接权值ωjp共同编码,这里采用实数编码.将训练误差倒数作为适应度函数,适应度越大荧光亮度越高.

Step4:利用式(3)计算惯性权重,根据式(4)更新萤火虫的位置,萤火虫个体随机移动.

Step5:更新萤火虫荧光亮度,将新的萤火虫位置向量代入神经网络适应度函数继续计算荧光亮度.

Step6:取萤火虫种群中前N个精英个体进行式(5)和式(6)的混沌操作并进行遍历搜索,若搜索到更优位置,则更新精英个体,否则直接转入下一步.

Step7:判断是否满足终止条件,满足跳出循环输出全局最优个体,如不满足返回Step3继续迭代.

Step8:输出最优解并解码,解码得到神经网络的最优参数并训练网络.

Step9:将测试样本放入训练好的神经网络模型进行测试,算法结束.

IFA-RBF短时交通流预测模型的流程如图2所示.

图2 IFA-RBF的算法流程图

3 实验结果与分析

3.1 实验数据来源及预处理分析

为验证本文提出模型的有效性,采用来自美国加州运输局运行监测系统提供的2016年5月1日至14日连续10个正常工作日的交通流量数据进行实验结果分析,每隔5 min进行一次数据采集,即每天可获取288组流量数据,实验数据总计2 880组.

本文采用sym8小波基函数对信号进行4层分解、降噪和重构,滤除原始交通流数据中包含的噪声成分,为预测模型提供高质量数据.经过降噪后的数据充分体现了交通系统的复杂性、非线性及不确定性,数据降噪前后的实验效果对比如图3和图4所示.

图3 降噪前交通流量Fig.3 Traffic flow before noise reduction

图4 降噪后交通流量Fig.4 Traffic flow after noise reduction

3.2 IFA-RBF模型结构确定

为确定RBF神经网络输入样本数,将采集到的一维交通流时间序列经过降噪处理后,利用C-C法获得的嵌入维数当作神经网络输入层节点数,经过重构后的多维时间序列为

X=[xi,xi+τ,…,xi+(m-1)τ]T(i=1,2,…,M)

(7)

式中:m为嵌入维数;τ为延迟时间;M为相点个数.实验结果得到τ=31,τw=178,最终计算得m≈7.实验表明,当神经网络输入层节点数等于嵌入维数m时,预测混沌时间序列的效果最好,故输入层节点数目定为7.隐含层节点数会对预测结果造成不同程度的影响,目前各领域学者对隐含层节点数的选定都是针对具体问题视情况而定,本文通过多次反复实验,最终将隐含层节点数定为11;另外,将网络输出层节点数定为1.因此,最终确定的RBF神经网络结构是7-11-1.其训练过程是在无需改变网络结构的前提下,通过随机设定结构内部参数来完成网络训练.为了提升预测精度,本文采用改进的萤火虫算法来优化RBF神经网络的参数,使神经网络的参数不再是随机生成而是通过算法选优来达到最佳设置.

3.3 IFA-RBF模型预测短时交通流量的结果与分析

本文将采集到的交通流时间序列经过小波降噪和相空间重构后划分成训练集和测试集两部分进行实验,实验中,选取5月1日到5月14日之间前九天工作日数据对IFA-RBF网络进行训练,将第十天数据用作测试,检验模型的有效性.通过实验,最终萤火虫算法的光强吸收系数γ取为1,种群规模为30,最大进化代数设为100,步长因子α为0.25,萤火虫之间的吸引度β为0.2,取种群中适应度函数最好的前10%作为精英个体,权重wmax和wmin分别为1.1和0.7,RBF网络学习速率为0.01.为了检验本文所提预测模型的效果,在同一数据集上利用5种模型进行预测,其中:模型1为Elman神经网络[20](Elman neuron network)模型,模型2为BP神经网络模型,模型3为RBF神经网络模型,模型4为基本萤火虫算法FA优化的RBF神经网络模型(FA-RBF),模型5为IFA-RBF神经网络模型.以上五种模型的预测结果如图5和图6所示.

图5 五种模型的实验结果对比图Fig.5 Comparison chart of experimental results of five models

图6 五种模型的实验结果局部图Fig.6 Partial graph of experimental results of five models

从图5和图6五种模型的预测效果对比可以看出,几种模型均能对交通流进行预测,但是预测效果相差很大.通过实验对比发现,Elman神经网络的预测曲线与实际交通流曲线差别很大,预测效果是五种模型中最差的;而RBF神经网络模型的预测结果相比Elman和BP神经网络模型而言,和实际曲线的拟合程度相对较高,即预测更加准确.FA-RBF和IFA-RBF模型相比其他三种模型来说,预测曲线和实际交通流曲线的拟合程度明显提升,预测精度提高,说明利用萤火虫算法改进RBF神经网络的参数可以有效提高短时交通流的预测精度.还可以得出,IFA-RBF的预测输出曲线和实际交通流曲线的拟合程度明显最高,说明其预测准确度相对其他四种模型来说达到最高.因此,可以得出IFA-RBF短时交通流预测模型能够很好地预测混沌时间序列.

3.4 模型评价

通过图5和图6的预测输出曲线不能客观公正地分析预测模型的预测效果好坏.为了更进一步直观地表达五种模型的预测结果,用均方根误差(root mean square error,RMSE)、平均相对误差(mean absolute percentage error,MAPE)和平均绝对误差(mean absolute error,MAE)量化评价各模型的预测结果(见表1).另外,这里将隐含层节点数也作为各种模型预测结果的影响因素进行了实验对比分析,表2和表3表示在其他参数不作改变的情况下当隐含层节点数目分别为9和13时的各模型预测结果对比.三种评价指标定义如下:

(8)

(9)

(10)

其中:yi为真实的交通流量;y′i为模型预测流量值;n为样本数量.

从表1~3对比可得出,神经网络隐含层节点数目的确能对预测精度产生一定程度的影响.表2表明,当神经网络隐含层节点数目少于最佳节点数时,各类模型预测误差明显增大,说明神经网络隐含层节点过少会导致网络出现“欠拟合”现象,网络训练不够充分,导致预测精度降低;另外,从表3可以得出,当神经网络隐含层节点数目多于最佳节点数时,各模型预测误差均有所降低,但是降低的效果并不明显,反而会造成由于隐含层节点数目变多导致的网络整体结构变复杂的问题;说明在利用神经网络模型预测短时交通流时,隐含层节点数目的选取对预测精度有一定程度的影响.通过表1可以看出,当各类预测模型隐含层节点数目为11时,本文所构建的IFA-RBF神经网络模型的预测精度相比较其他传统预测模型精度有了明显提升,其三个误差指标均达到最低,其RMSE是8.703 0,MAPE是10.722 9,MAE为6.962 5,FA-RBF模型预测效果次之;IFA-RBF预测模型的RMSE值相比Elman、BP、RBF、FA-RBF模型分别降低了4.029 4、3.365 3、2.829 3、0.724 3,说明本文提出的IFA-RBF预测模型可以很好地预测分析短时交通流量.

4 结语

本文提出一种基于IFA-RBF神经网络的短时交通流预测模型.该模型通过引入线性递减惯性权重和混沌搜索机制改进的萤火虫算法优化了基础RBF神经网络.通过改进方法使得萤火虫算法的全局和局部搜寻能力得到平衡,避免算法陷入“早熟”.该模型充分利用了萤火虫算法优秀的全局寻优能力和RBF神经网络强大的非线性拟合性能来提高短时交通流量的预测精度.通过实验对比表明,本文提出的模型相比传统RBF神经网络预测模型精度大为提高,说明通过FA对RBF神经网络的基函数宽度和连接权值进行选优,可以使RBF神经网络的结构参数设置达到最优,从而更好地预测短时交通流;另外,通过对基本FA的位置更新公式和搜索机制进行改进,可以进一步提高短时交通流预测精度,为智能交通系统的交通控制和诱导提供决策依据.

猜你喜欢

交通流量交通流萤火虫
基于LSTM的沪渝高速公路短时交通流预测研究
萤火虫
燕山路与曹雪芹西道交叉口运行有轨电车可行性研究
无人车对交通流的影响分析
萤火虫
广州港大濠水道定线制引航要领
交通流量增长下的空管安全预警系统研究
基于元胞自动机模拟沪金高速道路车流中的应用
抱抱就不哭了
夏天的萤火虫