APP下载

基于GM(1,1)+BP神经网络组合模型的路用性能预测研究

2022-03-24苏卫国吴启槟王景霄

关键词:灰色路面神经网络

苏卫国,吴启槟,王景霄

(华南理工大学 土木与交通学院,广东 广州 510640)

0 引 言

截至2020年底,全国公路总里程达519.81万千米,其中公路养护里程为514.40万千米,占公路总里程的99.0%,我国公路发展已进入管养为主的新时期[1].面对如此庞大的养护需求,各地方公路养护管理单位仍然保持着“坏了才修,哪坏修哪”的传统养护维修策略,这使得有限养护资金的使用效率大大降低[2].为缓解庞大的养护需求和有限的养护资金之间的矛盾,养护管理单位应从整体路网效益出发,根据路网内所有路段的养护需求进行决策优化,制定规划期内养护维修计划,优化分配养护资金.路面使用性能预测是网级路面养护决策中极为重要的一步,路用性能预测的准确与否关系到规划期内对路段的养护需求分析和养护优先级排序,进一步影响了养护方案制定的合理性.

目前常用路用性能预测方法主要有三类:确定性预测、概率性预测及灰色预测.确定性预测方面,国内学者孙立军等[3]提出沥青路面性能衰变方程,利用初始路面性能指数、路龄、寿命因子和形状因子定量确定路面性能指数,但复杂的结构行为分析导致计算量较大,在路面养护管理系统中运用较少;概率性预测引入马尔可夫模型,考虑路用性能状态转移的概率,如Kobayashi等[4]在路段劣化过程中利用马尔科夫概率法对车辙、平整度等指标预测,其测点劣化的马尔科夫转移概率由风险模型参数决定;刘伯莹等[5]应用马尔科夫建模方法提出用于北京市公路或类似条件的网级路用性能概率预测模型对PCI进行预测,概率性预测虽更贴合路面实际衰减趋势,但概率转移预测过程与结果往往不够直观.

在灰色系统理论中,将信息完全已知的系统称为“白色系统”,将信息未知的系统称为“黑色系统”,而将部分信息己知、部分信息未知的系统称为“灰色系统”.灰色预测是基于数学方法,对不完全信息系统进行推导和预测[6].GM(1,1)模型是最为常用的灰色预测模型之一.吴栋等[7]在灰色GM(1,1)模型上建立指数形式路面性能衰变模型,并用灰色关联度法对精度进行检验.俞蕾等[8]利用灰色理论方法建立路面车辙变化规律预测模型,具有较好精度;靳明等[9]基于灰色系统理论建立GM(1,1)方程对SRI、PSSI、RQI、PCI指标进行预测分析,并依据预测结果分段提出养护决策方案.

灰色理论建模对确定性信息利用与处理有限,同时缺乏误差反馈调整,导致误差较大且不可控.近些年,随着对生物脑神经元处理信息过程研究的深入,将输入和输出连接形成网络结构[10],神经网络预测在各行各业得到广泛运用,同样也被运用于道路性能预测以及造价预算等方面.神经网络拥有强大的信息处理能力,同时结合自学习、自组织和自适应特点对反馈误差校正调整,有效弥补灰色模型缺点[11].因此,本文在传统GM(1,1)模型的基础上,提出了GM(1,1)+BP神经网络组合模型对路用性能进行预测,并通过实际工程数据验证了组合预测模型的可行性与合理性.

1 GM(1,1)灰色预测模型

GM(1,1)是最经典的灰色预测模型之一,通过序列数据建立近似微分方程模型,无需大量数据,最少只需4个数据便可构成序列建立灰色模型.其建模过程为简化系统内复杂因素影响,将所有内部因素作为整体进行研究分析.GM(1,1)灰色路用性能预测模型建模思路为:路用性能指标数据作为因变量,时间作为自变量,研究路用性能指标数据按照时间构成的时间序列数据的变化规律,从而得出路用性能与时间的关系式,实现对未来路用性能的预测.按上述建模思路建立GM(1,1)路用性能预测模型,具体步骤如下:

1)根据历史路面检测数据,将PCI或RQI数据组成时间序列X(0):

X(0)={x(0)(1),x(0)(2),…,x(0)(n)}

(1)

2)为消除数据的随机性和波动性,对原始数据进行累加处理,累加法则见公式(2),得到了新的数据序列X(1):

(2)

X(1)={x(1)(1),x(1)(2),…,x(1)(n)}

(3)

式中,k为累加项数.

3)对步骤2)计算的新数据序列按照公式(4)进行紧邻均值计算,得到新序列Z(1),见公式(5):

Z(1)(k)=(x(1)(k)+x(1)(k-1))/2,k=2,3,…,n

(4)

Z(1)=[z(1)(2),z(1)(3),…,z(1)(n)]T

(5)

4)原始PCI或RQI时间序列X(0)与步骤3)中新生成的序列Z(1)共同构建GM(1,1)灰微分方程:

x(0)(k)+az(1)(k)=b

(6)

5)GM(1,1)灰微分方程参数a、b通过最小二乘法求解,计算A:

A=[a,b]T=(NTN)-1NTM

(7)

6)通过步骤5)求解出a、b后,建立一阶白化方程:

(8)

7)通过一阶白化方程的时间响应函数得到累加序列值模型:

(9)

8)由公式(9)可得到路用性能预测模型:

(10)

2 GM(1,1)+BP神经网络组合预测模型

2.1 BP神经网络

BP神经网络算法通过吸收神经网络理论精华部分而建立的多层前馈网络,由输入层、若干中间隐层和输出层组成,理论上一个3层的BP神经网络能无限逼近任意非线性连续函数.同时,作为单向传播网络,每一层神经元只接受前一层神经元信号,而同一层各神经元之间没有任何联系.这样的结构算法简单、可塑性强,如图1所示.隐层层数、各层神经元数及网络学习率等参数可根据具体情况进行调整和设置,也可通过算法寻找最优参数组合,灵活性和适应性较好[12-13].BP神经网络作为监督式学习算法,训练样本包含输入向量与期望输出值,其训练本质是正向传播信号和逆向传播误差两个过程不断循环,使权值、阈值不断调整,直至网络输出值和样本期望输出值之间误差减少到可接受程度或达到设定循环次数.训练后的神经网络对输入类似信息样本进行数据处理,最终输出非线形转换且误差最小的信息[14-15].

图1 BP神经网络结构

2.2 GM(1,1)+BP神经网络组合预测模型

根据前文以及实际应用发现GM(1,1)预测存在以下缺点:(1)模型短期预测效果较好,长期预测精度显著下降;(2)数据波动过大时模型无法准确反映系统内部发展规律;(3)无法根据预测结果与期望结果之间的偏差对模型进行修正.路用性能受多种因素影响和随机波动大,GM(1,1)灰色路用性能预测模型表现出较低预测精度.此时结合BP神经网络,利用其并行计算、分布式信息存储、强容错力等特点,既克服了误差无法反馈调整的缺点,又减少了在路用性能预测中因数据波动而影响预测结果精度的情况发生,更贴合路用性能衰减趋势,整个组合预测建模思路如下:

1)基于GM(1,1)灰色模型预测:收集道路路况检测数据,以时间作为自变量,通过对路用性能分项指标值构成的时间序列数据使用GM(1,1)灰色预测模型,得到规划周期内路段的路用性能分项指标灰色模型预测值.

2)基于BP神经网络模型修正:将GM(1,1)灰色模型得到的规划周期路段的路面性能分项指标灰色模型预测值和对应路段上一年路用性能分项指标值、路龄、交通荷载等级、地貌、技术等级、路面类型、面层厚度等作为BP神经网络模型的输入变量,通过BP神经网络模型对路用性能分项指标灰色模型预测值修正,得到规划周期内路用性能分项指标组合模型预测值,网络结构如图2所示.

图2 路用性能预测模型网络结构

3 数据收集与模型训练

3.1 数据集准备

3.1.1 数据来源

本文数据包含道路属性数据和路况数据两部分.其中道路属性数据来自“某市国省道公路网综合管理平台”,包含某市国省道路线名称、起止点桩号、路段类型、路龄、地貌、技术等级、路面类型、面层厚度、车道数、交通量等级、设计时速及所在地市区县,具体见表1.路况数据来自专业检测单位为某市制定的各年度路面技术状况检测报告,但由于数据存储原因,目前仅收集到2016-2020年公路检测数据,其中PQI项目仅包含PCI及RQI.

表1 某市国省道基础属性信息表

3.1.2 数据处理

由于在网络内部进行矩阵运算,需将字节特征转为数字特征.交通量等级特征值包括“特重”“重”“中”“轻”4种,4种取值间有明显顺序含义,该类特征称为有序特征.而地貌和路面类型两个特征,取值为“平原”“微丘”和“沥青”“水泥”,取值间没有顺序关系,该类特征称为无序特征.有序特征和无序特征转成数字类型特征的处理方式如下:

(1)有序特征处理:有序特征顺序对结果预测可能很重要,这时候不应忽略其顺序关系.对交通量等级的“特重”“重”“中”“轻”依次映射为4、3、2、1,公路技术一、二、三、四级依次映射为1、2、3、4,其转化示意图见图3.

图3 有序特征处理

(2)无序特征处理:无序特征顺序对预测结果并没有明显关系,通常采用独热向量编码(One-hot Encoding)处理.对“平原”“微丘”类地貌特征依次映射为(1,0)、(0,1);对“沥青”“水泥”的路面类型特征,依次映射为(1,0)和(0,1).

3.2 GM预测

根据上文组合模型预测思路,从国省道路况检测数据中选取2016—2019年路况信息,以时间做自变量对PCI、RQI值构成的时间序列数据使用GM(1,1)灰色预测模型,得到2020年预测值,将其与2020年实际值进行比较;由于篇幅有限,只选取了某市国省道部分路段PCI数据展示,详见表2.

表2 GM(1,1)灰色模型PCI预测

3.3 建立模型

3.3.1 训练数据

首先将前文经过处理的道路基础属性数据按路段类型、路龄、交通荷载等级、技术等级、路面类型、面层厚度、所在区县等基础属性完成初步划分;再按 1 km 整桩号划分养护路段,最终划为 2 288 个养护路段,并将每一段标好序号;然后汇总各路段的路龄、交通量等级、地貌、路面类型、面层厚度、车道数以及2019路况数据、2020年路况指标灰色预测值和真实值,得到BP神经网络训练数据,剔除异常数据后共得到 1 629 个训练样本,见表3.由于篇幅限制,故只取部分路段数据展示.

表3 BP神经网络数据集(PCI)

3.3.2 数据预处理与划分

1)数据预处理

对数据无量纲化处理,能保证训练模型时快速收敛.典型无量纲化处理方式有标准化和区间缩放两种方法.若特征值服从正态分布则可采取标准化方法;区间缩放法根据边界值情况将取值区间缩放至特定范围.标准化和区间缩放法计算如下:

(11)

(12)

2)训练集与验证集划分

将BP神经网络数据集分为训练集、验证集和测试集.其中训练集用来训练模型,对模型内部权重和阈值等参数训练修改;验证集用于调整超参数或检验模型收敛情况,以确定最优网络深度,或决定反向传播算法停止点;测试集用来测试模型数据并评价模型泛化性能,但其只限于对模型好坏进行评估,不能对模型调整优化.本文BP神经网络模型训练过程中,将数据集按照6∶2∶2的比例划分为训练集、验证集以及测试集.

3.3.3 模型训练

1)模型参数设置

输入层单元数为12,输出层单元数为1,隐层层数为1层,隐层单元数如下:

(13)

本文隐层单元数通过交叉验证后选择为6.网络模型的权值与阈值参数共12×6+6+6×1+1=85个.激活函数选取为最大值函数,网络结构具体信息如图4所示.

图4 网络结构的具体信息

epoch设置为100,优化函数设置为随机梯度下降,回调函数callbacks选择可提前停止训练的EarlyStopping,其中patience设置为5,阈值min_delta设置为0.01.

2)评价指标选择

根据模型预测结果将任务分为分类任务和回归任务.若模型预测是连续值,为回归任务;反之是分类任务.采取不同的评价指标评估回归任务或分类任务预测结果的好坏程度.路用性能预测显然是回归任务,回归任务中常用的评价指标包括评价绝对误差(Mean Absolute Error,MAE)、均方误差(Mean Square Error,MSE)、均方根误差(Root Mean Square Error,RMSE)、可决系数(R2).

3)训练结果

首先,对2016—2019年PCI数据序列使用GM(1,1)灰色模型得到2020年GM(1,1)模型PCI预测值;然后,将2020年GM(1,1)模型PCI预测值、2019年PCI值、路龄、交通量程度、地貌、技术等级、路面类型、面层厚度、车道数、设计时速、所在区县、路段类型作为样本自变量,2020年PCI真实值为样本因变量,构建BP神经网络模型训练数据;最后,经特征处理、数据集划分、模型参数设置及模型训练,得到GM(1,1)+BP神经网络PCI组合预测模型的损失函数下降曲线,如图5所示.图中纵坐标为均方误差MSE,横坐标为模型迭代次数,loss曲线为训练集的均方误差下降曲线,val_loss曲线为验证集均方误差下降曲线.模型在42轮以后停止训练,训练集均方误差下降至7.76,验证集误差下降至8.43.同样构建RQI的BP神经网络模型训练数据,得到GM(1,1)+BP神经网络RQI组合预测模型的损失函数下降曲线,如图6所示.其训练集均方误差下降至24.53,验证集误差下降至12.86.

图5 PCI组合预测模型损失函数下降曲线

图6 RQI组合预测模型损失函数下降曲线

4 组合模型验证与预测

4.1 结果对比与分析

为验证组合模型的合理性与准确性,选用GM(1,1)和BP神经网络模型进行对比分析.首先,利用BP神经网络预测时,将2019年路况数据及相关道路基础属性数据作为输入数据,同时将2020年实际路况数据作为期望输出值,以此训练模型得到2020PCI(RQI)作为因变量输出;然后,采用前文划分的测试集中的数据,得到2020年PCI(RQI)在GM(1,1)灰色模型、BP神经网络以及组合模型的预测值,如表4所示.

表4 组合模型预测、BP预测、GM(1,1)预测PCI、RQI值对比

分析计算三种模型的预测值与实际值误差,得到GM、BP神经网络和组合模型的2020PCI均方差分别为9.884、17.574和3.066,2020PQI均方差分别为11.233、18.519和5.317.对比三种模型的均方差可知:组合预测模型对PCI(RQI)预测效果优于仅使用BP神经网络模型或GM(1,1)灰色模型.GM模型适合短期预测,且对波动性较大、有缺失的数据列预测效果不理想,而BP神经网络的精确预测需要准确的样本输入数据以及相对准确的样本期望数据.因此,在BP神经网络前用GM模型对数据进行处理,使GM(1,1)+BP神经网络组合预测模型在路用性能预测上具有可行性和合理性.GM(1,1)+BP神经网络组合预测模型训练收敛时均方误差仍较大,组合预测值与真实值之间也存在差距,一方面是因为目前训练数据较少,而神经网络模型需大体量的数据;另一方面是因为部分属性数据空缺.随着数据不断积累和属性数据的补充完善,组合预测模型可不断自我修正,从而提高模型预测精确度.

4.2 养护规划期预测

以2年养护规划期为例,首先利用某市国省道2016—2020年PCI建立原始数据序列,对路网各路段使用GM(1,1)灰色PCI预测模型,得到2021和2022年PCI初步预测值;然后分别将其与对应路段的路龄、车道数、交通量等特征一起作为已训练完毕的BP神经网络PCI预测模型的输入向量,即得2021和2022年PCI最终预测值(RQI预测过程同理),养护规划期内路用性能预测如表5所示.

表5 国省道养护规划期路用性能预测

5 结论与展望

本文GM(1,1)+BP组合模型首先利用少量原始数据建立GM(1,1)预测模型,再用BP神经网络模型对GM(1,1)预测值训练优化,得到新的预测值.将此模型用于某市国省道路用性能数据预测,通过误差对比及分析表明组合模型将GM(1,1)模型和神经网络模型各自优点融合,比GM(1,1)灰色模型、BP神经网络模型预测准确度更高,提高了沥青路用性能预测精度.但由于缺少路面结构、基层结构等对路用性能影响较大的数据类别以及其他相关训练数据的不完整,后续研究中需不断积累数据和修正模型,提高预测的精度,才能使最终养护决策优化更加科学.

猜你喜欢

灰色路面神经网络
基于递归模糊神经网络的风电平滑控制策略
浅灰色的小猪
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
灰色时代
她、它的灰色时髦观
基于Q-Learning算法和神经网络的飞艇控制
感觉
安装在路面的交通信号灯
一款透水路面养护车