基于PSO-BP的明挖法地铁车站施工工期预测
2022-05-13王军武潘子瑶
王军武, 王 靖, 刘 森, 潘子瑶
(武汉理工大学 土木工程与建筑学院, 湖北 武汉 430070)
据我国交通运输部最新统计,我国大陆地区城市轨道交通至2020年底开通运营里程超7500 km,车站4660座。相比于2015年,新增车站2403座,这说明我国地铁车站正处于建设的高峰期。其中明挖法车站因其结构适应性强,方法简单,技术成熟,且施工成本较低,是现阶段地下车站最常用的施工方法[1]。而制定合理的目标工期,是确保施工质量、施工安全,以及提高经济效益的前提。因此,提高预测明挖法地铁车站施工工期的准确度具有重要意义。
由于地铁车站易受周边环境和项目管理能力等众多因素影响,使得根据主观经验或运用线性回归法、灰色预测模型和蒙特卡洛法等传统预测方法往往难以满足工期预测的精度要求[2~4]。近些年,机器学习法被广泛运用于工程施工工期的预测研究。Cheng等[5]采用萤火虫算法(Firefly Algorithm,FA)与支持向量机(Support Vector Machine,SVM)相结合,建立了连续墙施工工期预测模型,但SVM存在固有缺陷,即便采用其他算法优化,也难以保证预测精度[6];祁神军等学者采用BP(Back Propagation)神经网络建立了工程施工工期预测模型[7],但传统BP神经网络存在易陷入局部极值和收敛速度慢甚至不收敛的缺陷。为解决传统BP神经网络的缺陷,周方明等学者利用遗传算法(Genetic Algorithm,GA)对 BP 神经网络进行优化,提出了工期风险预测模型[8],但GA算法存在收敛速度慢、参数设置多以及依赖初始种群选择的问题。相比于GA算法,粒子群算法(Particle Swarm Optimization,PSO)计算简单,需要的调整参数少,采用PSO算法对BP神经网络的初始权重和阈值进行优化,可以避免其陷入局部极值,同时提高收敛速度[9]。
鉴于此,笔者拟在识别得出影响明挖法地铁车站施工工期因素清单的基础上,采用粗糙集理论对其进行约简,建立工期预测指标体系,然后采用PSO算法优化BP神经网络建立工期预测模型,最后将该模型与BP神经网络、GA-BP模型进行对比分析。
1 明挖法地铁车站施工工期影响因素识别
本文选取《上海市建设工程施工工期定额(2011)》中对明挖法地铁车站施工工期的定义,即明挖地下车站工期为完成车站主体及附属结构的基坑围护、支撑、开挖、运输与回填,结构与防水等全部土建施工内容所需日历天数。通过分析国内外关于建筑工程施工工期影响因素的文献,参考GB 50722—2011《城市轨道交通建设项目管理规范》[10],结合典型的明挖法地铁车站工程的工程实践,将主要的施工工期影响因素分为四类进行分析,即工程内容、技术标准、建设环境和项目管理,再通过细分得到工期影响因素清单如表1所示。
表1 明挖法地铁车站施工工期影响因素清单
2 PSO-BP神经网络预测模型建立
2.1 粗糙集理论
现实系统中存在着大量不确定因素,导致影响因素中易存在冗余的属性指标,为提高模型预测结果的准确度,需要对输入的指标进行约简,删除冗余的属性指标。粗糙集理论(Rough Set Theory,RST)是由波兰数学家Pawlak提出的一种处理信息和知识不确定、不一致与不完整的数学工具[11]。属性约简是粗糙集理论的主要作用之一,它能在不改变信息系统分类和决策能力的基础上,删除系统中不重要、不相关的属性。因此,本文拟采用Rosetta软件实现粗糙集理论,用于选取影响明挖法地铁车站施工工期的主要属性指标。
2.2 粒子群优化算法
粒子群算法(PSO)是一种基于群智能方法的随机优化算法,它模拟鸟群的觅食行为,通过粒子间的信息共享和协同进化来寻找最优解[12]。PSO算法用一组随机粒子来模拟鸟群,每个粒子都具有速度和位置两个属性,由目标函数确定适应度值,由适应度值判断粒子的优劣。每个粒子将单独搜寻到的最优解与其他粒子共享,得到整个种群的最优解。在k次迭代中,第i个粒子根据个体最优解Pbesti和全体最优解Gbesti来更新自己的速度Vi和位置Xi,更新公式如式(1)所示,从而使自身的适应度值达到在预设空间中的寻优目标。相比于梯度下降法,PSO算法能够更好地进行全局寻优,从而避免模型陷入局部极值。
(1)
式中:ω表示惯性权重;c1为个体学习因子;c2为社会学习因子;r1,r2为[0,1]区间的随机数。在粒子飞行的过程中,为避免不必要的搜寻,需将粒子速度控制在一定范围内,即Vi∈[-Vmax,Vmax]。
惯性权重ω能够影响粒子的寻优能力,ω取值较大有助于加强粒子的全局寻优能力,取值较小可以提高粒子的局部寻优能力,相比于将惯性权重ω取为常数,随着迭代次数增加而递减的惯性权重能够逐步缩小粒子搜寻的范围,使粒子更快地达到寻优目标,通常情况下选取线性递减的惯性权重,权重变化公式如下:
(2)
式中:ωmax为惯性权重最大值,通常取0.9;ωmin为惯性权重最小值,通常取0.4;k为当前迭代次数。
在PSO算法优化BP神经网络之前,需要根据BP神经网络的拓扑结构确定PSO算法的粒子维度d,确定方法见式(3)。
d=mn+n+nl+l
(3)
式中:n为BP神经网络隐含层神经元数;m为输入层神经元数;l为输出层神经元数。
在PSO算法中,粒子需要根据适应度函数来判断自身的优劣,本文将均方根误差作为粒子的适应度函数,通过式(4)计算粒子的适应度值。
(4)
式中:M为输入学习样本总数;yij为第i个样本第j个输出节点的实际输出值;xij为第i个样本第j个输出节点的期望输出值。
2.3 PSO-BP神经网络计算流程
PSO-BP神经网络的本质是采用PSO算法替代梯度下降法,发挥PSO收敛速度快,能够全局寻优的优势,计算得出BP神经网络的初始权值和阈值,从而提高模型的训练速度和预测精度[13]。
本文PSO-BP神经网络的计算流程如下:
(1)确定BP神经网络结构。根据样本数据确定网络输入层及输出层节点数;根据不同隐含层节点数,BP神经网络的训练结果对比确定隐含层节点数;设置激活函数及训练函数。
(2)设置PSO算法参数。根据BP神经网络结构,设置PSO算法的粒子维度d、种群规模N、学习因子c1及c2、粒子最大速度Vmax和终止条件等基本参数,建立PSO-BP模型。
(3)初始化粒子的位置和速度。
(4)设置适应度函数。根据式(4)计算粒子适应度值。
(5)根据适应度值更新粒子的个体极值和粒子群的全局极值。
(6)更新粒子的速度和位置。
(7)确定是否满足终止要求。若满足,则终止迭代,将结果作为BP神经网络的初始权值和阈值,否则返回第三步。
(8)训练BP神经网络,当网络训练误差满足设定的允许误差或最大迭代次数时,停止训练,建成模型。
PSO-BP神经网络的流程图如图1所示。
图1 PSO-BP神经网络的流程
3 案例分析
3.1 数据收集
选取成都地铁11号线、成都地铁2号线、南京地铁2号线等56座明挖法地铁车站为研究对象,各车站施工工期影响因素的数据收集方式见表2。其中,X14,X15,X16,X20,X23,X24为定性指标,其余指标均为定量指标。
通过查阅设计资料、现场调研等多种方法获取定量指标的数据。邀请31位专家对各定性指标性进行打分,得到了有效问卷共29份。所有指标得分数据如表3所示。
3.2 数据处理
采用Rosetta软件内置的属性约简算法,删除每个一级指标下不相关或不重要的二级指标,挖掘出对明挖法地铁车站施工工期影响较大的预测指标。根据约简得到的预测指标,建立明挖法地铁车站施工工期影响指标体系如表4所示。将这11个工期影响指标作为预测模型的输入变量,从56个样本数据中随机抽取9组数据作为预测模型的测试集,其余47组数据为训练集[14]。
表2 各指标取值方式
表3 各指标得分与实际施工工期
3.3 PSO-BP模型参数设置
(1)BP神经网络结构
采用单隐含层BP神经网络,输入层神经元个数为11,输出层神经元个数为1。由于现阶段尚未有一个合理的解析式来确定隐含层神经元个数,因此本文采用经验公式(5)得出隐含层神经元数n在[5,13]范围内[15]。通过分析区间内不同n取值下BP神经网络的训练结果,确定隐含层神经元数为8。因此,本文BP神经网络的拓扑结构为11-8-1。
表4 明挖法地铁车站施工工期影响指标体系
(5)
式中:α为[1,10]区间的常数。
BP神经网络中的激活函数通常采用非线性sigmoid型函数及线性purelin型函数,其中sigmoid型函数可以将输出值控制在一个较小的区间内,包括对数S型函数(logsig)和正切S型函数(tansig),purelin型函数的输入输出值可以取任意函数。本文中间层神经元及最后一层神经元传递函数分别取logsig型函数和purelin 型函数,设置训练目标为0.001,最大训练次数为2000,训练函数为有动量的梯度下降法traingdm。
(2)PSO算法参数
根据式(3)计算,粒子维度d为105(=11×8+8+8×1+1),取种群规模N为40,最大迭代次数kmax为300,学习因子c1=c2=1.5,粒子最大速度Vmax为0.8,选取线性递减的惯性权重并根据式(2)计算。
(3)数据归一化处理
为避免数据量级有明显差异而影响预测模型的速度和精度,本文采用Matlab语言中的mapminmax函数对数据进行归一化处理。
3.4 仿真测算及结果分析
输入训练集样本数据,运用Matlab软件分别对BP神经网络模型,GA-BP模型和PSO-BP模型进行20次仿真测算,并就仿真结果进行对比分析。其中GA算法的群体大小取40,交叉率及变异率分别取0.64和0.01,最大迭代次数取300,网络的拓扑结构为11-8-1的3层神经网络[16]。
通过仿真测算,得出三种模型收敛速度最快的迭代误差曲线如图2所示,图中纵坐标为均方根误差,横坐标为迭代次数。由图中可以看出,BP神经网络模型迭代了2000次尚未达到训练目标要求的精度;GA-BP模型迭代了1407次后收敛于预设目标误差;而PSO-BP模型迭代了383次,均方根误差就达到了预设的训练目标。
图2 各模型迭代误差曲线
在20次仿真测算中,对各模型测试集的预测值与实际值的平均相对误差进行对比分析,得出各模型平均相对误差最小的预测结果如表5所示。由表5可知:BP神经网络模型、GA-BP模型和PSO-BP模型预测结果的最大相对误差分别为11.90%,6.50%,2.37%,平均相对误差分别为7.53%,2.92%,1.27%,平均绝对误差分别为41.39,15.74,6.97 d。
根据表5中的预测结果绘制各模型工期实际值与预测值的对比图(图3),从图3中可以很直观地看出PSO-BP模型的预测结果与实际值最接近,GA-BP模型次之,BP神经网络模型误差最大。结果证明经PSO算法优化的BP神经网络有效避免了传统BP神经网络易陷入局部最优的缺点,能够更快地收敛于目标误差,同时能够明显提高工期预测的预测精度,能更好地满足明挖法地铁车站施工工期预测的工程需求。
表5 施工工期预测结果对比 d
图3 各模型实际值与预测值对比
4 结 论
(1)通过将明挖法地铁车站施工工期的影响因素分为工程内容、技术标准、建设环境和项目管理四个层次,并进一步细化,得到了初步工期影响因素清单,然后以56座地铁车站为样本数据,采用粗糙集理论进行约简得到了可靠的工期预测指标体系。
(2)通过仿真测算,PSO-BP神经网络模型的收敛速度和预测精度都高于GA-BP模型,且远高于BP模型,有效地解决了传统BP神经网络存在的缺陷。
(3)案例分析表明,采用PSO-BP神经网络模型进行明挖法地铁车站施工工期预测,误差在合理范围以内,能为明挖法车站工程工期预测提供一种有效的方法。考虑到BP神经网络需要根据收集到的样本数据对模型进行训练,因此训练得到的预测模型对工程内容、技术标准及建设环境等工程特征在模型训练样本数据取值范围以内的车站工期预测精度较高,相反,对工程特征超出训练样本数据取值范围的车站,无法保证其工期预测精度,故需进一步探讨。