APP下载

基于MIC-CNN的山区高速铁路土建工程造价预测模型

2023-08-21易梦雪秦张越夏子又

铁道标准设计 2023年8期
关键词:高速铁路山区卷积

易梦雪,曾 勇,秦张越,夏子又,贺 燚

(1.西南交通大学土木工程学院,成都 610031; 2.西南交通大学高速铁路线路工程教育部重点实验室,成都 610031)

引言

高速铁路工程项目投资分析是贯穿铁路工程建设各个阶段的一项重要工作。在高速铁路项目预可行性研究阶段,实际发生费用在工程总造价中的占比很小,却对工程项目最终造价影响甚大[1-2],因此,高速铁路预可行性研究阶段的工程造价估算需要力求准确。而土建工程造价通常是高速铁路工程总造价中占比最大的一项,对于高速铁路土建工程造价的准确估算尤为重要。对于山区高速铁路而言,土建工程项目建设周期一般较长,工程复杂,工程造价影响因素众多,而早期研究方案可用于造价分析的信息量少,故预可行性研究阶段对山区高速铁路土建工程造价进行快速准确估算非常困难。

为得到铁路或其他工程造价估算较精确解,学者们尝试采用回归分析、专家系统和新型预测技术等方法进行相关研究。孔令鹤[3]将回归分析应用于建筑物造价估算,并通过计算机模拟实现;曾学贵等[4]通过专家系统快捷估测铁路工程造价, 但较依赖于专家经验,其准确度和有效性有限;CHEVROULET[5]等提出一种新型造价估算模型,该模型通过累加所有单项工程造价随机数来估算项目的总造价,但模型需建立在大量历史统计数据上,且单项工程数量繁多,因此,模型结构复杂,难以准确预测。

随着人工智能知识库的发展,具有强大的自适应性和学习能力的神经网络算法逐渐被应用到投资估算领域。WILMOT[6]将BP神经网络应用于公路工程造价,但依赖于数据库的时效性和准确性;邓雪松[7]在2000年提出一种改进的 BP 神经网络模型用于预测在预可行性研究阶段的单线铁路建设投资,但预测模型仍以累加单项工程造价来估算总造价,虽能进一步提升预测精度,但模型较为复杂;段晓晨[8]在提取显著性影响因子后采用BP神经网络预测工程造价,但仅为隧道部分工程造价,缺乏整体性。虽然BP神经网络已应用于铁路、公路工程造价估算,相关估算模型的高效性和准确性均有待提高。

卷积神经网络(CNN)相较于BP神经网络具有自学习功能,且能高速寻找优化解,已广泛应用于非线性预测领域。AHMED[9]和SOH[10]都利用卷积神经网络识别图像应用于医疗领域; KHARE[11]和LIU[12]在人类情绪和行为上利用卷积神经网络进行识别;ASMAA[13]采用深层卷积神经网络对新型冠状病毒肺炎进行分类;LIAO[14]通过提出双流卷积神经网络提取图片处理的命令流;TIAN[15]、QI[16]和袁华[17]均通过将卷积神经网络与长短期记忆人工神经网络相结合进行预测,而ZHU[18]和ZHANG[19]通过改进卷积神经网络使其自身具有时序效果,从而进行交通流预测。在山区高速铁路预可研阶段进行土建造价估算时,众多影响因素对造价的影响是非线性的,而CNN中强调空间窗口的卷积核可处理非线性数据,也可通过共享卷积核处理多维数据,因而,CNN可适用于山区高速铁路土建工程造价估算。

此外,山区高速铁路土建工程造价预估算问题根本上是一种函数回归问题,而支持向量回归(SVR)是支持向量在函数回归领域的应用,但SVR进行预测时存在核函数及参数选择困难的问题,可认为是弱学习器,常采用Adaboost算法进行多次弱学习器的学习训练,从而建立起较强的映射关系,因此,Adaboost与SVR算法被结合起来广泛应用于预测领域。例如,周子东等[20]将Adaboost-SVR模型应用于风电项目造价预测中;丁玉剑等[21]利用Adaboost-SVR模型对直流杆塔间隙操作冲击电压进行预测。本文在研究时也将其作为一个比较模型。

山区高速铁路土建工程造价与很多因素相关,但不同的影响因素与造价的相关性不同,相关性较弱的影响因素会影响最终预测结果的准确性,因此,需要选取相关性较高的关键指标来进行后续预测。虽然在预可行性研究阶段进行山区高速铁路土建工程造价预测十分困难,但CNN、BP和Adaboost-SVR这些新型预测模型的发展为其提供了便利,但不同预测模型的适用性与适用范围皆有所差异。为快速而稳健地在预可行性研究阶段获得较精确的山区高速铁路土建工程造价,需要进行预测模型的对比选取,从而得到目前最精确的预测解。

因此,首先利用收集的山区高速铁路土建工程造价相关数据,对影响其土建工程造价估算的指标体系进行分析,并利用最大互信息系数(MIC)从中选取关键指标;然后,根据卷积神经网络原理构建山区高速铁路土建工程造价预测模型,在保证预测精度的同时降低预测模型复杂度;最后,通过高速铁路土建工程造价预测模型参数的优化实现其土建工程造价的快速准确估算,并与CNN、BP、Adaboost-SVR模型的预测效果进行对比分析。

1 基于MIC-CNN的山区高速铁路土建工程造价预测模型

1.1 MIC原理

为较精确地预测山区高速铁路土建工程造价,需合理选取山区高速铁路中对土建工程造价预测有显著性影响的指标建立关键指标体系。MIC[22]可用于检测变量之间的非线性相关性,且具有普适性、公平性、对称性、计算复杂度低和鲁棒性高等特点,适用于寻找显著影响山区高速铁路土建工程造价的指标。

最大互信息系数越高,则变量间的相关性越大,其计算原理为式中,X、Y表示2个变量;B为关于样本规模n的函数,通常取B=n0.6;I(D,X,Y)为落入网格区域D的最大互信息值,通过除以log2(min(X,Y))进行归一化,最终MIC的数值范围为[0,1]。MIC阈值与相关性的对应关系如表1所示。

(1)

表1 MIC值与相关性的对应关系

1.2 CNN预测模型结构

基于CNN的山区高速铁路土建工程造价预测模型的网络结构如图1所示,主要包括输入层、多层卷积部分、全连接层部分和输出层。将影响铁路土建工程造价的关键指标作为输入数据,进行卷积操作提取各指标与铁路造价的相关性;再通过池化处理压缩数据和参数的量,避免过拟合现象的出现并降低模型复杂度;再通过扁平化层转化数据形式,最后使用全连接层进行微调并输出,便于与山区高速铁路土建工程实际造价进行对比,进而优化模型权重和偏置。

图1 基于CNN的山区高速铁路土建工程造价预测模型

建立的山区高速铁路土建工程造价CNN预测模型不同于一般的卷积神经网络结构,该模型对二维数据进行纵向数据个数维度上的一维卷积,更有助于模型学习到关键指标和山区高速铁路土建工程造价之间的关系,增强模型的普适性。卷积层均采用Relu函数作为激活函数,前期较大的卷积核大小可降低噪声的影响,后期较小的卷积核大小可用于提取更细微的特征。池化层采用最大池化运算规则。

1.3 CNN预测模型评价指标

(1)CNN预测模型精度评价指标

为有效评价山区高速铁路土建工程造价预测模型的效果,选取平均相对误差(Mean Relative Error,MRE)和平均准确率(Mean Accuracy,MA)作为预测模型精度的评价指标,其计算公式见式(2)和式(3)。MRE可反映预测值与真实值的平均相对偏差程度,MRE越小,模型预测的精度越好。MA反映预测结果的平均准确度,它与MRE相反,其值越大表明模型的预测精度越高。

(2)

MA=1-MRE

(3)

(2)CNN预测模型稳定性评价指标

CNN模型预测能力强弱不仅仅决定于精度高低,也取决于预测模型稳定性。为有效评价CNN预测模型稳定性,采用多次运行结果中MA值的波动(Flu)进行评估。

(4)

式中,MAmax是多次运行CNN预测模型得到的MA最大值;MAmin是多次运行CNN预测模型得到的MA最小值;MAmean是多次运行CNN预测模型得到的MA平均值。

(3)CNN预测模型计算效率评价指标

CNN预测模型计算效率也是评判模型优劣的重要指标,可采用模型运算时长t来评价山区高速铁路土建工程造价CNN预测模型计算效率。

1.4 基于MIC-CNN的山区高速铁路土建工程造价预测流程

山区高速铁路土建工程造价预测流程及伪代码如图2所示。其预测步骤主要包含MIC优选关键指标、建立CNN预测模型、模型验证和模型预测等。其中,在模型验证阶段,为提高预测精度,当验证精度小于95%时重新训练预测模型参数。

图2 MIC-CNN模型预测流程图及对应伪代码

2 基于MIC的造价预测关键指标选取

为得到山区高速铁路预可行性研究阶段影响其土建工程造价估算准确性的关键指标,利用文献[23]中通过实际调研铁路项目中标单位报价、期刊、年鉴等途径收集的40条已完工山区高速铁路土建工程造价相关信息进行分析。其中,各土建工程项目造价影响指标主要包括桥梁占比、隧道占比、路基宽度、正线数目等36个指标,如表2所示。

表2 山区高速铁路土建工程造价主要影响指标

由于在山区高速铁路预可行性研究阶段进行土建工程造价估算时所能获取的指标有限,因而,在表2的36个指标中初步选取预可行性研究阶段较易获取且真正影响土建工程造价的21个指标作为关键指标优选对象。同时,因土建工程单位造价预测可使造价信息维持在较小的波动范围内,使CNN模型更易收敛,参数更新更迅速,因而,采用土建工程单位造价作为其造价预测最终目标。初步选取的造价预测指标以及部分相关数据如表3所示。

表3 山区高速铁路土建工程造价预测相关指标及数据

为在其中选取关键指标,采用MIC方法计算表3中各指标与山区高速铁路土建工程单位造价的相关性系数,结果如图3所示。

图3 预测指标与山区高速铁路土建工程单位造价的MIC值

由图3可知,除气候、闭塞类型和牵引种类指标外,其余18个指标的MIC值均超过0.4,根据表1可知,其与山区高速铁路土建工程造价均有较强相关性,故选取此18个指标作为预测铁路工程造价的关键指标。最终确定的关键指标体系见表4。

表4 山区高速铁路土建工程造价预测关键指标体系

3 MIC-CNN模型预测结果分析

3.1 数据预处理

(5)

(6)

3.2 模型参数设置

3.2.1 卷积层层数和卷积核大小

因山区高速铁路土建工程造价预测关键指标体系中包含18个预测指标,为寻找出最优的卷积层层数,设置卷积层层数为1~16层,在保持其他参数不变的情况下,运行程序10次取平均值(MREmean)以分析卷积层层数对模型预测损失和精确度的影响。因数据组合较多,仅在表5中展示部分验证结果。

表5 卷积层层数对验证结果的影响

为确保山区高速铁路土建工程造价预测模型精度,要求验证集预测结果精度达到95%,因而需选取平均相对误差小于5%的卷积层数和卷积核大小。从表5中可以看出,随着卷积层数增加,平均相对误差呈先减小后增大的趋势,当卷积层层数为7,卷积核大小为1×9×1+1×4×1+1×2×5时验证数据的平均相对误差(MRE)最小,为4.639%,说明此参数设置下预测模型最为精确,且满足MRE误差小于5%的要求。因此,山区高速铁路土建工程造价预测模型卷积层层数设置为7层,卷积核大小为1×9×1+1×4×1+1×2×5。

3.2.2 卷积核个数

合理的卷积核个数是保证计算效率和预测结果的重要参数。为选取合理的卷积核个数,在保持其他参数不变条件下运行程序10次取平均值,验证结果如表6所示。

表6 卷积核个数对验证结果的影响

由表6可知,随着卷积核个数增加,验证数据的平均相对误差(MRE)存在先降低后升高的趋势,当卷积核个数分别为8、16、32、64、128、256和512时,验证数据的平均相对误差(MRE)达到最小值4.639%,同时在10次预测结果中,最小损失值和最大损失值均小于其他卷积核个数组合。同时,当卷积核个数增加到1 024后,预测时长显著增加,为同时保证山区高速铁路土建工程造价预测效率和精度,卷积核个数设置为8、16、32、64、128、256和512的组合。

3.2.3 优化学习算法

优化学习算法可在训练过程中更新和调整模型权重和偏差参数,寻求最小的损失并使模型收敛。常用的优化学习算法包括随机梯度下降(SGD)、自适应梯度(Adagrad)、均方差传播(RMSprop)、自适应矩估计(Adam)[24],不同模型的验证结果和收敛情况分别如表7和图4所示。

图4 优化学习算法下模型收敛情况

表7 优化学习算法对验证结果的影响

由图4可知,预测模型采用SGD、Adagrad、RMSprop和Adam四种优化学习算法均可收敛,但SGD算法和RMSprop算法在收敛过程中的波动较大。Adagrad算法收敛到0.3左右便相对稳定,而其他3种算法都能收敛到0.2以下。同时,SGD算法、RMSprop算法和Adam算法大致都在迭代50次左右趋近收敛,而Adagrad算法收敛速度较慢。

由表7可知,预测模型采用SGD算法、RMSprop算法和Adagrad算法时,预测结果损失程度都较大,导致铁路土建工程造价预测误差均在10%以上,因此,采用Adam算法可以使模型达到更好的收敛效果和更快的收敛速度。

3.3 预测结果分析

根据上述研究结果对MIC-CNN预测模型参数进行修正。为考察修正模型预测效果,利用平均相对误差、平均准确率、波动指标、计算时长进行评价,将其与CNN、BP、Adaboost-SVR等几种常用预测模型进行比较,4种模型分析结果如表8所示。MIC-CNN和CNN模型预测结果偏差均在10%以内, 其中MIC-CNN模型预测偏差最小,仅为5.476%,相较于CNN模型9.072%的偏差,MIC-CNN模型预测精度有明显提升,说明利用MIC方法选取关键指标能较大提高预测准确度。但BP和Adaboost-SVR模型的预测偏差达到12.626%和28.010%,从而预测精度仅为87.372%和70.623%,不能应用于山区高速铁路土建工程造价预测。相比于CNN、BP、Adaboost-SVR模型预测结果的波动情况和预测时长,MIC-CNN模型的波动仅为1.045%,预测时长仅为14.337s,该模型在预测山区高速铁路土建工程造价时最稳定和高效。

表8 不同模型的预测结果

MIC-CNN预测模型结果与真实值对比如图5所示,其得到的各样本土建工程单位造价预测值与真实值均较为接近,表明该预测模型能较准确地预测山区高速铁路土建工程项目造价。

图5 山区高速铁路项目样本土建工程单位造价的预测值与真实值

4 结论

(1)利用MIC方法可以合理选取并构建用于山区高速铁路预可行性研究阶段土建工程造价的关键指标体系,其指标体系包括特大桥占比、大桥占比、中小桥占比、河海谷环境、特长隧道占比、长隧道占比、中小隧道占比等18个特征指标。

(2)通过对山区高速铁路土建工程造价卷积神经网络预测模型参数进行大量对比分析可知,当卷积层层数设置为7层,卷积核大小为1×9×1、1×4×1和1×2×5,卷积核个数设为8、16、32、64、128、256和512的组合,并采用Adam优化学习算法调整模型的权重和偏差参数时,模型预测精度和计算效率最高,且最稳定。

(3)应用MIC-CNN模型预测山区高速铁路土建工程造价的平均相对误差仅为5.476%,而CNN模型预测的平均相对误差达到9.072%,说明利用MIC方法优选关键指标可降低模型的网络复杂度并提高预测精度。BP和Adaboost-SVR模型预测山区高速铁路土建工程造价的平均相对误差分别达到12.626%和28.010%,与此两种模型的预测结果相比,MIC-CNN模型的预测精度更高。

(4)MIC-CNN模型预测结果波动仅为1.045%,且预测时长仅为14.337s,预测模型有较高的稳定性和计算效率。

(5)MIC-CNN模型不仅适用于山区高速铁路土建工程造价预测,也可推广应用到其他地域和类型铁路的土建工程造价预测。本研究样本数量有限,对预测精度可能有一定影响,后续将继续补充样本进行分析,以进一步提高模型预测精度。

猜你喜欢

高速铁路山区卷积
《高速铁路技术》征稿启事
《高速铁路技术》征稿启事
基于3D-Winograd的快速卷积算法设计及FPGA实现
《山区修梯田》
从滤波器理解卷积
山区
基于傅里叶域卷积表示的目标跟踪算法
邮一堆微笑到山区
基于TD-LTE的高速铁路WiFi通信系统
高速铁路道岔维修与养护