APP下载

基于ISSA-GRU的混凝土抗压强度预测

2023-07-31段妹玲袁锦虎孙爱军

硅酸盐通报 2023年7期
关键词:适应度变量样本

段妹玲,张 单,袁锦虎,孙爱军,强 晟

(1.河海大学水利水电学院,南京 210098;2.中国电建集团华东勘测设计研究院有限公司,杭州 311122;3.江西省鄱阳湖水利枢纽建设办公室,南昌 330046;4.余姚市水利局,宁波 315402)

0 引 言

混凝土是当今必不可少的建筑材料之一[1]。现如今,结构工程对于混凝土力学性能的提升具有迫切需求,其中抗压强度是最重要的指标之一,它直接关系到结构的安全,因此,如何快速确定混凝土的抗压强度对工程建设与运行的影响至关重要[2-3]。目前,混凝土抗压强度的获取方法主要有回弹法[4]、钻芯法[5]和模型预测法[6]等。回弹法操作简便,但是对于同种混凝土,采用不同回弹仪时会有较大的差异,不能准确地估计混凝土的内部强度;钻芯法的均值较为精确,但是标准差偏大,试验耗时且结果不稳定;模型预测法是通过建立材料配合比、龄期与混凝土抗压强度的数学模型进行预测,但是由于各因素与抗压强度并非简单的线性关系,直接建立显式的数学模型比较困难。因此,亟需一种快速、准确、可靠的混凝土抗压强度预测方法[7]。

近年来,国内外学者针对混凝土抗压强度预测模型进行了大量的探索,其中统计方法和机器学习方法已被广泛应用[8]。许开成等[9]利用SPSS统计分析软件,通过逐步回归分析法和多元非线性回归分析法建立了锂渣混凝土强度预测模型,但该模型只有在使用P·O 42.5级普通硅酸盐水泥时才有效。陈洪根等[10]考虑不同配合比与强度的非线性结构关系,利用误差反向传播(error back propagation training, BP)神经网络预测粉煤灰混凝土的抗压强度,然而,在分析时未综合考虑龄期对混凝土抗压强度的影响。如今,将深度学习算法应用于混凝土领域已成为当前研究热点。高蔚[11]采用卷积神经网络预测了再生混凝土的抗压强度,与传统神经网络模型相比,卷积神经网络模型具有高精度和高泛化性能的优点。Chen等[12]利用长短期记忆(long short-term memory, LSTM)网络模型评估了在一定配合比下高强混凝土抗压强度,证明LSTM能很好捕捉原材料的不同配合比与混凝土抗压强度的非线性关系。

门控循环单元(gate recurrent unit, GRU)是LSTM网络的改进形式,不仅在预测中考虑了时间序列,还通过引入门机制有效解决了记忆网络中易引发梯度爆炸的问题,使得该模型具有结构更简单、计算效率更高的明显优势。因此,本研究采用GRU模型作为混凝土抗压强度预测的主体模型。对于混凝土抗压强度的预测主体模型中参数的选择,张静等[13]利用混沌灰狼群算法优化了最小二乘支持向量机(least squares support vector machines, LSSVM)的混凝土强度预测模型,提高了机器学习算法在实际应用的泛化性能和稳定性,但训练集与测试集的任意选取降低了预测模型的泛化性能。Rankbar等[14]结合卷积神经网络与遗传算法对高性能混凝土的抗压强度进行预测,通过10折交叉验证了所提出方法的可靠性。

鉴于此,本研究采用改进麻雀搜索算法优化门控循环单元神经网络(ISSA-GRU)的高性能混凝土抗压强度预测优化模型。利用光谱-理化值共生距离(SPXY)抽样方法综合考虑输入变量与输出变量的差异性,合理划分ISSA-GRU模型训练和测试样本集;采用引入动态惯性权重的麻雀搜索算法综合全局搜索与局部搜索,优化GRU模型的units、batch_size、epochs参数以提高预测精度;通过对比LSTM、核极限学习机(kernel extreme learning machine, KELM)和支持向量回归(support vector regression, SVR)模型预测结果,验证ISSA-GRU预测模型的有效性;最后,分析训练集数据量和输入变量对预测模型的影响。

1 基本原理

1.1 SPXY划分样本集

不同于将所有训练数据统一看待而随机选取样本训练集的传统方法,SPXY样本划分方法依据数据间的欧式距离来构建样本训练集,这避免了因样本随机划分而降低模型本身预测性能的影响,计算式如式(1)~(3)所示。

(1)

(2)

dy(p,q)=|yp-yq|

(3)

式中:N为数据样本集的样本总数;xp、xq为样本数据值;yp、yq为样本标签值;dx(p,q)为样本p数据值与样本q数据值的欧氏距离;dy(p,q)为样本p标签值与样本q标签值的欧氏距离;dxy(p,q)为样本数据值与样本标签值的综合距离。算法的具体计算步骤详见文献[15-16]。

1.2 门控循环单元(GRU)神经网络

GRU网络是LSTM网络的改进形式,能有效解决梯度爆炸问题。GRU网络通过巧妙地使用门结构来减少传统递归神经网络中的梯度消失现象,能更好地捕捉序列中的长期依赖性关系。核心思想是GRU单元的门结构可以通过同时接收当前输入和输出的新信息,利用动态更新机制有效捕获记忆时间序列的长期历史信息和前一状态信息。与由遗忘门、输入门和输出门组成的LSTM单元相比,GRU单元仅使用重置门和更新门来调节信息流。因此,GRU网络具有结构简单、参数少、计算效率高等优点[17-18]。

GRU模型计算式如式(4)~(7)所示。

zt=σ(Wz[ht-1,xt]+bz)

(4)

rt=σ(Wr[ht-1,xt]+br)

(5)

(6)

(7)

1.3 改进麻雀搜索算法(ISSA)

麻雀搜索算法(sparrow search algorithm, SSA)是通过模仿麻雀群体的搜索行为提出的方法[19]。根据麻雀群体中个体的健康状况,可以被分为发现者和追随者,此外,在麻雀种群中随机分配10%~20%的警备者,它们在群体觅食的过程中负责躲避捕食者。简而言之,麻雀群体可以通过不断更新位置来寻找更低风险的食物,其发现者、追随者和警备者的位置更新公式如(8)~(10)所示[20-22]。

(8)

(9)

(10)

与其他元启发算法相同,如何平衡算法的全局搜索能力和局部搜索能力一直是算法工程师关注的重点问题[23]。麻雀种群中的发现者负责引领整个种群并确定觅食方向,进而影响算法的最终寻优效果。为了适应算法在不同阶段的需要,引入动态惯性权重w。在迭代计算的早期,w的值较大,全局搜索效果越好;在迭代计算的后期,w自适应减小,使得局部搜索效果更好,也使得算法收敛速度更快。w的计算公式如式(11)所示,改进的发现者更新方法如式(12)所示。

(11)

(12)

2 混凝土抗压强度预测模型

2.1 数据源和数据预处理

数据来源于UCI Machine Learning Database,该数据集由水泥、高炉矿渣、粉煤灰、水、高效减水剂、粗骨料、细骨料、龄期和混凝土抗压强度9种参数下的1 030组实测数据值组成[24]。根据相关学者[25-27]的研究,混凝土的原材料和龄期对抗压强度有不同的影响,因此,不可直接忽略任一属性对混凝土抗压强度预测的影响。本研究采用的GRU主体预测模型结构较简单,可以很好地考虑该数据集中所有原材料的配合比。在此,选择前8个参数作为模型的输入变量,第9个参数作为模型的输出变量,构建高性能混凝土抗压强度预测模型的初始指标体系。分别用X1~X8表示8个输入变量,Y表示输出变量,现将反映数据分布情况的几个统计特征归纳至表1。Max、Min、Mean和SD分别表示数据的最大值、最小值、平均值和标准差。

表1 原始数据统计特征Table 1 Statistical features of raw set

从表1中可以明显看出各个变量之间数值差异较大,未缩放的输入变量和输出变量可能导致缓慢或不稳定的训练过程。因此,采用式(13)对原始数据进行归一化处理,处理后的数值皆在0~1,归一化结果如图1所示。由图1可知,归一化处理不仅消除了龄期所具备的量纲与其他输入变量所具备的量纲之间的差异性影响,还避免了由各变量值域差异引起的训练过程仅受单个输入变量控制的情况。

(13)

式中:xnorm为第i个数据变量归一化后的值;xi为第i个数据变量的原始值;xmax和xmin分别为第i个数据变量的最大值和最小值。

2.2 ISSA-GRU模型预测混凝土抗压强度流程

由于GRU主体预测模型中的units、batch_size、epochs是影响 GRU拟合精度的关键参数,为了避免参数估计带来的偏差,采用ISSA同时优化这3个参数,实现对混凝土抗压强度的精准预测。对收集数据集进行分析和整理,并且考虑样本划分方式,ISSA-GRU模型预测混凝土抗压强度的具体实施步骤如下:

1)数据预处理。根据混凝土实际性能发展原理分析收集数据的可用性,合理选择输入变量和输出变量。采用SPXY样本集划分方法,将归一化后的所有数据样本按一定比例划分为训练集和测试集。使用训练集对建立的预测模型进行训练后,代入测试集数据可得到混凝土抗压强度预测值。

2)ISSA-GRU算法终止条件。初始化ISSA算法中的麻雀种群信息,设置GRU算法来优化参数的范围和ISSA算法的最大迭代次数。设定适应度函数值≤0.001或达到最大迭代次数作为算法的终止条件。

3)ISSA优化算法。根据麻雀种群信息计算适应度值,标记当前最坏和最佳适应情况,并给出相应的位置信息。随后,根据适应度值对麻雀种群进行排序并分类,从种群中选择适应度较好的麻雀作为发现者,种群中的其他麻雀扮演追随者,种群中随机选取一部分麻雀作为警备者。根据引入动态惯性权重的式(12)更新发现者位置;根据式(9)更新追随者位置;根据式(10)更新警备者位置。一次迭代完成后,计算麻雀种群位置更新后的适应度值,其中,最小适应度值为局部最优适应度值。将局部最优适应度值与位置更新前的全局最优适应度值进行比较,取更小的适应度值作为位置更新后的全局最优适应度值,此时全局最优适应度值对应的超参数组即为最优超参数组。更新全局最优适应度值,并将最新确定的超参数组传递给GRU模型。

4)GRU主体预测模型。判断是否满足步骤2中设定的终止条件,如不满足则返回步骤3;如满足则根据全局最优超参数组获取GRU模型中units、batch_size和epochs的最佳值。最后,利用最佳模型参数建立GRU预测模型。

综上所述,基于ISSA-GRU的混凝土抗压强度预测模型流程如图2所示。

图2 混凝土抗压强度预测模型流程图Fig.2 Flow chart of prediction model of concrete compressive strength

2.3 模型评价指标

为评估ISSA-GRU模型的拟合预测性能,使用广泛的评估指标来评估模型以确定最佳模型,在分析时采用如式(14)~(16)的具体评价指标[28-29]。所采用的各评价指标具有以下趋势时说明模型具有更优预测性能:决定系数R2值越接近1;均方根误差(root mean square error, RMSE)越小;平均绝对误差(mean absolute error, MAE)越小。

(14)

(15)

(16)

3 预测结果及分析

3.1 数据划分与模型建立

为测试SPXY划分数据样本训练集和测试集的性能,参考Feng等[30]研究,将原始数据样本集按9-1划分为训练集和测试集,同时与随机抽样(random sampling, RS)方法进行对比分析。样本集中9个变量的量纲不完全相同且测量尺度具有较大差异,故采用变异系数对数据进行比较,SPXY与RS两种数据样本划分方法得到的变异系数结果如图3所示。

图3 SPXY和RS划分样本的变异系数Fig.3 Coefficient of variation of SPXY and RS divided samples

从图3(a)可以看出,利用SPXY和RS两种方法划分数据样本,得到的训练集变异系数与原始数据变异系数都呈现较好的一致性,表明两种方法皆具较强的针对遵循变量原始数据分布特征的训练集数据筛选的能力,使训练模型更具代表性。分别代表高炉矿渣、粉煤灰、高效减水剂和龄期的变量X2、X3、X5和X8变异系数均超过了50%,说明这些变量数据的离散性较大。同时,结合图1可以看出,产生较大变异系数的原因主要有两种:一是高炉矿渣、粉煤灰和高效减水剂具有较多值为零的数据;二是龄期具有阶段划分的特征。从图3(b)可以看出,在SPXY方法划分得到的测试集结果中,高炉矿渣、粉煤灰、高效减水剂和龄期的变异系数较RS法分别降低了22.03%、2.93%、37.87%和52.92%,表明SPXY具有更强的测试集数据选取能力,能自发地避免由混凝土抗压强度及其原材料因素带来的变量数值异常性影响。现分别利用SPXY和RS数据样本划分方法,使用本研究提出的ISSA-GRU模型对混凝土抗压强度进行预测,输出结果表现为:训练集RMSE分别为2.89%和3.28%;测试集RMSE分别为3.60%和4.44%;训练集MAE分别为2.04%和2.29%;测试集MAE分别为2.70%和3.13%。涉及两种样本集划分方法中更直观的ISSA-GRU模型预测精度结果如图4所示。

图4 SPXY与RS划分样本的模型误差Fig.4 Model error between SPXY and RS

从图4中可以明显看出,与RS划分数据样本集相比,将SPXY方法划分的训练集和测试集数据代入预测模型均会得到更小的RMSE和MAE值,说明采用SPXY方法划分样本集对混凝土抗压强度数据预测具有更强的适应性,具备更高的预测精度。从图4中可以发现,测试集数据对应的RMSE和MAE值均大于训练集,与实际相符。因为预测模型是针对训练集数据特征对提出模型进行训练的结果,所以测试集数据下的RMSE和MAE值应均大于训练集,否则将表现为弱化训练集数据及过拟合现象。

因此,通过将变量间距离加以考虑并为样本空间赋权的SPXY样本划分方法,能高效覆盖变量的各个空间,智能表征变量分布特征,在混凝土抗压强度预测模型的稳定性与预测精度方面表现优异。

3.2 模型对比分析

ISSA-GRU模型针对测试集数据得到的混凝土抗压强度预测值与实测值对比结果如图5所示。其中,中心线代表抗压强度预测值等于实测值,即测试集数据点越接近中心线,预测精度越高。从图5可以看到数据点大致分布在中心线两侧,且无明显离群点,表明ISSA-GRU模型的预测强度值与实测强度值接近,模型的整体拟合预测结果较好。同时,从图5中观察测试集数据的相对误差可以发现,当混凝土抗压强度值较小时,预测结果的相对误差较大,最大相对误差接近35%;当混凝土抗压强度值较大时,预测结果的相对误差较小,且当强度值大于25 MPa之后时,预测结果的相对误差在20%之内,这与早期混凝土的强度增长不稳定有关,符合预期。

图5 ISSA-GRU模型抗压强度预测值与实测值Fig.5 Prediction values versus real values under ISSA-GRU

为评估ISSA-GRU模型对于混凝土抗压强度预测能力的优越性,采用相同数据集,选择LSTM、KELM、SVR三种模型与本研究所提出的模型进行对比分析。各模型的预测性能指标如表2所示。

表2 模型预测性能指标Table 2 Performance criteria values of models

从表2结果可以看出,与LSTM、KELM、SVR模型相比,本研究提出的ISSA-GRU模型测试集R2=0.98,具有最大的决定系数值,拟合优度好;同时,测试集RMSE值分别降低了9.3%、37.5%、33.5%,测试集MAE值分别降低了13.5%、38.5%、41.7%,针对混凝土抗压强度预测具有最高的整体预测精度。

3.3 模型性能分析

为考虑数据训练集数据量对模型预测性能的影响,训练集数据量与测试集数据量分别选取为8.5-1.5、8-2、7.5-2.5和7-3,采用ISSA-GRU模型对混凝土抗压强度进行预测,不同数据集划分比例下的预测性能指标如表3所示。

表3 不同数据集划分比例下的预测性能指标Table 3 Prediction performance values under different data set division

由表3可知,ISSA-GRU模型在不同训练集数据量下,对应的测试集性能指标表现为:RMSE最大值为4.38;MAE最大值为3.38;R2最小值为0.97,这表明在不同的训练集数据量下,ISSA-GRU模型整体预测的误差均较小,具备较强的混凝土抗压强度预测能力。同时,模型预测精度随着训练集数据量的减少而降低,符合数据驱动模型的特性,但并没有表现出较大程度的降低,表明ISSA-GRU模型稳定性较高,对不同数据样本划分比例均有较好的适定性。

输入变量也对模型性能有很大的影响。参考相关文献[30],另外选取三种输入变量组合,与表2中ISSA-GRU的测试集性能指标进行对比分析,不同输入变量下的预测性能指标如表4所示。

表4 不同输入变量下的预测性能指标Table 4 Performance criteria values under different input variable

从表4可以看出随着输入变量的减少,预测数据集的性能指标明显降低,并且模型的预测性能与输入变量数之间没有明确的相关关系,例如,仅缺少“水泥”1个输入变量的预测误差大于缺少“粉煤灰”和“高效减水剂”2个输入变量的预测误差。这表明直接减少输入变量的数量是不可行的,会造成输入信息损失,为保证模型的预测性能,需保留所有输入变量。

4 结 论

1)通过SPXY抽样方法合理划分数据集,能减少随意划分数据集对于预测结果的影响,有效避免对模型预测性能评估的干扰。

2)在基础SSA模型中引入动态惯性权重,具有前期扩大搜索范围,避免陷入局部最优,后期增强局部搜索,加快计算收敛的特点,提高计算效率和泛化性能。

3)提出的ISSA-GRU模型避免了传统GRU网络参数的人为选取方式,能高效获取对预测性能有较大影响的GRU网络参数。ISSA-GRU模型能有效预测混凝土抗压强度,与LSTM、KELM、SVR模型相比,ISSA-GRU模型具有更好的预测能力。

4)一般数据驱动模型的预测精度会随着训练集数据量的减少而降低,本文提出的ISSA-GRU模型符合该特征,但降低程度较小,表明ISSA-GRU模型针对不同训练集数据量均有较稳定的预测性能。输入变量的减少会极大影响模型预测精度,需将混凝土所有材料参数加以考虑,保留全部输入变量。

猜你喜欢

适应度变量样本
改进的自适应复制、交叉和突变遗传算法
抓住不变量解题
用样本估计总体复习点拨
也谈分离变量
推动医改的“直销样本”
随机微分方程的样本Lyapunov二次型估计
基于空调导风板成型工艺的Kriging模型适应度研究
村企共赢的样本
SL(3,3n)和SU(3,3n)的第一Cartan不变量
分离变量法:常见的通性通法