APP下载

基于PSO-GBDT 模型的再生混凝土抗压强度预测

2023-11-05郭园园原慧敏田青青李泽宣

科技创新与应用 2023年30期
关键词:预测值精度预测

郭园园,原慧敏,冯 飞,田青青,李泽宣

(1.河南水投舆源水生态实业有限公司,河南 驻马店 463400;2.河南欣峰信息科技有限公司,郑州 450003;3.河南水利投资集团有限公司,郑州 450000;4.华北水利水电大学 水利学院,郑州 450046;5.河南省水环境模拟与治理重点实验室,郑州 450002)

随着全球经济的不断发展和人口的不断增加,建筑业发展迅速,对建筑材料的需求也越来越大。然而,传统的混凝土材料在生产和使用过程中会产生大量的废弃物和污染,给环境带来了极大的压力。因此,再生混凝土作为一种环保型建筑材料,已经成为当前建筑材料领域的研究热点之一。

再生混凝土在生产和使用过程中,其性质和强度等方面都受到影响,这给其在实际工程中的应用带来了一定的难度。因此,预测再生混凝土的强度是实现其应用的关键之一。目前,国内外已有很多学者对再生混凝土的强度预测进行了研究。在国内研究中,如高蔚[1]使用深度学习方法对再生混凝土抗压强度进行预测,并取得精确的预测结果。廖小辉等[2]使用BP 神经网络对再生混凝土抗压强度进行预测,并取得了较高的预测结果。白浩杰等[3]使用基于GA 优化BP 神经网络模型预测再生混凝土抗压强度,证实经过GA 算法优化权阀值的BP 神经网络精度更高,朱伟等[4]使用GA 算法优化支持向量机模型对再生混凝土进行抗压强度预测,并与支持向量机模型进行对比,证实GA 算法优化模型可以提升其精度。邹超英等[5]使用模拟退火原理构建模型预测混凝土徐变参数,并证实其预测结果与实际相吻合,具有较高的精度。黄炜等[6]使用PSO-BP 模型和GA-P 模型对再生混凝土抗压强度进行预测,并发现PSO 算法参数优化能力好于GA 算法。

与此同时,国外学者对再生混凝土强度预测研究也在不断深入,如Deng 等[7]使用softmax 回归开发预测模型,对再生混凝土强度进行预测,并与传统神经网络相比,证实深度学习算法具有更高的精度。Marian 等[8]使用多元线性回归,对再生混凝土抗压强度进行预测,并通过预测结果得出为不影响其强度,骨料替代率不要超过30%。Gregori 等[9]使用SVM 算法和GPR 模型对再生混凝土强度进行预测,都取得了精确的预测结果,并且GPR 模型精度高于SVM 模型精度。Li 等[10]使用稻壳灰提到水泥制备再生混凝土,并使用堆叠集成学习的方法对其抗压强度进行预测,并取得了精确的预测结果。Mai 等[11]使用随机森林模型对含油棕壳的再生混凝土抗压强度进行预测,并取得较为精确的预测结果。

基于上述已有研究,在再生混凝土强度预测中,基于参数优化机器学习模型研究甚少,故本文提出了一种基于粒子群优化(PSO)和梯度提升决策树(GBDT)的再生混凝土强度预测模型,通过优化GBDT 模型的超参数,提高了模型的预测精度和稳定性,对再生混凝土相关领域的实际工程具有指导作用。

1 数据来源

1.1 数据分析

本研究数据来自文献[12],根据实际情况,选取其中再生粗骨料数据集118 组,为研究所用数据分布情况,采用SPSS 软件对其28 d 抗压强度进行正态Q-Q图分析,如图1 所示,可以看出,抗压强度数据点紧密围绕理论直线,且除两端点部分,其余大量数据均基本以理论直线重合。

图1 抗压强度正态Q-Q 图

为进一步验证其是否符合正态分布,采用单样本K-S 检验,以设定95%置信区间,进行检验,证实其显著性P=0.099,所得显著性大于0.05,故保留原假设,数据符合正态分布。

1.2 数据预处理

所用数据配合比中,不同成分所带自身量纲不同,直接将数据代入模型,可能会对最终结果造成影响,故此处采用最大值最小值方法进行归一化,归一化公式见公式(1)

式中:X表示归一化之后的数值,x1表示试验值,xmax表示数据列中最大的值,xmin表示数据列中最小的值。

2 评价指标

模型建立并进行数据预测之后,为了检验模型的泛化能力和预测准确性,故需设定模型评价指标从而更加直观地了解模型性能。因此,选用决定系数R2、均方根误差(RMSE)和平均绝对误差(MAE)为模型评价指标,其中决定系数R2表示试验值和预测值之间的拟合程度,其越接近于1,表明其预测结果越接近试验值,RMSE 表示试验值和预测值之间差异的样本标准差,MAE 表示试验值和预测值之间绝对误差的平均值,二者大小越接近0 越好,以上评估指标计算原理见公式(2)(3)(4)。

式中:N为数据库中数据总数;为试验值数据的平均值,MPa;Qi为试验值,MPa;为模型预测值,MPa。

3 模型概述

3.1 PSO 算法

粒子群算法(PSO)是目前众多寻优算法之一,其设计原理是通过模拟鸟类捕食,主要是通过在给定区域定义一块食物(即寻优目标最优解),让鸟类进行寻找,通过信息交流等报送自己位置,从而确定是否找到最优解,最后所有鸟类都到达最优解处,即寻优完成。

理论解释主要分为以下几步。

1)初始化所有粒子,即给其速度和位置赋值,并将个体的历史最优Best1 设为当前位置,群体中的最优个体作为当前的Best2。

2)在每一代的进化中,计算各个粒子的适应度函数值。

3)如果当前适应度函数值优于历史最优值,则更新Best1。

4)如果当前适应度函数值优于全局历史最优值,则更新Best2。

5)对每个粒子i的第d维的速度和位置分别按照公式(5)和公式(6)进行更新

3.2 GBDT 算法

梯度提升决策树(GBDT)是一种利用残差拟合弱学习器的集成算法,通过将多个弱学习器串联起来,每个学习器学习的都是前一个学习器输出的结果,最终逼近最终预测值,其计算流程如下。

1)初始化学习器。

2)计算残差。

将所得rt,i作为预测值,计算当i=1,2,…,i时拟合得到第t棵回归树。

3)遍历节点,计算回归树Tt的每个叶子节点Rt,j的输出值ct,j

4)更新学习器。

式中:I表示学习率;J为叶子节点个数。

5)最终学习器。

4 结果分析

本次研究所使用数据共118 组,为了增加模型泛化能力,采用随机打乱的方式,将数据集按照7∶3 的比例进行训练集和测试集的划分,以粉煤灰、细骨料、粗骨料、粗骨料取代率、减水剂和水胶比作为模型输入变量,以28 d 抗压强度为输出变量并将其代入所提出的PSO-GBDT 模型中,如图2 所示,表示模型训练集和测试集中试验值和预测值的拟合情况。

图2 PSO-GBDT 模型训练集和测试集拟合图

由图2 可知,PSO-GBDT 模型训练集决定系数R2=0.962 4,测试集决定系数R2=0.976 8,由图2 可以发现经过PSO 算法优化的GBDT 模型拥有较为精确的预测精度。

为了更加全面地分析预测结果,如图3 所示,绘制PSO-GBDT 模型试验值和预测值的折线对比图,并计算其误差。

图3 PSO-GBDT 模型折线误差图

通过图3 可知,PSO-GBDT 模型训练集绝对误差在[0.01,4.57]之间,测试集绝对误差在[0.26,3.75]之间,经过PSO 算法优化之后,模型的训练集和测试集误差减少,模型预测性能提升。

因模型未出现过拟合情况,测试集为反映模型训练情况,所有通过计算测试集评估指标可知,PSO-GBDT 模型测试集决定系数R2=0.976 8,RMSE 为1.75,MAE 为1.50。

5 结束语

本研究首先通过数据分析,得出再生混凝土抗压强度数据符合正态分布规律,然后使用PSO 算法优化GBDT 模型,从而使得模型具有较高的精度和较小的预测误差,可以较大程度上缩短工程中获取抗压强度结果,减少试验材料消耗,降低工程成本,对工程实际具有指导作用。

猜你喜欢

预测值精度预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
法电再次修订2020年核发电量预测值
基于DSPIC33F微处理器的采集精度的提高
不必预测未来,只需把握现在
GPS/GLONASS/BDS组合PPP精度分析
改进的Goldschmidt双精度浮点除法器