APP下载

基于XGBoost的崩塌落石风险预测模型及在复杂山区公路工程中的应用

2024-06-20曹放李培骏詹同安孙徐张钰

交通科技与管理 2024年12期
关键词:落石边坡预测

曹放 李培骏 詹同安 孙徐 张钰

摘要 公路工程在进行崩塌落石处治设计时,需要解决措施有效性与经济性之间的矛盾,如何在勘察设计工作中充分运用机器学习工具,是一个前沿的领域。以省道S463改扩建为国道G664的项目为契机,充分利用项目勘察设计阶段获得的342组工点数据集,首先采用XGBoost算法构建“XGB—崩塌”模型,利用改扩建前的220组数据集构建测试集进行训练,然后对改扩建后的数据集进行测试,实现了对122段新增边坡工点的崩塌、落石风险预测及评价,最后与支持向量机(SVM)、随机森林(RF)的预测结果进行了对比。结果表明:“XGB—崩塌”模型较参照机器学习工具更具优势,取得了91.04%~94.12%的准确率。

关键词 公路工程;崩塌;预测;XGBoost;机器学习;监督学习;SVM;RF

中图分类号 P642.22文献标识码 A文章编号 2096-8949(2024)12-0001-04

0 引言

崩塌、落石是山区公路修建时的常见地质病害[1]。该文研究的依托项目位于四川省甘孜州稻城县境内,为既有省道S463升级改扩建为国道G664,路线全长为164 km,沿线海拔在2 240~4 100 m,属构造剥蚀高山峡谷地貌。断裂、褶皱发育,崩塌落石十分发育。

目前,针对崩塌、落石的工程防治措施主要为主、被动网,挂网喷混凝土,锚杆、锚索框架梁等。但此类灾害分布十分广泛,偶发性极强,无法做到全线处治。因此,勘察设计阶段需要做好风险分类,尽可能针对高风险段落进行靶向防护[2-3]。

对于崩塌、落石的灾害的风险评估,主要基于InSAR、卫星遥感、航空遥感等GIS技术手段,获得大区域内可能发生的时间、地点、成灾范围和影响程度等信息。但受限于GIS手段仅能探测地球表面及探测精度不高,其效果无法达到直接指导设计的目的,加之缺乏高精度的地质资料分析,无法进行工程推广[4]。

因此,充分挖掘工点的多尺度信息并构建高精度预测模型,对崩塌落石的防护处治来说,有着显著的现实意义。目前,支持向量机、神经网络、极限学习机等算法已广泛应用于风险预测领域。近年来,Bagging、Boosting等集成学习算法因速度快、精度高、鲁棒性强等优势,为公路边坡崩塌、落石风险评价及预测提供了新思路。极端梯度提升树(Extreme Gradient Boosting,XGBoost)是基于梯度提升改进的算法,具有非线性数据处理、计算量小、运算速度更快及能够更好地防止过拟合等优势[5]。

该文结合机器学习理论,采用极端梯度提升树(XGBoost)算法,通过网格搜索和曲线搜索调整内部学习参数,反复迭代后建立“XGB—崩塌”预测模型。此外,与SVM、RF两种学习算法进行对比,评价其效果。

1 XGBoost算法基本原理

XGBoost算法的基本原理,是建立多个弱学习器,将决策树作为基学习器,采用梯度提升算法,通过计算模型负梯度,多次迭代训练,逐步提高模型的准确性;损失函数用二阶泰勒级数展开,并加入正则项,可以有效地避免经过高度拟合、多线程的并行处理问题[5-10]。

树模型预测结果通式为:

损失函数为:

二阶泰勒级数展开优化后的目标函数与Gain函数分别为:

式中,Gain——树分裂后目标函数损失量;Gj——损失函数一阶导之和;Hj——损失函数二阶导之和;γT——惩罚项;GL、GR——左、右损失函数一阶导和;HL、HR——左、右损失函数二阶导之和;λ——惩罚系数。

2 “XGB—崩塌”预测模型的建立

2.1 崩塌预测指标因子

充分利用公路工程勘察设计阶段获得的设计参数、地质及水文指标,重点考察14组定量指标因子,详见表1所示。由于模型的创建及分析需要用到Python编程,为便于程序实现和解释,将对应因子译成英文,并作对照解释。

2.2 数据准备

为了检验模型的适用性、合理性和准确度,数据集基于沿线长期跟踪的实际案例样本。依托项目改造前共计220处的基岩边坡工点,结合发生频率、发生次数、崩落块石粒径、坍塌方量等指标进行风险划分:高风险46处,中风险34处,低风险140处,并分别赋予其风险特征值(高风险为3,中风险为2,低风险为1)。

既有道路改扩建后,随着边坡的开挖,路堑产生的新基岩边坡共计122处,“新基岩边坡+既有道路基岩边坡”共计342处,数据集样本总数为342组。

2.3 数据预处理

2.3.1 缺失值处理

在该文研究过程中,少量工程指标未能采集齐全,缺失值共计28个,缺失比例为0.67%,按照众数填充进行处理。

2.3.2 异常值处理

指标因子较多,部分因子存在一定的换算关系。过多的输入指标会增加模型训练的时长、指标之间的强相关性,也会增加模型结构的复杂性,降低模型的预测效果。该文模型考虑通过计算皮尔逊(Pearson)相关性系数对指标进行相关性分析,原理如下:

式中,x1i、x2i——指标x1、x2的统计数据;——指标x1的平均值;——指标x2的平均值;r——指标x1和x2之间的皮尔逊相关性系数。

由表2及图1可见,坡长、坡宽、坡高、坡率、面积之间的皮尔逊相关性系数绝对值大于0.6,具有强相关性;真、视倾角之间的皮尔逊相关性系数绝对值大于0.8,具有极强相关性。因此,需要将有关评价指标之间的冗余信息进行优化或删除。

该文利用Boruta算法进行指标筛选,其是一种基于包装器的特征选择技术。其基本思路是,将原始的训练集进行数据拓展,初始数据与拓展数据经水平连接后形成混洗副本,通过基于树模型的监督学习算法,进行迭代拟合,最后逐步筛选出最优解。

经算法筛选,剔除坡高、真倾角这2项因子,保留坡长、坡宽、坡率、面积、岩性强度、岩层厚度、完整性指数、岩层倾向、边坡坡向、岩层倾向—边坡坡向夹角、岩层视倾角、地下水出露这12项作为定量评价因子。

3 模型建立与处理

3.1 模型建立

将边坡开挖前的220组数据作为训练集,其中:高风险46组,占20.91%;中风险34组,占15.45%;低风险140组,占63.64%。此外,将122组改造后边坡作为测试集,拟合目标为回归测算风险特征值,进而判别分类标记。基于默认参数,分别采用AUC(Area Under Curve)、KS(Kolmogorov-Smirnov)、F1和Acc的分数(Accuracy)这4项指标对该模型进行评价。“XGB—崩塌”模型初步建立后,得到了0.852 4的AUC和0.596 9的KS,分类能力良好。同时F1值达到了0.886 8,Accuracy达到了0.899 8,预测准确度很高。

3.2 参数调优

为解决XGBoost过拟合降低运算性能的问题,同时获得更优的预测精度,需要进行超参数调优,其核心部分包含3个方面:通用参数、Booster参数及目标参数。该文主要针对Booster参数进行调整。通过对Python程序xgboost库中默认参数进行优化调整,寻找到更优的参数组合:learning_rate的优化值为0.02、n_estimators的优化值为150、gamma的优化值为0.2、max_depth的优化值为5,此时模型的预测效果有了明显提高。

3.3 性能评价

由表3可以看到,在训练集上,经调参优化后,得到了0.887 6的AUC和0.658 8的KS,分类能力提升明显。同时F1值达到了0.933 4,Accuracy达到了0.931 5,预测准确度进一步提高。

3.4 模型对比评价

为了对比XGBoost模型与传统机器学习方法的差异,继续采用Python的Scikit-learn库,实现SVM、RF两种模型对测试集的学习成果对比,同时针对精确度P、召回率R以及F1、Accuracy值进行对比,各模型主要调整参数见表4所示、分析结果如表5所示。

由表5可以看到,XGBoost无论是性能还是准确率,较其他参照模型都具有明显优势,能更好地服务于实践应用。

4 案例应用

训练集完成后,利用“XGB—崩塌模型”对依托项目改造后新增的122处路堑边坡作为测试集进行了预测分析,得到该模型在实际使用中的预测结果。真实值综合考察挖开后边坡的实际坍塌情况及专家评判成果如图2所示。

如图2混淆矩阵所示:低风险段落预测成功35段,成功率92.11%;中风险段预测成功61段,成功率91.04%;高风险段落预测成功16段,成功率94.12%。由此可见,该模型在该项目中实际运用的成功率较高,有较好的适应性,基本满足工程辅助手段的需求。针对评估预测的成果,应加强较高风险段的防护措施,有助于降低对崩塌、落石病害的主观认识风险。

5 结论

该文将具体的工程实践与当前热门的机器学习工具相结合,以中国西南高山峡谷地区勘察设计过程中获得的342组崩塌落石数据为基础,初步建立了“XGB—崩塌”预测模型,并将此模型应用到勘察设计工作中,作为辅助决策手段,获得了较高的预测成果。

(1)机器学习算法是一种理性、客观的技术手段,利用人工智能工具辅助公路工程的勘察设计,有助于提高决策效率,拓宽了行业发展的新思路。

(2)XGBoost与SVM、RF模型对比,其准确率、处理性能整体更高,该文在测试集上获得了91.04%~94.12%的准确率,有着更好的推广优势。

(3)XGBoost模型也存在着制约瓶颈,为了进一步改善模型的准确率及运行效率,需要对多元参数进行调整,调参过程通常会非常繁复;为了获得最优参数,也需要探究更多的基于模型本身的伴生改良型算法。

(4)该文只是针对崩塌落石模型的初步探讨,实际上,崩塌、落石形成和发生的随机性较大,需要针对不同的致灾机制探究更合理的分类方式,进而形成更合理的评估判定标准。

参考文献

[1]孟晖, 胡海涛. 我国主要人类工程活动引起的滑坡、崩塌和泥石流灾害[J]. 工程地质学报, 1996(4): 69-74.

[2]钟立勋. 中国重大地质灾害实例分析[J]. 中国地质灾害与防治学报, 1999(3): 2-7+11.

[3]吉随旺, 唐永建, 胡德贵, 等. 四川省汶川地震灾区干线公路典型震害特征分析[J]. 岩石力学与工程学报, 2009(6): 1250-1260.

[4]林报嘉, 刘晓东, 杨川, 等. XGBoost机器学习模型与GIS技术结合的公路崩塌灾害易发性研究[J]. 公路, 2020(7): 20-26.

[5]Chen T , Guestrin C . XGBoost: A Scalable Tree Boosting System. [J]. CoRR, 2016, abs/1603. 02754

[6]高永涛, 朱强, 吴顺川, 等. 基于AVOA-XGBoost模型的岩爆预测研究[J]. 华中科技大学学报(自然科学版), 2023(12): 151-157.

[7]齐石, 李墨潇, 吕伟, 等. 基于L-XGB算法的岩爆倾向等级预测模型[J]. 中国安全生产科学技术, 2023(9): 33-38.

[8]赵晓东, 徐振涛, 刘福, 等. 基于极端梯度提升算法的滑坡易发性评价模型[J]. 科学技术与工程, 2022(23): 10347-10354.

[9]胡旭东. 基于集成学习的地质灾害易发性评价研究[D]. 武汉:中国地质大学, 2019.

[10]李尧. 基于深度学习的滑坡检测算法研究[D]. 成都:成都理工大学, 2018.

猜你喜欢

落石边坡预测
这边山 那边坡
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
基于机器视觉的高速道路落石检测
基于视觉识别的隧道落石预警系统
引导式落石拖挂网落石冲击模型试验研究
不必预测未来,只需把握现在
水利水电工程高边坡的治理与加固探讨
基于SLOPE/W的边坡稳定分析