APP下载

基于Logistic回归的水利工程边坡稳定性评价

2020-03-02陈兆龙

水利建设与管理 2020年2期
关键词:坡体因变量边坡

陈兆龙

(湖南兴禹建设有限公司,湖南 常德 415000)

水利工程建设过程中常常无法避免对山体的切削,坡体的稳定性直接决定了工程建设的可行性、难易程度以及施工管理的复杂性。工程边坡的稳定性评价是勘查、设计和施工管理中的重中之重。为此,国内外对边坡稳定性评价进行了大量的研究,Zhou J[1]等利用二次二阶矩法(SOSM)分析了含软弱结构面的边坡稳定性,穆志江[2]基于有限差分的FLAC3D软件实现了三维情况下的水利工程高陡边坡开挖稳定性的模拟,评价了该工程边坡的稳定性。然而这些方法所基于的数学、力学原理均较为复杂,需要大量的建模、参数拟定和数值计算,因此虽然给出了较为可信的定量评价结果,但对水利工程边坡的稳定性评价效率并不高。在工程建设的初始阶段,定性评价往往要比定量评价更为适用。

近年来,随着计算机技术的发展,对于水利工程边坡稳定性的定性评价系统以及工程风险评估系统的开发成为了研究的热点[3]。随着现代计算机和人工智能技术的飞速发展,大量人工智能技术被运用到了边坡稳定性评价当中,如Qi C[4]等提出并比较了六种基于元启发式和ML算法的边坡稳定性预测的综合人工智能(AI)方法,证明了集成的AI方法具有很大的预测斜率稳定性的潜力。Hoang N D[5]等利用先进的机器学习方法,包括极限学习机(ELM)、径向基函数神经网络(RBFNN)和最小二乘支持向量机(LSSVM),对边坡稳定性预测进行了对比研究。苏国韶[6]等基于高斯过程机器学习对边坡稳定性进行了定性评价,康飞[7]等提出了基于计算机试验结合机器学习理论建立边坡系统(体系)可靠度分析智能响应面法的一般框架。

对于工程建设者而言,Logistic回归算法可以很好地用于边坡稳定性分析,通过设计与水利工程边坡稳定性评价配套的计算模型,可利用该算法快速地得出稳定性评价的结论。

1 水利工程边坡稳定性评价的Logistic回归模型

1.1 水利工程边坡稳定性评价初步模型化

在水利工程项目可行性研究阶段,边坡稳定性评价问题可以简化为“欠稳定”与“稳定”两种情况的判定,若将其分别利用“0”和“1”表示,这就成为了典型的离散变量预测问题。

该离散变量预测问题因变量简明,但由于影响水利工程边坡稳定性的因素较多,如坡高、坡角、地质年代与地层岩性、岩层厚度、软弱结构面的数量与厚度、水文地质条件等,使得该离散变量预测问题的自变量纷繁复杂,因此提炼影响边坡稳定性的主要因素至关重要。本文取坡高、坡角、地层岩性、岩体结构、软弱地层、风化程度、地下水和年降水量等作为控制水利工程边坡稳定性的主要因素,将这些因素作为模型的自变量,研究其对边坡稳定性的影响。

1.2 水利工程边坡稳定性评价的数学模型

1.2.1 评价模型的建立

经过水利工程边坡稳定性评价模型因变量与自变量的选取,可将其用数学语言表达如下:

设因变量符号为y(i)(1≤i≤m),其中i代表第i个所研究的边坡,m为所研究边坡的总数量。由以上分析可知y(i)满足y(i)∈{0,1},当边坡被判定为“欠稳定”时,y(i)=0,当边坡被判定为“稳定”时,y(i)=1。

下面建立自变量与因变量之间的关系,先令中间变量为z,表达式见式(1):

式中,θj为常系数,该式表示各自变量的值与其权重的乘积之和,表征各因素对边坡稳定性的影响程度。

向量化表示以便于运算,式(1)可化为式(2):

由于y(i)∈{0,1},对“0”与“1”的判断可用概率表示,所以应选取合适的自变量与因变量之间的函数关系hθ(x)描述因变量的取值概率,见式(3)、式(4):

式中,P(y=1|x)表示y=1(稳定)的概率,P(y=0|x)表示y=0(欠稳定)的概率,0<hθ(x)<1。上述两式表示,当z取正值且较大时,P(y=1|x)=1,P(y=0|x)=0,当取负值且足够小时,P(y=1|x)=0,P(y=0|x)=1。由此可通过选取适当的概率阈值判断边坡是否稳定。

1.2.2 模型的求解

在Logistic回归中,最终要求解的未知量是θ,此处采用最速梯度下降法进行求解。在求解过程中需要判定解是否收敛,可选取一个目标函数,命名为Cost函数,Cost函数在Logistic回归中用于判定算法的收敛性,当Cost函数达到最小值时判定算法求解已收敛,即此时的θ即为区分边坡稳定性的最优解。

机器学习中,通常该问题的Cost函数表达式见式(5):

对式(5)解释如下:由于需要得到J(θ)的最小值,因此当已知样本的y(i)=1时,意味着需要将式中的hθ(x(i))更替为一较大值,使得J(θ)减小;当y(i)=0时,意味着需要将hθ(x(i))更替为一较小值,使得J(θ)减小。由此通过一个边坡稳定性的判断,可以得到一组更佳的θ值,θ迭代方式通过最速梯度下降法获得,见式(6):

式中,α为学习速率,为一常数,式(6)即θ原值减去学习速率与式(5)对θ的导数之积,Cost函数沿此路径下降最快。实际计算时本文采用Matlab的fminunc函数实现α的自动选取。

由此经过一系列已知边坡稳定性情况对上述模型的反复训练,便可得到使得Cost函数收敛的最佳θ取值,将该值代入式(2)中得出判断边坡稳定与否的边界。

1.3 水利工程边坡稳定性评价模型变量的参数化

在按上述思路求解该水利工程边坡稳定性评价模型的过程中,定义模型自变量为坡高、坡角、地层岩性、岩体结构、软弱地层、风化程度、地下水和年降水量。其中坡高、坡角和年降水量已为量化指标,可不进行处理,但需将其他自变量进行量化以便代入数学模型运用Logistic回归算法进行求解。参考刘美芳[8]所建立的复杂边坡管理系统,规定量化指标见表1~表5。

表1 岩性量化指标

表2 岩体结构量化指标

表3 软弱地层量化指标

表4 地下水量化指标

表5 风化程度量化指标

2 工程实例分析

2.1 案例及训练集地质资料

石磨岭库区边坡经初步地质调查,得到的地质资料见表6[9],现对该边坡的稳定性作出初步的定性判断。

表6 石磨岭库区边坡地质资料

首先利用表1~表5对该水利工程边坡的地质资料进行量化操作,所得量化指标见表7。

表7 地质情况量化表

利用Logistic回归建立分类模型的首要步骤是收集训练集相关数据。由于所研究的对象是水利工程边坡,研究的内容是水利工程边坡的稳定性评价,可根据统计学大样本定义,借鉴该案例的评价指标,经野外地质调查,另选取30个水利工程边坡形成训练集。水利工程边坡训练集相关数据见表8,相关指标均以量化的形式呈现。

表8 水利工程边坡训练集数据

由表8可知,正样本(“稳定性”=1)的个数为13,负样本(“稳定性”=0)的个数为17,正负样本选取较为均匀,可以进行下一步的Logistic回归分析。

2.2 Logistic回归及稳定性评价

2.2.1 Logistic回归的实现

由表8可知,单个样本中自变量的取值差异较大,如年降水量比岩性评分等指标高出2个数量级,这种情况将会造成Logistic回归的收敛速度过慢甚至无法得到最优解。因此,考虑将每个自变量均进行特征缩放,特征缩放的过程见式(7):

式中,μj为第j个自变量的均值,sj为第j个自变量的标准差,由此限制所有样本的自变量均满足。

为防止过拟合的现象发生,设定正则因子为λ(λ>0,λ∈R),正则化后的Cost函数及θ值迭代表达式分别见式(8)、式(9):

式中,与λ的乘积项为正则化项,通过选取合适的正则因子λ可以有效地防止过拟合。

取λ=10,经上式迭代400次,编制程序进行计算,可得θ值:

此时对应的Jmin(θ)=0.263545,θ为局部最优解,由于Cost函数是凸函数,所以该局部最优解便是全局最优解。

建立水利工程边坡稳定性定性预测与评价模型,见式(10)、式(11):

式(10)为预测模型,式(11)为评价模型,将待评价边坡的自变量代入两式计算,当hθ(x)≥0.5时,认定y(i)=1,即坡体是稳定的;当hθ(x)<0.5时,认定y(i)=0,即坡体欠稳定。

2.2.2 边坡稳定性评价

在对工程案例进行评价之前,为考证模型的正确性,将30个训练集边坡案例代入由式(11)所建立的模型中,重新对各个已知稳定性的边坡进行稳定性判断。经检验,得到与真实结果相同结论的准确率为96.67%,模型准确性较高。

对案例边坡进行稳定性评价,将已量化的已知自变量代入上述模型中,得到hθ(x)=0.263442<0.5,因此y=0,即该边坡可能发生失稳,与实例结论一致。

3 结 语

水利工程边坡稳定性的研究是水利工程建设可行性研究的重要环节之一,在可行性研究阶段对坡体稳定性进行简单可信的定性评价有利于节省勘查成本和研究成本。基于这一需求,结合目前热门的Logitsic回归思想,建立了水利工程边坡稳定性评价模型,该模型能够定性给出坡体的稳定性情况。模型考虑了地层岩性、坡高、坡角等8个主要因素对坡体稳定性的影响,充分体现坡体的特征,使得运用该模型评价的结果更加准确可靠。经30个样本的训练后,利用该模型对石磨岭库区水利工程实际边坡稳定性作出了定性预测,论证了该模型的可靠性和实用性。

猜你喜欢

坡体因变量边坡
降雨与水位波动作用下的水库边坡稳定性影响研究
水利工程施工中高边坡开挖与支护技术的应用
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
建筑施工中的边坡支护技术探析
采动-裂隙水耦合下含深大裂隙岩溶山体失稳破坏机理
陡帮强化开采边坡立体式在线监测技术研究
边坡控制爆破施工
强降雨作用下滑坡稳定性分析
偏最小二乘回归方法
谈谈如何讲解多元复合函数的求导法则