基于GRA-GPR的滚石运动特征参数敏感性分析及预测模型
2024-03-13赵天豪马春辉
赵天豪,马春辉,杨 杰,程 琳
(1. 西安理工大学 水利水电学院,陕西 西安 710048; 2. 西安理工大学 省部共建西北旱区生态水利国家重点实验室,陕西 西安 710048)
0 引言
滚石是指个别块石因某种原因从地质体表面失稳后经过下落、回弹、跳跃、滚动或滑动等运动方式中的一种或几种的组合沿着坡面向下快速运动,最后在较平缓的地带或障碍物附近静止的动力演化过程[1]。滚石灾害虽发生规模较小,但由于其具有泛生性、突发性和随机性的特点,其所造成的生命、财产损失与大规模滑坡灾害基本相当。随着我国国民经济的高质量发展和西部大开发战略的实施,水利、公路和建筑等基础建设范围日益广泛,所面临的滚石灾害问题愈发凸显[2-3]。因此,明确合理、有效的支挡结构设计方案和位置,是防止滚石灾害发生、减少灾害损失的有效手段之一[4],而滚石的运动特征参数是制定支挡结构方案的关键指标,直接关系到滚石防护治理工程的安全性、经济性和有效性。由于边坡滚石的影响因素众多,滚石的运动特征参数具有明显的随机性和模糊性[5],目前缺少易用性高和精确度高的边坡滚石运动特征参数预测方法[6]。
国内外专家学者针对滚石的运动模型运动参数开展了大量的研究:在滚石的运动参数方面,黄润秋等[6]通过现场滚石试验,分析了滚石形状对滚动摩擦系数的影响;AZZON等[7]应用数学模型进行落石的研究;DUSSAUGE等[8]研究了3个实际落石的堆积,并采用幂律分布拟合落石体积分布数据;秦志英等[9]通过单球碰撞系统的数值仿真,从精度、效率和微观接触过程等方面对各种碰撞模型进行了比较;何思明等[10]研究了滚石法向和切向碰撞恢复系数的计算模式与计算公式,并阐明了影响碰撞恢复系数的主要因素。在滚石运动预测方面,吴顺川等[11]提出了落石参数的正交试验确定方法,及基于概率分析的落石预测分析思路;吴琴等[12]通过分析崩塌落石的运动形式和受力情况,对灾害的危险性进行预测;王学良等[13]对山区输变电工程中滚石灾害的识别与预测方法进行了研究;郭亮等[14]通过室内模型试验考察基-覆界面倾角、傍依坡角和堆积高度对震后崩塌堆石体稳定性的影响,揭示失稳前兆特征及变形破坏模式;何宇航等[15]对九寨沟景区悬沟危岩体的威胁范围进行了预测;熊绍真等[16]采用3DEC离散元数值模拟方法,对高陡斜坡在地下开采作用下崩塌所产生的机理、失稳模式和运动轨迹进行了全过程模拟;魏新容等[17]基于颗粒接触理论,并考虑了斜坡滚石碰撞过程中的随机因素,建立了斜坡滚石速度预测模型;HUANG等[18]利用K近邻算法预测落石跳动范围,根据与坡脚的距离将落石跳动范围分类为不同的子区间;HUANG等[19]将逻辑模型树与装饰、随机子空间和旋转森林集成技术相结合,比较混合方法的预测性能以对不同类型的滑坡进行敏感性评估;ZHOU等[20]引入SVM支持向量机和LM-BP神经网络建立斜坡特征落石预测系统,并通过工程实例对预测系统进行了验证;刘福臻等[21]基于GIS环境下三维落石模拟软件Rockfall Analyst,对物源区块石进行了运动轨迹、速度和弹跳高度的数值模拟。上述研究在滚石问题中均取得了重要进展,但对于滚石运动特征参数的研究目前多针对单一因子,尚未有不同因素的敏感性研究,且缺少科学、快捷的滚石运动特征参数预测系统。
综上,本文将灰色关联法与滚石运动数值模拟相结合,以滚石的水平运动距离、弹跳高度和冲击运动能量为目标指标,分析评价不同滚石运动特征影响因素的显著性。在此基础上,采用多种预测方法对滚石运动特征参数进行预测,并依据预测精度选取精度最优的预测模型,以快速估算滚石运动参数,为支挡结构的设计施工提供科学合理的依据。
1 GRA-GPR模型原理简介
1.1 GRA原理
灰色关联法(grey relation analysis, GRA)用于判断多因素之间的关联性,可以确定各因素与参考变量之间的主次关系,进而掌握事件的主要特征,相较于其他多目标优化方法,灰色关联法具有搜索性强和效率高的特点[22-23]。本文采用邓氏关联度[23]评价滚石运动特征参数与其影响因素的显著性关系。邓氏灰色关联法原理如下:
设有参考序列X0(t)和比较序列Xi(t);由于不同变量的量纲不同,故需进行无量纲处理:
(1)
求差序列Δi(t)及差序列的最大差Δmax和最小差Δmin公式为
(2)
(3)
(4)
可得灰色关联系数:
(5)
式中ρ为分辨系数,取值区间为(0,1),具体取值要具体分析情况。当ρ≤0.5463时,分辨力最好,通常取值0.5。
滚石灾害受到地形、地质、环境和人为因素等各种因素的影响,有较强的不确定性,属于灰色系统[24],因此,滚石运动特征参数及其影响因素的研究也属于灰色关联分析的范畴,灰色关联法还具有原始信息量少、计算简单及预测精度较高等优点。综上,灰色关联法适合滚石运动特征参数影响因素的敏感性分析。
1.2 GPR预测模型
高斯过程回归(Gaussian process regression, GPR)是基于贝叶斯网络的新型机器学习算法[25],它适用于处理小样本、随机性强及多维复杂因素预测问题[26-27]。GPR模型本质上是非参数回归模型[28],是将函数的分布从有限维度空间推广到无限维。对于数据集合:
D={(xi,yi)|i=1,…,n}
(6)
输入矩阵xi∈Rd,输出矩阵为yi∈R。其中f(x(1)),f(x(2)),…,f(x(n))可构成输入变量的联合高斯分布集合,即
f(x)~GP(m(x),k(x,x′))
(7)
考虑到训练样本目标值中可能存在噪声,所以GPR的一般模型为
y=f(x)+ε
(8)
式中ε为独立的高斯白噪声,方差为σ2。
(9)
式中:I为单位矩阵;C(X,X)和K(X,X)分别为N×N的协方差矩阵与核矩阵。
训练数据的输入向量X和输出向量f,以及测试数据的输入向量X*和输出向量f*间的联合高斯分布为
(10)
式中,K(X*,X)=KT(X,X*)=[k(x1,x*),k(x2,x*),…,k(xn,x*)]T为n×1维协方差函数,测试数据的自协方差函数值为K(X*,X*)。由此可以得到高斯过程回归方程,即
f*|X,y,X*~N(mx,cov(f*))
(11)
(12)
(13)
式中f*为预测均值向量。
2 基于GRA-GPR的滚石运动特征参数预测模型构建
影响滚石运动的因素众多,针对单一工程边坡,目前缺少简单易操作的滚石运动特征参数预测系统。因此,深入研究滚石影响因素是进行防护措施设计、施工和构建滚石运动特征参数预测模型的关键。综上,本文基于GRA计算分析滚石运动影响因素的敏感性,并根据敏感性分析结果,基于GPR等预测方法构建了不同滚石运动特征参数的预测模型,其主要计算步骤如下:
1)灰色关联分析:①确定参考序列和比较序列,即滚石运动特征参数和各个影响因子;②针对数据进行无量纲化处理;③求解参考序列和比较序列之间的灰色关联系数值;④求解关联度值;⑤对关联度值进行排序,得出结论。并将灰色关联的分析结果与极差方差的结果结合分析,得出不同影响因子对3个滚石运动特征参数的敏感性排序。将灰色关联分析的结果与方差极差分析的结果相结合,对各个影响因子的敏感性进行综合排序。
2)预测模型的构建:基于不同影响因子的敏感性排序结果和现场实际的勘察情况构建预测模型数据集,对敏感性较高的因子取较多的因素水平,对敏感性较小的因子取较少的因素水平。完成因素水平的选取后,将部分数据集按照一定比例归为验证集,利用二维滚石数值模拟软件,计算工程边坡的滚石运动特征参数。
3)数据预测:利用不同预测方法对3个滚石运动特征参数进行预测,并将预测结果与验证集中滚石模拟软件的计算结果、误差进行对比分析,以此来验证模型的精确性,为实际工程的工作人员提供科学精准方便易操作的滚石运动特征参数预测模型。模型构建的流程如图1所示。
图1 模型构建流程图Fig.1 Model building flowchart
3 基于GRA的滚石运动影响因素敏感性分析
滚石运动特征参数的影响因素众多,且均具有随机性和模糊性的特点,对滚石防护措施的设计、施工及管理都造成了困难。因此,探究众多影响因素对滚石运动特征参数的影响程度,对实际工程中防护方案的制定有重要的意义。GRA是分析因子间相互关系的有效方法,且对样本量、样本概率分布形式要求低,因此,能够将GRA与滚石数值模拟结合,用于分析不同滚石运动影响因素的敏感性。
影响滚石运动特征参数因素众多。本文将水平运动距离L、弹跳高度H和总动能J作为滚石运动特征参数,其主要受初始速度V、边坡摩擦角φ、滚石质量M、法向恢复系数Rn和切向恢复系数Rt等5个滚石运动影响因素的影响。其中Rn和Rt的取值主要受边坡和滚石岩体性质的影响,因此,在以下滚石运动分析中,不将Rn和Rt作为独立因素考虑。
本研究通过滚石运动数值模拟进行计算,将滚石简化为质点以分析崩落岩体的运动。数值模拟是基于滚石基本参数进行大量模拟和概率统计,能够模拟出滚石运动过程中的运动轨迹、运动状态及运动特征参数。
3.1 敏感性分析试验方案设计
滚石运动影响因素的具体取值范围如表1所示。对于初始速度V,通常认为滚石在启动时V较小,本文
表1 滚石运动影响因素的取值范围Table 1 Value range of factors affecting rolling stone movement
取值范围为0.1~0.5 m/s;Rn和Rt参数的取值参考文献[29];在此次研究中,假设边坡为单一的无植被覆盖的堆石边坡。
作为研究多因素、多水平的高效和快速设计方法,采用正交试验设计方法选取的代表点具有“均匀分散,齐整可比”的特点[30],既能减少试验次数,又能收到较好的代表效果。本研究采用正交试验设计方法组成25组试验方案,结果如表2所示,进行数值模拟计算。
3.2 滚石运动影响因素敏感性分析
通过对表2中的25组试验方案进行计算,获得相对应的水平运动距离、弹跳高度和总动能等滚石运动特征参数,使用灰色关联方法对计算结果进行敏感性分析,结果如图2所示。灰色关联法的关联度值介于0~1之间,该值越大代表其与滚石运动特征参数之间的相关性越强。
表2 数值模拟计算结果Table 2 Numerical simulation calculation results
由图2可知,Rn、Rt、φ对于水平运动距离的影响较大,对V、M的影响结果较小;Rn、Rt、φ对于弹跳高度的影响较大,对V、M的影响结果较小;M对于总动能的影响较大,对其余因素的影响较小。此结果符合边坡滚石的一般规律特性。
图2 滚石运动影响因素关联度计算结果Fig.2 Calculation results of correlation degree of influencing factors of rolling stone
在上述分析的基础上,使用极差和方差方法进一步分析数值模拟结果。极差和方差的计算结果如表3和表4所示。极差分析与灰色关联法的结果分析类似,根据极差分析的计算结果,可以对影响因素的敏感性进行排序;方差分析的贡献值p是衡量3个滚石运动特征参数与影响因子差异大小的指标,*代表p值小于0.01,表示2组存在显著差异。
表3 数值模拟计算结果极差分析Table 3 Range analysis of numerical simulation calculation results
综合图2、表4的计算结果进行分析,得出以下结论:
1)对于水平运动距离L,灰色关联法和极差分析的滚石运动影响因素敏感性结果一致,结合方差分析结果可知:Rn、Rt、φ、V均对L影响较大,而M对L无显著性影响。
2)对于弹跳高度H,灰色关联法和极差分析的滚石运动影响因素敏感性结果一致,结合方差分析结果可知:Rn、Rt、φ均对H影响较大,而V和M对L无显著性影响。
3)对于滚石的总动能J,灰色关联度和极差分析对各因素显著性的排序结果分别为M>V>Rn>Rt>φ和M>Rn>Rt>φ>V;方差分析认为仅滚石质量对滚石的总动能有显著性;因此结合方差分析结果可知:M对于J有较强的显著性,其余因素对J均无显著性。
4)由图2、表3和表4可知,V对于3个滚石运动特征参数的影响均较小;φ对于L和H的影响较大,对于J的影响较小;M对于J的影响较大,对于L和H的影响较小;Rn和Rt对于水平运动距离L和H的影响较大,对于J的影响较小。
表4 数值模拟计算结果方差分析Table 4 Analysis of variance of numerical simulation results
综上所述,基于GRA分析的结果可知:Rn、Rt、φ对水平运动距离L和弹跳高度H的影响较大,对总动能J无显著性影响;M仅对J有较大影响,对水L和H无显著性影响;V仅对L有较小影响,对H和J无显著性影响。
4 基于GPR的滚石运动特征参数预测模型
滚石运动特征参数多需要通过数值模拟计算获得,当影响滚石运动影响因素发生较大变化时,需要重新进行数值模拟计算,制约着防护方案的制定。因此,本研究将采用支持向量机、神经网络和高斯过程回归等预测方法,以某抽水蓄能电站的特大型堆石边坡为例,建立滚石运动特征参数的预测模型,为防护结构的设计、施工及时提供科学数据。
4.1 预测模型数据集建立
本研究以某一等大(1)型抽水蓄能电站的堆石边坡为研究对象,滚石的边坡和业主营地的位置关系如图3所示。建成后的特大型堆石边坡最大高差为199.80 m,一旦发生滚石灾害,极有可能对上下库连接路、业主营地造成堵塞,存在极大的安全隐患。因此,建立快速、准确的滚石运动特征参数预测模型,对工程的安全管理与可靠运行具有重要的意义。
图3 滚石边坡与工程弃渣场的平面布置图Fig.3 Floor plan of rolling stone slope and engineering waste slag yard
模型构建方法如下:根据现场勘察的情况可知,边坡上半段主要为矮植被的岩屑堆积层,边坡下半段主要为无植被的块石堆积层,边坡的实际状况及三维模型如图4 所示。因此,在进行数值模拟建模时,两段边坡的恢复系数及摩擦角取值范围也不同,具体的取值范围参考文献[31]。各参数具体取值范围如表5所示。由基于GRA的滚石运动影响因素敏感性分析结果可知:恢复系数、质量和摩擦角对滚石运动特征参数影响程度较大,对初始速度的影响程度较小,基于敏感性分析结果和实际调查情况,拟定该边坡滚石运动特征参数的水平取值,共组成216组试验组合,选取数据集后40组作为验证集。
图4 边坡分段示意图Fig.4 Schematic diagram of slope section
对表5的数据排列组合并进行数值模拟计算,得出预测模型所需数据集,如表6所示。
表5 预测模型各参数取值范围Table 5 Value range of each parameter of the prediction model
根据表6的数据,建立滚石运动特征参数的预测模型,具体步骤如下:①确定取数据集176组试验数据,采用SVM、GPR和神经网络方法进行回归训练,用后40组样本进行预测验证;②通过贝叶斯优化器进行参数寻优,确定最小MSE;③基于生成的预测模型,使用交叉验证法进行验证;④对验证集的预测值和实际值进行误差分析,确定模型的可行性。
表6 预测模型试验数据集Table 6 Experiment dataset of prediction model
4.2 预测结果分析
各模型对不同特征参数的预测相对误差、对角误差图如图5所示,预测值和实际值的均方误差(MSE)、R2如表7所示。
图5 不同特征参数的预测相对误差及对角误差Fig.5 Prediction relative error and diagonal error of different feature parameters
对于模型精确度的评价通过两方面进行:①MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述试验数据具有更好的精确度;②R2也称拟合优度和决定系数:反应回归模型拟合数据的优良程度,R2越接近1,代表模型的拟合效果越好。由图5和表7可知:
表7 不同预测模型对不同参数预测的MSE及R2Table 7 MSE and R2 of different prediction models for different parameters
1)对于滚石的水平距离,基于GPR的滚石运动特征参数预测模型的相对误差及MSE最小,R2值最大,模型预测的精度最高;
2)对于滚石的弹跳高度,基于神经网络的相对误差及MSE最小,R2值最大,模型预测的精度最高,基于GPR的滚石运动特征参数预测模型精度略差;
3)对于滚石的总动能,基于GPR的滚石运动特征参数预测模型的相对误差及MSE最小,R2值最大,模型预测的精度最高;
4)从模型的训练时长看,GPR预测模型的训练时间要明显优于SVM预测及神经网络预测。
综上所述,基于GPR的滚石运动特征参数预测模型虽存在一定的误差,但未超过10%[32],模型精度能够满足工程要求,并且相较于SVM预测及神经网络预测有较为明显的优势,在模型预测时间上也明显优于SVM预测及神经网络预测。基于GPR的滚石运动特征参数预测模型,省去了传统滚石数值模拟繁琐的计算过程,预测模型只需修改不同影响因子的取值即可快速获得相应的滚石运动特征参数,有效提高了设计施工人员的工作效率。
5 结论
本文将灰色关联法与滚石数值模拟相结合,以滚石的运动特征参数为目标参数,对滚石运动影响因素的敏感性进行分析,得出结论如下:
1)Rn、Rt、φ对水平运动距离L和弹跳高度H的影响较大,对总动能J无显著性影响。
2)M仅对J有较大影响,对L和H无显著性影响。
3)V仅对L有较小影响,对H和J无显著性影响。
根据影响因素的敏感性分析结果,基于GPR、SVM和神经网络方法对滚石运动特征参数建立预测模型,对不同模型的精度和训练耗时等进行对比,结果表明基于GPR的方法滚石运动特征参数预测模型能够对特征参数进行精准快速估算,提高了工作人员设计施工管理的工作效率,对实际工程中支挡结构的设计施工有重要的参考价值和意义。