APP下载

基于投影寻踪聚类方法的边坡稳定性分析

2019-06-28李佳伟顾中明

水电与新能源 2019年6期
关键词:安全系数投影遗传算法

李佳伟,李 婷,顾中明,张 琪

(1.四川蜀禹水利水电工程设计有限公司,四川 成都 610072;2.南京水利科学研究院,江苏 南京 210024;3.云南水利水电建设工程技术开发有限公司,云南 昆明 650021;4.乐安县烟草专卖局,江西 抚州 344300)

边坡稳定性分析评价一直以来都是土木工程中的重要课题和难点[1-2]。边坡稳定性受多重因素的影响[3],安全系数法是衡量边坡稳定的常规方法,但同一安全系数往往具有不同的安全性。常用的边坡稳定评价方法有灰色聚类、熵值法确定权重、模糊评价等基于均值和权重的评价方法[4-5]。这些方法,一方面,对于非线性、高维的边坡稳定影响因素分析存在很多不确定性[6];另一方面,没有理论依据的权重赋值,导致结果受人为干扰因素过大。因此,这些方法存在一定的局限性或适用范围。投影寻踪是一种将高维数据投影到低维空间上,寻找能够反映原高维数据的结构特征的投影,从而分析高维数据规律的方法。司俊燕等[2]使用粒子群优化算法结合投影寻踪聚类方法对锦屏一级水电站边坡稳定进行了分析,将边坡稳定性能分为五个等级;汪明武等人[5]利用加速遗传算法结合投影寻踪聚类方法对12个典型崩滑体边坡进行了分析;金永强等人[7],使用和声搜索和投影寻踪聚类方法,分析12个边坡案例。综上,投影寻踪聚类结合人工智能算法,在的边坡稳定性分析中得到了充分的运用。

本文以冯夏庭[8]书中记载的典型的82个圆弧破坏型边坡工程实例数据为驱动,建立投影寻踪聚类模型,采用遗传算法实现对样本的自动聚类寻踪和投影方向拟合,并对其适用性进行分析。

1 投影寻踪聚类模型建立

1.1 原理方法

在边坡稳定分析中,假设对边坡稳定主要影响因素有m个,共收集到n个边坡实例,即将n个实例组成样本集xij(i=1,2,…,n;j=1,2, …,m),其中xij为第i个案例的第j个指标值。综合成投影方向a={a(1),a(2), …,a(n)}上的投影序列值{z(i)|i=1,2,…,n},通过构造投影指标Q(a)实现各案例的边坡稳定性进行聚类,并用遗传算法进行优化求解,以Q(a)最大化时的a*值,来确定投影值Z(a)并评价边坡的安全性能大小。

步骤 1:边坡影响因素归一化处理

对于越大越优的指标:

(1)

对于越小越优的指标:

(2)

步骤2:构造投影函数

(3)

a=(a(1),a(2), …,a(m))为m维数据{x(i,j)|j=1~m}的投影方向,{z(i)|i=1~n}为投影值,依据投影值进行分类。

步骤3:构造投影指标函数

构造投影指标函数,投影指标函数的优劣,以投影值z(i)局部之间凝聚效果和投影局部与局部之间的分散效果为判断指标。最优的投影值z(i)分布特征应达到局部尽可能聚集,局部与局部间尽可能分散。其数学实现途径如下:

2.4.2 不同性别的医务人员院感知识认知正确率比较分析 不同性别医务人员的问卷总体认知正确率差异并无统计学意义(P>0.05),进一步对问卷的7个方面逐一比较后发现,医院污物处理认知正确率男性医务人员高于女性医务人员,差异有统计学意义(P<0.05)。在其余6个方面男女认知正确率差异无统计学意义(P>0.05)。

Q(a)=SzDz

(4)

其中,Q(a)为投影指标函数,Sz为投影值z(i)的标准差:

(5)

Dz为投影值z(i)的局部密度:

(6)

其中,Ez为投影均值;R为投影局部密度的半径,R的值不宜过大,过大会导致局部投影分区不明显,也不宜过小,过小会导致投影聚类效果下降。rij=|z(i)-z(j)|,表示不同样本间的投影差值;u(R-rij)为单位阶跃函数,当R-rij≥0时u值为1,当R-rij<0时u值为0。

步骤4:优化投影指标函数——基于遗传算法确定最佳投影方向

投影指标函数Q(a)的取值仅受投影方向a的影响,将最佳投影方向定义为多影响因素下的最大可能暴露边坡安全性特征的投影方向。通过求解投影指标函数最大化问题来估计最佳投影方向[8],即:

maxQ(a)=SzDz

s.t.a(j)⊆[0,1]

以{a(j)|j=1~m}—j个样本指标为变量的复杂非线性优化问题。

在确定目标函数和约束条件的情况下,采用基于全局优化的遗传算法来求解最优投影方向[9-10]。确定最优投影方向a*。

步骤5:投影值综合聚类分析

将a*代入公式(3),进行聚类计算,得到最优投影值z*(i):

各投影值z*(i)间相隔越接近,表示样本之间更易于越倾向为同一类。按z*(i)值从大到小排序,据此可把各指标的样本集进行分类[1]。

1.2 边坡稳定投影寻踪聚类分析实现过程

采用matlab实现上述计算步骤。82个典型圆弧破坏数据中,包含了边坡稳定影响因素、安全系数值和边坡稳定状态。影响边坡稳定的主要有6个参数[8]:岩石容重γ、岩石粘聚力C、内摩擦系数φ、边坡角φf、边坡高度H和孔隙压力比γu。将这6个参数作为输入参数,参数分为越大越优的指标和越小越优的指标。为避免因参数间数量级不同造成误差,同时保留数据间的联系,对样本数据进行归一化。具体实现过程:

1)依据边坡稳定特性γ、C、φ三个安全系数越大越易趋于稳定,按公式(1)进行归一化;φf、H和γu越小越易趋于稳定,按公式(2)进行归一化。

2)适应度函数。依据投影寻踪算法,建立待优化的函数即适应度函数Sz,遗传算法一般默认为求极小值,因此优化的函数的目标函数为-Sz。其中,本文中R取值为0.1Sz。

3)调用matlab里的optimtool优化算法。求解器选择遗传算法工具ga-Genentic Algorithm。

4)遗传算法具体参数。约束边界条件为6个参数的取值范围,6个参数的上边界为均为0,下边界均为1。其他设置采用,默认设置。

5)当matlab计算停止时,输出使得-Sz最小的最佳投影方向a*;确定各案例在a*下的投影值Z*。并依据Z*的值进行聚类分析。见流程图1。

图1 投影寻踪聚类流程图

2 实例分析

2.1 数据及方法

边坡稳定稳定受多个因素影响[11],针对不同地质,不同边坡破坏形式,投影寻踪聚类法均能进行客观的聚类分析。本文采用冯夏庭[8]中典型的82个圆弧破坏型边坡工程实例作为研究对象,并按照书中次序依次编号为1-82,将82个实例按安全系数小于1.2、1.2-1.3、大于1.3分为3组,如图2。分别进行投寻踪聚类分析。

图2 边坡工程82个实例安全系数值

2.2 结果分析

投影寻踪结果,如图3。不同范围分布的安全系数案例对应不同的最佳投影方向,其中,投影值越大代表越有利于边坡稳定。具体分析如下:

1)安全系数小于1.2,样本量28,按照γ、C、φ、φf、H和γu的顺序,确定最佳投影方向a*=[0.966, 0.272, 0.999, 0.063, 0.758,0.686],投影值见图(a),边坡稳定性贡献排序为:φ>γ>H>γu>C>φf。

2)安全系数1.2-1.3,样本量24,最佳投影方向a*=[0.977, 0.820, 0.334, 0.591, 0.196, 0.994],投影值见图(b),边坡稳定性影响因素排序为:γu>γ>C>φf>φ>H。

3)安全系数大于1.3,样本量30,最佳投影方向a*=[0.981, 0.335, 0.794, 0.008, 0.013, 0.998],投影值见图(c),边坡稳定性影响因素排序为:γu>γ>φ>C>H>φf。

聚类分析。按照投影值大小进行聚类结果等级划分,投影值相近的认为是同一等级即同类。聚类分析的目的是在安全系数确定的情况下,可以再次对各案例进行稳定排序,以便从多角度对边坡的稳定性进行判断。显然,在案例数较多的情况下,对投影值划分越细,聚类过程中会产生越多的分类。本文以投影值相差0.2-0.4为判断区间,并尽可能多的包含案例数量。按阶梯状较好的化为同类,当投影值阶梯状案例数小于4个时,归为同类的投影值相差范围可适当的放大。通过聚类分析,投影值大小进行聚类结果如图3所示。图(a)、(b)、(c)的安全系数变化范围依次为0.6-1.2、1.2-1.3、1.3-2.1。按聚类效果(a)、(c)可分为四类,其中稳定性由高向低排序依次为四类、三类、二类、一类。其中,(a)和(c)由于安全系数变化范围较大,样本间的相似性不足,导致聚类值和安全系数计算结果存在较大的差异,该情况下聚类结果不足以作为判断安全性能差异的依据。但图(b),安全系数变幅在0.1范围内,实例间有足够的相似性,其中投影值小于1.7的为一类,投影值在1.7-1.9的为二类,投影值大于1.9的为三类,聚类结果可作为指导边坡稳定的判断依据。

3 结 语

通过投影聚类分析边坡稳定性,可依据最佳投影方向,通过确定影响边坡稳定性因素的贡献排序,来指导边坡整治,从而达到快速提升边坡的稳定性的目的。同时,对安全系数相接近的情况,可通过投影寻踪聚类方法进一步进行等级分类分析。因此,安全系数法和投影寻踪聚类方法相结合,可对边坡的稳定性进行综合评价。此外,投影寻踪聚类方法适应于小样本间的聚类分析,对于样本数量过大时,聚类效果受样本特异性干扰较大,聚类效果可能失真。因此建议,在投影寻踪聚类分析时为保持样本间具有足够的相似。

图3 安全系数与投影寻踪聚类值

猜你喜欢

安全系数投影遗传算法
考虑材料性能分散性的航空发动机结构安全系数确定方法
解变分不等式的一种二次投影算法
基于最大相关熵的簇稀疏仿射投影算法
找投影
找投影
基于遗传算法的智能交通灯控制研究
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
电梯悬挂钢丝绳安全系数方法的计算
基于改进的遗传算法的模糊聚类算法
关于电梯悬挂钢丝绳安全系数计算的一些探讨