基于WOA优化Elman神经网络的露天矿边坡位移预测
2024-01-10戚鑫鑫杨逸飞高彩云
高 宁,戚鑫鑫,杨逸飞,高彩云
(1.河南城建学院测绘与城市空间信息学院,河南平顶山467036;2.安徽理工大学空间信息与测绘工程学院,安徽 淮南 232001;3.高分辨率对地观测系统河南数据与应用中心平顶山分中心,河南 平顶山 467036;4.白俄罗斯国立经济大学,白俄罗斯 明斯克 220071)
露天开采是我国矿产资源开发的主要形式,在开采过程中形成了大量的矿边坡工程。随着开采深度、堆排高度和边坡角度不断增大,边坡稳定性变差,由此引发的露天矿安全风险日益突出,制约了区域经济和社会的可持续发展[1]。为降低露天矿安全风险,迫切需要建立准确的边坡变形预测模型,及时掌握边坡变形发展趋势,实现提前预测、预报和预警。
露天矿边坡始终处于复杂的动态开挖、回采过程,且影响因素复杂多变[2],因此具有明显的“动态”特征。目前,学界关于边坡变形预测的方法主要有时间分析、小波分析、灰色系统理论、神经网络等[3]。其中,神经网络因其具有较强的非线性映射能力、自主学习能力优等特点,被广泛用于边坡工程变形预测。如林国平[4]采用BP神经网络对降雨条件下的边坡变形演化发展进行了较为准确的预测;欧阳斌等[5]利用优化后的BP神经网络对安家岭露天煤矿1270平盘边坡位移开展预测,预测结果与实测值较为吻合;刘利君等[6]应用RBF神经网络对白音华二号露天矿南帮边坡位移进行了预测;韩亮等[7]提出了基于RBF神经网络的露天矿边坡稳定系数预测模型。虽然BP、RBF神经网络能够用于露天矿边坡位移预测,但其建模原理都是将动态时序问题转变为适合算法本身的静态问题,而这与露天矿边坡工程数据的动态特性不匹配,会影响预测结果的合理性、正确性。
基于此,本文引入具有动态反馈功能的Elman神经网络,并通过鲸鱼算法(Whale Optimization Algorithm,WOA)获取最佳权值和阈值,构建露天矿边坡WOA-Elman预测模型,为露天矿边坡变形预测提供一种有效途径。
1 模型算法原理
1.1 Elman原理及特点
1990年,Jeffery.L.Elman针对语音处理问题提出了Elman神经网络。它的输入包括有延迟的输入或输出数据的反馈,被视为一种反馈动力学系统[8-10]。
Elman神经网络的拓扑结构主要包含输入层、隐含层、承接层和输出层(见图1)。输入层的主要作用是传输信号;隐含层的主要作用是连接输出层和承接层的反馈,根据权值的调整影响输入的数据;承接层作为一步延时算子,能够使系统对历史状态的数据具有较强的敏感性,以达到记忆目的,增强网络本身处理动态信息的能力,实现动态建模;输出层的主要作用是线性加权输出。
图1 Elman神经网络拓扑结构
Elman神经网络的非线性状态空间表达式为
式中:x为n维隐含层的节点单元向量;f(*)为隐含层神经元的传递函数;w1为承接层与隐含层的连接权值;w2为输入层与隐含层的连接权值;w3为隐含层与输出层的连接权值;xc为n维反馈状态向量;u为r维输入向量;y为m维输出节点向量;g(*)为输出神经元的传递函数,是隐含层输出的线性组合。
Elman神经网络采用传统的BP神经网络修正权值。误差函数的表达式为
式中di(k)为k时刻第i个输出节点的期望输出。
1.2 WOA优化Elman神经网络
WOA是一种元启发式优化算法,他源于对自然界中座头鲸群体狩猎行为的模拟,如鲸鱼群体搜索、包围、追捕和攻击猎物等过程实现优化搜索目的。相较于其他优化算法,WOA具有机制简单、参数少、寻优能力强等优点[11-12]。
传统的Elman神经网络初始权值和阈值一般通过随机赋值方式确定,缺乏全局搜索优化能力。本文采用WOA优化Elman神经网络的权值和阈值,增强Elman网络的训练速度及全局寻优能力。WOA优化Elman神经网络(WOA-Elman)算法流程如图2所示。
图2 WOA优化Elman神经网络算法流程
Step1:初始化Elman神经网络所需的参数。
Step2:初始化鲸鱼数量、最大迭代次数以及参数的上下限等WOA参数。
Step3:WOA通过包围猎物、螺旋式更新位置和搜索猎物,迭代优化Elman神经网络,直到迭代结束,形成最佳个体,包括权值和阈值。
Step4:分析最佳个体,利用分析的权重和阈值对Elman神经网络进行训练,并进行预测。
2 实例建模与验证
抚顺西露天煤矿位于辽宁省抚顺市,是我国第一大露天煤矿。该矿南帮边坡岩体破损、风化严重。本文以2016年1月至3月采用雷达系统监测的该矿南帮边坡位移80期数据[13]为例建立边坡位移预测模型。
2.1 构建WOA-Elman边坡位移预测模型
(1)数据预处理。
随着露天矿边坡演变阶段的不同,数据的变化差异较为明显。采用Elman神经网络预测时,各输入数据之间的量级差异偏大或者偏小均会影响预测结果。为了消除数量级与量纲方面的影响,防止出现神经元输出饱和现象,本文对所有原始数据进行归一化处理,使其均落在[0,1]区间。归一化公式为
反归一化公式为
式中:xmax为输入样本数据的最大值;xmin为样本数据的最小值;xi、yi分别为输入样本归一化前后的值。
(2)确定输入层节点数。
Elman神经网络输入层节点数对预测时效影响较大。若输入层节点数太大,Elman神经网络的训练时间长、结构冗余;若输入层节点数太小,会导致Elman神经网络不收敛。为此,本文采用滚动预测模式确定输入层节点数。所谓滚动预测即对每一周期的训练数据进行同步更新[14]。
以训练样本为例,抽取x1~xN组成第一个样本,其中(x1,x2,…,xN-1)为自变量,xN为目标函数值,以此类推,形成训练矩阵
本例中,分别选取3,4,5,…,20作为输入层节点数进行实时滚动。因输出为边坡预测值,故输出节点取1。不同的输入层节点数所对应的均方误差如图3所示。当N取值为3时,神经网络的均方误差最小,因此,选择3作为输入层节点数。
图3 本文输入层节点数与神经网络均方误差的关系
(3)选取激活函数。
选取常用的激活函数(purelin型、logsig型及tansig型)进行两两组合,求出不同组合下预测结果的均方误差(见表1)。
表1 不同激活函数组合预测结果的均方误差
由表1可知,当隐含层函数选取purelin、输出层函数选取purelin时,均方误差最低。因此,本文选其作激活函数组合。
(4)确定隐含层节点数。
隐含层节点数直接影响Elman神经网络的泛化能力。若隐含层节点数太大,则网络训练时间过长,会导致过学习现象,进而降低工作效率;若隐含层节点数太小,则难以建立复杂的映射关系,会导致逼近能力差。
图4 本文隐含层节点数与神经网络均方误差的关系
2.2 3种模型的建模与预测性能对比分析
(1)3种模型建模。
分别采用3种神经网络对本文实例进行建模预测。将第1~58期数据作为训练样本,将第59~80期数据作为测试样本。
模型1(BP神经网络)。输入节点设为3,输出节点设为1,单隐含层,隐含层节点数设为6,隐含层、输出层的激活函数以及训练函数分别设为tansig、purelin、trainlm,学习速率设为0.01,目标误差设为0.000 1 mm,最大收敛次数设为2 000。
模型2(Elman神经网络)。输入节点数设为3,输出节点数设为1,单承接层、单隐含层、隐含层节点数均设为8,隐含层、输出层的激活函数均为purelin,训练函数设为traingdx,学习速率设为0.01,动量因子设为0.01,目标误差设为0.000 1 mm,最大收敛次数设为2 000。
模型3(WOA-Elman神经网络)。采用WOA获取Elman神经网络的最佳权值和阈值。初始化Elman神经网络所需的参数以及WOA参数(如鲸鱼数量、最大迭代次数以及参数的上下限等),再通过WOA包围猎物、螺旋式更新位置和搜索猎物操作,不断迭代寻找最优个体(包括权值w1、w2、w3和阈值b1、b2)。WOA的维数设为105,则存放最优个体的矩阵为1×105的权值矩阵。输入层到隐含层是8×3的权值矩阵,共24个权值。隐含层到承接层是8×8的权值矩阵,共64个权值。隐含层的阈值矩阵为8×1矩阵,共8个阈值。隐含层到输出层是1×8的权值矩阵,共8个权值。输出层的阈值矩阵为1×1的矩阵,共1个阈值。使用WOA得到的WOA-Elman神经网络最优初始权值和阈值如表2所示。
表2 WOA-Elman神经网络最优初始权值与阈值
(2)3种模型的预测性能对比分析。
采用3种神经网络对本文实例建模时,迭代次数越少,收敛速度越快。为了验证WOA-Elman神经网络的收敛性,在相同的训练样本下,比较WOA-Elman神经网络与Elman神经网络的收敛速度(此处不再讨论BP神经网络的收敛性)。WOA-Elman神经网络的进化曲线如图5所示。迭代过程可分为3个阶段:第0~10次进化迭代时,均方误差急剧减小;第10~23次进化迭代时,均方误差变化率逐渐减弱;第38次进化迭代后,进化曲线趋于平缓,并最终获得最优值。
图5 WOA-Elman模型的进化曲线
样本相同时,Elman神经网络在迭代108次时才达到收敛,而WOA-Elman神经网络仅迭代38次,就达到了收敛,说明WOA-Elman神经网络收敛速度快。3种模型对测试样本的模拟测试结果及残差值如表3所示。
表3 3种模型对抚顺西露天矿位移的模拟测试结果mm
由表3可知,模型1的残差绝对值最大为1.07、最小为0.02;模型2的残差绝对值最大为0.68、最小为0.05;模型3的残差绝对值最大为0.37、最小为0.01。这说明模型3的测试结果较稳定,波动性小。选取均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)等指标评价各模型,评价结果如表4所示。
表4 3种模型对抚顺西露天矿位移预测的测试结果精度
由表4可知,模型3的MAE、RMSE和MAPE分别为0.146 mm、0.167 mm及0.685%,与其他两种模型的预测结果相比,具有较小的预测误差,与模型2的MAE、RMSE、MAPE相比,分别降低了0.137 mm、0.165 mm、0.647%。因此,模型3的稳定性更好,预测精度更高,泛化能力更强。
3 结论
(1)Elman神经网络具备动态映射功能,适应时变建模预测系统。
(2)采用WOA优化Elman神经网络的初始阈值与权值,增强了Elman神经网络的稳定性以及全局寻优的能力,提升了Elman神经网络预测的稳定性。
(3)WOA-Elman神经网络对露天矿边坡变形预测得到的RMSE、MAE、MAPE均优于Elman神经网络和BP神经网络,且收敛速度快,预测结果与真实值更接近、精度更高。本文模型可为露天矿边坡灾害的防治工作提供参考。