基于WOA-LSTM的工作面瓦斯涌出量预测研究
2023-11-13张玉财郭凯岩
张玉财,王 毅,郭凯岩
(太原理工大学 安全与应急管理工程学院,山西 太原 030024)
矿井瓦斯涌出是造成瓦斯灾害的主要原因之一,不仅影响矿井的安全高效生产,更对井下设备、人员造成极大的威胁,因此,准确高效地对矿井瓦斯涌出量进行预测显得尤为重要[1-3]。对于瓦斯涌出量的预测,国内外专家学者做了大量研究,提出了多种有用的模型和方法。JING Guoxun等[4]在煤矿瓦斯涌出量预测方法中对比了一元线性回归分析法和灰色预测方法,实验验证之后得出灰色预测的GM(1,1)方法具有较好预测精度的结论;邵良杉等[5]将小波理论应用于煤矿瓦斯涌出量预测,建立基于小波理论的支持向量机模型,实验表明该模型具有良好的时间复杂度和预测精度;周西华等[6]采用遗传算法优化BP神经网络初始权值和阈值,建立基于主因子分析的GA-BP神经网络预测模型,测试表明该模型预测平均相对误差为0.58%;肖鹏等[7]针对BP神经网络易陷入局部最优解的问题,采用压缩映射遗传算法(CMGA)对BP神经网络进行了优化,提出一种KPCA-CMGANN模型,该模型通过核主成分分析法(KPCA)对瓦斯数据进行降维处理,降维后的数据经过CMGANN算法对瓦斯涌出量进行预测,实例验证了模型预测精度和收敛速度均优于传统的BP神经网络;刘鹏等[8]针对单一树回归算法(CART)稳定性差、容易过拟合的问题,在算法叶子节点中使用支持向量机建模输出一种增强CART算法,通过实验证明该算法能够有效提高工作面瓦斯涌出量预测精度;付华等[9]采用蚁群优化算法优化基于Elman神经网络的瓦斯涌出量动态预测方法,实验结果表明该ACC-ENN模型有较好的泛化能力和预测精度。上述模型在矿井瓦斯涌出量预测中发挥了重要作用。但瓦斯涌出量变化具有非线性、时变性的特点,如何对瓦斯涌出量变化因素间的关联特征进行有效提取,建立时间序列模型提高预测准确性仍有待进一步深入研究。
随着深度学习理论的进一步发展应用,长短期记忆 (Long Short-Term Memory,LSTM)网络因其较强的建模能力和优秀的泛化能力而被广泛应用于各个领域[10-12]。因此,笔者基于LSTM网络开展瓦斯涌出量预测研究[13-15],提出一种WOA-LSTM模型,即基于鲸鱼优化算法(Whale Optimization Algorithm,WOA)与长短期记忆网络(Long Short-Term Memory,LSTM)相结合的瓦斯涌出量多步预测模型,并采用皮尔逊(Pearson)相关系数法来解决预测模型特征选择困难的问题,采用鲸鱼优化算法优化LSTM的超参数来解决传统LSTM网络超参数难选的问题[16-18]。
1 WOA-LSTM模型
1.1 LSTM神经网络模型
长短期记忆网络(LSTM)是基于循环神经网络(RNN)对长序列数据易造成“梯度消失”和“梯度爆炸”问题进行改进而提出的一种神经网络[19]。LSTM在RNN的基础上增加了输入门(Input Gate)、输出门(Output Gate)和遗忘门(Forget Gate)3个特殊结构来实现信息的长期保存,网络的基本结构如图1所示。
图1 LSTM记忆网络基本结构
图1中,X(t)为t时刻的输入数据;ht-1和ht分别为t-1与t时刻隐藏层输出;Ct-1和Ct分别为t-1与t时刻细胞单元的状态;tanh为双曲正切激活函数;σ为sigmoid 激活函数。t时刻LSTM网络的输入门i、遗忘门f、输出门O和网络输出值h的具体计算过程如下:
1)遗忘门对数据信息进行筛选,决定选取多少有用信息。t时刻的输入X(t)与前一时刻隐藏层的输出ht-1经过σ函数输出0~1的数值,其中0表示不允许任何历史数据信息保留,1则表示所有历史数据信息保留。计算公式如下:
ft=σ{Wf[ht-1,X(t)]+bf}
(1)
2)输入门对传输信息进行存放和决定哪些保留被用来更新处理器状态。it表示对新加入信息的取舍程度,通过tanh函数生成候选单元Ct,计算公式如下:
it=σ{Wi[ht-1,X(t)]+bi}
(2)
(3)
(4)
3)输出门决定多少数据信息基于新的单元状态输出。Ot表示对当前已融合历史信息和输入信息的取舍程度,ht表示输出预测数据。计算公式如下:
Ot=σ{Wo[ht-1,X(t)]+bo}
(5)
ht=OttanhCt
(6)
式(1)~(6)中W和b为对应的权重系数矩阵和偏差向量。
1.2 WOA鲸鱼优化算法
鲸鱼优化算法(Whale Optimization Algorithm,WOA)是由澳大利亚学者Seyedali Mirjalili和Andrew Lewis提出的一种群体智能优化算法[20]。该算法模拟了鲸鱼独特的气泡网捕食行为,具有搜索能力强、能够跳出局部最优且收敛速度更快等优点。算法包含包围捕食、螺旋气泡袭击和搜寻猎物3个阶段,其具体流程如下:
1)包围捕食阶段
WOA算法中,各个鲸鱼通过信息交流机制不断获取猎物信息,算法初期将距离鱼群最近的鲸鱼个体当作局部最优解,其余鲸鱼计算当前位置到最优解的距离,进而朝着当前最优解聚拢,包围猎物。数学上,将包围猎物的行为描述为:
X(n+1)=X*(n)-A|CX*(n)-X(n)|
(7)
A=2ar1-a
(8)
C=2r2
(9)
式中:X(n+1)为下一次迭代后解得的位置向量;X*(n)为当前的最优解的位置向量;X(n)为当前的位置向量;n为迭代次数;A、C为随机系数向量;r1、r2为[0,1]的随机向量;a为从2到0线性递减的系数,即a=2-2n/nmax;nmax为最大迭代次数。
2)螺旋气泡袭击阶段
鲸鱼沿着螺旋状的轨迹运动,缩小包围猎物圈捕捉猎物。该阶段主要包括收缩包围机制和螺旋更新位置两种行为,由于这两种行为是同时发生的,所以每只鲸鱼在该阶段随机选择一种方式来更新自己位置,假设两者概率均为50%,其数学表达式如下:
(10)
式中:D为迭代第n次时个体鲸鱼到目标的距离;b为常数;l为[-1, 1]的随机数;p为策略选择阈值,取值范围为[0, 1]。
3)搜寻猎物阶段
在搜寻猎物阶段,鲸鱼通过|A|的值来控制是搜寻阶段还是包围阶段。当|A|大于1时,各个鲸鱼判断彼此位置进行随机搜索,其数学描述如下:
X(n+1)=Xrand(n)-A|CXrand-X(n)|
(11)
式中Xrand(n)为迭代第n次时鲸鱼种群中任意选择的一个鲸鱼的位置向量。
2 模型建立
2.1 数据预处理
为了提高模型的预测准确度、避免数据影响造成的过拟合现象,对原始数据进行归一化处理,通过将所有有量纲的数据转化为[0,1]的无量纲数据。选用最值归一化,其计算公式如下:
(12)
2.2 特征值筛选
瓦斯涌出量的变化受煤层的瓦斯含量、地质构造、煤壁及其他瓦斯涌出量、开采深度、工作面推进速度、时间和位置、风量变化、采煤方法与顶板控制等多个因素的影响。采集山西常村煤矿掘进工作面的数据,原始数据有 11个影响掘进工作面瓦斯涌出的特征量,分别为风量X1、回风流瓦斯浓度(CH4体积分数,下同)最大值X2、回风流瓦斯浓度平均值X3、工作面瓦斯浓度最大值X4、工作面瓦斯浓度平均值X5、煤壁及其他瓦斯涌出量X6、掘进进度X7、巷道总进度X8、回风流距离X9、瓦斯含量X10、巷道断面积X11,将这11个主要影响因素作为模型的初始输入样本实现对瓦斯涌出量Y的预测。该工作面的部分数据见表1。
表1 掘进工作面瓦斯涌出量与影响因素数据
采用皮尔逊相关系数法对输入特征进行特征筛选,结果如图2所示。
图2 特征之间皮尔逊相关系数
图2中,按照相关系数从大到小的排列顺序依次为X3、X6、X1、X2、X10、X5、X7、X8、X9、X4、X11。对于皮尔逊相关系数而言,其绝对值小于0.3说明特征之间相关程度较弱,可视为特征之间非线性相关,0.3~0.5视为低相关,0.5~0.8视为中度相关,高于0.8时,可视为高度相关。基于图2中的计算结果,X4、X11相关系数分别为0.23、0.13,相关性较低,所以选择回风流瓦斯浓度平均值、煤壁及其他瓦斯涌出量、风量、回风流瓦斯浓度最大值、瓦斯含量、工作面瓦斯浓度平均值、掘进进度、巷道总进度、回风流距离等9个特征作为瓦斯涌出量预测的外部输入特征量。
2.3 模型评价指标
为了衡量模型的预测效果,选用平均绝对误差(MAE,eMA)、均方根误差(RMSE,eRMS)来验证数据集的预测结果及检验模型特征之间皮尔逊相关系数的效果,其计算公式如下:
(13)
(14)
2.4 模型预测流程
LSTM神经网络的初始参数设置是预测模型建立的重要环节之一,参数选取合理与否直接关系着模型的拟合速度和预测误差[21]。实践证明,模型的预测误差主要受隐藏层神经元个数和时间步长设置的影响,而模型收敛速度的快慢则受批处理数的影响。为避免人为经验差异影响,使用WOA算法对LSTM的隐藏层神经元个数、时间步长和模型批处理数3个参数进行寻优。模型的预测流程如下:
1)数据标准化处理。由于多步预测需要将上个时间段的瓦斯涌出量相关的时间序列数据进行转换并转化监督学习问题,因此需对原始数据进行标准化处理。
2)特征筛选。利用皮尔逊相关系数法对输入特征进行筛选,合理选取模型输入特征因子以减少模型的复杂性。
3)LSTM网络结构设计。LSTM网络模型的拓扑结构设计是指对模型输入层、输出层及隐藏层维数的设计。针对瓦斯涌出量数据,设计选用输入层、一个隐藏层和输出层。针对LSTM超参难选问题,采用鲸鱼寻优算法优化隐藏层神经元个数、时间步长和批处理数这3个参数。
4)鲸鱼算法种群初始化。将(neurons,time_steps,batch_size)这3个变量组成的一组值作为待优化参数输入到鲸鱼算法中,3个变量分别代表隐藏层神经元个数、时间步长和批处理数,选择模型的RMSE值作为算法的适应度值。
5)LSTM网络训练。将传统LSTM训练得到的模型均方根误差值作为系统的终止值,并求取鲸鱼算法优化后的误差值。
6)判断是否满足终止条件。若鲸鱼算法优化后的模型误差值小于系统终止值则输出最优参数;若模型误差无法小于终止值或迭代次数未达到最大值,则更新参数重新进行训练。
7)最优参数预测。将满足终止条件获取的最优参数输入LSTM模型进行瓦斯涌出量的预测。
3 实例应用与分析
3.1 实验参数设置
建立的WOA-LSTM模型由输入层,一个隐藏层和输出层构成,模型采用Adam优化算法更新模型参数,为了避免模型过拟合设置丢弃率为0.2。鲸鱼算法中初始种群数设为30,对待优化的隐藏层神经元个数、时间步长和批处理数这3个参数分别设置下界lb=[10,1,20],上界ub=[100,20,200],为了防止过拟合,设置迭代次数为100次。算法寻优的适应度收敛曲线如图3所示。
图3 适应度收敛曲线
从图3中可以看出,WOA优化算法在第20次迭代时出现最优适应度值,相对应的最小均方根误差为0.201。获得的最优参数组合如表2所示。
表2 LSTM模型最优参数组合
3.2 实验结果分析
为了探究时间步长对瓦斯涌出量预测的影响,按照表2所得最优隐藏层神经元个数、批处理数的条件,构建LSTM网络进行预测。为了避免模型训练次数不足所造成的数据误差,取10次模型训练预测后所得数据的平均值 ,1~5步时间步长的预测误差见表3。
表3 不同时间步长预测误差指标对比
在进行时间序列预测时,若时间步长较小,则模型不能够有效利用历史信息易造成模型预测不收敛、预测精度较低等问题;若时间步长过大,则会造成模型收敛性降低,容易出现过拟合现象。因此预测步长选取的合理与否,直接影响着模型的预测效果。分析表3 可以看出,随着预测步长的增加,瓦斯预测均方根误差值在逐渐减小,在3个时间段的历史数据上,模型的预测误差达到最小,继续增加时间步长,模型预测误差开始逐渐增大。最佳3个时间段的步长预测相较单步预测,其eRMS值降低了67.4%,eMA值降低了66.9%,验证了多步预测模型能够有效挖掘历史信息、提高模型预测精度。
为了验证所建模型的有效性,采集山西常村煤矿掘进工作面统计数据,经过处理统计出800条数据作为实验数据。按照7∶3的比例划分训练集、测试集,对其进行建模预测,预测结果如图4所示。
图4 WOA-LSTM预测值与实际值对比
为了进一步验证WOA-LSTM模型的预测效果,分别采用LSTM、RNN、BP模型进行瓦斯涌出量预测,所得预测效果如图5所示(为了图线清晰,图5中仅画出间隔10个时间段的预测值)。
图5 不同模型对瓦斯涌出量预测效果对比
由图4和图5可以看出,BP神经网络由于内部结构的限制在挖掘时间序列潜在规律、预测稳定性等方面具有一定的缺陷,RNN与LSTM模型能够整体刻画出瓦斯涌出量变化趋势,但WOA-LSTM瓦斯涌出量多步预测模型比其他3种模型更加接近瓦斯涌出量的实际值且具有较好的泛化能力。同时也可以看出,随着时间序列的延长,WOA-LSTM多步模型对于长时间序列的预测精度较之前有所下降,但总体上对于长时间的预测WOA-LSTM多步预测模型所表现的预测精度和效果更好。各个模型的预测结果评价指标如表4所示。
表4 多种模型预测结果对比
从表4中可以看出,WOA-LSTM瓦斯涌出量多步预测模型相较于LSTM、RNN及BP模型,其eRMS分别降低了29.7%、32.0%、55.1%,eMA分别降低了41.6%、46.6%、65.8%,说明WOA-LSTM瓦斯涌出量多步预测模型在进行瓦斯时间序列数据预测时具有较好的预测精度。
4 结论
1)矿井瓦斯涌出量的影响因素众多,采用皮尔逊相关系数法筛选输入特征因子,算法筛选了9个主要影响瓦斯涌出量变化的特征作为模型的外部输入特征,验证了该算法能够有效挖掘输入特征的有效信息,从而提高预测模型训练效率并降低复杂性。
2)对于LSTM模型中超参数优选难题,采用WOA优化算法对LSTM模型的隐藏层神经元个数、时间步长、批处理数进行寻优,结果表明3个时间步长瓦斯模型预测误差最低,最佳神经元个数与批处理数分别为13、20,有效解决了LSTM模型中超参数优选难题。
3)相较于传统的LSTM网络、循环神经网络和BP神经网络,WOA-LSTM瓦斯涌出量多步预测模型在预测精度与预测效果上更优,其平均绝对误差相较于LSTM、RNN和BP神经网络模型分别降低了41.6%、46.6%、65.8%,具有较强的鲁棒性,可为预防矿井瓦斯灾害的发生提供参考。